디지털아카이브 소개와 활용사이트 안내
현안과이슈 / by Jussi / 작성일 : 2017.05.27 / 수정일 : 2017.05.27
정보검색을 넘어서 책, 음악, 비디오, 오디오, 예술 , 문화 등 모든것이 인터넷에 연결되는 사회에서
현재 전세계적으로 구축되고 있는 디지털 아카이브 개념과  활용사례 를 소개합니다. 

1. 디지털 아카이빙 개념 

 

디지털 아카이브(digital archive)는 인터넷에 디지털로 이루어진 거대한 문서 저장고이자 콘텐츠 아카이브다. 인터넷에서는 실시간으로 정보가 생산되는 동시에 저장된다. 디지털 아카이브는 정보의 생산과 전달, 공유 속도를 극대화하고 지식에 대한 접근성을 향상시킨다. 디지털 아카이브는 지구화된 차원에서 실시간으로 내용물이 축적되는 동시에 사용되는 시공간 압축의 저장고다. 디지털로 전환된 사물의 반영물은 디지털 복제로 수많은 사람의 용도에 맞게 사용될 수 있다. 디지털 아카이브는 지구화된 차원에서 실시간적인 데이터로 이루어진 내용물이 축적됨과 동시에 사용되는 시공간압축의 저장고이다. 이는 인터넷 사용자들이 여러 가지 형태로 올린 말과 생각, 의견과 감정이 쌓이는 실시간 저장고라고 할 수 있는데, 사용자가 올려놓은 디지털 콘텐츠는 그것이 저장되는 물리적 장소(서버)에 상관없이 네트워크 안에서 사이버스페이스라는 가상의 공간 안에 축적된다

쉽게 말해 디지털, 전자화된 자료를 보존하기 위해서 만든 시스템을 디지털 아카이빙이라고 하며 이북, 오디오, 비디오, 텍스트, 소프트웨어, 인터넷사이트(웹정보) 등의 모든 디지털 데이터가 이 범주에 포함된다

  

2. 디지털 아카이빙 주요 사이트 소개 

 

- 인터넷 아카이브

http://www.archive.org


인터넷 아카이브(Internet Archive)는 1996년부터 역사적인 온라인 자료 및 웹사이트 수집 보존하고 있으며 Wayback Machine 이라는 시스템을 통해 사이트의  소급년도까지 검색이 가능하여  현재의 데이터 뿐만 아니라 그 당시의 과거자료도 검색 및 확인이 가능한 기록사이트이다 

누구나 쉽게 접근할 수 있는 무료 온라인 디지털 도서관을 구축해 유지하고 있는 비영리 단체로, 사무실은 샌프란시스코의 프레시디오(Presidio)에, 데이터 센터는 샌프란시스코를 포함해 레드우드 시티, 마운틴 뷰에 있다. 데이터 센터에서는 웹 페이지, 소프트웨어, 영화, 책, 노래, 녹취물을 저장하고 있다. 안정성을 고려해 이집트 알렉산드리아 도서관에 미러가 있다.  

 

 

- 구글 아트앤컬쳐 

https://www.google.com/culturalinstitute/beta/



Google Cultural Institute와 제휴한 1,200여 곳의 주요 박물관과 자료실의 콘텐츠 등 전 세계의 소중한 자료를 온라인에서 제공하고 있으며 아직까지는 베타 버젼을 운용중이다. 
지난 2011년 설립된 ‘구글 아트 앤 컬처Google Arts & Culture’는 전 세계 문화 속 다양한 이야기를 구글의 디지털 기술에 적용하여 누구나, 언제, 어디서나 문화·예술 콘텐츠를 향유할 수 있도록 돕고 있다.구글의 스트리트 뷰Street View 팀은 미술관, 박물관과 같은 실내를 촬영할 수 있는 '트롤리’라는 장비를 고안해냈다. 경기도미술관의 그라피티 전시 또한 이렇게 촬영된 파노라마 이미지에 담길 수 있었다. 이 아카이빙 방식은 지금도 국내외 다양한 문화 기관에서 적극적으로 활용되고 있다.미술관, 박물관에 가지 않아도 다양한 화풍의 미술작품을 고화질로 감상할수 있다. 

 

한국 - 오아시스  (디지털 아카이빙 사이트)

Online Archiving & Searching Internet Sources, OASIS

http://www.oasis.go.kr/

  

온라인상에서 쉽게 사라져 버리는 전자 정보를 어떻게 수집하여 보존하고 제공할 것인가 논의하여 

그리고 국가 차원에서 디지털 지식 정보 자원에 대한 수집·보존의 필요성이 대두되어  

국립중앙도서관은 2004년 시범 수집을 거처 2005년부터 본격적으로 소멸하기 쉬운 웹 자원을 보존하기 위한

‘오아시스Online Archiving & Searching Internet Sources, OASIS 프로젝트’를 국가적차원에서 운영하고 있다.

 

2016년에는 2015년과 비교해 약 20만 건의 도메인이 사라지거나 새로 생겨났다. 모바일 브라우징 증가 등 웹 환경의 변화로 미래 웹사이트 모습은 지금까지와는 많이 달라질 것으로 예상된다. 국립중앙도서관은 주요한 개별 웹사이트( 대한민국 국가도메인인 ‘.kr’) 와 국가 재난, 이슈, 주제 분야 등 테마 단위로 선별하여 수집해왔으나 2016년부터는 웹사이트의 대량 손실을 막기 위해 포괄적 수집을 병행해 나가고 있다. 주요 사이트에 대해 심층적인 수집을 하는 선택적 수집과 달리 포괄적 수집은 .kr 등 국가도메인 단위의 전체적 수집을 의미한다. 전체 도메인 중 에 20만 건을 대상으로 포괄적 웹사이트 수집을 시범 추진하였으며, 2017년에는 30만 건을 수집할 계획이다.

 

구글 북스, 포토, 뉴스 

구글은 디지털 아카이빙의 선두업체 답계  디지털 매체별로 각각 아카이빙하고 각각 서비스 하고 있다. 

 

구글 뉴스 : 
https://news.google.com/
구글 북스 : 
https://books.google.com/

구글 포토 : https://www.google.com/photos/about/​

 

 

3. 정보의 보고, 웹 아카이브 활용 사례 

구글은 미국 대선 기간 일 년 가량 구글 뉴스 웹사이트를 아카이빙archiving하고 분석하여 대선 후보 도널드 트럼프Donald Trump와 힐러리 클린턴Hilary Clinton의 미디어 활동을 정량적으로 시각화했다. 그 결과 트럼프는 구글 뉴스 웹사이트에서 클린턴보다 2배나 많이 언급되어 뉴스 사이클에서 우세했던 것으로 나타났다. 영국국립도서관과 런던대학교 등이 협력하여 추진하는

‘인문·예술을 위한 빅 영국 도메인 데이터 프로젝트’는 영국 도메인 아카이브archive를 빅데이터로 분석·활용한 서비스를 개발하고, ‘웹상에서의 영국 기업의 역사, 영국 웹 아카이브와 비트 문학Beat literature’ 등 인문 예술 분야 연구를 지원하고 있다. 연구자들을 참여시키기 위한 웹 아카이빙 해커톤도 매년 미국, 영국 등지에서 열린다.

미디어이론가이자 문화비평가인 마셜 매클루언Marshall McLuhan은 ‘미디어는 메시지’라고 했다. 매체는 단순한 정보 전달 도구가 아니며, 그 자체가 인간의 인식, 내면에까지 영향을 미친다는 의미이다. 수집된 웹사이트를 활용한 연구는 웹상의 내용 분석을 통한 인문사회학적 연구뿐 아니라, 웹사이트라는 매체를 통해 사람들의 행위와 반응이 이뤄지는 현상이나 인간 의식의 변화, 온라인 자체에 대한 연구까지 확대될 수 있다.

또한 연구자들에게는 수집된 웹사이트 요소 가운데 추출, 처리한 데이터 세트를 저작권이 저촉되지 않는 범위 내에서 제공하거나 맞춤형 아카이빙 등을 서비스할 수 있을 것으로 기대된다.

대한민국은 올해 국립중앙도서관에서  그동안 수집한 오아시스 웹사이트 데이터를 활용한 시각화 서비스를 시범적으로 개발하고, 연구자 및 일반 이용자들을 대상으로 서비스 확대를 위한 인식 조사를 실시할 예정이라고 하니 웹 아키이브와 빅데이터가 결합하여 다양한 미래예측, 사용자 기반  맞춤형 서비스를 제공하게 될 날을 기대해 본다. 

 

기사 참고 : 

오늘이 도서관 - 오아시스 :  http://blog.naver.com/todayslibrary/221011755544


글쓴이 _ jussi 
서울시NPO지원센터 아카이브 큐레이터. 
IT분야에서 엔지니어로 근무하다가 책과 도서관이 좋아
비영리기관에서 독서문화, 작은도서관 활성과 홍보 등의 업무를 하고 있습니다


작성자 : Jussi / 작성일 : 2017.05.27 / 수정일 : 2017.05.27 / 조회수 : 40644

코멘트를 달아주세요!



 목록으로