2009.12.13 01:11

지오태깅된 위키피디아 컨텐츠 지도

아주 재밌난 글을 발견했는데 Mapping the Geographies of Wikipedia Content 이다. 이건 Mark Graham 이라는 개인 블로그 글인데 그가 영국의 가디언에도 이를 바탕으로 Wikipedia's known unknowns 라는 기사를 실었는데 가디언에서 소개하기를 위키피디아 각 항목들을 분석한 결과 전세계적으로 지식과 정보의 사막(Knowledge deserts)이 어딘지를 알 수 있었다 라고 헤딩을 달고 있다. ... 안타깝게도 분석 결과 우리나라가 바로 지식과 정보의 사막에 해당되고 있는데 분석 결과로 제시한 지도들은 아래에서 살펴보겠다. 아래는 Mark Graham 글의 인트로에 있는 내용인데 맘에 들어 인용해 본다.

인터넷은 마치 공기처럼 우리 주위에 맴돌며 우리 가정과 사무실 곳곳에 스며들고 있다. 그러나 단지 비물질 상태로만 머물러 있지도 않다. 우리는 만질 수도 있고 지도로 그려낼 수도 있고 사진을 찍을 수도 있다 - Andrew Blum 2009

아래는 2009년 11월까지의 위키피디아 컨텐즈 중에 거의 50만건에 달하는 (장소나 특정 장소에서 발생한 이벤트에 대해) 지오태깅된 위키피디아 항목들을 분석하여 나온 결과를 GIS를 이용하여 지도화한 것이라고 한다. 참고로 영어로 되어 있는 컨텐츠뿐만 아니라 전세계 모든 언어로 되어 있는 위키피디아 컨텐츠를 모두 분석한 결과라고 한다.

아래 지도는 각 국가별로 지오태깅(geo tagging)된 컨텐츠 숫자를 보여준다. 미국이 약 9만건에 달하고 Anguilla 라는 나라는 4건밖에 없다고 한다.


아래는 데이터를 국가 면적으로 나누어 본 결과인데 위와는 다른 패턴을 보여주는 것을 알 수 있다. 글쓴이에 따르면 중서부 유럽과 이스라엘, 일본에서 단위 면적당 컨텐츠 수가 많음을 보여주었다고 한다.

아래는 인구대비 컨텐츠 수를 지도화한 결과인데 위와는 또 다르다. 영어권 선진국들과 함께 그린랜드에서의 컨텐츠 수가 많음을 알 수 있었는데 개인적으로는 지구 기후변화와 관련된 선진국 과학자들의 컨텐츠 작성이 늘어난 결과가 아닐까 생각한다.


인터넷 인프라가 세계적인 수준이라고 자처해 왔던 우리?로서는 뜨악한 결과가 아닐까 싶다. 우리가 영어권 국가가 아니라서라고 변명하기에는 바로 옆 일본의 컨텐츠 등록 숫자가 그러한 변명을 무색하게 만들기 때문이다. 위키피디아가 우리나라에서 영향력을 발휘하지 못하는 것을 네이버의 지식인 서비스와 비교하여 설명한 글도 있는데 정작 중요한 문제는 컨텐츠는 많아도 효율적으로 정리되고 다듬어진 컨텐츠가 없어 시너지 효과를 기대하기가 매우 어려운 상황에 놓였다는 점이다.

위키피디아의 지오태깅된 컨텐츠뿐만 아니라 온라인상의 사진, 동영상 등 우리나라 내에서의 각 부문별 컨텐츠는 앞서있는 인터넷 하드웨어 인프라 덕분으로 인해 그 숫자는 많지만, 그 중 상당수가 지리정보화 될 수 있는 컨텐츠임에도 불구하고 지오태깅되어 있지 않거나 지오파싱할 수 있는 기술의 부족과 준비 미흡으로 인해 위치를 기반으로 하는 검색이 불가능하고 지도화시켜 볼 수 있지 않으며 다른 분야에서의 소중한 자원으로 활용되지 못하고 서로간에 분리되어 인터넷에 흩어져버리고 마는 결과를 가져오게 되었다. 이는 결국 미래(거의 현재와 가까운)에 활용 가능한 사회적 자원과 인프라가 투자한 것에 비해 효용을 얻기 어려운 구조를 만들어 버렸기 때문이다.

정부, 학계보다는 기업이 리드하고 있는 전세계적 추세를 고려할 때 국내 인터넷 1위 업체인 네이버가 자신들만의 이익 확보를 위해 행한(또는 행하고 있는) 폐쇄적인 인터넷 사업은 글로벌 업체의 그것과 너무 대비되며 결국 자신들의 경쟁력을 물론이고 국가 경쟁력까지 갉아먹는 결과를 낳게 되었다. 한편으로 정부는 돈대주는 물주 역할을 하니 어쩔 수 없다 하더라도 정부측과 긴밀히 활동하는 학계에서도 새로운 시대변화를 정부 정책에 반영할 수 있는 역량을 키우지 못했다고 보는데 ... 결국은 IT 쇄국 속에서  갈라파고스 효과와 지식정보의 사막화 사례가 될 수 있는 불명예를 만들어가고 있다. 이글 또는 경각심을 불러 일으키자는 의도인데 .. 관련 있는 사람들조차도 걍 그런갑다 라고 생각할 것만 같아 걱정스럽다. GIS 시점에서 볼 때 GeoWeb 이란 것이 기존 GIS시스템의 공간과 속성데이터의 강결합 체계를 무너뜨리고, 공간데이터와 속성 데이터의 연결성을 느슨하게 하면서 한편으론 연계될 수 있는 지리적 속성 데이터를 폭증시키는 일이기도 한데 우리나라만 그러한 데이터 생산을 못하고 있다는 의미이기도 하다.

오늘자 뉴스중에 4대강 사업-세종시 수정 중단 촉구 관련 뉴스가 있었는데... 정말로 이 시대와 다음 시대를 살아갈 이 땅의 사람들에게 시급한 것은 물리적 현실공간에서의 "삽질"이 아니다. 그보다는 인터넷 또는 가상공간 상에서의 "국가적 땅따먹기" 와 "자원생산"에 열 올리고 있는 글로벌 트렌드에 더 이상 늦어지지 않도록 GeoWeb 컨텐츠를 일구는 "삽질"이 필요한 상황이다.
Trackback 0 Comment 0