2010.07.24 15:01

구글의 Public Data Explorer

구글에서 Public Data Explorer 서비스를 하고 있는 것을 Tim O'Reilly 의 트윗을 통해 알게 되었다. (구글링해보니 지난 3월에 발표가 있었는갑다)서비스 초기에는 언제나 그렇듯이 Labs 단계이며 그동안 공들여 만든 Google Visualization Widget 들의 무궁무진한 활용 가능성을 엿볼 수 있는 무대이기도 하다. 홈페이지 소개 내용을 우리말로 옮겨보면

​Google Public Data Explorer를 통해 매우 큰 데이터셋이라도 쉽게 탐색하고 정보를 시각화시켜 커뮤니케이션 할 수 있습니다. 차트와 지도는 시간 흐름에 따라 애니메이션 되며 이를 통해 변화되는 세계를 쉽게 이해할 수 있습니다. 여러분이 비록 데이터 분석 전문가가 아니더라도 데이터 패턴 분석을 위해 여러가지 시각적 탐색 도구를 활용할 수 있으며 직접 비교하고 여러분이 발견한 내용들을 쉽게 공유할 수 있습니다.

학생이나 저널리스트, 정책 입안자들 뿐만 아니라 누구든지 공공의 데이터를 쉽게 시각화 시킬 수 있는 도구들을 사용하여 링크를 걸거나 자신의 웹 페이지 안에 임베딩 시킬 수있습니다. 임베딩된 차트와 링크는 데이터가 변함에 따라 자동적으로 업데이트 되기 때문에 여러분은 최신의 활용 가능한 데이터를 언제든지 사용하고 공유할 수 있습니다. ...





위 차트는 World Bank 의 전세계 데이터를 가져다가 보여주는 가젯인데(위 가젯은 이미지 캡쳐가 아니라 정상 작동하는 가젯입니다.) 시계열 자료의 시각화에 많이 활용되는 버블차트 위젯을 사용하고 있다. 가로축은 기대수명, 세로축은 총출산률로서 가임여성 한명이 평생동안 낳는 아이의 수다. 그래프상의 동그라미 크기는 국가별 인구를 나타내며 지역별로 색상을 구분해서 표현하게끔 지정되어 있다. 특정 데이터 항목에 대해서도 조작 가능한 옵션들이 있는데 위 그래프에서는 북한에 대해 그래프상에서의 이동경로를 남겨둘 것(show trails)을 지정하였다. 그래프 왼쪽 하단의 플레이 버튼을 누르면 움직이는 모습을 볼 수 있다. 데이터 시각적 탐색 결과를 살펴보면 대게 시간 경과에 따라 출산률이 낮아지고 기대 수명은 높아지면서 전반적인 데이터들이 우하향으로 움직인다. 그럼에도 불구하고 아프리카 지역을 뜻하는 사하라사막 남부지역 국가들은 오늘날에도 높은 출산율과 기대 수명이 그리 높지 않음을 볼 수 있다. 아시아 태평양 국가와 유럽, 북아메리카 국가들은 오른편 아래 치우쳐 있음을 색상을 통해 시각적으로 알 수 있다. 경로 흔적이 남는 것은 북한에 대한 데이터인데 매우 특이한 움직임을 보이고 있음을 알 수 있다. 우하향하던 그래프가 90년대 전후로 갑자기 왼쪽으로 방향을 틀었으며 아직까지도 그 당시 수준을 회복하고 있지 못하다. 지금도 식량 문제로 어려움이 많다는데 90년대 전후부터 그러한 어려움이 있었음을 알 수 있다. 저쪽은 굶어 죽어가는데 가장 가까운 우리나라는 남아도는 쌀을 주체 못하고 있다. ...



위 차트는 OECD Factbook 2009 자료를 버블차트를 이용해서 시각화시킨 결과다. 근로시간이 다른 OECD 국가에 비해 월등히 높음을 알 수 있다. 다행히 시간 경과에 따라 데이터 포인트가 왼쪽으로 움직이고 있어 그 탁월함?이 약해지고 있기는 하지만 바람직한 모습은 아닐게다. 결국 생산성이 낮다는 의미이기도 하며 한편으로는 다른 국가들과 비교해 볼때 선진국이 되고자 한다면 노동시간을 줄이고 소득을 높이는 방향으로 나아가야 한다는 것을 보여준다.

구글에서는 UN 이나 OECD, EU 등에서 생산한 데이터와 함께 미국내에서 공개된 데이터들을 활용한 Public Data Explorer 서비스를 하고 있으며 기타 조직에서도 원하면 이런 서비스가 가능하니 신청할 것을 독려하는 상황이다. 아울러 연구자나 언론 기관에서도 이러한 시각화 가젯을 활용하는 사례가 증가하고 있다. 최근 TED 에서 발표했던 Hans Losling 의 동영상을 보면 이러한 시각화 위젯을 가지고 발표 내용을 이끌어가고 있다.

사용자 개인적으로도 자신의 데이터를 이용해서 이런 시각화 가젯을 사용할 수 있는데 구글 스프레드시트에 자료를 담아서 시각화 가젯을 사용하는 것은 엑셀에서의 사용법과 유사하다. 구글 퓨전 테이블에 담은 자료도 시각화 가젯을 적용시켜 차트화 시킬 수 있다. 이러한 시각화 가젯의 예들은 Google Visualization API 샘플(동적인 것만)에 있으니 관심있는 분은 보시면 되겠다. 위에 소개한 Public Data Explorer 에는 겨우 네가지 시각화 기법이 소개되어 있지만 원래 비주얼 가젯에는 종류가 매우 많으며 정적 동적 가젯들을 쉽게 만들어 인터넷 환경에서 "펌질"이 매우 쉽게 되어 있다.

국내 공공기관들은 자료 공개에 대해 아직도 웹 1.0 시대관을 가지고 있는데 어찌 됐던 시류를 따르고자 한다면 자체적으로 데이터를 관리하면서 이러한 외부 가젯들이 데이터를 쉽게 가져다 쓸 수 있게끔 데이터 소스 서비스를 하면 된다. 특히, 통계청같은 공공기관에서는 앞으로는 이런 식(시각적 완결품을 제공하는 것이 아니라 데이터 그 자체를 인터넷 상에서 활용하기 쉽게 제공하는)의 서비스가 필수적일 것이다. 통계지도 서비스도 결국에는 이러한 시각적 분석 도구의 일환으로 포함되게 될 것으로 보이는데, 지금 수준에서는 매우 단순한 형태지만 지도화된 통계 시각자료 쪽도 더욱 발전하고 자동화될 것이다. 물론 그러한 작업을 담당하는 쪽은 클라이언트이며 데스크탑이건 모바일이건 그건 프론트 엔드쪽에서 알아서 할 일이다. 다른 기관도 그렇지만 우리나라 통계청 쪽의 서비스도 공간통계 오픈API와 같이 필요이상의 불필요한 서비스 제공을 위해 정작 중요한 걸 놓치고 있었는데 앞으로의 방향성 탐색에 구글의 Public Data Explorer 사례가 많은 참고가 될 것이다.

... 그런데 어쨌거나 저쨌거나...결국은 클라우드로 갈 것이다. 트위터도 클라우드에 있고 뭐도뭐도 클라우드에 있고..최근에는 ArcGIS Server 10 도 클라우드로 올라갔단다. 미국 TIGER 데이터도 클라우드에 있고 OSM도 클라우드에 있고... 다들 구름너머로 승천하고 있다. .. 모 언젠가는 우리들도 구름너머 올라가겠지만서도 작년의 국내 GIS 사업처럼 지자체에 하드웨어나 몇대씩 사서 돌리는 일을 하고 있으니 참으로 답답한 일이다. ... ESRI Speaker Podcast 를 들으니 ESRI 홈페이지 내에 별도의 Cloud GIS 페이지가 생겼다고 한다. 관심 있으신 분들은 한번 보시면 되겠다. 클라우드컴퓨팅에 대한 정의, GIS 업체로서의 클라우드 활용 전략 등의 내용이 담겨 있다.
Trackback 0 Comment 0