'데이터과학'에 해당되는 글 1건

  1. 실리콘 밸리에서도 주목받고 있는 토폴로지 데이터 분석

Slideshare를 통해서 토폴로지 데이터 분석(Topological Data Analysis, TDA)에 대한 발표 자료를 2014년 4월에 공유했다. 슬라이드 쉐어에서는 나의 슬라이드를 본 사람들이 어떤 경로로 찾아왔는지에 대한 정보와 어느나라 사람들이 주요하게 관심을 갖고 있는지의 여부를 자동으로 분석해주는 기능이 있어서 한번 살펴봤다.

한국 사람중에 나의 슬라이드를 본 사람들은 대부분 얼굴책 등에서 내가 공유한 것을 보고 링크를 타고 온 사람들이라고 생각된다. 하지만 미국이나 독일에서 슬라이드를 본 사람은 분명히 검색을 통해서 나의 토폴로지 데이터 분석 슬라이드를 찾았을 것이다. 또한, 아래 그림 중에서 국가별로 슬라이드를 '본 사람 수'의 그래프에서도 볼 수 있듯이 토폴로지 분석은 미국, 독일, 인도 등 IT 강국에서 큰 관심을 갖고 있는 분야임은 분명한 것 같다.

미국 내에서도 특히 어느 지역의 사람들이 관심을 갖고 있는지 궁금해서 Google Fusion Table의 heat map 기능을 이용해서 지도에 뿌려보니, 실리콘 벨리 지역의 사람들이 토폴로지 데이터 분석에 많은 관심이 있는 것으로 보인다 (아래 그림). 꼭 토폴로지 데이터 분석이 아니더라도, 쌓여있는 데이터에서 의미 있는 정보를 찾아내고 그것으로부터 가치를 부여하는 일은 분명 많은 수요가 있을 것으로 기대된다. 위에 bar-graph는 2014년 4월부터 2015년 3월 18일까지의 누적 수치이고, 아래 heat map은 최근 1달(2015년 2월 19일-3월 18일)간의 정보를 통해서 얻은 결과이다. heat map도 전체 viewer에 대해서 그려고보 싶었는데, slideshare에서는 최근 1달간의 방문자 기록만 raw 데이터 형태로 추출이 가능하다.



신고