본문 바로가기

전체 글106

Topological Data Analysis를 이용한 전국 지방자치단체의 토건예산, 복지예산, 자살률의 관계 분석 Topological Data Analysis 방법에 대해 궁금한 사항은 Slideshare를 통해서 공개된 자료를 참고해 주시면 되고, 여러 논문들에서도 방법을 확인하실 수 있습니다. 뉴스타파는 제가 제일 신뢰하는 언론이기에 뉴스타파 홈페이지를 자주 방문하곤 합니다. 전국 242개 지방자치단체 토건예산, 복지예산, 자살률 자료가 공개 된지는 두어달 전이지만, 그동안 그냥 눈팅만 하다가 이제야 데이터를 직접 분석해 보기로 했습니다. Topological Data Analysis (이하 TDA)는 데이터 간의 거리 정보를 이용하여 데이터 간에 관계를 분석하는 기법으로 순수 수학인 '위상수학'에 뿌리를 두고 있습니다. 데이터 분석을 위해서 사용한 데이터는 2009년 복지예산과 토건예산의 비율, 2012년 복.. 2014. 7. 26.
TCI & Functional Modular Organisation 논문 수락 후기 뇌과학 분야에서 출판한 첫 논문이기에 꼭 후기를 남기고 싶었다. 물리학 분야에서 첫 논문이 출판되었을때 후기를 썼던 것 처럼... 논문의 Manuscript가 대략적으로 완성된 시점은 2012년 12월 쯤으로 기억한다. 데이터 획득부터, 뇌영상 데이터의 분석, 그리고 논문 작성의 전체 과정에 직접 참여했기 때문에 나에게 의미가 더욱 각별하게 느껴지는 논문이다. 이번 연구는 "기질Temperament에 따라서 뇌네트워크의 연결성이 다르게 나타나고 그로 인해서 서로 다른 모듈 구조를 갖는다"는 것을 주요 결과로 하고 있으며, 논문 초안의 제목은 으로 정했다. 인성의 외향성은 기질의 위험회피 척도와 자극추구 척도로 구분하는 것이 무리일 수도 있다는 것은 어느정도 예상했고, 특히 성격심리학자들이 보기에는 완전 .. 2014. 7. 19.
수리연을 떠나기 직전에 참석하는 학회. 5년전. 2009년 7월. 그러니까 내가 물리학과 석사 졸업 직전에 폴란드에서는 Europhysics 2009 학회를 개최했었고, 나는 여기에서 Belle Collaboration을 대표하여 'b->s Hadronic Decays at Belle' 이란 주제로 발표를 할 수 있는 기회를 얻었다. 졸업 직전이라 어지간해서는 해외출장을 보내달라고 애원해도 쉽지 않을 일이었지만, 지도교수님의 추천으로 국제무대에서 발표할 수 있는 기회를 갖게 되었다. 첫 국제 학회였는데 구두발표여서 무척이나 긴장하며 발표 자료를 몇번이고 되새기며 연습했던 날이 기억난다. 그 후로 뇌과학으로 전공을 바꾸면서는 구두 발표를 하기가 좀처럼 쉽지 않았는데, 지도교수님의 영향이었던것 같기도 하고, 이쪽 분야를 공부하는 사람들의 전반적인.. 2014. 7. 14.
Data Analysis (3): Flip Neuroimaging Data 병변Lesion이 있는 환자의 뇌영상을 분석할 때, 종종 영상의 좌-우를 반전Flip이 필요한 경우가 있습니다. 가령, Stroke으로 인해 운동영역에 손상을 입은 환자의 병변을 overlay 하는 연구를 진행한다고 했을때, 가장 좋은 방법은 병변이 한쪽으로 몰려 있는 환자들만을 피험자로 선정하여 연구를 진행하면 좋습니다. 하지만, 모든 뇌졸중 환자들이 천편일률적으로 오른쪽 대뇌 피질의 운동영역에 손상이 오지 않습니다. 어떤 환자는 왼쪽 운동영역에 손상이 오기도 하고, 어떤 환자는 오른쪽 운동영역에 손상이 오기도 합니다. 이럴때는, 피험자의 숫자가 적은 쪽의 뇌영상 데이터를 좌-우 Flip하여 병변이 한쪽인것처럼 맞춘 후에 통계분석을 하게 됩니다. 이러한 경우가 아니더라도, 뇌영상 데이터를 처리하는 과정.. 2014. 4. 30.
Data Analysis (2): Graph Theoretical Analysis in R 수학에서의 그래프 이론(Graph Theory)과 물리학에서의 복잡계 네트워크(Complex Network)는 관련 전공자가 아닌 분야의 사람들에게는 비슷하게 느껴집니다. 저 또한 수학자도 아니고 물리학자도 아니기에 그래프 이론과 복잡계 네트워크를 혼용해서 사용합니다. 두 학문 분야의 전문가들이 보시기에는 다른 학문이으로 생각되겠지만, 그래프 이론이나 복잡계 네트워크에서 발견된 연구 결과물을 활용하는 연구자들에게는 '그게 그거 아닌가?' 라는 생각이 들기 마련인 것 같습니다. 저 또한 그래프 이론과 복잡계 네트워크라는 용어를 구분하지 않고 혼용해서 사용합니다. 그래프는 '점'과 '선'의 집합으로 구성되어 있습니다. 그래프에서 노드와 노드가 어떻게 연결되어 있는냐에 따라서 community를 이루기도 하지.. 2014. 4. 24.
Data Analysis (2): Linear Model in MATLAB Linear Regression이란 용어는 실험을 동반한 대부분의 연구에서 빠지지 않고 등장하는 개념입니다. 사실, 어려운 개념은 아니지만 통계학에 익숙하지 않은 (인문/사회 계열) 연구자들에게는 일단 거부감부터 안겨주는 골칫덩어리가 아닐까? 생각됩니다. 본 강좌는 "The Elements of Statistical Learning by Trevor Hastie, Rober Tibshirani, and Jerome Friedman"의 Chapter 3의 내용을 참고하여 작성했습니다. Linear Regression은 (1) 연구자가 설정한 모델이 실험 데이터를 얼마나 잘 설명하는가?를 확인하고 싶을때도 사용되고, (2) confounding 효과를 제거하기 위한 목적으로도 사용됩니다. 보통 General.. 2014. 1. 27.