'All'에 해당되는 글 158건

  1. 토폴로지 데이터 분석을 이용한 섬망의 하위그룹 발견 (1)
  2. 비엔나 오스트리아에서 1주일간 살아보기
  3. 야외 포스터 세션 / Resting State Brain Connectivity at University of Vienna
  4. 19개월 아이 대소변 훈련하기
  5. Invited Talk
  6. Sunghyon Kyeong CV (Curriculum Vitae)
  7. Publications
  8. Topological Data Analysis (토폴로지 데이터 분석 방법) (6)
  9. 경규빈 타임라인 (2)
  10. 뇌영상 데이터 분석 - Create Brain Mask

최근 미국 식품의약청(FDA)는 Personalized Medicine의 중요성을 강조하고 있는 추세다. 같은 병명의 질병을 가졌다고 할지라도 사람마다 유전적인 특징이 다를 수가 있고, 생물학적으로 약물에 반응하는 정도가 모두 다르기 때문에다. 이에 따라 함께 강조되고 있는 것이 환자들을 아형에 따라 하위그룹으로 나누는 "Phenotypic Subgrouping"이다. 

Subgrouping을 위해 사용할 수 있는 비지도 기계 학습(Unsupervised Machine Learning) 방법은 여러가지가 있을 수 있지만, 질환을 범주화 하기에는 어려움이 있다. 이제 새롭게 등장한 것이 토폴로지 데이터 분석(Topological Data Analysis, TDA)이다. TDA는 일종에 Partial Clustering 방법으로 질병이 Spectrum 형태로 분포하는 경우에, 매우 유용하게 적용할 수 있는 클러스터링 방법이다.

토폴로지 데이터 분석에서 Input Features를 선택하는 방법은 많이 있지만, 이번 연구에서는 로지스틱 회귀분석을 이용해서 수술후 섬망 발생에 영향을 미치는 위험인자를 우선적으로 찾아냈다. 이렇게 찾아낸 위험인자는 노인 인지기능 평가 지수(MMSE), 심경증, 성실성, 수술시 마취의 종류이다. 이 4개의 특징 변수의 Principal Component를 찾아내서, 이를 Mapper의 filter metric으로 사용했다. 아래 그래프에서 노드의 색깔은 filter metric이다. Mapper에 input으로 사용된 distance metric으로는 L2-distance를 사용했고, 클러스터링 알고리즘으로는 single-linkage dendrogram을 적용했다. 

분석 결과로 생성된 Topology of patient-patient networks에 여러 임상 변인들을 mapping해보니, 섬망의 하위 그룹이 2개 정도로 나눠지는 것을 발견했다. 하나의 섬망 그룹은 인지기능 평가지수가 낮으면서 수술시에 부분마취를 했던 환자그룹(G1)이고, 또 다른 섬망 그룹은 인지기능 평가점수는 보통이지만, 신경증 지수가 매우 높고, 성실성 점수가 낮으며 수술시에 전신마취를 했던 환자 그룹(G2)임을 밝혔다.

재미있는 것은 로지스틱 회귀 분석에서는 혈액내 단백질 총량이나 알부민 수치가 섬망의 위험인자가 아닌것으로 나타났지만, 이 두 변인을 Patient-patient network에 Mapping 했더니, 섬망이 발생한 그룹에도 단백질과 알부민 수치가 낮은 것으로 나타났다. 이 두 수치가 환자의 영양상태와 관련 있음 고려했을때, 수술 전에 환자의 영양 상태가 섬망 발생에 영향을 미칠 수 있음을 밝힌 셈이다. 이는 같은 데이터에 로지스텍 회귀분석을 적용했을때는 발견할 수 없던 결과로, TDA 연구의 중요성이 강조되는 부분이다.

본 연구는 2016년 11월에 BMC Psychiatry 학술지에 게제되었다.
저널 바로가기: https://bmcpsychiatry.biomedcentral.com/articles/10.1186/s12888-016-1079-z



신고

박사학위를 마친지 반년 정도가 지났다. 졸업한 연구실에서 1년 반 정도는 더 있을 수 있고, 그렇게 하기로 교수님과 약속을 한 상태이기 때문에 아직은 해외 포닥을 전투적으로 알아보고 있지는 않다. Job opening에 지원을 많이하더라도 인터뷰 까지 가는 경우가 많지는 않겠지만, 인터뷰에 합격하고 나면 대부분 4-5개월 이내에 일을 시작할 수 있는 포닥을 찾는 채용 공고가 많기 때문이다. 또, 아내와 만 2살이 안된 아이와 함께 외국에서 생활하는 것을 결심하는 것은 쉬운 일이 아닌것 같다. 여러 지인들은 "외국에 가게되면 살아지게 된다." 라며 응원해 주셨지만, 막상 제주도 갈때 말고는 비행기를 타본적이 없는 아내가 외국에서 두려움 없이 잘 생활할 수 있을 것인가? 는 조금 다른 문제 인것 같다는 생각을 하고 있었다.

그러던 중에 마침 기회가 좋아서 오스트리아 비엔나에서 열리는 Resting State Brain Connectivity 학회에 참석할 수 있었고, 짧은 기간이지만 아내에게 외국에서 생활을 체험시켜 주고 싶었다. 그래서 이번 출장은 "나의 학문적 발전" 과 "아내의 유럽생활 체험" 두가지 목표가 있었다. 첫번째 목표는 학회장에 열심히 출석해서 발표를 듣고 외국인들과 교류하는 것인데, 늘 해오던 것이라 문제 없고, 두번째 목표인 "아내의 유럽생활 체럼"을 위해서 1주일간 현지인처럼 살아보는 것을 목표로 했다. 그래서 숙소를 호텔이 아닌 도시 스타일 Flats으로 정했고, 근처에 전통시장에서 장도보고, 아침 식사는 매일 직접 해먹고 있다.

생각보다 전통시장의 (채소/과일 등) 물가는 서울 물가와 비슷했고 이정도면 포닥 월급으로도 3인 가족이 살아가는 것에는 크게 무리는 없어 보입니다. 학회 시작 3일 전에 비엔나에 도착해서 2일 정도 아내와 같이 시내 구경을 했다. 3일차 부터는 아내 혼자서 시내를 잘 돌아 다니고 비엔나에 잘 적응하는 것 같아 보였다. 이정도면 유럽권 국가에서 포닥을 한다면, 가족 모두가 잘 생활해 나갈 수 있지 않을까? 생각해 본다. 미국은 조금 다른 느낌이기에, 내년에 미국에서 출장이 있다면 체험삼아 함께 가보고 싶다.

숙소에서 직접 해먹는 식사는 2-3만원짜리 호텔식보다 훨씬 훌륭한것 같습니다.



신고
이 장소를 Daum지도에서 확인해보세요.
유럽 오스트리아 | 비엔나
도움말 Daum 지도

2009년에 폴란드 Krakow에서 열린 Europhysics 학회가 나의 첫 해외 학회였다.

첫 해외 학회를 동료없이 혼자 참석해서 그런지, 학회에 혼자 오는 것이 여럿이 함께하는 것보다 더욱 익숙하다. 물론 모두 함께 올때는 나름의 재미가 있다. 제네바에서 있었던 OHBM 학회가 그랬다.

여튼 2009년 첫 학회 부터 지금까지 야외 포스터 세션은 처음이다. 야외 포스터 세션은 아마도 비엔나 대학에서만 가능하지 않을까? 정말이지 낭만이 있는 포스터 세션이다. 포스터 보다가 지치면 앉아서 쉬기도 하고, 동료와 자연스럽게 복잡한 포스터 세션장으로부터 빠져나와 벤치에 앉아서 토의도 할 수 있고.


신고
이 장소를 Daum지도에서 확인해보세요.
유럽 오스트리아 | 비엔나
도움말 Daum 지도

아이를 키우는 것은 부모에게 많은 순간 기쁨이 되지만, 또 많은 순간 인내가 필요하기에 "양가적" 감정이 동반됩니다. 하지만, 누워만 있던 아이가 기어다니고, 일서서 걷고, 또 엄마 아빠가 말하는 것을 따라하기 시작하면 너무 신기하고 놀라는 일이 더욱 많아집니다.

저희 아가는 16~17?? 개월쯤부터 두글자로 이루어진 단어를 따라하기 시작하더니, 따라하는 단어의 숫자가 폭발적으로 증가하기 시작했습니다. 요즘(19개월)에는 두글자 단어를 최대한 아이의 눈높이에서 나열하는 것으로 간단한 의사소통이 될정도니, 얼마나 신기한지 모르겠어요.

가급적 아이와 몸으로 놀아주고 싶지만, 그러지 못하는 경우가 종종 있습니다. 뽀통령이라는 것이 그렇게 위대한 프로그램인지는 아기를 키워본 사람만 알 수 있습니다. 저희 아기는 뽀로로와 더불어, 타요와 로보카 폴리 도 즐겨 봅니다. 처음 동영상을 틀어줄때는 화려한 색상 때문인지 집중해서 보는듯 하더니만, 2-3분 정도 지나면 집중력이 쉽게 떨어지곤 하더라고요. 그래서 한동안 동영상을 잘 안보여줬답니다.

그런데 최근에 다시 동영상을 틀어달라고 하는 요구가 늘었기에, 뽀로로와 타요를 연속재생으로 틀어줬는데, 20분-30분 까지도 집중해서 보더라고요. 저는 동영상 틀어 놓고 딴일하기 바쁜데, 아이 엄마는 동영상 틀어주고, 동영상에 나오는 장면 하나하나를 새롭게 스토리 텔링하며 아이와 시간을 보내곤 합니다. 그러다보니, 동영상에 나오는 여러 물건들의 이름들을 익히는데도 많이 도움이 되고, 말도 더 빨리 느는것 같다는 생각이 들더라고요.

7-8월 (17-18개월)에는 여름이라 덥워서 그런지 아이가 기저귀를 착용하고 싶지 않다고 하는 날이 많았습니다. 그래서 집안 곳곳에 '쉬--'를 하고 물웅덩이를 만드는 날이 많아졌고, 이불 빨래 횟수가 기하급수적으로 늘게 되었습니다. 

아이가 동영상을 보며 집중하는 시간이 늘었기에, 동영상을 통해서 배변 훈련을 하면 어떨까? 싶어서 뽀로로가 등장하는 응가훈련 동영상을 몇번 틀어줬는데... 출근전에 10여번 반복해서 틀어줬는데, 이게 효과가 있긴 하더라고요. 하지만, 부작용도 있네요..ㅠㅠ

아래는 제가 출근한 이후에 아내가 보내준 카톡 메세지 입니다. ㅠㅠ


신고

Invited Talk

Invited Talks

  1. Sunghyon Kyeong, 'Voxel-based Lesion Symptom Mapping: Manual for iVLSM Matlab Toolbox', Kunkok University Hospital, October 14, 2016 pdf toolbox
  2. Sunghyon Kyeong, 'Basic concepts of phMRI: interpretation and pitfalls', Korean College of Neuropsychopharmacology, September 2, 2016
  3. Sunghyon Kyeong, 'Industrial Mathematics and Neuroscience', 9th Bigdata Machine Learning Meetup in Korea, August 29, 2016
  4. Sunghyon Kyeong, 'Topological Data analysis: methods and examples', 연세대학교 커뮤니케이션 연구소 / 연세대학교 커뮤니케이션대학원 BK21 플러스, 2015년 4월 3일 slideshare
  5. Sunghyon Kyeong, 'Resting State Functional Connectivity: Basics and Analysis Technique', 전북대학교 정신건강의학과, 2014년 10월 10일
  6. Sunghyon Kyeong, 'Resting State Functional Connectivity and Modular Organisations', 대한생물치료정신의학회, 2014년 8월 30일
  7. Sunghyon Kyeong, 'Topological Data Analysis', R Users Conference in Korea, Seoul L-Tower, May 30 2014 slideshare
  8. 경성현, '복잡계 네트워크와 데이터 과학: 서울 N버스 노선배치, 구글 독감 예측, 트위터에서 실시간 주제어 추출, 성격에 따른 뇌네트워크', 서라벌고등학교, 2013년 10월 18일
  9. Sunghyon Kyeong, 'Physics, brain, and network', Toinmo (study and discussion group for cognitive science), Sogang University, March 17 2012 slideshare
  10. Sunghyon Kyeong, 'Neuroscience Primer for the Particle Physicists', International Conference on Particle Physics, Yong-Pyong, Korea, February 20-23 2011
  11. Sunghyon Kyeong, 'Neuroscience - from detector systems and to neural data analysis', Department of Physics, Yonsei University, October 2010


신고

'Invited Talk' 카테고리의 다른 글

Invited Talk  (0) 2016.08.23

Personal Information 

  • Name:          Kyeong, Sunghyon 
  • Nationality:    Republic of Korea 
  • Email:           sunghyon.kyeong@gmail.com 

Current Position 
  • Postdoctoral Fellow (March 2016 ~ Now) 
    Severance Biomedical Science Institute, 
    Yonsei University College of Medicine, 
    Seoul, Republic of Korea 

Research Interests 
  • Multimodal neuroimaging, heart rate variability, and medical data analysis
  • Data Analytics using Topological Data Analysis (TDA) and Graph Theoretical Approaches
  • Developing the classification and clustering using supervised and unsupervised methods
  • Twitter Data Crawling and Analysis
  • Life is short, use Python
  • Matlab / C&C++ / MongoDB

Media Interviews 
  • 뇌 영상으로 진단하는 ADHD, <의학채널 비온뒤>(2016.04.05) link
  • 애매한 과잉행동장애 ADHD, 수학 모델로 진단, <YTN science>(2016.04.07) link

Education 
  • Ph D. in Neuroscience (February 2016) 
    Yonsei University College of Medicine, Seoul, Korea 
    Thesis title: Complex network analysis and topology-based data analysis for identifying risk factors of delirium [pdf]
  • Master's Degree in Physics (August 2009)
    Yonsei University, Seoul, Korea 
    Thesis title: Observation of $B^0 \to \rho^0 K^+ \pi^-$ and Measurement of Charmless Hadronic $b \to s$ Penguin Decays in the $\pi^+ \pi^- K^+ \pi^-$ Final State [pdf]
  • Bachelor's Degree in Physics (February 2007)
    Yonsei University, Seoul, Korea 


Research Experience 
  • National Institute for Mathematical Sciences (2011-2014): measuring complex network properties from functional and structural neuroimaging data. Topology-based data analysis.
  • MoNET (2009-2011):(TMS study), Motor functional recovery study for stroke patient before/after repetitive transcranial magnetic stimulation (rTMS). (Neurointervention project), intensive C/C++ programming to develop MRI-computer interface module.
  • The Belle Collaboration (2007-2009): C/C++ programming to reconstruct the decay $B^0 \to \rho^0 K^{*0}$ and upgrading work for Belle data acquisition (DAQ) module.


단편영화 조연 <난시, 2001>

---------------------------------------- 
        Full CV download: PDF 
----------------------------------------


신고

'About' 카테고리의 다른 글

Sunghyon Kyeong CV (Curriculum Vitae)  (0) 2015.11.15

Publications

Publications



Publications in Neuroscience
(*: corresponding author, †: first or equally contributed author)
  1. Sunghyon Kyeonget al., Genomic characterization of breast cancer reveals different spatial distribution of brain metastasis, in preparation.
  2. Sunghyon Kyeong, Jae-Jin Kim, Eunjoo Kim, Novel subgroups of attention-deficit/hyperactivity disorder identified by topological data analysis and their functional network modular organizations, in preparation.
  3. Sunghyon KyeongJung Eun Shin, et al., Can preoperative neuroimaging assessments predict the severity of postoperative delirium?, submitted.
  4. J-C Kim and Sunghyon Kyeong*, Reliable new measures capturing low-frequency fluctuations from resting-state functional magnetic resonance imaging, submitted.
  5. Sunghyon Kyeong, Joohan Kim, et al., Alteration in neural network functional connectivity and brain-heart coupling during  and after the gratitude meditation, submitted.
  6. Yu-Bin Shin, Sunghyon Kyeonget al., A distinct role of the precuneus in the representation of future selves, submitted.
  7. Sunyoung Park, Kiwan Han, Jung Eun Shin, Sunghyon Kyeong, et al., Neural basis of cultural differences in the effects of intimacy and social hierarchy on social decision-making, submitted.
  8. Soo-Hee Choi, Sunghyon Kyeong, et al., Brain network characteristics separating individuals at clinical high risk for psychosis into normality or psychosis, submitted.
  9. Sunghyon Kyeong, Soo-Hee Choi, et al., Functional connectivity of the circadian clock and neural substrates of sleep-wake disturbance in delirium, in revision.
  10. Hea Eun Yang†, Sunghyon Kyeong, et al., Structural and functional improvements due to robot-assisted gait training in the stroke-injured brain, Neuroscience Letters 637:114-119 (2017) link
  11. Sung Jun Ahn, Sunghyon Kyeong, et al., What is the impact of child abuse on gray matter abnormalities in individuals with major depressive disorder: a case control study, BMC Psychiatry 16:397 (2016) link
  12. Jung Eun Shin, Sunghyon Kyeonget al., A personality trait contributes to the occurrence of postoperative delirium: a propective study, BMC Psychiatry 16:371 (2016) link
  13. Dae Hyun Kim, Sunghyon Kyeong, et al., Usefulness of voxel-based lesion mapping for predicting motor recovery in subjects with basal ganglia hemorrhage, Medicine 95(23): e3838 (2016) link
  14. Jung Min Lee†, Sunghyon Kyeong, Eunjoo Kim and Keun-Ah Cheon, Abnormalities of inter- and intrahemispheric functional connectivity in Autism Spectrum Disorders: A study using the Autism Brain Imaging Data Exchange database, Frontiers in Neuroscience 10: 191 (2016) link
  15. Eunjoo Kim, Sunghyon Kyeong, et al., Neural responses to affective and cognitive theory of mind in children and adolescents with autism spectrum disorder, Neuroscience Letters 621: 117-125 (2016) link
  16. Eun Joo Kim, Sunghyon Kyeong, et al., Happier people show greater neural connectivity during negative self-referential processing, PLoS One 11(2): e0149554 (2016) link
  17. Sunghyon Kyeong, Seonjeong Park, et al., A New Approach to Investigate the Association between Brain Functional Connectivity and Disease Characteristics of Attention-Deficit/Hyperactivity Disorder: Topological Neuroimaging Data Analysis, PLoS One 10(9): e0137296 (2015) link
  18. Sunghyon Kyeong, Eunjoo Kim, Hae-Jeong Park, Dong-Uk Hwang, Functional network organizations of two contrasting temperament groups in dimensions of novelty seeking and harm avoidance, Brain Research 1575: 33-44 (2014journal slideshare
  19. Sera Park, Hae-Jung Park, Sung-Hyon Kyeong, et al., Combined rTMS to the auditory cortex and prefrontal cortex for tinnitus control in patients with depression: a pilot study, Acta Oto-Laryngologia 113(6): 600-606 (2013) link
  20. Byung-Hoon Kim, Yu-Bin Shin, Sunghyon Kyeong, et al., Characteristics of Ambivalence of Self-image in Patients with Schizophrenia, (domestic journal) Korean J Schizophr Res 19(1): 5-9 (2016) link
  21. Jae-Chang Kim, Sunghyon Kyeong, et al., A System for Concurrent TMS-fMRI and Evaluation of Imaging Effects, (domestic journal) Journal of the Korean Society of Magnetic Resonance in Medicine, KJSMRM 17(3): 169-180 (2013) link

Conference Proceedings (Full Papers)
(*: corresponding author, †: first or equally contributed author)
  1. Hwi-Gang Kim, Seongjoo Lee, Sunghyon Kyeong*, Discovering Hot Topics using Twitter Streaming Data: social topic detection and geographic clustering, Proceedings of the 2013 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining, ISBN-978-1-4503-2240-9, ACM 2013, Niagara, Canada. link slideshare
  2. S.-H. Kyeong† (on behalf of Belle Collaboration), '$ b\to s $ Hadronic Decays at Belle', Proceedings of the International Europhysics Conference on High Energy Physics, Krakow, Poland, July 2009 link


Publications in High Energy Physics
(*: corresponding author, †: first or equally contributed author)
  1. S.-H. Kyeonget al. (Belle Collaboration), Measurements of charmless hadronic $b\to s $ penguin decays in the $\pi^+ \pi^- K^+ \pi^-$ final state and first observation of$B^0 \to \rho^0 K^+ \pi^-$, Phys. Rev. D 80 051103(R) (2009)
  2. O. Seon et al. (Belle Collaboration), Search for Lepton-number violating $B^+ \to D^- \ell^+ \ell'^-$ Decays, Phys. Rev. D 84 071106 (2011)
  3. A. Vinokurova et al. (Belle Collaboration), Study of $B^\pm \to K^\pm (K_S K\pi)^0$ decay and determination of $\eta_c$ and $\eta_c(2S)$ parameters, Phys. Lett. B 706 139-149 (2011)
  4. S. Bahinipati et al. (Belle Collaboration), Measurements of time-dependent CP asymmetries in $B \to D^{*\mp} \pi^\pm $ decays using a partial reconstruction technique, Phys. Rev. D 84 021101 (2011)
  5. B.R. Ko et al. (Belle Collaboration), Search for $CP$ Violation in the Decays $D^0 \to K^0_S P^0$, Phys. Rev. Lett. 106, 211801 (2011)
  6. M. Bischofberger et al. (Belle Collaboration), Search for CP violation in $\tau \to K^0_S \pi \nu_\tau$ decays at Belle, Phys. Rev. Lett. 107, 13108 (2011)
  7. Y. Miyazaki et al. (Belle Collaboration), Search for Lepton-Flavor-Violating tau Decays into a Lepton and a Vector Meson, Phys. Lett. B 699, 251-257 (2011)
  8. H. Ha et al. (Belle Collaboration), Measurement of the decay $B^0\to \pi^- \ell^+\nu$ and determination of $|V_{ub}|$, Phys. Rev. D 83 071101 (2011)
  9. T. Aushev et al. (Belle Collaboration), Study of the decays $B\to D_{s1}(2536)^+ \bar{D}^{(*)}$, Phys. Rev. D 83 051102 (2011)
  10. H. Guler et al. (Belle Collaboration), Study of the $K^+\pi^+\pi^-$ final state in $B^+\to J/\psi K^+\pi^+\pi^-$ and $B^+ \to \psi' K^+\pi^+\pi^-$, Phys. Rev. D 83 032005 (2011)
  11. G. Pakhlova et al. (Belle Collaboration), Measurement of $e^+e^- \to D^{(*)+}_s D^{(*)-}_s$ cross section near thresholding using initial state radiation, Phys. Rev. D 83 011101 (2011)
  12. W. Dungel et al. (Belle Collaboration), Measurement of the form factors of the decay $B^0 \to D^{*-} \ell^+ \nu_\ell$ and determination of the CKM matrix element $|V_{cb}|$, Phys. Rev. D 82 112007 (2010)
  13. S. Uehara et al. (Belle Collaboration), Measurement of $\eta\eta$ production in two-photon collisions, Phys. Rev. D 82 114031 (2010)
  14. K. Sakai et al. (Belle Collaboration), Search for $CP$-violating charge asymmetry in $B^{\pm}\to J/\psi K^\pm$ decays, Phys. Rev. D 82 091104 (2010)
  15. S. Esen et al. (Belle Collaboration), Observation of $B^0_s \to D^{(*)+}_S D^{(*)-}_S$ Using $e^+e^-$ Collisions and a Determination of the $B_s-\bar{B}_s$ Width Difference $\Delta\Gamma_S$, Phys. Rev. Lett. 105 201802 (2010)
  16. K. Nishimura et al. (Belle Collaboration), First Measurement of Inclusive $B\to X_s \eta$ Decays, Phys. Rev. Lett. 105 191803 (2010)
  17. Y. Nakahama et al. (Belle Collaboration), Measurement of $CP$ violating asymmetries in $B^0 \to K^+ K^- K^0_S$ decays with a time-dependent Dalitz approach, Phys. Rev. D 82 073011 (2010)
  18. C.-C. Peng et al. (Belle Collaboration), Search for $B^0_S \to h h$ decays at the $\Upsilon(5S)$ resonance, Phys. Rev. D 82 072007 (2010)
  19. K. Hara et al. (Belle Collaboration), Evidence for $B^- \to \tau^- \bar{nu}_\tau$ with a semileptonic tagging method, Phys. Rev. D 82 071101 (2010)
  20. Bozek et al. (Belle Collaboration), Observation of $B^+\to \bar{D}^{*0}\tau^+\nu_\tau$ and evidence for $B^+\to \bar{D}^0 \tau^+\nu_tau$ at Belle, Phys. Rev. D 82 072005 (2010)


신고

'Publications' 카테고리의 다른 글

Publications  (0) 2015.11.15

토폴로지 데이터 분석은 다양한 분야에서 거대하고 복잡한 데이터로부터 의미있는 정보를 추출하는데 활용된 사례가 많이 있다. 많은 연구자들이 토폴로지 데이터 분석이 어떻게 작동하는지 원리를 알지 못한체 사용하는 사례가 많이 있기 때문에, 이번 포스팅에서는 토폴로지 분석이 왜 데이터 분석에서 효과적인 방법론인지에 대해 설명하고자 한다.

토폴로지 데이터 분석을 둘러싼 한가지 중요한 메세지는 데이터는 모양Shape을 갖고 있고, 그 모양이 우리에게 새로운 통찰을 줄 수 있다는 것이다. 분석을 통해서 완전히 새로운 메세지가 나타났다고 해도, 사실은 우리가 잘 알고 있는 것을 설명하는 것인 경우가 종종 있다.

토폴로지 데이터 분석에 대한 방법을 이야기 하기 전에 몇가지 서로 다른 형태의 데이터 분포에 대해서 이야기 하고자 한다. 위에 제시된 그림 중 제일 왼쪽에 보여지는 데이터는 직선 모양으로 대표될 수 있다. 이러한 데이터는 보통 선형회귀 분석을 통해서 데이터의 기울기를 찾을 수 있다. Fitting을 통해서 1차방정식의 계수를 구한다면, 데이터에 대해서 충분히 이해했다고 할 수 있을것이다. 두번째로 보여지는 데이터는 세개의 덩어리로 나뉘어진 데이터이다. 이러한 데이터는 1차 선형 방적식으로 설명할수는 없고, 최소 3개의 선형 방정식이 있어야 세개의 덩어리를 구분할 수 있을것이다. 두번째 예제에서는 데이터가 세군데의 서로 다른 곳을 중심으로 클러스터를 이루고 있기 때문에 평면에서 세개의 point cloud가 하나의 직선으로 대표될 수 없음을 쉽게 알 수 있다. 이러한 데이터를 보는 순간 사람들을 모양이 없는 데이터로군! 이라고 생각할 수도 있겠지만, 곧이어 '아! 이 데이터는 세개의 클러스터로 나눌 수 있겠군.' 이라고 생각할 것이다.  

세번째로 원형 모양의 데이터 분포를 생각해 보자. 이 데이터는 가운데 구멍이 뚤려 있는 원형 방정식으로 표현하면 가장 적절할 것이다. 직선 방정식으로 원형 모양의 데이터를 설명하고 싶은 사람은 없을 테니까. 마지막으로 데이터가 Y-모양 처럼 생겼다고 가정하면, 어떻게 할것인가? 이러한 데이터는 직선 방정식으로 표현할 수도 없고, 여러개의 덩어리 형태로 표현하기도 어려울 것이다. 그럼 어떻게 Y-모양 데이터를 설명할 수 있을까? 또는 하나의 방법으로 다양한 형태의 모양을 가진 데이터를 표현할 수 있는 방법은 없을까? 토폴로지 데이터 분석 기법에서 그 해답을 찾을 수 있을 것이다.

토폴로지 데이터 분석은 2007년에 스탠포트 대학교의 계산공학을 전공하는 Gurgeet Singh 박사과정 학생과 위상수학을 전공하는 Gunnar Carlsson 교수에 의해서 방법론이 세상에 처음 소개 되었다 (논문: Topological Methods for the Analysis of High Dimensional Data Sets and 3D Object Recognition). 이후 2011년도에는 스탠포드대학의 Monica Nicolau와 Gunnar Carlsson 교수는 토폴로지 데이터 분석 기법을 이용하여 유방암 환자의 Microarray 데이터를 분석했고, 유방암의 subgroups을 찾아내는데 성공했다 (논문: Topology based data analysis identifies a subgroup of breast cancers with a unique mutational profile and excellent survival).

논문이 소개된 년도를 보면 알겠지만, 수학의 토폴로지가 데이터 분석에 활용되기 시작한것이 2010년 쯔음이고, 데이터로부터 가치를 창출하는 것은 학계와 기업에 많은 관심과 수요가 예상되는 부분이다. 토폴로지 데이터 분석은 기계학습 방법론 측면에서 보면 비지도 기계학습 (unsupervised machine learning)에 해당되고, 보다 구체적으로는 "Partial Clustering"이라고 하는게 더욱 정확할 것이다.

토폴로지 데이터 분석은 크게 네 단계로 나눌 수 있다. 첫번째는 필터 함수를 구성하는 것이다. 필터 함수의 역할은 고차원의 데이터의 모양을 가장 잘 표현할 수 있도록 데이터를 Projection하기 위함이라고 할 수 있다. 위의 예제 그림에서는 Y축의 좌표값을 return하도록 필터 함수를 구성하면, Y-모양의 데이터 분포의 토폴로지를 가장 잘 추출할 수 있을 것이다. 두번째는 거리 함수를 정의하는 것이다. 고차원의 데이터가 필터함수를 통해서 하나의 값으로 요약되고 나면, 필터 값을 기준으로 데이터를 구획화 하게 되고, 구획화된 데이터 값들 간의 거리를 계산하게 된다. 거리 함수를 정의하는 방법도 여러가지가 있겠지만, 가장 많이 사용되는 거리함수는 유클리디언 거리 함수 있다. 세번째로 클러스터링 방법이다. 필터값에 따라서 데이터를 구획화 하고, 구획화된 데이터 값들 간에 거리를 구하고 나면, 이후에는 데이터 값들간의 거리를 기준으로 클러스터링을 지행하게 된다. 해당 필터 구간내에 몇개의 데이터들이 서로서로 모여 있는지, 아니면 2~3개의 덩어리로 서로 뭉쳐 있는지 등이 클러스터링을 통해서 계산되게 된다. 마지막으로 데이터를 시각화가 필요하다. 데이터 포인트로부터 결과로 생성된 simplicial complex를 그래프의 형태로 표현하고 나면 위의 그림에서 (C)의 형태가 되는데, 그래프에서 각 노드Node는 Cluster이고, 선Edge는 클러스터간의 교집합이 존재함을 표현한다. 마지막으로 노드의 색은 관심있는 값을 표현하게 되는데, 위의 예제에서는 각 노드 내의 데이터 값이 같는 필터 값의 평균을 표현했다. 

토폴로지 데이터 분석은 다양한 분야의 데이터 분석에서 많이 활용되고 있고, 토폴로지 데이터 분석이 각광받고 있는 이유는 기존의 클러스터링 방법으로는 찾지 못하는 "데이터 내의 특이한 subgroups"을 잘 추출하는데 있다. P.Y. Lum은 미국 NBA 농구선수들의 분당 리바운드, 슈팅, 피스, 파울 등의 수치 값들을 이용해서 토폴로지 데이터 분석을 시행했더니, 기존에 잘 알려진 공격형, 수비형 선수를 구분해 냈을 뿐만이 아니라 All star players들도 하나의 subgroup으로 검출해 냈다. 이는 기존의 고전적 비지도학습 방법으로는 확인할 수 없덨던 결과이다 (논문: Extracting insights from the shape of complex data using topology).

마지막으로 토폴로지 데이터 분석이 뇌영상 데이터 분석에도 적용한 연구도 있다. S. Kyeong은 토폴로지 데이터 분석을 뇌영상 데이터 분석에 적용하여 정상군과 환자군을 구분해 내는데 성공했다. 연구 초기의 목표는 토폴로지 데이터 분석으로 주의력결핍/과잉행동 장애 환자의 아형을 구분해 내는 것 이었는데, 실제 데이터 분석에서는 아형을 구분해 내지는 못했다. 연구 결과는 PLoS One에 게제되었다 (논문: A New Approach to Investigate the Association between Brain Functional Connectivity and Disease Characteristics of Attention-Deficit/Hyperactivity Disorder: Topological Neuroimaging Data Analysis). 본 연구는 뇌영상 데이터를 분석하는데 토폴로지 데이터 분석 기법을 처음으로 제기 했다는데 큰 의미가 있다.

신고

경규빈 타임라인

신고

MATLAB을 이용하여 뇌영상 데이터를 분석하다 보면, 뇌영역에 해당되는 부분의 마스크Mask를 만들어야 하는 경우가 있습니다. 이러한 경우에는 뇌영상 데이터 분석 - Matlab Index scheme 강의에서 처럼 MATLAB의 index 기능을 이용하면 회색질, 백색질, 뇌척수액 등에 해당되는 뇌 영역을 indices 값을 얻을 수 있고, 각각의 인덱스 값의 합집합을 이용하면 전체 뇌영역에 해당되는 마스크Mask를 얻을 수 있습니다.

위에 그림은 회색질(Grey Matter, GM), 백질(White Matter, WM), 뇌척수액(Cerebro-spinal Fluid, CSF)의 3차원 공간에서의 확률 분포를 보여주고 있습니다. 각각의 영상은 SPM (Statistical Parametric Mapping)을 설치하면 자동으로 설치되는 영상파일 입니다.

이제 다음의 MATLAB 명령어를 통해서 뇌마스크(Brain Mask)를 만들어 보겠습니다. 다음과 같이 한줄씩 MATLAB 명령창(Command Window)에 입력해 보시면서, 각각의 명령어가 의미하는바가 무엇인지 결과를 확인해 보시면 많은 공부가 될것 같습니다. 

>> % Specify file path >> fn_GM = fullfile(spm('dir'),'tpm', 'grey.nii'); >> fn_WM = fullfile(spm('dir'), 'tpm', 'white.nii'); >> fn_CSF = fullfile(spm('dir'), 'tpm', 'csf.nii'); >> >> % read volume header information >> vo_GM = spm_vol(fn_GM); >> vo_WM = spm_vol(fn_WM); >> vo_CSF = spm_vol(fn_CSF); >> >> % read 3D volume image data >> GM = spm_read_vols(vo_GM); >> WM = spm_read_vols(vo_WM); >> CSF = spm_read_vols(vo_CSF); >> >> % find indices of brain matter mask (idbrainmask) >> idx_gm = find(GM>0.5); % GM mask with Prob(GM>0.5); >> idx_wm = find(WM>0.5); % WM mask with Prob(WM>0.5); >> idx_csf = find(CSF>0.5); % CSF mask with Prob(CSF>0.5); >> >> % Set operation to compute union of two indices >> idbrainmask = union(idx_gm, idx_wm); >> idbrainmask = union(idbrainmask, idx_csf); >> >> % Fill ones for ROI >> IMG = zeros(size(GM)); % create zeros matrix >> IMG(idbrainmask) = 1; >> >> % Write 3D image >> vout = vo_GM; % copy header information >> vout.fname = 'brainmask.nii'; >> spm_write_vol(vout,IMG);

ex1.m

위의 프로그램을 실행하기 위해서는 확률맵(grey.nii, white.nii, csf.nii)이 필요한데, 이 파일들은 위에 설명되어 있듯이 SPM을 설치하고 MATLAB에서 Set Path로 SPM의 경로를 설정해 주어야 접근 가능한 파일들입니다.

신고