본문 바로가기
데이터과학/데이터 분석 실습

Voxel size determination through the MonteCarlo Simulation in AFNI

by 경성현 2015. 1. 7.

뇌영상을 이용한 뇌과학 연구는 대부분 다음과 같은 질문에 답하는 것이다.

  • 3차원의 뇌에 어떤 영역이 활성화 되었는지?  
  • 특정 영역의 시계열 데이터와 상관성이 높게 나오는 뇌영역은 어디인지? 

생물정보학에서 다루는 Microarray 데이터도 마찬가지 이지만, 뇌영상 데이터도 multiple comparison에서 발생하는 false positive를 조절하는 방법에 대해서다양한 해법들이 있다. 가령, false discovery rate (FDR) 또는 family-wire error rate (FWE) 등이 전통적으로 가장 많이 이용되어 왔던 multiple comparison correction 방법들이다. 

뇌영상 데이터는 특정 복셀에서 통계적으로 유의미한 차이를 보인다고 했을때 "아, 이 볼셀에서 통계적으로 유의미 하니까 해당 영역이 중요하겠네!" 라고 생각하면 안된다. 뇌는 인접한 뇌영역들 같이 비슷한 역할을 하는 뉴런들이 있어서 특정 복셀 1개만 통계적으로 유의미한 차이를 보이고, 인접한 영역에 있는 복셀들에서도 비슷한 양상이 보여야 한다. 전문 용어로 차이가 나는 영역 덩어리 (continuous voxel size)가 얼만큼 큰지?의 여부에 따라서 해당 영역이 false positive인지를 판별해야 한다. 최근 뇌영상 연구에서는 multiple comparison correction을 하지 않은 분석 결과는 좋은 저널에 출판하기 어려울 것이다. 

뇌영상 연구의 Multiple comparison에서 중요한 것은 다음의 두가지 질문일 것이다.

  • 각 복셀에서의 통계적 유의미성이 어느정도로 해야 하는지? (보통 뇌영상(fMRI or MRI) 분석에서는 p<0.005 or p<0.001을 많이 사용) 
  • 해당 threshold에서 덩어리져 있는 영역-덩어리를 찾아야 할텐데, 덩어리(or continuous voxel size)의 크기는 얼만큼이 적당한지?  

위의 질문은 MonteCarlo (MC) simulation을 통해서 할 수 있는데, SPM with REST toolbox와 AFNI의 AlphaSim을 통해서 시뮬레이션이 가능하다. MC simulation을 위해서는 여러가지 파라미터가 필요한데, 각각의 파라미터의 이름은 프로그램마다 조금씩 다르지만, 대략적으로 다음과 같은 의미를 가진다고 할 수 있다.

  • mask: MC simulation을 하는 voxel size, image dimension, and brain boundary 등의 정보를 담고 있음.
  • rmm: 얼만큼 떨어져 있는 복셀을 인접한 복셀로 볼 것인지? 볼셀의 중심과 중심의 거리
  • NN: nearest neighbor를 어떻게 정의할 것인지?  가령, 각각의 볼셀이 6면체로 되어 있는데 복셀의 face가 붙어 있는 것을 연결된 복셀로 볼 것인지? edge가 붙어 있는 것을 연속적으로 연결된 복셀로 볼것인지? 아니면 corner가 붙어 있는 것을 연속적으로 연결된 볼셀로 볼 것인지? 의 여부를 결정할 수 있다.
  • FWHM: 이것은 결과 데이터의 smoothness를 의미함. 단순히 smoothing kernel의 FWHM 값을 입력하면 안되고, AFNI나 SPM의 smoothness estimation 방법을 통해서 계산한 결과 값을 입력해야 한다. smoothness estimation을 다룬 포스팅을 확인하기.