본문 바로가기
데이터과학/데이터 분석 실습

Contrasts in Neuroimaging Data Anlaysis

by 경성현 2015. 3. 15.

SPM 등의 뇌영상 데이터 분석 툴을 이용한 뇌영상 데이터의 분석은 기본적으로 각 복셀의 영상에 할당된 데이터 값을 일반 선형 모델 (General Linear Model, GLM)을 이용하여 모델링하고, 실제 데이터와 모델이 얼마나 잘 맞는지 통계적으로 테스트 하는 것이다. 특정 복셀 $i$에 대해서 $Y_{i} = XB_i + E_i$로 모델링 했을때 $X$는 디자인 행렬이되고, 벡터 $B_i$는 분석을 통해서 추정되는 파라미터이며, $E_i$는 에러를 의미한다. 이때 contrast는 $c'B$를 통해서 계산된다. 뇌영상 데이터에서 $c$는 보통 행벡터(column vector)를 의미하고, $c$를 통해서 다양한 contrasts로 결과를 확인할 수 있다. 

벡터 $c$는 contrasts의 가중치를 의미하고, 확인하고자 하는 대부분의 contrast의 Null hypothesis는 $c'B=0$이다. 구체적으로 contrast 가중치를 구성하는 방법에 대해서 다음의 예를 통해서 설명하고자 한다.

위 그림과 같이 세 그룹에 대한 데이터가 있을때, 가장 먼저 생각해 볼 수 있는 통계 분석은 일원분산분석(Analysis of variance, ANOVA)이고 이때의 contrast는 F-contrast로 세 그룹 중 발생할 수 모든 차이를 보고자 할때는 다음과 같은 방법으로 만들 수 있다.

또는 결과는 동일하지만 다른 방법으로 표현하고 싶다면, 다음과 같은 방법도 가능하다.

이제 각 그룹간 차이를 보고자 한다면, 다음과 같은 방법으로 분석이 가능하다. 하지만 분석의 초점이 ANOVA에서 그룹간 차이가 나는 영역을 찾고 해당 영역 내에서 세 그룹간 값이 어떻게 되는지 통계적으로 분석하는 것이 목표라면, F-contrast의 결과로 나온 영역에 대해서 평균 Beta 값을 추출해서 SPSS 등에서 post-hoc 분석을 진행하는 것이 옳다. MATLAB에서 post-hoc 분석이 가능하다면 말리지는 않겠다. SPM에서 T-contrast는 다음과 같은 방법으로 만들 수 있다.

  • -1    1    0:  spm{T} contrast for sample2 > sample1

  •  1     0   -1:  spm{T} contrast for sample1 > sample3

  •  2   -1   -1:  spm{T} contrast for sample1 > (sample2 + sample3)

이제 confounding effect를 제어한 후에 그룹간 차이를 비교하는 분석을 생각해 보자. 이러한 분석을 공변량분석 (Analysis of Covariance, ANCOVA) 이라 불린다. 다음과 같은 데이터가 있다고 가정해 보자.


이제 공변량(covariate1)의 효과를 제거한 후에 두 그룹간의 차이를 비교하는 F-contrast를 생각해 보다. 다음과 같은 spm{F} contrast를 통해서 sample1과 sample2 간의 값의 차이를 비교할 수 있다.