저작권 정보: Jang, Y. H., Kim, J., Kim, S., Lee, K., Na, J. Y., Ahn, J. H., ... & Lee, H. J. (2022). Abnormal thalamocortical connectivity of preterm infants with elevated thyroid stimulating hormone identified with diffusion tensor imaging. Scientific Reports, 12(1), 1-11.

해당 저널은 Open access임을 사전에 밝힙니다.


한양대학교 소아과 이현주 교수 연구팀 논문

개요

갑상선 호르몬은 태아부터 출생 후 2-3년동안 뇌 발달에 필수적인 역할을 수행합니다.
조산의 갑상선 기능 장애의 원인은 아래와 같이 설명됩니다.

  • 시상하부-뇌하수체-갑상선의 미성숙
  • 갑상선 호르몬 합성과 대사의 손상
  • 비갑상선 질환으로 인한 갑상선 호르몬 분비 증가
  • 약물 투여

많은 연구들은 미숙아에서 특히 선천성 갑상선 기능 저하증(Congenital Hypothyroidism; CH)는 후기 신경발달장애의 원인이 될 수 있음을 밝혔습니다. CH의 임상 양상은 아래와 같이 표현됩니다.

  • 발달지연
  • 청력
  • 언어
  • 자발적 운동 활동
  • 곁눈질
  • 등의 신경학적 문제와 관련이 있습니다.

신생아 갑상선 검사 및 진단 기준

신생아 갑상선 검사는 출생 첫 주 갑상선 자극 호르몬(Thyroid-Stimulating-Hormone; TSH)와 유리 티록신( free Thyroxine; fT4)을 사용하여 수행됩니다.
여기서 조산아의 경우에는 첫 번째 선별검사에서 놓치 TSH 수치의 지연된 상승의 발생률이 높습니다. 그렇기 때문에 미숙아의 경우에는 TSH의 지연된 상승이 뇌 발달에 유의한 영향을 끼칠 수 있기 때문에 반복 검진을 강력하게 권고합니다.

지속적인 선별검사와 함께 신생아 갑상선 호르몬 검진의 TSH 절단 값 또한 신경 발달 장애를 예방하고 최적의 발달을 이루기 위해 고려되어야 합니다.
치료 기준

  • 갑상선 기능 검사 $20mU/L$ 이상의 TSH 수준을 보이거나/보이면서 낮은 fT4 농도를 기반으로 합니다.

하지만,

  • TSH 수치가 $6$~$20mU/L$의 경우에는 치료 결정에 충분한 논의가 필요합니다.
  • 그래서 많은 임상가들은 조산과 만삭 등가 연령(Term-equivalent age; TEA; 정상 출생 40주를 의미합니다.) 사이에 TSH 수치가 3-6주 이상 높게 유지될 경우 갑상샘 기능저하증의 약물요법으로 호르몬 제제인 levothyroxine을 처방합니다.

이렇듯 뚜렸한 진단 근거를 보이지는 않지만 뒤 늦게 급증하는 TSH와 같은 무증상 갑상선 기능 저하증(Subclinical Hypothyroidism; SH)은 신경 발달에 분명한 영향을 끼치고 후기 인지 기능 장애를 유발할 수 있습니다.
여기서 우리는 한가지 임상적 적용의 제한점을 제시합니다.

  • SH를 나타내는 초기 갑상선 기능 저하의 증상은 현저한 임상 증상으로 표현되지 않기 때문에 몇 주 안에 진단이 어렵습니다. 다시말하면, 미숙아에서 SH의 발병은 갑상선 기능 장애보다 먼저 발생합니다. 따라서 미숙아 신생아에서 SH의 합리적인 임상마커는 후기 신경발달을 예측하기 위해서 필요합니다.

우리는 SH의 합리적인 임상마커로 신생아 뇌 발달에 가장 중요한 지표중 하나인 시상 피질로(Thalamocortical pathway)의 발달을 탐구했습니다.
신생아 시기의 시상 피질로는 세계적인 학술지 Cerebral Cortex에서 메인 토픽으로 다룰 정도로 중요한 영역입니다.
시상 피질로에 대해 간략하게 설명해 드리면,

  •  피질로는 대뇌 깊숙히 위치한 감각의 중개소인 시상(Thalamus)에서 대뇌피질(Cortex)로 이어지는 거대한 트랙입니다.
  • 시상 피질로는 재태 연령 25주부터 TEA까지 빠르게 성장하여 기본적인 시각, 청각, 운동 및 체성감각 기능에 기여하는 주요 백질 조직입니다.
  • 조산 시기에 시상 피질로의 손상은 의식, 작업, 기억, 감각 전달, 집행 및 통제에 장애를 일으킬 수 있습니다.
  • 갑상선 자극 호르몬은 시상 피질로의 발달에 주축이 됩니다. 
    • 신경 이동, 신경교 세포의 증식, 시냅스 형성, 축삭 및 수상돌기 발다, 수초 형성
  • 조산 시기에 갑상선 호르몬 기능 장애는 시상 피질로의 미성숙을 유발하여 앞서 설명한 신경발달적 장애를 유발 할 수 있습니다.

시상 피질로; 출처, https://en.wikipedia.org/wiki/Internal_capsule


우리는 시상 피질로의 정량적 분석을 위해 뇌영상 분석을 진행하였습니다.
뇌영상 분석은 보다 정확한 지표를 추출하여 SH유발 이상을 조기에 예측할 수 있는 의미있는 바이오마커를 제공할 수 있습니다.


결과

결과에 앞서 연구 모델을 간략하게 기술하겠습니다.

  • 36명의 조산(갑상선 호르몬 기능 정상) vs. 29명의 조산(갑상선 호르몬 기능 장애)
  • MRI 진단 소견상 이상이 없으며, 다른 합병증을 통제한 조산 출생 아동을 대상으로 하여 오롯이 호르몬 기능 장애가 조산아의 뇌 발달에 미치는 영향을 연구했습니다.
  • CN: 조산 호르몬 정상군; SH: 조산 호르몬 비정상군

 

그림 1. 시상에서 뇌의 다양한 피질로 향하는 시상 피질로 길이의 두 집단 차이를 보여줍니다.
그림 2. 시상에서 뇌의 다양한 피질로 향하는 시상 피질로 길이의 두 집단 차이를 보여줍니다.

해석과 토의

  • 그림 1과 2는 두 집안의 시상 피질로의 길이 차이를 보여줍니다. 해당 그림은 모두 시상에서 출발하여 각 피질(초록색)로 향하는 백질을 노랑~빨강으로 보여줍니다. 
  • 갑상선 기능이 정상인 조산 아동에 비해서 갑상선 기능 장애가 있는 조산 아동은 위에 나온 모든 영역에서 유의하게 저하된 뇌 섬유 길이를 나타냅니다. 
    • SH가 있는 조산아의 전두엽, 측두엽 및 후두엽에서 시상 피질로의 섬유의 발달이 지연되었음을 나타내고, 위에서 설명하였듯이 비정상적인 백질 수초화 및 손상된 피질 성장을 반영합니다.
  • 측두엽 발달 지연
    • 이전 CH에 대한 연구에서는 특히 측두엽의 신경 세포 손실이 유아와 성인에서 피질이 얇아지는 현상으로 나타난다고 보고했습니다. 
    • 측두엽에서 섬유길이의 단축에 관한 우리의 결과는 피질이 얇아지는 것이 단축된 섬유와 양의 상관관계가 있다는 이전 연구로 뒷받침됩니다.
    • 측두엽은 신생아 발달에서 언어와 청각인지에 중요한 역할을 수행하기 때문에 해당 영역은 신경 발달을 모니터링하기 위한 민감한 마커가 될 수 있습니다.
  • 다른 영역의 발달 지연은 논쟁의 여지가 있어 추가 연구가 필요함을 밝힙니다.

결론

우리는 비침습적 DTI(MRI의 일종)을 사용하여 SH에서의 섬유 길이 감소를 밝혔으며, 이것이 조산아의 정상적인 발달을 위한 임상적으로 기능적이고 효율적인 치료를 지원할 수 있는 신뢰도 있는 이미징 바이오마커임을 암시합니다. 이전 연구에서 DTI를 통해 밝혀진 섬유의 이상은 조산아의 후기 정신, 인지, 언어 및 운동 기능과 양의 상관관계가 있기 때문에, 연속 갑상선 검사와 함께 DTI를 통한 섬유질 변화의 추적은 조산아가 갑상선 호르몬 치료를 받는 동안 대뇌 발달이 잘 이루어 지는지 확인할 수 있는 정량적 임상 바이오마커로 활용될 수 있습니다.


신생아 연구에서 신생아 연령에 대한 이해는 발육이 상당히 빠른 신생아 시기에 있어 중요한 변수로 작용할 수 있다. 

이에 따라 주산기 시기의 연령에 대해서 자세하게 정의하고자 한다.


 

Gestational age(재태 연령; GA)

권위있는 학회지 Pediatrics에서 2004년 신생아 연령에 대한 명확한 표기법을 발표하였다.

더불어, 연구에 있어 Newborn infants에서는 일반적으로 GA를 사용하는 것을 약속으로 하였다.

정의

  • 마지막 정상 월경 기간의 첫날과 분만일 사이의 경과 시간
  • 마지막 생리의 첫날은 배란 약 2주 전과 배반포 착상 약 3주 전에 발생한다.
    • 보조 생식 기술을 사용하여 임신한 경우 재태 연령은 수태 연령(착상)에 2주를 더하여 계산할 수 있다.

예시

  • 25주 5일 태아는 25주 태아로 간주된다.
    • 25주 5일 태아를 26주로 반올림 하는 것은 국제 규범에 위배된다.

Chronological age(postnatal age; CA)

정의

  • 출생 후 경과된 시간
  • 일반적으로 일, 주, 월, 년 단위로 설명된다.

Postmenstrual age(GA + CA; PMA)

정의

  • 마지막 월경 기간의 첫째 날과 출생 사이의 경과 시간
    • 재태 연령에 출생 후 경과 시간을 더한 것
  • MRI 연구에서 공변량으로 넣을 수 있는 Age at scan와 동의어이다.
  • 일반적으로 주수로 설명되며 출생 이후 주산기 기간(perinatal period)동안 가장 많이 활용된다.

예시

  • 태어난 지 10주된 재태연령 33주의 조산아는 PMA 43주이다.
  • 33주 1일 GA 유아는 10주 5일의 CA후 PMA 43주 6일이 된다. 

Corrected age(adjusted age)

정의

  • 임신 40주 이전에 태어난 주수 만큼 감소된 CA연령
    • 이 용어는 조산으로 태어난 3세 이하의 아동에게만 사용된다.
  • 주산기 신생아 입원 기간 동안 미숙아의 연령을 설명하기 위해서 PMA가 선호된다.
  • 주산기 이후에는 교정 연령을 선호한다.

연구에 활용할 때 주의점

  • 산과 정보의 차이와 재태 연령 추정 방법의 고유한 가변성(최대 2주)때문에 최상의 산과적 추정이 필요하다. 
  • 이것이 정확하지 않은 경우, 영아의 출생 후 신체 검사는 재태 연령을 결정하는 방법으로 사용될 수 있다.
  • 따라서 결과를 해석할 때 이러한 추정에 내재된 가변성을 고려할 수 있도록 재태연령을 결정하는 방법을 논문에 명시해야 할 수 있다.

Reference

https://doi.org/10.1542/peds.2004-1915

 


상관 분석에서 비모수적 순위 상관에 대해서 대표적으로 2가지 방법을 사용한다.

  • Kendall's Tau & Spearman (rho) Rank Correlation 

상관 분석에서 귀무가설은 "연구 중인 변수 간에 연관성이 없다."이다.

따라서 이 분석은 목적은 기본 변수에서 가능한 연관성을 조사하는 것이다. 

가끔씩 연구자들이 실수하는 부분이 있는데, 상관분석이 두 변수 간의 원인-결과를 설명한다고 생각한다.

원인-결과가 알고 싶다면, Linear regression을 하자.

 

 


돌아와서, 두 분석 방법의 일반적인 특징을 구분해 보자.

  1. Kendall's Tau
    • 일반적으로 Spearman의 rho correlation보다는 작은 값으로 나온다. 
    • 일치 (agreeable) 및 불일치 (non-agreeable) 쌍을 기반으로 계산을 하며, 오류에 둔감하다.
    • 적은 표본에 더 민감하기 때문에 p-value는 표본 크기가 작을수록 더 정확하다.
  2. Spearman's rho
    • 일반적으로 편차 (deviations)를 기반으로 한 계산으로 Kendall's Tau보다 큰 값을 갖는다. 
    • 데이터의 오류와 불일치에 더 민감하다.
    • $r_s$=$1-$($6∑d_i^2$ )/($n(n^2-1))$
      • 여기서 $d_i$는 특정 데이터의 각 항목에 대한 변수 값에 부여된 순위의 차이를 의미한다.

결론: 대부분의 상황에서 Kendall's Tau와 Spearman의 순위 상관 계수의 해석은 매우 유의하고, 비슷한 추론으로 이어지니 개인의 데이터 수를 고려하여 진행하자.


Reference.

https://www.statisticssolutions.com/free-resources/directory-of-statistical-analyses/kendalls-tau-and-spearmans-rank-correlation-coefficient/https://support.minitab.com/ko-kr/minitab/18/help-and-how-to/statistics/basic-statistics/supporting-topics/basics/linear-nonlinear-and-monotonic-relationships/

 

'통계 > 기초 통계' 카테고리의 다른 글

공분산분석 (ANCOVA)  (2) 2022.06.24
다중공선성 (Multicollinearity)  (0) 2022.06.17

공분산분석(analysis of covariance; ANCOVA)

공분산분석은 분산분석회귀분석이 결합된 형태의 분석법이다.

위 내용을 아래와 같이 구분하여 설명할 수 있다.

  1. 범주형 변수의 수준(level) 간에 종속변수의 평균에 차이가 존재하는가 를 분석한다 (ANOVA)?
  2. 여기에 종속변수에 영향을 미칠 것으로 판단되는 연속형 변수, 범주형 변수(공변량: covariate)의 효과를 동시에 고려하여 분석한다.
  3. 정리하면, 각 변수 안에서 공변량을 독립변수로 하는 회귀분석을 시행하고, 이것으로부터 얻어진 변수 간 회귀식을 분산분석한다. 

공분산분석의 목적

  • 공변량을 통제하여 독립변수의 순수한 영향을 검정하기 위함이다.
  • ANOVA에 통제할 수 없는 연속형 변수를 통제하여 오차를 줄이고 검정력을 높인다.

공분산분석 (출처: https://bioinformaticsandme.tistory.com/198); 주요 독립 변수를 중점으로 두고, 나머지 독립 변수를 공변량으로 분석할 수 있다.

 


공분산분석의 가정

정상출생아와 조산 출생아의 뇌 발달 차이를 검정하고자 할 때,

  • 가설: 두 그룹간 백질 성숙도의 차이가 있을 것이다.

여기에, 우리는 백질의 분획이방성(fractional anisotropy; FA)에 순수하게 조산 출생의 여부가 미치는 영향을 보고 싶다. 그렇지만, 종속변수인 FA에 신생아의 재태 기간(Gestational age; GA) 혹은 MRI를 찍은 주수(Age at MRI; 신생아 뇌 발달은 급격하게 이루어 지기 때문에 MRI를 찍은 주수가 백질 발달에 영향을 충분히 미칠 수 있다)에 따라 FA가 영향을 받을 수 있다. 그렇기 때문에 우리는 GA와  Age at MRI를 종속변수 FA에 영향을 미칠 것으로 판단하여 covariate로 지정할 수 있다.

 

우리는 성별과 Age at MRI가 두 그룹의 FA에 동일하게 영향을 미치는가에 대하여 질문할 수 있다.

여기서 공분산 분석을 위한 두가지 가설을 제시할 수 있다.

  • 가설 1: 종속변수에 미치는 공변량의 효과가 모두 동일해야 한다.
  • 가설 2: 공변량의 효과는 0이 아니어야 한다.

공변량이 2개인 경우에 3개의 독립 변수가 있고, 종속변수를 y, 공변량을 x라고 했을 때 데이터 형태를 아래와 같이 표현할 수 있다.

group1 group2 group(3) ...
$x_{11}$ $y_{11}$ $x_{21}$ $y_{21}$ $x_{31}$ $y_{31}$
$x_{12}$ $y_{12}$ $x_{22}$ $y_{22}$ $x_{32}$ $y_{32}$
$x_{13}$ $y_{13}$ $x_{23}$ $y_{23}$ $x_{33}$ $y_{33}$
: : : : : :
$x_{1n_1}$ $y_{1n_1}$ $x_{2n_2}$ $y_{2n_2}$ $x_{3n_3}$ $y_{3n_3}$

이 때 공분산모형은 다음 식과 같다.

$$y_{ij}=\mu+\alpha_i+\beta(x_{ij}-\bar x)+\epsilon_{ij}$$

$y_{ij}$: $i$번째 처리에서 $j$번째 개체의 반응 값

$x_{ij}$: 공변량

$\bar x$: 공변량 $x$의 전체 평균

$\mu$: 반응 변수 $y$의 전체 평균

$\alpha_i$: 변수의 효과

$\beta$: 모든 변수에 공통으로 작용하는 공변량의 효과

$\epsilon_{ij}$: 오차항


위에서 언급했던 가설 2개를 다시 한번 생각해보자. 수식으로 다시 설명해 볼 수 있는데,

  • 가설 1: 종속변수에 미치는 $\beta$의 효과가 모두 동일해야 한다.
    • 조산 출생이 백질 FA에 미치는 영향에 GA와 Age at MRI가 미치는 효과가 모두 같아야 한다.
  • 가설 2: $\beta$의 효과는 0이 아니다.
    • 이럴 경우는 ANOVA를 시행하면 된다.

One-way ANCOVA

일원공분산분석은 공변량이 하나일 경우 시행한다.

<예제 1>
발달중인 신생아 20명에 대해 조산 출생과 정상 출생의 영향을 비교하고자 신생아 20명을 조산출생과 정상출생으로 나누어(2 그룹) 백질 성숙도 지표인 FA$(y)$를 측정하였다. 추가로 GA$(x)$가 FA$(y)$ 값에 영향을 미칠 것이라고 생각하여 GA$(x)$ 값도 함께 측정하였다. 여기서 조산출생과 정상출생의 차이가 있는지 검정하라.

발달 중인 신생아 20명에 대한 조산군과 정상군(preterm, fullterm), GA$(x)$, FA$(y)$에 대한 데이터는 아래와 같다.

FA, fractional anisotropy; GA, gestational age; PMA, age at MRI; group1, preterm infants; group2, full-term infants.

공분산 분석을 진행하기에 앞서 HH, Car, lsmeans를 설치하자.

먼저, 각 군에서 공변량 효과가 동일하다는 공분산 분석의 첫 번째 가정을 검정해 보자.

먼저 options 함수로 그룹의 계수의 합이 0이 되도록 지정해 보자. 

options(contrasts=c("contr.sum","contr.poly"))

(해당 R 코드를 사용하는 이유에 대해서는 차후 설명하겠습니다.)

 

각 군에서 공변량 효과가 동일한지를 확인하기 위해서는 그룹과 GA간의 상호작용 효과(Interaction effect)를 확인해야 한다.

상호작용이 존재한다면, 그룹간의 회귀계수가 동일하지 않다라고 해석할 수 있고, 공분산분석이 바람직 하지 않음을 시사한다. 

model1 <- lm(`fa-value`~group*GA, data=FA)
Anova(model1, type="III")

Result
-------------------------------------------
Anova Table (Type III tests)

Response: fa-value
              Sum Sq Df F value Pr(>F)
(Intercept) 0.000416  1  0.1965 0.6635
group       0.003045  1  1.4370 0.2481
GA          0.003980  1  1.8782 0.1895
group:GA    0.003952  1  1.8650 0.1909
Residuals   0.033904 16 
-------------------------------------------

 

group:GA를 보면 상호작용에 대한 p값이 0.1909으로 유의수준 5%에서 유의하지 않음을 알 수 있다.

  • 그룹과 GA 사이의 Interaction effect가 없음으로 공분산분석을 위한 첫 번째 가정을 충족한다.

ANCOVA의 경우는 Anova(model1, type="III")을 사용하여 분석하게 되는데, 여기서 제 1종 제곱합(Type I SS)과 제 3종 제곱합(Type III SS)에 대해서 훑고 넘어가보자.

먼저 제곱합에 대해 간략하게 정의하면, 

  • 제곱합(sum of squares, 자승합, SS)는 변동의 측정이나 평균의 편차를 나타내며, 평균과의 차이 제곱합으로 계산된다.

 

분산분석에서 제 1종 제곱합은

  • 임의의 1차 상호작용 이전에 주효과가 지정되고 2차 상호작용 효과 이전에 1차 상호작용 효과가 지정되는 등의 균형분산 분석 모형으로 설명된다.
  • 1차 지정 효과가 2차 지정 효과 내에 중첩되고 2차 지정 효과가 3차 지정 효과 내에 중첩되는 모형을 보인다.
  • $Model SS$ = $SS(group, GA)$ = $SS(group) + SS(GA|group)$

제 1요인(group)이 FA에 값의 변화에 기여한 후에 제 2요인(GA)가 추가로 기여한 부분이다.

따라서 각 요인의 제 1종 제곱합은 요인들의 순서에 따라 값이 바뀔 수 있다.

 


3종 제곱합은 분산분석에서 기본값으로 사용되는 제곱합이다.

  • 계획에 있는 한 효과의 제곱합을 계산할 때 이 효과를 포함하지 않는 다른 효과에 맞게 수정되며 이 효과를 포함하는 효과 (제 3의 효과)에 직교하는 제곱합 방법을 사용한다.
  • 요인의 최종적인 기여분: $Model SS$ = $SS(group|GA) + SS(GA|group)$
  • $SS(group|GA)$ = group의 제 3종 제곱합
  • $SS(GA|group)$ = GA의 제 3종 제곱합

여기서 우리는 공변량의 효과를 제어했을 때 group에 따른 FA의 보정모평균이 차이가 나는지 여부가 궁금하기 때문에 group의 유의성은 제 3종 제곱합에 나타는 결과를 봐야 한다.

 

제 1종 제곱합과 제 3종 제곱합을 비교하여 보자

-----------------------------------------------------------------
model2 <- lm(`fa-value`~group+GA, data=FA)
제 1종 제곱합
result
-----------------------------------------------------------------
> anova(model2)
Analysis of Variance Table

Response: fa-value
          Df   Sum Sq  Mean Sq F value    Pr(>F)    
group      1 0.051289 0.051289  23.033 0.0001671 ***
GA         1 0.000441 0.000441   0.198 0.6619904    
Residuals 17 0.037856 0.002227                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
-----------------------------------------------------------------

제 3종 제곱합
result
-----------------------------------------------------------------
Anova Table (Type III tests)

Response: fa-value
              Sum Sq Df F value  Pr(>F)  
(Intercept) 0.003799  1  1.7061 0.20889  
group       0.007943  1  3.5672 0.07612 .
GA          0.000441  1  0.1980 0.66199  
Residuals   0.037856 17                  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
-----------------------------------------------------------------

해석

  • group의 제 1종 제곱합의 p값은 0.001671로 유의하지만, 제 3종 제곱합의 p값은 0.7612로 유의하지 않다.
  • group이 FA에 미치는 효과는  GA를 보정했을 때보다 보정하지 않았을 때 더 크다.
  • GA에 대한 p값은 0.6619로 같게 나오는데, 두 제곱식에서 이 값은 $SS(GA|group)$가 동일하기 때문이다.
    • p값이 5%에서 유의하지 않음으로 GA의 효과가 0이라는 귀무가설을 채택하게 된다.
    • 즉, 공분산분석의 두 번째 가정이 불충족 되는 것을 볼 수 있다.
    • GA는 공변량으로써 group간의 FA차이에 영향을 주는 요인이 아님을 밝힐 수 있다.
    • 이러한 경우에는, ANOVA를 시행하면 된다.

두 번째 가설이 불충족 되었다고 공분산분석을 멈출수는 없다.

임의로 데이터를 수정하여 두 번째 가설이 충족하게끔 한 뒤 공분산 분석을 진행해 보고자 한다 (데이터가 변경되었어도 위에서 설명한 두개의 가설은 충족한다).

(여담이지만, 많은 논문들은 조산과 정상의 비교에 있어서 실제로 GA가 영향을 종속변수에 영향을 끼치지 않더라도 GA를 공변량으로 넣어 분석한다.)

존재할 수 없는 GA이지만 통계를 위하여 임의로 변경해 보았다.

제 1종 제곱합
result
-----------------------------------------------------------------
> anova(model2)
Analysis of Variance Table

Response: fa-value
          Df   Sum Sq  Mean Sq F value   Pr(>F)    
group      1 0.051289 0.051289 30.4822 3.74e-05 ***
GA         1 0.009692 0.009692  5.7603  0.02812 *  
Residuals 17 0.028604 0.001683                     
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
-----------------------------------------------------------------
제 3종 제곱합
result
-----------------------------------------------------------------
> Anova(model2, type="III")
Anova Table (Type III tests)

Response: fa-value
              Sum Sq Df F value    Pr(>F)    
(Intercept) 0.093167  1 55.3709 9.643e-07 ***
group       0.020678  1 12.2891  0.002711 ** 
GA          0.009692  1  5.7603  0.028123 *  
Residuals   0.028604 17                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
-----------------------------------------------------------------

One-way ANCOVA (모형 적합성, 보정 평균, 다중 검정)

두 가지 가정이 모두 충족되었고 우리는 공분산분석을 시행할 수 있게 되었다.

------------------------------------------------------------------
> summary(model2)

Call:
lm(formula = `fa-value` ~ group + GA, data = FA)

Residuals:
      Min        1Q    Median        3Q       Max 
-0.059395 -0.030951 -0.001097  0.029778  0.086346 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)  0.361563   0.048590   7.441 9.64e-07 ***
group1      -0.153170   0.043693  -3.506  0.00271 ** 
GA          -0.002998   0.001249  -2.400  0.02812 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.04102 on 17 degrees of freedom
Multiple R-squared:  0.6807,	Adjusted R-squared:  0.6431 
F-statistic: 18.12 on 2 and 17 DF,  p-value: 6.104e-05
------------------------------------------------------------------

 

해석

  • 모형의 적합성을 보여주는  p값이 <.0001임으로 가정한 모형이 자료분석에 적합한 모형임을 확인할 수 있다.
  • group1에 대한 p값은 group1과의 차이에 대한 유의성 검정으로 유의수준 0.05에서 group1과 group2에 유의한차이가 있음을 알 수 있다.
  • ANCOVA의 경우에는 Adjusted R-squared: 0.6431을 봐야 한다. 
    • 독립변수를 추가할수록 결정계수가 1에 가까워진다는 단점을 보완한 보정된 결정계수이다. 
    • 즉, 적절하지 않은 독립변수를 추가한 모형이라면, 그것을 포함하지 않은 모형보다 작은 보정된 결정계수를 가진다.

공분산 모형식

각 출력된 추정계수(Estimate)를 바탕으로 공분산모형식을 작성할 수 있다.

  • $\hat {y}_{1j}$ = $0.361563 + (-0.153170) + (-0.002998)x_{1j}$
  • $\hat {y}_{2j}$ = $0.361563 + (0.361563) + (-0.002998)x_{2j}$
    • 여기서 $\hat {y}$는 group이 많을 경우 표본의 $y$를 뜻한다. group이 많으면 더 많은 회귀식이 만들어 진다.
  • 각각의 회귀식의 공변량에 공변량의 전체 평균값(mean GA: 38.2)를 곱하면 처리별 보정된 평균이 계산된다.
    • $\bar {y}_{1j}$ = $0.361563 + (-0.153170) + (-0.002998)x_{1j} \cdot 38.2 = 0.0939$
    • $\bar {y}_{2j}$ = $0.361563 + (0.361563) + (-0.002998)x_{2j} \cdot 38.2 = 0.4002$
  • R에서 lsmeans() 함수를 통해 쉽게 구할 수 있다.
> LS <- lsmeans(model2, ~group)
---------------------------------------------
 group lsmean     SE df  lower.CL upper.CL
 A     0.0939 0.0446 17 -0.000322    0.188
 B     0.4002 0.0446 17  0.306018    0.494

Confidence level used: 0.95
---------------------------------------------

 

다중비교 검정

group이 더 많다면 좋겠지만, 우선 2개 그룹이라도 각 그룹간의 비교를 위해 다중비교를 할 수 있다.

Tukey's HSD 검정을 시행해보자.

> model2.lsm=lsmeans(model2,pairwise~group,glhargs=list())
> print(model2.lsm,omit=1)
result
 ----------------------------------------------------------
$lsmeans
 group lsmean     SE df  lower.CL upper.CL
 A     0.0939 0.0446 17 -0.000322    0.188
 B     0.4002 0.0446 17  0.306018    0.494

Confidence level used: 0.95 

$contrasts
 contrast estimate     SE df t.ratio p.value
 A - B      -0.306 0.0874 17  -3.506  0.0027
 ----------------------------------------------------------

해석

  • HSD 검정에서 마찬가지로 p값이 유의수준보다 작기 때문에 두 그룹은 FA에 있어 유의한 차이가 있음을 다시 한번 확인할 수 있다 (A=group1; B=group2).

이를 신뢰구간을 포함한 그래프로 보여줄 수 있다

plot(model2.lsm[[2]])

.

A=group1; B=group2

모형적합성 검토 결과

par(mfrow=c(2,2))
plot(model2)

outlier의 여부는 보이지 않는다. 즉, 등분산성 가정에는 큰 문제가 없는 것으로 확인된다.


Two-way ANCOVA

to be continued...


Reference

https://blog.naver.com/PostView.naver?blogId=kunyoung90&logNo=222031709655&parentCategoryNo=&categoryNo=22&viewDate=&isShowPopularPosts=false&from=postView (이 곳에서 많은 소스를 얻어 저희 연구에 맞게 재구성하여 기술하였습니다. 저희 분석과 다른 분석을 진행하고자 하신다면, 즉 group이 많은 경우에는 해당 자료를 확인하세요.)

 

https://www.ibm.com/docs/ko/spss-statistics/SaaS?topic=model-sum-squares (제곱합을 알고 싶다면 여기로)

+ Recent posts