[꿍꾸룽] 회귀분석, 분산분석(ANOVA)

2021. 4. 12. 21:20통계

안녕하세요 꿍꾸룽입니다. 최근 통계 공부를 다시 하고있는데 (언제까지..? 평생..?) 심리학에서 사용하는 통계는 회귀의 확장형이기때문에 회귀분석관련한 복습은 계속 하게 되네요. ㅎㅎ

 

회귀분석, 분산분석(아노바)에 대해 간략히 정리해보았습니다. :-)


상관 : 두 변수간의 관련성의 정도

회귀 : 한 변수로부터 다른 변수를 예측하는 통계 방법

 

회귀방정식 : 두 변수간의 최적선을 바탕으로 예측, 두 변수간의 상관이 높을 수록 회귀방정식을 구하는 예측값이 정확. 

 

회귀분석

독립/종속 변수의 선형(linear)식을 산출하여, 독립변수 값으로 종속변수를 예측하려는 것. 

식에서, 종속변수에 대한 독립변수의 회귀계수(예측력)을 분석하여 예측값을 구하려는 것. 

회귀분석 종류

1) 독립변수가 하나 : 단순 회귀분석

2) 독립변수가 두개 이상 : 중다회귀분석.

- 공통 : 종속변수는 하나. 

중다회귀분석 

다른 독립변수들의 오염을 제거하고, 종속 변수에 대한 독립변수의 순수한 효과 파악 + 가장 잘 예측하는 독립변수 파악하기 위해 사용. 

 

집단 간 차이 확인을 위한 검증방법 중 분산분석 ANOVA (Analysis of Variance)

두개 이상의 집단 차이 검정을 위함. 

평균 차이를 검정하기 위해 총 분산을 집단 내 / 집단 간 분산으로 비교. 

 

3개 집단 이상일 시 변산성의 원인을 밝힐 때 처치효과 때문인지 아닌 지 분석, 즉 종속변수의 평균에 집단 간 차이가 있는 가를 알 수 있음.

> 처치효과가 있다면, 정확히 어느 집단에서 발생한 것인지 살펴보는 것은 사후검증

 

분산분석 종류

1) 일원분산분석 : 독립변수가 하나

2) 이원분산분석 : 독립변수가 두개 = 요인설계. 독립변수가 두개라면, 분산 원인이 어디있는 지 밝힘. 

 

일원분산분석

t검정의 오류를 보완하여 집단을 한꺼번에 검증하는 것. 오류라함은, 반복 검증함으로써 통계적 오류가 증가하게 되는 것. 

 

이원분산분석의 장점

두개의 독립변인 효과 한번에 검증가능, 효율적.

변수를 고정하였을 때보다 결과를 더 넓게 일반화하여 해석 가능. 

주효과/상호작용 효과 검정 가능.

 

 

반응형