[꿍꾸룽] 구조방정식 복습 1

2021. 8. 10. 01:40통계

안녕하세요 꿍꾸룽입니다. 

연구를 하면서, 통계의 중요성이 수면위로 다시 떠올라서, ㅎㅎ 복습하려고 구조방정식 공부 중이에요. 

제 식으로 정리할거라, 많이 축약되어있거나, 한 내용이 많이 길어질 수도 있긴하지만, 혹시 공부하시다가 몰라서 검색해온 분들에게 도움이 되었으면 좋겠습니다. 

 


구조방정식 

 

구조방정식 모형 : 측정모형 + 구조모형

. 측정모형 : EFA(탐색적 요인분석), CFA(확인적 요인분석)

. 구조모형 : 경로분석 모형과 연결. 변수간의 영향관계를 확인하는 것

 


구조방정식 모형의 한계

.모형의 적합도 즉, 모형이 자료에 부합하는 정도의 지수가 만족되면(기준있음) 자신의 모형이 true model인 것으로 해석 함. 단 한계는, 인과관계의 측면에서 보았을 때, (인과 모형 causal modeling) 가설은 인과관계에 기반해서 설정함.

그런데 구조방정식에서 통계적으로 SEM은 상관분석 > 회귀분석> 구조방정식으로 발전한 것임. 

상관에 기반해서 분석하기때문에 X > Y / Y >X 는 같음. 즉, 방향을 결정하지는 못함. 

causality는 통계모형에서 오는 게 아니고, 데이터로부터 오는 것. 데이터가 가진 속성에서 분석하는 것 즉, 연구자의 몫.

 

(메모) 논문을 읽을 때, 상관분석 및 해석을 읽음에 있어 관계방향에 대해 생각하기

 


 구조방정식의 자료

 

. 전통적 구조방정식 : raw 데이터 분석이 아닌, 자료를 요약해서 사용했었음. 그래서 모든 원리, 이론이 그렇게 발전했음. 1) 각 평균의 평균을 사용해서 분석 2) 공분산 자료를 이용해서 분석. 편차점수(원점수-평균)에서 공분산을 계산. 

 

공분산은 두 변수의 상관. 공분산을 표준화하면 상관계수. 공분산 > 상관계수 계산 가능. 반대는 불가. 즉 정보는 공분산을 더 많이 가지고 있음. 

 

같은 변수의 공분산은 : 분산

 

즉, 평균벡터, 공분산 행렬가 있으면, 자료의 중심이 어디있는지 (평균), 변수끼리의 관계는 어떠한지(공분산), 각자료가 얼마나 퍼져있는 지 (분산) 정보를 가지고있음. 이렇게 가지고있으면 대부분의 모형은 추정/응용할 수 있음. 

 

. 추가로, 독립적인 정보의 개수라는 개념이 있음. 겹치지 않는 정보의 갯수. 계산하는 방법 : 변수갯수(변수갯수+1) 나누기 2. 

 

현재 mplus는 요약자료, 원자료로 다 분석가능. 하지만 원자료가 있으면 할 수 있는 게 더 많아짐. 

 

자료의 적절성

 

. 충분히 큰 표본크기가 큼. 표준오차의 정확성이 신뢰가 되어야 검정 결과를 신뢰할 수 있음. 모형의 복잡성에 따라 요구하는 표본의 크기가 다름.

. (주의) 표본 수 number of samples : 표본 크기 sample size . 

표본수는 표본 크기와 전혀 다른 개념. 표본 수라는 단어는 존재 하지 않음. 표본의 수는 표집 이론에서 나오는 개념으로 표본크기가 다른 개념. 표본크기 라고 해야함. 

 

다변량 정규성

 

. 구조방정식을 따르는 변수는 다변량 정규성을 따름.

. 단변량 정규성 (=정규성) : 엎어진 종모양. 

. 다변량 정규성. 각각의 모든 변수가 정규분포를 따르고, 두 변수의 결합분포가 이변량 정규분포를 따르는 것. 

 

. 다변량 정규성을 따르는 지 확인하는 방법 관련

각 변수의 단변량 정규성을 조사하여 정규성을 따르면, 다변량 정규성을 확인. SPSS에서 확인하는 방법도 있고, 구조방정식에서 왜도와 첨도를 확인해서 정규성을 확인하는 것이 일반적. 

. 왜도 : 치우친 정도 / 첨도(excess kurtosis) : 뾰족한 정도 - 절대값이 0에 가까운 것이 정규성을 벗어나지 않는 정도라 해석. 

. 첨도 명확한 명은 excess kurtosis. 그냥 kurtosis는 3을 빼주는 식이 없기때문에 절대값이 3에 가까워짐. 요즘 일반적으로 첨도라고 하면 excess 를 의미하기는 하지만, 그렇지 않은 프로그램도 있음 (R)

. 왜도와 첨도의 절대값에 대한 가이드라인 Kline(2011), Curran. West 와 Finch(97) 

 

. 정규성이 깨지게 되면? 

가장 쉬운 방법은 추정방법을 바꾸는 것 MLR 


정리

 

통계는 인과관계에 대한 답을 주지 않음. 변인들끼리의 관계성을 바탕으로 분석하는 것. 

인과관계는 자료로부터, 선행연구를 참고하여 설정 및 해석이 필요. 논문읽을 때 유의하기. 

(주의점)
표본크기 Sample size 가 연구대상의 number을 의미하는 것. 표본수 (X)

(자료의 적절성 관련)
구조방정식을 사용하여 분석할 시 자료는 다변량 정규성을 따른 다고 가정함. 
확인은 왜도와 첨도를 통해 하는 것이 일반적.

정규성을 따르지 않을 시 처리해야하는 일련의 절차가 있음 (예: 분석방법의 변경 MLR)


자료의 출처는 김수영 교수님의 강의입니다. 

책 : 구조방정식 모형의 기본과 확장. 서울 : 학지사.

 

내용이 저작권 등 문제가 된다면 연락주시면 삭제하겠습니다.


어우 분명히 다 공부하고 공부했던 내용인데 ㅋㅋㅋ 역시 새롭고 재밌고 새롭고 재밌네요. (?)

이제 컨디션이 돌아왔으니, 내일부터 달린다아!!!

 

그럼 모두들, 건강하게 달리고, 건강하게 쉬는 하루하루 되길 바랄게욥~~

반응형