[꿍꾸룽] 구조방정식 복습 3

2021. 8. 11. 21:38통계

안녕하세요 꿍꾸룽입니다.

연구를 하면서, 통계의 중요성이 수면위로 다시 떠올라서, ㅎㅎ 복습하려고 구조방정식 공부 중이에요. 


행렬과 벡터

.행렬은 숫자의 나열. 3X2는 3개의 행, 2개의 열. 6개의 값을 element 요소라고 함. a11은 1행에 1열 값. 

.벡터는 행 또는 열만 있는 것이 벡터. 열 벡터가 기본이기에 행은 프라임(')을 붙임.

.스칼라는 행도하나 열도 하나. 즉 상수.  

 

행렬의 종류

.전치행렬 : transpose. 행렬e , e' 을 이야기하는 것

.정방행렬 : 행과 열의 값이 같은 것. (대각요소/비대각요소)

- 대각요소 : 1행1열 2행2열 -.

.대칭행렬 : 비대각요소들(서로 마주보는 값)이 같은 행렬

.영행렬 : 0밖에 없는 것. 

.대각행렬 : 대각요소만 숫자가 존재하거나 (or) 대각요소도 0이고 + 비대각요소는 0인 것

.항등행렬 : 대각행렬인데, 대각요소가 다 1이고 비대각요소가 0인것

.하위행렬 : 2행1열이 제거된 행렬. 

 

행렬의 연산 및 주요개념

.행렬의 덧셈 : 똑같은 차원을 가질때만 가능. 2x3 끼리 더할 때 같은 위치 상응끼리 더하기. 

.스칼라 곱셈 : 행렬에다가 스칼라(상수) 곱한 것. 

.선형결합 : 백터에 스칼라 곱 + 백터에 스칼라 곱 

 

벡터라는 것은 통계에서 변수를 말하는 것. 

 

선형독립과 선형종속

선형종속에 대한 정의를 하고, 선형종속이 아니면 선형독립이다 라고 정의 함. 

. 선형 종속 : 상수A+상수B=0을 만족하는 0이 아닌 상수가 존재한다면 백터 A, B는 서로 선형종속. 즉 A와 B가 같은 정보를 가지고 있다라는 의미. 다중공선성이 존재한다는 것과 같은 의미. 

. 선형독립 = 변수가 서로 독립된 정보를 가지고 있다. 

 

. 행렬의 rank : 서로 선형독립인 행의 개수.  

. 백터의 내적 : 상응하는 것끼리 곱하여 더한 것. 

. 행렬의 곱셈 : AB =/ BA. 1행과 1열 곱하여 1행 1열 만듦.  

. 대각합 : 대각 요소를 더 한 것. 다변량 통계에서 중요한 개념. 

. 행렬식 : 자료가 가진 변동성의 크기를 나타내기도 함 (variability). submatrix 하위행렬과 관ㄹㄴ있는 개념

. 역행렬 : AB=BA=I를 만족시키면 A와 B는 서로 역행렬 관계. B가 A-1(A inverse)가 되는 것. 역행렬이 존재하지 않는 경우도 있음. 

- I : 항등행렬. 대각행렬인데 대각요소가 1인 것. 

 

EFA 확인적요인분석 에 필요한 개념 (교재 7장) 아이겐구조 1) 고유값 2)고유벡터가 필요.

 


구조방정식모형의 이해

 

. 통계모형 = 식. 

. 그림을 이용해서 설명하게 되면 = 경로도. Path diagram.

 

모형 안에서 (내 가설 안에서)

. 직선은 인과관계를 나타냄. 

. 구조모형 : 구조방정식 안에 있는 모형으로, 영향관계가 나타나는 부분

. 측정모형 : 변수a(잠재변수)를 측정하는 변수들(관찰변수). 예. 우울(잠재변수)를 측정하는 우울1,2,3(관찰변수). 변수a b c 를 측정하는 모형 3개가 있다고 측정모형 3개!가 아니라, 다 합해서 하나의 측정모형이라고 함.

 

즉, 구조방정식 모형은 측정모형 + 구조모형. 따로 존재하는 게 아니라 같이 있는 것.

개념적으로, 측정모형을 이용해서 주요변수들을 측정해내고, 그렇게 측정된 변수들의 관계를 보는 것이 구조모형. 

3변수의 관계를 구조관계라고 함. 

- 통계에서 상관은 구조의 의미.

 

. 관찰변수 : 네모 표시. 관찰되는 변수. 문항. 문항은 눈에 보임. 내 데이타 셋 안에 변수가 보이느냐 아니냐 : 보인다

. 잠재변수 : 눈에 보이지 않는 변수. latent. 개념적 변수.  즉 컨셉에서 발생된 변수. 내 데이타 셋 안에 변수가 보이느냐 아니냐 : 안보인다. / 데이터 셋에서는 없지만 모형 안에서 나타나는 것. 

- 오차도 잠재변수임. (e, d)

 

. 직선의 화살표 : 영향관계. 

. 곡선의 화살표 : 분석되지 않는 관계. 오차의 관계는 관계가 있지만, 영향관계를 모를 때 표시. 다른 말로 하면, 곡선의 화살표는 상관임. 공분산 또는 상관계수로 측정되는 상관. sem에서는 공분산을 의미. 공분산으로 분석하니까. 

 

. 측정 : 사물, 사람의 속성(property)에 숫자를 부여하는 작업. 예. 우울 1 2 3를 이용해서 우울을 측정한다. 눈에 보이는 관찰변수를 통해서 눈에 안보이는 잠재변수를 만들어내는 것. 

 

관찰변수 쓰임의 변수

관찰변수가 측정을 위해서만 쓰이는 것은 아님. 그 종류에 대한 내용.

. 지표변수 : 눈에 보이는 관찰변수인데 역할이 지표변수. 관찰변수인데 역할이 지표변수. 잠재변수를 측정하는 관찰변수를 지표변수라고 함. indicator. 우울1 indicates 우울. 우울1은 우울의 indicator. point out.

(주의) 화살표. 직선의 화살표는 인과관계. 우울이 있어야 우울1, 2, 3의 척도의 우울점수로 나오는 것임. 그러니까 화살표가 향하는 것이 결과. 거꾸로 하면 안됨~ 우울이 먼저고, 우울 1 2 3는 종속변수. 

 

. 공변수(covariate) : 독립변수의 의미를 가지고 있는 데, 구조모형안에 꼭 잠재변수만 있어야 하는 게 아님. 구조모형 안에 성별을 줄 수 있음. 성별은 관찰변수라서 네모임. 이때 역할이 공변수. 

. 결과변수(outcome) : 내 주요변수들이 있다면, 어떤 관찰변수에 영향을 줄 수 있음. 그 관찰변수가 결과변수. 결과변수 중 원격 결과변수distal outcome과 같은 의미로 쓰임.

즉, 내 주요변수 잠재변수들이 있다면, 거기에 영향을 주는 관찰변수인 공변수가 들어올 수 있고, 잠재변수들이 어떤 관찰변수에 영향을 주는 결과변수가 있을 수 있음. 

 

. 지표변수와 결과변수 : 지표변수도 결과변수(종속변수). 수리적으로 추정할 때 (최대우도추정) 지표변수와 결과변수가 의미상으로 다르나 수리적으로는 같은 역할.

 

잠재변수의 종류

. 구인/요인/차원/잠재특성 : 개념을 변수화한 과정에서 나타난 개념이 구인. 측정모형(factor model) 측면에서 보면 요인. 한 사람이 가진 속성 중에 다른 차원에서 보는 거니까 차원. 사람이 잠재적으로 가진 특성인 잠재특성

. 오차 error : 측정오차 measurment / 설명오차 disturbance

- 측정오차 : 측정의 과정에서 생긴 오차. e1~eN

- 설명오차 : 구조모형에서 생긴 오차. 인과관계를 설명하려는 과정에서 생긴 오차. (예: 우울이 면역기능을 설명하는 과정에서 생긴 것) d1~dN

 

내생변수 외생변수

회귀분석에서 나타날 수 없는 변수인, SEM에서 표현가능한 매개변수 : 종속변수인 동시에 독립변수인 것. 

. 외생변수 : 그 어떤 변수에 영향을 받지 않는, 즉, 직선의 화살표가 들어오지 않고 나가기만 하는 것.

. 내생변수 : 그 어떤 변수에 의해서 설명이 한번이라도 되는 것, 즉 직선의 화살표가 들어오는 것. 

 

그럼, 관찰변수는 내생변수. 

오차는 내생/외생변수라고 구분하지 않음. 

 

. 외생/내생 VS 독립/종속 : 의미가 다른 개념. MPLUS에서 독립/종속이라는 이름을 외생/내생에 써서 헷갈리게 됨. 

 


구조방정식 모형의 구성

측정모형과 구조모형

- 측정모형은 독립적으로 모형일 수 있고

- 구조모형은 독립적으로 모형일 수 없음.

 

. 측정모형 : 어떤 관찰변수에 의해 잠재변수가 어떻게 측정되고 있는 지 보여주는 부분. 잠재변수들 간의 관계에 대한 가설이 없음. 모든 잠재변수간의 상관(곡선 화살표)을 다 포함함. 오차간의 상관을 설정하기도 함. 오차관의 상관을 설정하는 이유는, 관찰변수 사이의 높은 상관이 있으면, 딸려있는 오차 간의 상관이 생길 가능성이 높아짐.

- 단 오차간의 상관을 처음에 지정하지 않는 경우가 대부분. 

- 내생변수 하나당 식이 하나 생김. 각 내생변수의 관점에서 식을 쓰면 됨 (회귀분석의 수준)

. 측정모형은 EFA와 CFA 더하면 측정모형. 

. 잠재변수를 독립변수로 하고, 각 상응하는 지표변수를 종속변수로 하는 회귀분석. (단, 회귀분석은 독립변수도 잠재변수. 큰 의미에서 이렇게 표현하는 것) 

 

참고. 편상관

다른 독립변수의 효과를 통제한 상태에서 하나의(!) 독립변수와 종속변수의 상관. 독립변수1에서 독립변수2의 상관을 빼고, 종속변수에서 독립변수2의 상관을 빼고 나머지들의 상관이 편상관. 

- 통제의 개념과 연결.

 

구조모형

.잠재변수 사이의 관계를 연구가설에 따라 설정한 모형. 

.하나의 독립된 모형이 아님. 

- 내생변수 하나당 식을 하나씩. 구조모형 역시 일련의 회귀분석 모형. 

 

측정오차

.구조방정식 모형에서는 측정의 과정이 들어가있는 것.  

.측정오차를 모형 안에서 명확하게 설명 즉, noise를 제거한것 (뭐보다 ? 관찰변수로만 이루어진 것 보다)

 


(주의) 화살표. 직선의 화살표는 인과관계. 우울이 있어야 우울1, 2, 3의 척도의 우울점수로 나오는 것임. 그러니까 화살표가 향하는 것이 결과. 거꾸로 하면 안됨~ 우울이 먼저고, 우울 1 2 3는 종속변수. 

 

외생/내생 VS 독립/종속 : 의미가 다른 개념. MPLUS에서 독립/종속이라는 이름을 외생/내생에 써서 헷갈리게 됨. 

 

https://dream2run.tistory.com/213

 

[꿍꾸룽] 구조방정식 복습 1

안녕하세요 꿍꾸룽입니다. 연구를 하면서, 통계의 중요성이 수면위로 다시 떠올라서, ㅎㅎ 복습하려고 구조방정식 공부 중이에요. 제 식으로 정리할거라, 많이 축약되어있거나, 한 내용이 많이

dream2run.tistory.com

https://dream2run.tistory.com/215

 

[꿍꾸룽] 구조방정식 복습 2

안녕하세요 꿍꾸룽입니다. 연구를 하면서, 통계의 중요성이 수면위로 다시 떠올라서, ㅎㅎ 복습하려고 구조방정식 공부 중이에요. https://dream2run.tistory.com/213 [꿍꾸룽] 구조방정식 복습 1 안녕하

dream2run.tistory.com

 


자료의 출처는 김수영 교수님의 강의입니다.

책 : 구조방정식 모형의 기본과 확장. 서울 : 학지사.

 

내용이 저작권 등 문제가 된다면, 연락바랍니다. 삭제하겠습니다.


 

 

반응형