[꿍꾸룽] 공분산, 상관계수

2021. 4. 12. 20:57통계

안녕하세요 꿍꾸룽입니다. 기초통계 개념 한번 더 짚으려고 기록해요 :-) 

틀린 정보가 있다면 알려주세요. ㅎㅎ 


공분산 Covariance : 두 변수가 동시에 변하는 정도. 즉, 변동성. 두 변수의 선형적(linear) 관계를 나타냄. 

공분산 행렬에는 분산이 포함되어있음. Sxy > Sxx / Sxy / Syy / Syx

- Sxx / Syy : X와 Y 각각의 분산

- Sxy / Syx : X와 Y의 공분산, Y와 X의 공분산. 

 

분산이란 Variance 자료가 평균에서 얼마나 떨어져있는 지에 대한 제곱의 평균값. ('편차 제곱의 합'의 평균치). 즉 자료의 정보.

 

공분산의 문제는 무한대 사이의 값, 그리고 단위가 달라 변수끼리 비교할 수가 없음. 절대값의 크기가 어느 정도 상관을 가지고 있는 지 판단하기가 어려움. 그래서 상관계수(Correlation coefficient)를 사용. 

 

상관계수(Correlation coefficient) : 공분산을 각 변수의 표준편차로 나누어 준 값. -1과 1사이에서 움직임. 절대적 크기는 관계의 강도로 해석할 수 있음. 

 

나의 언어로 정리하자면,

분산 variance는 개별값이 기준(평균)으로 얼마나 다양하느냐에 대한 정보 

공분산 covariance은 변수를 묶어 볼 때 기준으로 동시에 변하는 정도에 대한 정보 (공통성질이 얼마나 있냐)

상관계수 Correlation coefficeint는 변수들 간의 상관(관계성)을 수치로 보기 위해 수리적으로 통일 시킨 값.

 

dream2run.tistory.com/52

 

[꿍꾸룽] 통계기초 - 분산, z분포 t분포

안녕하세요. 통계 개념들 정리 해보려고하는 데 회귀분석 공부하면서 정리하는 개념이라, 기초 통계의 일반적인 흐름을 따르진 않을 것 같아요. 기초 정리한 것 보면서 머리에 쏙쏙 들어왔으면

dream2run.tistory.com

dream2run.tistory.com/145

 

[꿍꾸룽] 공변수, 공변인

안녕하세요 꿍꾸룽입니다. 강의 듣다가 한번 더 정리하고 싶은 개념이 있어 블로그 오랜만에 켰어요~ ㅎㅎㅎ 공변수, 공변인이란? 변수의 하나. 여러 변수들이 공통적으로 함께 공유하고있는 변

dream2run.tistory.com

반응형