2021. 4. 12. 20:57ㆍ통계
안녕하세요 꿍꾸룽입니다. 기초통계 개념 한번 더 짚으려고 기록해요 :-)
틀린 정보가 있다면 알려주세요. ㅎㅎ
공분산 Covariance : 두 변수가 동시에 변하는 정도. 즉, 변동성. 두 변수의 선형적(linear) 관계를 나타냄.
공분산 행렬에는 분산이 포함되어있음. Sxy > Sxx / Sxy / Syy / Syx
- Sxx / Syy : X와 Y 각각의 분산
- Sxy / Syx : X와 Y의 공분산, Y와 X의 공분산.
분산이란 Variance 자료가 평균에서 얼마나 떨어져있는 지에 대한 제곱의 평균값. ('편차 제곱의 합'의 평균치). 즉 자료의 정보.
공분산의 문제는 무한대 사이의 값, 그리고 단위가 달라 변수끼리 비교할 수가 없음. 절대값의 크기가 어느 정도 상관을 가지고 있는 지 판단하기가 어려움. 그래서 상관계수(Correlation coefficient)를 사용.
상관계수(Correlation coefficient) : 공분산을 각 변수의 표준편차로 나누어 준 값. -1과 1사이에서 움직임. 절대적 크기는 관계의 강도로 해석할 수 있음.
나의 언어로 정리하자면,
분산 variance는 개별값이 기준(평균)으로 얼마나 다양하느냐에 대한 정보
공분산 covariance은 변수를 묶어 볼 때 기준으로 동시에 변하는 정도에 대한 정보 (공통성질이 얼마나 있냐)
상관계수 Correlation coefficeint는 변수들 간의 상관(관계성)을 수치로 보기 위해 수리적으로 통일 시킨 값.
[꿍꾸룽] 통계기초 - 분산, z분포 t분포
안녕하세요. 통계 개념들 정리 해보려고하는 데 회귀분석 공부하면서 정리하는 개념이라, 기초 통계의 일반적인 흐름을 따르진 않을 것 같아요. 기초 정리한 것 보면서 머리에 쏙쏙 들어왔으면
dream2run.tistory.com
[꿍꾸룽] 공변수, 공변인
안녕하세요 꿍꾸룽입니다. 강의 듣다가 한번 더 정리하고 싶은 개념이 있어 블로그 오랜만에 켰어요~ ㅎㅎㅎ 공변수, 공변인이란? 변수의 하나. 여러 변수들이 공통적으로 함께 공유하고있는 변
dream2run.tistory.com
'통계' 카테고리의 다른 글
[꿍꾸룽] 구조방정식 복습 1 (0) | 2021.08.10 |
---|---|
[꿍꾸룽] 회귀분석, 분산분석(ANOVA) (0) | 2021.04.12 |
[꿍꾸룽] 소논문, Mplus demo 버전 연습 -8 (2) | 2021.01.07 |
[꿍꾸룽] 소논문, Mplus demo 버전 연습 -7 (0) | 2021.01.04 |
[꿍꾸룽] 소논문, Mplus demo 버전 연습 -6 (0) | 2020.12.29 |