[꿍꾸룽] 기초통계

2020. 12. 8. 05:25통계

안녕하세요. 꿍꾸룽입니다. 통계 복습 중에 기초통계 관련 내용 포스팅합니다. :-)

 


빈도분포에서 중점적으로 고려해야하는 3가지

1) 중심경향성 2) 변산도 3) 형태

 

1) 중심경향성 : 분포의 중앙이 어디 위치하는 가? 점수들이 어느 주위에 몰려있는 가? _ 평균, 중앙치, 최빈값

2) 변산도 : 점수들이 모여있는 가 퍼져있는가 _ 범위, 사분편차, 분산, 표준편차

3) 형태 : 분포의 모양이 종 모양인지, 다른 모양인가 _ 편포, 왜도

 

통계적 의사결정 오류와 검정력, 그에 영향을 미치는 요인

- 통계적 의사결정 오류 : 영가설이 참인데, 기각할 확률 혹은 영가설이 거짓인데 채택할 확률

- 검정력 : 영가설이 거짓이라 기각하는, 올바은 의사결정.

- 검정력에 영향을 미치는 요인 1) 효과크기 2) 표본크기 3) 모집단의 변산도 3) 유의수준

 

집단차이 검증방법론

Z검정, T검정, 분산분석

- Z검정 : 모집단의 표준편차를 아는 경우, 단일 표본 평균에 대한 검정 시 사용. 모집단의 평균과 표본의 평균이 같은지 차이를 검증함

 

- T검정 1) 독립표본 2) 종속표본 T검정.

1) 독립표본T검정 : 두 집단간 평균에 차이가 있는 지 확인할 때, 두 표본이 서로 독립적이라면 사용

2) 종속표본T검정 : 두 집단간 평균에 차이가 있는 지 확인할 때, 두 표본이 서로 종속적인 관계일 때 사용. 

 

- 분산분석 : 비교해야할 집단이 2개 이상일 때 사용하는 건. 총 분산을 집단 내 분산과 집단 간 분산으로 쪼개어 비요. 집단 내 분산은 우연 즉 오차로 포함시킴. 분산분석은 독립변수가 하나일 땐 일원분산분석, 독립변수가 두개일 땐 이원분산분석으로 나뉨. 

 

상관계수

두 양적 변수의 선형관련성의 정도를 측정하는 통계치로, 일반적으로 피어슨 적률 상관계수가 대표적. 두 변수가 변하는 방향과 크기를 나타낸 것으로 변수가 함께 변하는 정도를 상관계수r로 분석. (범위 -1에서 1까지).

상관계수r은 공분산을 표준화한 값. 이때 0에 가까울 수록 관련이 없는 것이며, 부호는 두 변수가 어떤 관련성을 가지고 변화하는 가를 의미.

 

이 외 다른 상관계수는 변수가 어떤 성질을 가지고 있느냐에 따라 나뉨. 

- 스피어만 등위상관계수 : 두 변수 중 하나 이상의 변수가 서열척도

- 파이계수 : 두 변수 모두 질적변수(자연양분변수)

- 중다상관계수 : 둘 이상의 독립변수와 종속변수의 상관을 구하는 것

- 사분상관계수 : 두 변수의 임의양분변수일 경우

- 이연상관계수 : 임의양분변수와 연속 변수 간의 상관을 측정 시

- 점이연상관계수 : 자연양분변수와 연속 변수 간의 상관을 측정 시


학생분들은 학기말이라 다들 바쁘고, 직장인분들은 연말이라 다들 바쁘시겠네요. ㅋㅋ 그래서 새해연초의 쉼이 더 의미가 있는건가 갑자기 생각이 드네요. 

 

코로나19가 너무 난리라, 걱정할 것도 많은 하루하루에요. 모두 건강한 하루 보내세요~

 

 

 

반응형