[꿍꾸룽] spss 파일 합치기 : merge

2021. 10. 31. 01:04통계

안녕하세요 꿍꾸룽입니다. 

 

저는 지금 종단 자료를 활용해서 통계분석을 하고있어요.

종단 자료는 패널을 활용하고 있는데, 패널에서는 차시 (1, 2, - N)별로 SPSS를 나누어서 주기 때문에

자신이 활용할 문항을 고르고, 역문항을 해야한다면 역문항 처리를 하고, 파일을 합치는 과정이 필요해요.

 

종단 분석을 하기 위해서는

1번 사람 의 1번 변인의 1차년도, 2차년도, 3차년도 - N차년도 

1번 사람 의 2번 변인의 1차년도, 2차년도, 3차년도 - N차년도

... N번 사람 의 - "

 

등, 한 파일안에 응답한/관찰한 내용이 들어가 있어야 해요. 

 

파일을 합치는 과정 (MERGE)에 대해 정리해보았습니다. 

 

기준 파일과 더할 (PLUS) 파일 두개 켜놓고 한번 작업하고 > 또 더해야 할 파일 켜놓고 하고 이런 반복작업이 필요해요. 

예를 들어 합쳐야 할 파일이 총 7개라면

기준 파일 (보통 1번 파일) 켜놓고, 2차시 파일 > 합치기

기준 파일 (1차시, 2차시 합쳐진 파일) 켜놓고 > 3차시 파일 > 합치기

 

이런 과정을 거치게 되죠. 

 

파일 MERGE과정 대신 엑셀을 활용하게 되면 SPSS로 정리된 파일을 복사붙여넣기하고 ID별로 정렬한 뒤에 수동으로 복붙하여 하나로 합치는 방법도 있지만

 

저는 그런 과정에서 제가 실수할 거 같아서 (나 자신을 믿지않아 ~~) SPSS 파일 MERGE 기능을 활용했어요. 


먼저 합쳐질 파일의 기준, 저의 경우는 ID를 오름차순 정렬해줍니다. 

오름차순 정렬하면 오류가 발생할 확률이 줄어든다고 하는 걸 권장하더라구요. 

 

 

케이스 추가는 ID가 다른 것 즉, 원래 있던 사람들이 아니라 다른 사람을 합치는 기능이에요

저는 ID가 같은 사람들의 변수 (차시에 따라 다르게 답한 것들)를 추가 하는 거라서 변수 추가를 클릭했어요. 

여러개 켜놓지 않는 이유는 헷갈리기 때문이에요. 딱 합칠 파일만 기준으로 켜놓고 반복하는 게 안전해요. 

새 활성 데이터 세트에서는 필요없는 변수는 다 빼고 최종적으로 활용할 변수들만 남겨두고 제외된 변수로 다 옮겨놓으면 됩니다. 

 

이때, 차시별로 변수 명이 같으면 충돌이 되어서 MERGE가 제대로 되지 않으니 차시별로 변수명에 차별을 두어야 해요. 

MERGE가 끝나면 부모1,SELF1 - 부모2, SELF2 - 부모3, SELF3 이런식으로 정렬이 되어있어요. 

그래서 같은 변수끼리 정리해주고나면, 기술통계 표 정리 시에 순서를 따로 정렬할 필요가 없고

특히나 상관계수 볼 때는 더 중요하기 때문에 (삼각형 모양을 유지하기위해)

같은 변수/카테고리끼리 묶어주는 과정을 거쳤습니다. 

 


 

사실 별 건 아닌데 제가 나중에 다시 통계 분석을 할 때 까먹을 거 같아서 기록해두어요.

이 글이 누군가에게 도움이 되고 시간을 단축시키는 데 공헌?ㅋㅋㅋ하길 바래욥 :-) 

 

 

반응형