통계 공부하기/SPSS 사용법

[회귀분석/regression/multivariate analysis]결과변수가 정규분포라면 쓸 수 있다!

승목이 2016. 10. 25. 23:24

통계 교수님과의 면담에서 오해가 있었다. 

그것때문에 partial correlation using Spearman method 를 배우고 

R사용법을 배워서 좋긴 했지만 

앞으로도 communication 의 문제에 대해서도 생각해봐야겠고 


제일먼저 data moduling 시에 정규냐 비정규를 생각하고 

통계상담을 의뢰해야겠다는 생각이 들었다. 


결론적으로 결과변수만 정규분포를 하면 

회귀분석을 할 수 있다. 설명변수는 정규분포 안해도 된다 

만일 결과변수가 정규분포가 아니라면? 그때 바로 partial correlation이 기능하는 것이다. 


회귀분석하면 표에 보면 partial correlation 다 나와있다. 결국 한단계 위의 분석인 것이다. 


stepwise : 적합한 식을 구하는것 


입력 : 이건 의미있어 보이는거 다 넣어서 각각 어느정도 의미있는지. 정말 의미있는지 보는것 


우리가 보려는건 적합한 식을 구하려는게 아니기 때문에 입력법을 쓰기로 했다. 



sex는 case 가 적어서 ...하지만 집어넣는다면 


0,1 dummy 변수화? 

매우 유의하면 나타날수도 있지만 잘 안나온다. 케이스 적으면.. 


Pearson 시, Spearman 시 .. 교란변수는 보통 괜찮으니까 교란변수 control 한다고 이게 Pearson이 Spearman 이 되지는 않는다. 


correlation efficient 도 비교하는 방법이 있는데 

univariate 에서는 paired 로 

그룹별로에서는 독립으로 

비교하는 overlap? 머시깽이 패키지가 있단다 

이거 R에서만 돌아가고 

r값이 비슷할 때 이 차이가 의미가 있는지 봐주는 통계란다. 별게 다 있네 


회귀분석할때 다중공선성 체크하면 되고 

서로 연관있는 팩터는 안 넣도록 하자.