통계 공부하기 17

[재현성 검사] ICC(연속), Cohen's kappa(명목,2명), Fleiss kappa(명목, 여러검사자), Weighted kappa, Kendall W (서열)

재현성 검사 ICC(연속), Cohen's kappa(명목,2명), Fleiss kappa(명목, 여러검사자), Weighted kappa, Kendall W (서열) 재현성 검사 Analyze-Scale-Reliability Analysis ICC(intraclass correlation coefficient; 급간 상관계수) 관찰자내(intra-rater), 관찰자간(inter-rater) 재현성 검사(reliability) 연속변수인 경우 관찰자내 – 동일한 사람이 다시 검사 관찰자간 – 한 사람이 검사하고, 다른 사람이 검사한다면 상관분석은 직선인가. ICC 는 y=x 인가를 물어보는 것 SPSS –reliability – 2 way mixed(검사자 k 명이서 무작위로 선택된 환자나 연구집단을 ..

통계 공부하기 2017.04.23

[진단법]민감도, 특이도, ROC curve, AUC

민감도,특이도, 양성 예측도, 음성 예측도 민감도 : 병이 있는 사람 중에 몇 명을 병이 있다고 말하는가특이도 : 병이 없는 사람 중에 몇 명을 병이 없다고 말하는가 현재 유병률과는 상관없이 그 검사법 자체의 고유한 성격 양성 예측도 : 검사상 양성으로 나왔는데 실제 병이 있는 사람음성 예측도 : 검사상 음성으로 나왔는데 실제 병이 없는 사람 사각형의 면적으로 이해할 것 분홍 : 양성이고 병 없는 사람연두: 음성이고 병 있는 사람 노랑: 양성이고 병 없는 사람 녹색: 음성이고 병 없는 사람 민감도, 특이도와 관련된 연구의 가장 큰 특징은 확진 검사법 또는 많은 사람들이 공감하는 gold standard 가 되는 검사법이 있다는 것. 그 검사법에 대해서, 우리의 관심사인 새 검사법은 민감도와 특이도가 어떠..

통계 공부하기 2017.04.23

[생존분석]Cox 비례위험모형 Cox proportional hazards model

Regression 처럼 여러 변수를 동시에 넣고서 어떤 변수가 event 에 영향을 미쳤는지, 각 변수를 분석하게 되어 있습니다. 여러 원인 중에서 생존곡선에 영향을 미치는 변수에 대한 각각의 p 값과 odds ration 를 계산해낼 수 있지요 --그러면 reference 설정하고 HR 은 어디서 하는가---> Cox regression 에서는 Exp(b) 값을 보통 오즈비나 승산비라 부르지 않고 위험비(hazard ratio)라고 부릅니다 카이제곱과 multiple regression 이 합쳐진 것이 logistic regression 였다면 여기에다 다시 생존분석을 붙여서 Cox regression을 만들게 됩니다 regression - logistic regression - Cox regress..

통계 공부하기 2017.03.21

[생존분석]Kaplan Meier, Censored data, Log-rank test

이것은 생존이라는 종속변수를 대상으로 하는 카이제곱 분석입니다. 생존율에서 중간 과정은 무시하고 마지막에 누적된 생존을 분석하기 때문에 누적생존율에 대한 분석이라 할 수 있고 이를 통계적으로 생존분석이라고 하지는 않습니다. 요약하자면 카이제곱 분석이 누적 생존율에 관심을 가지고 있지만 생존분석은 그 과정 중의 생존 곡선에 관심을 갖고 있다는 듯입니다. failure 라는 사건이 언제 생긴 것인지까지를 구분하여 분석하려는 것이 바로 생존분석입니다 샌존분석에서는 사건이 발생한 시간을 중요하게 다루고, 또 중도탈락한 경우도 그 추적 관찰된 시점까지의 시간을 의미있게 반영합니다 (TKRA 에서는 failure 발생 후 종료, 중도탈락한 경우는 최근 외래 f.u 까지하는지. Lee.... were consider..

통계 공부하기 2017.03.21

[회귀분석/regression/multivariate analysis]결과변수가 정규분포라면 쓸 수 있다!

통계 교수님과의 면담에서 오해가 있었다. 그것때문에 partial correlation using Spearman method 를 배우고 R사용법을 배워서 좋긴 했지만 앞으로도 communication 의 문제에 대해서도 생각해봐야겠고 제일먼저 data moduling 시에 정규냐 비정규를 생각하고 통계상담을 의뢰해야겠다는 생각이 들었다. 결론적으로 결과변수만 정규분포를 하면 회귀분석을 할 수 있다. 설명변수는 정규분포 안해도 된다 만일 결과변수가 정규분포가 아니라면? 그때 바로 partial correlation이 기능하는 것이다. 회귀분석하면 표에 보면 partial correlation 다 나와있다. 결국 한단계 위의 분석인 것이다. stepwise : 적합한 식을 구하는것 입력 : 이건 의미있어 ..

[샘플사이즈, G-power,power analysis]샘플수를 산정하고 샘플 수로 파워 알아내기

아직 정리 안한 글입니다. n 이 많을수록 유의할 확률은 올라간다. 꼭 좋은 것만은 아니다 sample size 를 계산햇으면 그 숫자대로 해야한다. 나는 49가 나왔으니까 연구 recruit 를 하다가 49가 나오거나 추가적인 loss 를 감안해서 조금 더 잡은 다음에 결국 분석은 49로 하는 것. DH 샘이 논문에 자기 논문 power 적는 것은 통계샘이 보기에는 별로.... 이번처럼 샘플 수 넘겼으면 알파는 조정못하니까 베타를 0.8에서 0.9 정도로 조정해서 필요 샘플 수를 늘리는 것은 하나의 꼼수

통계 공부하기 2016.10.25

[R]패키지 설치하기, package install

R을 시행하고 명령어 2개만 쳐주면 됩니다. > install.packages("ppcor")--- 현재 세션에서 사용할 CRAN 미러를 선택해 주세요 --- --> 아무거나 선택 나는 USA 제일 처음꺼 URL 'https://cran.cnr.berkeley.edu/bin/windows/contrib/3.2/ppcor_1.1.zip'을 시도합니다Content type 'application/zip' length 25264 bytes (24 KB)downloaded 24 KB 패키지 ‘ppcor’를 성공적으로 압축해제하였고 MD5 sums 이 확인되었습니다 다운로드된 바이너리 패키지들은 다음의 위치에 있습니다 C:\Users\Shim euddeum\AppData\Local\Temp\Rtmp2X11Im\d..

[R]ppcor package,데이터입력,y.data, 통계상담, Partial Rank Correlation 돌리기

나중에 package 설치하는 법도 올려야 하는데.. 여튼 평소에 하던대로 data이름=read.csv 이후에 pcor을 돌려봤더니 안 되서 통계교수님께 여쭤본 내용을 올려본다. ----------------------------------------------------------------------------------------------------통계교수님 답변 아래와 같이 입력하시면 됩니다.이때 몇번째 컬럼에 변수가 있는지에 따라 컬럼번호 변경하시면 될듯 합니다. setwd("D:/상담/R_EX")Y.DATA