통계패키지로 데이타를 분석하다보면 항상 나오는게 p-value입니다.
많은 분들이 데이타 분석시 아래 정도만 알고계실겁니다.
p-value <= 0.05, 귀무가설 기각
p-value > 0.05, 귀무가설을 기각할수 없음.
매번 이렇게 결론을 내리다보면 찜찜하지요.
그럼 이 찜찜함을 해소해드리도록 노력해보겠습니다.
첫째, p-value는 확률입니다. 그러므로 (0, 1)의 값을 갖습니다.
둘째, p-value를 쉽게 설명하자면, 실험을 했건 설문조사를 했건 거기서 관찰된 데이타 또는 그것의 summary인 검정통계량(test statistic)이 귀무가설(H0)을 지지하는 정도입니다. 이 해석에 의하면 p-value가 작을수록 관찰된 데이타가 귀무가설을 지지하는 정도가 약해지므로 귀무가설을 기각하겠지요.
복잡한걸 싫어하시는 분은 여기까지만 아시면 되고요. 좀 더 알고 싶으신 분은 계속 읽어보세요.
셋째, p-value의 정확한 정의를 말로 써보면, 귀무가설이 맞다고 가정했을때 얻어진 검정통계량보다 더 극단적인 결과가 나올 확률입니다. 여기서 극단적이라함은 대립가설에 유리하게 나오는것을 의미합니다. 좀 어렵죠... 그래서 예를 들어보죠.
1970년대에 한국 성인 남자의 평균키가 170cm이었는데,
2000년에 키의 평균이 증가했을거라고 주장하고 표본을 뽑아서 측정했더니 175cm였습니다.
그러면 가설이 어떻게 될까요.
H0: mu=170 vs Ha: mu > 170
이겠지요.
여기서 2000년에 측정된 표본평균 175가 검정통계량입니다.
검정통계량이 크면 클수록 귀무가설에 불리하고 대립가설에 유리하겠지요.
p-value가 검정톨계량이 관찰치보다 더 대립가설에 유리하게 나올 확률이라고했으니,
p-value= Pr(표본평균 > 175) 입니다.
그런데 이게 다가 아니죠. 귀무가설이 맞다는 가정했을때라는 단서가 있으니
p-value = Pr(표본평균 > 175 | mu=170) 입니다.
그런데 여기서 귀무가설이 맞다고 가정하고 구한 이유에 주목해야합니다.
표본평균의 표준오차를 1이라고 하면
위의 확률을 구할때 "Z=(표본평균 - mu)/1=(표본평균-mu)"로 표준화시키겠죠.
p-value = Pr{ (표본평균-mu)/1 > (175-170)/1 } = Pr(Z > 5) = 0
으로 p-value가 0입니다.
만약 관찰된 검정통계량이 175가 아니고, 귀무가설에 가까와서 170.5라고 하면
p-value = Pr( Z > 0.5) = 0.3085375 여서 꽤 큰 값이 나오지요.
짐작 되시겠지만
귀무가설이 맞다고 가정함으로써
귀무가설을 기준으로 삼고
관찰된 검정통계량이 거기서 얼마나 멀리 떨어져있나 보는것입니다.
멀리 떨어지면 p-value가 작아 대립가설을 지지하고,
가까우면 p-value가 커므로 귀무가설을 지지하겠지요.
참고) 양측검정의 경우 (Ha: mu is not 170)는 대립가설을 지지하는게 170으로부터 양쪽으로 멀어지는거죠. 그래서 175보다 큰 경우와 mu=170을 중심으로 정반대인 165보다 작은 경우도 동시에 고려해야합니다. p-value = Pr( 표본평균 > 175 or 표본평균 < 165 | mu=170) 입니다.
그래서 정규분포같이 대칭인 경우는 양측검정의 p-value는 단측검정의 p-value의 2배입니다.
Subscribe to:
Post Comments (Atom)
7 comments:
정말 잘 봤습니다.
2번째 배우는데도 제대로 된 P-value의 뜻을 모르고 있다가 블로거님의 상세한 설명에 한번에 이해가 됐습니다. 정말 감사합니다. :)
잘 봤습니다. 감사합니다:D
P-value에 대해 확실히 이해하고 갑니다. 감사합니다~ :)
감사합니다!!!
덕분에 제대로 이해했습니다. 정말 정말 감사합니다.
로지스틱 분석 결과,
변수 A는 odds ratio=0.992, 그 95% CI=(0.987, 0.997), p-value=0.0019 가 나오고
변수 B는 odds ratio=1.24, 그 95% CI=(1.026, 1.495), p-value=0.0262 가 나왔습니다.
이와 같이 변수 A, B 모두 95% CI에 1이 포함되지 않았고, 변수 A의 odds ratio가 0.992로 1에 더 가까운데, 변수 A의 p-value가 B보다 더 작게 나온 이유는 신뢰구간의 길이, 즉 표준오차의 크기와 관련있다고 보면 될까요?
Post a Comment