가설 검정시에 항상 나오는것이 유의수준(level of significance)입니다.
유의수준은 가설검정시
귀무가설이 맞을때 그것을 기각하는 오류를 얼마나 허용할지를 말해줍니다.
이러한 오류를 1종오류라고도 합니다.
보통 1종오류를 일정수준으로 고정시킨후 가설검정을 합니다.
가장 많이 쓰는 값은 물론 0.05이지요.
예를 들어보면,
나뭇잎 하나를 발견했다고하죠.
그런데 그 나뭇잎이 A라는 나무의 잎하고 닮았습니다.
그래서 그 잎의 길이를 측정해서, A나무의 잎인지 아닌지 결정을 내리기로했습니다.
측정했더니 12.5cm였습니다.
A라는 나무의 잎의 길이는 10cm이고 표준편차가 1인 정규분포를 따른다고 하지요.
A나무의 잎은 평균보다 훨씬 큰 14cm일수도 있고 훨씬 작은 6cm일수도 있습니다. 그러나 평균에서 멀어질수록 가능성은 적어지죠.
여기서 유의수준을 0.05로 한다는것은 좀 극단적으로 표현하면
A나무의 잎이라도 평균에 가까운 100*(1-0.05)=95%만을 정상으로 생각하고
평균과 멀리 떨어진 나머지 5%는 비정상으로 생각한다는겁니다.
A나뭇잎 길이의 95% 신뢰구간을 구해보면,
(10-1.96*1, 10+1.96*1) = (8.04, 11.96)입니다.
A나뭇잎이 이 구간안에 있을 확률은 95%인데
미지의 나뭇잎은 12.5여서 비정상으로 분류된 5%에 속하므로
A나뭇잎이 아니라는 결론을 내립니다.
다른 말로, 8.04와 11.96이 기각력이 되고 측정된 검정통계량 12.5는 기각력에 속하므로
A나무의 잎이 아니라는 결론을 내립니다.
이 경우 p-value를 계산해보면
Pr(X >12.5 | mu=10) = Pr{(X-10)/1 > (12.5-10)/1} = Pr( Z > 2.5 ) = 0.0062인데
양측검정이므로 2배인 0.0124입니다.
Subscribe to:
Post Comments (Atom)
3 comments:
잘 봤습니다
퍼가요
단순 명쾌하게 설명 잘해주셨어요^^ 감사합니다.
가장 쉬운 설명입니다.. 잘 봤습니다..
Post a Comment