[통계학#6] 통계적 가설 - 귀무가설과 대립가설

※ K-Mooc 통계학 / 전공 데이터 애널리틱스 강의를 듣고 정리한 내용입니다.

통계적 가설

일반적인 가설은 1+1=3과 같이 참, 거짓을 검증할 수 있다. 하지만 통계적 가설은 참, 거짓을 귀납, 연역법으로 증명할 수 없고 관련된 통계 자료를 이용하여 가장 가능성 높은 결론을 내린다. 그리고 흔히 말하는 95%, 99%의 신뢰 수준이라는 것은 5% 또는 1%의 확률로 가설이 틀릴 가능성을 포함하고 있다. 즉, 반드시 오류를 수반한다. 그래서 통계적 가설은 “~가 아니라고 할 수 없다.”, “~와 다르다고 할 수 없다”와 같이 애매한 결론을 내리기도 한다.

귀무가설과 대립가설

통계적 가설에는 ‘귀무가설’과 ‘대립가설’이 있다. 귀무가설(Null Hypothesis)은 나의 가설과 반대되는 부정하고 싶은 문장을 가설로 설정한다. 반대로, 대립가설(Alternative Hypothesis)는 내가 주장하고 싶은 문장을 가설로 설정한다. 따라서, 가설을 채택할 때는 귀무가설 또는 대립가설을 선택한다.

예를 들어, 자동차 회사에서 신형차를 개발했다고 하자. 기존 자동차의 연비는 10이고, 신형차의 연비가 기존 자동차보다 좋다는 가설을 세웠다. 이때 귀무가설은 $μ = 10$ , 대립가설은 $μ > 10$ 이다.

통계적 가설 검정 과정

귀무가설과 대립가설을 세운다.
검정통계량 선택
기각역 설정

검정 통계량

검정 통계량은 귀무가설, 대립가설을 검증하는데 필요한 통계량을 말한다. 다른 말로 하면, ‘귀무가설의 기각 여부를 결정하는데 사용되는 통계량’이라고도 할 수 있다.

기각역

기각역(Rejection Region 또는 Critical Region)은 귀무가설이 기각되는 영역이다. 그리고 $c$ 는 귀무가설이 기각되는 경계에 있는 위치 ‘기각치(Critical Value)’를 말한다.

$\bar{X} > c$ 이면 귀무가설 $H$ _ $0$ 을 기각한다.

1종 오류(Type1 Error)와 2종 오류(Type2 Error)

위의 신형차 예시를 다시 보자. 신형차 중 표본 100개를 뽑아서 연비의 표본 평균 $\bar{X} = 10.5km/l$ 구했다.

그렇다면 신형차가 기존 차보다 연비가 좋다고 할 수 있을까? 모든 신형차에 대해 연비를 조사한 게 아니니 실제로 연비가 더 좋은지 아닌지는 ‘신’만이 안다. 즉, 앞서 통계적 가설은 참, 거짓으로 검증할 수 없다고 한 것처럼 가능성 높은 가설을 채택하는 수 밖에 없다.

이때, 저지를 수 있는 오류가 2가지가 있다.

1종 오류(Type1 Error)

$H_0$ (귀무가설)이 맞는데 $H_0$ 을 기각한 경우다. 즉, 내가 주장하고 싶은 것과 반대되는 귀무가설이 맞는데, 기각한 경우에 해당한다. 여기서 제 1종 오류를 범할 확률은 $α$ (유의수준, level of significance)라고 한다.

2종 오류(Type2 Error)

$H_1$ (대립가설)이 맞는데 $H_0$ 을 채택한 경우다. 1종 오류와 반대로, 내가 주장하고 싶은 가설이 맞는데, 귀무가설을 채택한 경우에 해당한다. 여기서 제 2종 오류를 범할 확률은 $β$ 라고 한다. $1-β$ 는 검정력이라고 하는데, 검정력이 높다는 것은 옳은 결정을 할 확률이 높다는 것을 의미한다. 따라서 $β$ 는 낮을 수록 좋다.

최적의 검정법(Optimal Test)

제 1종, 2종 오류를 범할 확률을 각각 $α, β$ 라고 했다. 옳은 결정을 하기 위해서는 이 두 확률을 최소화해야 한다. 하지만, 표본의 크기를 늘리지 않는 이상 두 확률을 최소화하는 것은 불가능하다. 이런 상황에서 최적의 검정법은 $α$ 를 작은 값(0.01, 0.05, 0.1)으로 고정시키고, 검정력( $1-β$ )를 최대화시킨다.

기각역 계산법

유의수준 $α$ 가 주어졌을 때, 검정통계량 $Z$ 의 분포를 구한 후, 유의수준에 맞는 기각역 설정한다.

위의 문제로 기각역을 계산해보자.

$α = P[\bar{X} > c] = P[ \frac{\bar{X} - 10}{2/\sqrt{50}} > \frac{c - 10}{2/\sqrt{50}}] = P[Z > z_α]$

이므로 $c = z_α \frac{2}{\sqrt{50}}$ 이 된다. ( $z_α$ 값은 Z 분포표를 통해 구할 수 있다.)

유의수준 $α = 0.05$ 라면 기각치 $c = 1.645 \frac{2} {\sqrt{50}} + 10 = 10.465$ 가 된다. 따라서, 관측된 검정통계량 $\bar{X} = 10.5$ 이다. 만약, $c$ 값 10.465보다 연비가 높다면 효과가 높다고 말할 수 있다. 위에서 신형차 100개 표본을 뽑아 구한 표본 평균이 10.5였으므로 유의수준 0.05일 때 귀무가설을 기각할 수 있다.

Summary

판사의 판결을 비유해 보면,

귀무가설 : 피고는 무죄
대립가설 : 피고는 유죄 (검사의 입장)
검정통계량 : 증인, 증거물 (판단의 근거)
기각역 : 법전, 판례 (판단 기준, 영역)
제 1종 오류 : 실제로 무죄인 피고를 유죄로 판결 (하지만 통계에서는 모수가 실제로 어떤지는 신만이 안다)
제 2종 오류 : 실제로 유죄인 피고를 무죄로 판결