귀무가설(null hypothesis)

 영가설이라고도 불리는 귀무가설은 쉽게 말해 아무것도 일어나지 않는다는 의미이다. 예를 들어, '직업에 따라 몸무게에 차이가 없을 것이다.', '나이에 따라 키 차이가 없을 것이다' 등을 예로 들 수 있다.

 

대립가설(alternative hypothesis)

 이는 귀무가설과 반대로 무언가 일어났다는 의미이다. 예를 들어, '직업에 따라 몸무게에 차이가 있을 것이다.', '나이에 따라 키 차이가 있을 것이다.' 등을 예로 들 수 있다.

 

유의수준(significance level)

 상관관계가 '있다', '없다'의 기준이 되고 오류를 허용할 범위를 설정하는 값을 의미한다. 쉽게 말해 유의수준 0.1은 90% 믿을 수 있다는 뜻으로 생각하면 되고, 이를 신뢰수준(confidence level)이 90%라고 표현하기도 한다. 유의수준이 작아질수록 신뢰수준은 높아진다. 즉 유의수준 0.05는 95%의 신뢰수준을 의미한다. 참고로 유의수준을 얼마로 정할지는 때에 따라 다르다. 때에 따라 요구하는 신뢰수준이 다르기 때문이다. 관습적으로 0.05의 유의수준을 사용하지만, 노이즈가 많다면 0.1의 유의수준을 사용하거나 고위험 분야에서는 0.01의 유의수준을 요구하기도 한다.

 

유의확률(significance probability)

오류가 나올 수 있는 확률을 의미한다. 이를 나타내는 수치가 p 값(p-value)이다. 유의수준과 분석 결과 나온 p 값을 비교하여 가설을 평가하는 것이 바로 가설검정(test of hypothesis)이다.

 


 

예시로 알아보기

예를 들어 평소에 늘 짜장면을 먹다가 언젠가부터 맛이 없어진 것 같아 짬뽕이 먹고 싶어졌다고 하자. 이러한 생각이 의미 있는지 가설을 검정해보려 귀무가설과 대립가설을 세우면 다음과 같다.

 

귀무가설: 짜장면과 짬뽕의 맛은 동일하다

대립가설: 짬뽕이 짜장면보다 맛있다.

 

유의 수준은 0.05로 결정했다고 하자. 이제 실제로 데이터를 수집해 컴퓨터로 계산한 결과 p 값이 0.03이 나왔다고 하자. 그러면 p 값이 유의수준 0.05보다 작다. 이 경우 귀무가설은 기각되고 대립가설이 채택된다. 즉 짬뽕이 더 맛있으므로 짬뽕을 먹겠다는 새로운 주장이 통계적으로 맞게 된다.

 

 

 

예시로 알아보기 2

+ Recent posts