가설 검정이란?
가설 검정, 유의성 검정은 전통적인 통계분석 방법이다. 목적은 관찰된 효과가 우연에 의한 것인지 여부를 알아내는 것이다. 이는 연구자가 랜덤하게 우연히 일어난 일에 속지 않도록 보호하기 위한 방법으로 개발되었다.
적절하게 설계된 A / B 검정에서는, A와 B 사이의 관찰된 차이가 1 ) 우연한 대상 선정 2 ) A와 B의 진정한 차이로 설명될 수 있도록 데이터를 수집한다.
가설 검정은 어떻게 이루어질까?
가, 나 그룹이 있을 때 실험에서 얻은 그룹간의 차이가 랜덤을 통해 얻을 수 있는 합리적인 수준과는 극단적으로 다르다는 증거를 보여야 한다. 그래서 두 가설을 세운다.
귀무가설 : 그룹들이 보이는 결과는 서로 동일하며, 그룹 간의 차이는 우연에 의한 결과이다. ( 이건 우연이야~ )
대립가설 : 귀무가설에 대립되는 가설( 증명하고자하는 가설, 우연이 아니다 !! 뭔가 있어 !! )
가, 나 그룹 간의 차이가 우연이 아님을 증명하는 방법은 재표본추출 순열검정을 통한 방법이 있다.
- 재표본추출 순열검정 : 가와 나 그룹의 결과를 서로 섞어서 비슷한 크기의 그룹들을 반복적으로 만든 다음, 관찰된 차이가 각 경우의 차이들과 비교했을 때 얼마나 극단적인지 관찰하는 방법이다.
일원 / 이원 가설검정이란 ?
A / B 검정을 통해 기존에 사용되던 옵션이 A(귀무 가설), 새로운 옵션이 B(대립 가설)라고 하자.
1 ) 일원 가설 검정
우리는 B가 A보다 나음이 증명되지 않으면 A를 계속 고수할 것이다. ( B가 증명되지 않았기 때문에 안속아요 ! ) 따라서 우리는 'B는 A보다 낫다'는 방향성을 고려한 대립가설이 필요하다. 이 경우에 일원 가설검정을 사용한다.
즉, 우연에 의한 극단적인 결과에 대해 한 방향만을 고려하여 p값을 계산한다는 것이다.
2 ) 이원 가설 검정
어느 쪽으로도 속지 않도록 가설검정을 원할 때 대립가설은 양방향이 되며, 이 경우에 이원 가설검정을 사용한다.
즉, 우연에 의한 극단적인 결과가 양쪽에서 나타날 p값을 계산한다는 의미이다.
3 ) 데이터 과학에서는 ?
A / B 검정의 특성상 일원 가설검정과 잘 어울린다. 하지만 여러 소프트웨어들은 일반적으로 이원 가설 검정 결과를 기본적으로 제공하며, 통계 전문가들도 보수적인 이원 가설 검정을 선택한다.
'AI > Statistics' 카테고리의 다른 글
05. t검정( t -test ) (0) | 2020.05.11 |
---|---|
04. 통계적 유의성과 p-value (0) | 2020.05.10 |
03. 재표본추출 (0) | 2020.05.09 |
01. A / B 검정 (0) | 2020.05.08 |
00. 통계적 실험과 유의성 검정 개요 (0) | 2020.05.08 |