본문 바로가기
AI/Statistics

02. 가설 검정

by _S0_H2_ 2020. 5. 8.
728x90
반응형

가설 검정이란?

가설 검정, 유의성 검정은 전통적인 통계분석 방법이다. 목적은 관찰된 효과가 우연에 의한 것인지 여부를 알아내는 것이다. 이는 연구자가 랜덤하게 우연히 일어난 일에 속지 않도록 보호하기 위한 방법으로 개발되었다.

 

적절하게 설계된 A / B 검정에서는, A와 B 사이의 관찰된 차이가 1 ) 우연한 대상 선정 2 ) A와 B의 진정한 차이로 설명될 수 있도록 데이터를 수집한다.

 

 

가설 검정은 어떻게 이루어질까?

가, 나 그룹이 있을 때 실험에서 얻은 그룹간의 차이가 랜덤을 통해 얻을 수 있는 합리적인 수준과는 극단적으로 다르다는 증거를 보여야 한다. 그래서 두 가설을 세운다.

 

귀무가설 : 그룹들이 보이는 결과는 서로 동일하며, 그룹 간의 차이는 우연에 의한 결과이다. ( 이건 우연이야~ )

대립가설 : 귀무가설에 대립되는 가설( 증명하고자하는 가설, 우연이 아니다 !! 뭔가 있어 !! ) 

 

가, 나 그룹 간의 차이가 우연이 아님을 증명하는 방법은 재표본추출 순열검정을 통한 방법이 있다.

  • 재표본추출 순열검정 : 가와 나 그룹의 결과를 서로 섞어서 비슷한 크기의 그룹들을 반복적으로 만든 다음, 관찰된 차이가 각 경우의 차이들과 비교했을 때 얼마나 극단적인지 관찰하는 방법이다.

 

일원 / 이원 가설검정이란 ?

A / B 검정을 통해 기존에 사용되던 옵션이 A(귀무 가설), 새로운 옵션이 B(대립 가설)라고 하자. 

 

1 ) 일원 가설 검정

우리는 B가 A보다 나음이 증명되지 않으면 A를 계속 고수할 것이다. ( B가 증명되지 않았기 때문에 안속아요 ! ) 따라서 우리는 'B는 A보다 낫다'는 방향성을 고려한 대립가설이 필요하다. 이 경우에 일원 가설검정을 사용한다.

즉, 우연에 의한 극단적인 결과에 대해 한 방향만을 고려하여 p값을 계산한다는 것이다.

 

2 ) 이원 가설 검정

어느 쪽으로도 속지 않도록 가설검정을 원할 때 대립가설은 양방향이 되며, 이 경우에 이원 가설검정을 사용한다.

즉, 우연에 의한 극단적인 결과가 양쪽에서 나타날 p값을 계산한다는 의미이다.

 

3 ) 데이터 과학에서는 ?

A / B 검정의 특성상 일원 가설검정과 잘 어울린다. 하지만 여러 소프트웨어들은 일반적으로 이원 가설 검정 결과를 기본적으로 제공하며, 통계 전문가들도 보수적인 이원 가설 검정을 선택한다. 

728x90
반응형

'AI > Statistics' 카테고리의 다른 글

05. t검정( t -test )  (0) 2020.05.11
04. 통계적 유의성과 p-value  (0) 2020.05.10
03. 재표본추출  (0) 2020.05.09
01. A / B 검정  (0) 2020.05.08
00. 통계적 실험과 유의성 검정 개요  (0) 2020.05.08