728x90 반응형 AI24 03. 재표본추출 재표본추출이란 ? 통계학에서 재표본추출의 목표는 랜덤한 변동성을 알아보기 위함이다. 재표본추출은 표본을 반복적으로 추출하는 것을 의미한다. 이를 적용하면 머신러닝 모델의 정확성을 평가하고, 향상시킬 수 있다. [ 재표본추출의 유형 ] 1 ) 부트스트랩 2 ) 순열 검정 재표본추출은 여러 표본이 결합되어 비복원추출을 수행할 수 있는 순열 과정을 포함하는 반면, 부트스트랩은 항상 관측된 데이터로부터 복원 추출한다. 부트스트랩은 추정의 신뢰성을 평가하는데 사용된다. 1. 부트스트랩( bootstrap ) 어원 pull your self up by your bootstraps이라는 말에서 유래되었다. 외부의 도움 없이 어떤 과정을 수행해나갈 수 있음을 의미한다. 장점 1 ) 데이터셋의 분포가 고르지 않은 경우에.. 2020. 5. 9. 02. 가설 검정 가설 검정이란? 가설 검정, 유의성 검정은 전통적인 통계분석 방법이다. 목적은 관찰된 효과가 우연에 의한 것인지 여부를 알아내는 것이다. 이는 연구자가 랜덤하게 우연히 일어난 일에 속지 않도록 보호하기 위한 방법으로 개발되었다. 적절하게 설계된 A / B 검정에서는, A와 B 사이의 관찰된 차이가 1 ) 우연한 대상 선정 2 ) A와 B의 진정한 차이로 설명될 수 있도록 데이터를 수집한다. 가설 검정은 어떻게 이루어질까? 가, 나 그룹이 있을 때 실험에서 얻은 그룹간의 차이가 랜덤을 통해 얻을 수 있는 합리적인 수준과는 극단적으로 다르다는 증거를 보여야 한다. 그래서 두 가설을 세운다. 귀무가설 : 그룹들이 보이는 결과는 서로 동일하며, 그룹 간의 차이는 우연에 의한 결과이다. ( 이건 우연이야~ ) 대.. 2020. 5. 8. 01. A / B 검정 A / B 검정이란? A / B 검정은 두 개의 선택 중 어느 쪽이 다른 쪽 보다 우월함을 입증하기 위해서 실험군을 두 그룹으로 나누어 진행하는 실험이다. 이 때, 두 그룹은 다음의 용어를 사용한다. 대조군 : 어떤 처리도 하지 않은 대상들의 집단 처리군 : 어떤 처리에 노출된 대상들의집단 두 그룹은 무작위로 할당되어 실험을 위한 처리가 이루어진다. 즉, 실험 결과에서 나타난 차이점은 1 ) 다른 처리의 효과 2 ) 어떤 대상이 어떤 그룹에 배정될지에 대한 경우의 수에 의해 나타난다고 말할 수 있다. 또한, 결과를 나타내는 측정 지표에도 주의를 기울여야 한다. 측정 지표는 연속형 변수, 횟수를 나타내는 변수에 따라 결과가 다르게 표시될 수 있기 때문이다. A / B 검정은 유의미한가? 1 ) 널리 사용되.. 2020. 5. 8. 00. 통계적 실험과 유의성 검정 개요 실험 설계는 모든 응용 연구 분야에서 통계분석의 토대가 된다. 실험 설계는 어떤 가설을 확인하거나 기각하기 위한 목표가 있기 때문이다. 데이터 과학자들은 지속적으로 실험을 수행해야 하는 상황에 있으며 의미와의 관련성에 대해 공부하고자 한다. 실험은 가설을 검정하기 위해 설계되며, 원하는 최종의 결론을 도출할 수 있도록 설계된다. 또한, 데이터를 수집하고 분석하여 결론을 도출한다. 공부할 내용 A/B 검정 가설 검정 재표본추출 통계적 유의성과 p값 t검정 다중검정 자유도 분산분석 카이제곱검정 멀티암드 밴딧 알고리즘 검정력과 표본크기 2020. 5. 8. 이전 1 2 3 다음 728x90 반응형