728x90 반응형 전체 글 보기164 00. 통계적 실험과 유의성 검정 개요 실험 설계는 모든 응용 연구 분야에서 통계분석의 토대가 된다. 실험 설계는 어떤 가설을 확인하거나 기각하기 위한 목표가 있기 때문이다. 데이터 과학자들은 지속적으로 실험을 수행해야 하는 상황에 있으며 의미와의 관련성에 대해 공부하고자 한다. 실험은 가설을 검정하기 위해 설계되며, 원하는 최종의 결론을 도출할 수 있도록 설계된다. 또한, 데이터를 수집하고 분석하여 결론을 도출한다. 공부할 내용 A/B 검정 가설 검정 재표본추출 통계적 유의성과 p값 t검정 다중검정 자유도 분산분석 카이제곱검정 멀티암드 밴딧 알고리즘 검정력과 표본크기 2020. 5. 8. [ 모두의 데이터 분석 with python ] 3.지하철 데이터 0. 데이터 가져오기 다음의 책을 참조하였습니다. 지하철 데이터를 다운받기 위해서 https://pay.tmoney.co.kr/index.dev 에 접속합니다. 데이터를 다운 받습니다. 1 ) subwayfee.csv 파일을 생성하겠습니다. 다운로드 받은 엑셀 파일을 열어 '지하철 유무임별 이용현황' tab으로 이동합니다. pandas로 불러와서 int로 편하게 바꾸기 위해서 ctrl + F 로 콤마를 찾아 제거합니다. 이후, 작업일시 (I)는 사용하지 않으므로 삭제합니다. 2 ) subwaytime.csv 파일을 생성하겠습니다. 다운로드 받은 엑셀 파일을 열어 '지하철 시간대별 이용현황' tab으로 이동합니다. pandas로 불러와서 int로 편하게 바꾸기 위해서 ctrl + F 로 콤마를 찾아 제거합.. 2020. 5. 8. [ 모두의 데이터 분석 with python ] 2. 인구 데이터 0. 데이터 가져오기 다음의 책을 참조하였습니다. 인구 데이터를 다운로드 받기 위해서 www.mois.go.kr에에 접속합니다. 상단에서 정책자료 -> 통계 -> 주민등록 인구 통계를 클릭합니다. 왼쪽의 연령별 인구 현황을 클릭한 뒤, 다음과 같이 설정하였습니다. 1. 데이터 살펴보기 파일을 로드하였습니다. import csv f = open('/모두의 데이터 분석 with 파이썬/Unit3 인구 raw.csv', encoding='cp949') data = csv.reader(f) for row in data: print(row) 다음과 같이 데이터가 있음을 확인하였습니다. 신도림 동의 인구를 확인해보겠습니다 ! # data를 한 줄 씩 돌면서 for row in data.. 2020. 5. 5. [ 모두의 데이터 분석 with python ] 1. 기온 데이터 0. 데이터 가져오기 다음의 책을 참조하였습니다. 기온 데이터를 다운로드 받기 위해서 https://data.kma.go.kr 에 접속하였습니다. 기후 통계분석 -> 통계분석 -> 기온분석 을 차례로 클릭하였습니다. 기간은 19040101 ~ 20190117 로 설정하였습니다. 이후, csv 다운로드를 클릭합니다. 파일을 열어 불필요한 부분을 삭제한 뒤, csv로 다시 저장하였습니다. 저는 구글 드라이브에서 실행하였습니다. 1. 데이터 살펴보기 파일을 로드하여, header에 어떤 것이 있는지 확인해봅니다. import csv f = open('/모두의 데이터 분석 with 파이썬/Unit1 기온 raw.csv', encoding='cp949') data = csv.read.. 2020. 5. 5. 이전 1 ··· 14 15 16 17 다음 728x90 반응형