안녕하세요~ 오늘도 글을 올립니다! 커피숍 커피는 너무 맛있는거 같군요..
오늘은 추정과 검정에 대해서 알아보겠습니다.
1. 추정과 검정
1) 추정의 개요
(1) 통계적 추론 : 표본에서 얻은 정보로 모집단의 특성을 추측하거나 결정. 추정과 검정이 있다.
(2) 추정 : 표본으로부터 미지의 모수를 추출하는 것. 점추정과 구간추정이 있다.
점추정 : 모수를 하나의 수치로 추정하는 것. ( 모평균, 모분산, 모비율 등 )
점추정량의 조건 : 불편성, 유효성, 일치성, 충분성
구간추정 : 모수다 포함될 구간을 추정하는 것 ( 모평균, 모분산, 모비율에 대한 구간 )
2) 가설검정의 개요
모집단의 특성에 대한 가설을 설정하고 표본관찰을 통해 해당 가설을 채택할 지 여부를 결정하는 방법으로, 언제나 귀무가설은
버릴 목적의 내용을 가설로 설정하고, 대립가설은 연구자인 내가 증명하고자 하는 내용을 담는다.
(1) 귀무가설 (H0) : "비교대상의 값과 차이가 없다, 동일하다"를 기본 개념으로 하는 가설
(2) 대립가설(H1) : 뚜렷한 증거가 있을 때 주장하는 가설
(3) 검정결과를 모집단에 대한 것으로 일반화할 경우의 오류
(1-1) 제 1종 오류() : 귀무가설 H0가 옳은데도 불구하고 H0를 기각하게 되는 오류
(1-2) 제 2종 오류() : 귀무가설 H0가 옳지 않은데도 불구하고 H0를 채택하는 오류
* 가설검정에서는 위 두 가지 오류가 작을수록 좋지만, 두 가지를 모두 다 줄일 수 없는 관계에 있다. 하지만 일반적으로
두 가지 중 제 1종오류를 더 중요시 생각하고 제 1종 오류를 범할 확률의 최대 허용치를 미리 지정하고,
제 2종 오류의 확률을 가장 작게 해주는 검정 방법을 택한다.
( 두 가지의 중요성을 이해하자면, 제 1종 오류는 사람A가 범죄자가 아님에도 기소하게 되는 경우? 제 2종 오류는 사람B가
범죄자임에도 무혐의가 되는 경우라고 보면 되겠네요. 도움이 됐을려나 모르겠네요 ㅋㅋ! )
(4) 유의수준 (signification level)
-제 1종 오류를 범할 확률의 최대 허용치
-통상 a=0.05나 0.01 때때로 0.1까지 선택함. 즉 5%, 1%, 10%
-a=0.05의 의미는 100번 검정 중 5번은 제 1종의 오류를 범한다는 의미.
(5) 검정력(power of test)
-제 2종 오류()를 1에서 빼준 값.
-1-b는 틀린 귀무가설을 기각하여 귀무가설의 잘못을 찾아내는 확률로 검정력이 된다.
-검정력은 모수의 값에 따라 달라지는데, 이 함수의 값이 클수록 좋은 검정.
(6) 검정통계량 (test statistic)
-관찰된 표본으로부터 구하는 통계량
-검성 시 가설의 진위를 판단하는 기준
(7) 기각역 (critical region)
-검정통계량의 분포에서 유의수준 a의 크기에 해당하는 영역
-계산된 검정통계량의 유의성을 판정하는 기준
(8) 유의확률(significance probability)
-관측치에 의해 귀무가설을 기각시킬 수 있는 검정법들의 유의수준 a 가운데 가장 작은 최솟값
-흔히 유의확률을 p-value라 하고 유의수준 a보다 작으면 귀무가설을 기각하게 됨.
* 유의해야할 점은 우리가 정해놓은 유의수준이 양측검정인지 단측검정인지 확인하여야 한다.
3) 가설검정의 절차
-통계분석에서는 언제나 통계 값에 대해 P값을 확인하여 유의미한지 확인해야 한다. 예를 들어 상관관계가 0.7이라고 하여
실제로 상관관계가 있다고 보는 것이 아니라 P값을 확인해보고 무엇이 문제인지 확인해봐야 하는 것이다.
1. 가설의 설정 (Ho,H1) -> 2. 유의수준 a 결정 -> 3. 검정통계량 계산 -> 4. 기각역 계산 -> 5. 가설의 채택여부 결정
4) 검증의 유형
- 한 개의 모평균 추정과 검정 / 두 개의 모평균 차에 대한 추정과 검정 / 한 개의 모분산 추정과 검정 / 두 개의 모분산비율에 대한
추정과 검정 / 적합도 검정 / 상관계수 검정 / 회귀계수 검정 / 회귀모형 적합도 검정 등
여기까지 추정과 검정에 대한 개념을 봤는데요~ 다음 시간에는 추정과 검정을 R을 이용해서 해보겠습니다!
'## 오래된 게시글 (미관리) ## > R' 카테고리의 다른 글
12. 기초통계분석의 개념과 시각화 방법 (0) | 2018.11.20 |
---|---|
11. R을 이용한 추정과 검정 (0) | 2018.11.20 |
9. 통계분석의 개념 (0) | 2018.11.20 |
+ R명령어 조금 더 알아보기 (0) | 2018.11.20 |
7. airquality 데이터를 이용한 데이터변환 (0) | 2018.11.20 |