ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 행동과학을 위한 기초 통계학 | 제 7장. z 검증을 통한 가설검증
    통계 공부 2022. 2. 13. 19:12

     

    가설검증의 가정과 단계
    가정 (assumption), 강건함 (robust)
    모수적 검증 (parametric test), 비모수적 검증 (nonparametric test)
    양방검증 (two-tailed test), 일방검증(one-tailed test)

    z 검증
    알파수준 (alpha level), 임곗값 (critical value), 임계영역 (critical region)
    통계적 유의성 (statistical significance)

     

     

     

    z 점수표


    7.1. 퍼센타일이란 무엇인가?

    분포의 특정 지점 아래에 위치한 점수들의 백분율이다. 

     

    7.2. z 점수표에서 z 점수를 찾으면, 어떤 정보를 보고할 수 있는가?

    z 점수표를 사용하여 분포의 평균과 주어진 z 통계치 사이에 들어가는 점수들의 백분율을 찾을 수 있다. 

     

    7.3. 양수인 z 점수 아래에 위치한 점수들의 백분율은 어떻게 계산하는가?

    평균과 양수인 z 점수 사이의 백분율을 50% (평균 이하 점수의 백분율) 에 더한다. 

     

    7.4. 평균분포에서 특정 평균의 퍼센타일을 계산하는 것은 점수분포에서 특정 점수의 퍼센타일을 계산하는 것과 어떻게 다른가?

    동일한 변환을 하나의 개별 점수 대신에 표본 평균을 대상으로 수행할 수 있다.
    절차는 동일하지만, 점수분포 대신에 평균분포의 평균과 표준오차를 사용한다. 

     

    더보기

    7.29. SAT 언어검사 평균점수가 542인 50명 표본에게 z 검증을 실시하고 있다.

    전집 평균은 500이고, 표준편차는 100이라는 사실을 알고 있다고 가정한다.

    비교 분포의 평균과 표준오차를 계산하라. 

    전집, 표본, 표본평균(비교분포)

     

     

     

     

     

     

    가설검증의 가정과 단계


    7.5. 통계학에서 가정 (assumption) 이 의미하는 것은 무엇인가?

    정확한 추론을 위하여 표본을 표집하는 전집에 요구하는 이상적인 특성이다. 
    가정을 충족하는 것이 연구의 질을 높여주지만, 가정을 충족하지 못하는 것이 반드시 연구를 무효화하지는 않는다. 

    세 가지 가정 가정의 위배
    종속변인은 척도변인 측정치로 평가한다. 명목변인이나 서열변인이 아니면 문제가 없다.
    참가자를 무선선택한다. 일반화에 신중을 기하면 문제가 없다.
    전집은 정상분포에 근접한다. 표본크기가 최소한 30이면 문제가 없다.

     

    7.6. 점수분포가 정상분포를 이루지 않을 때조차 평균분포의 정상성 가정을 충족시키기 위해 어떤 크기의 표본을 권정하는가? 

    표본크기가 최소 30에 달하기를 권장한다. 

     

    7.7. 모수적 검증과 비모수적 검증 간의 차이는 무엇인가?

    모수적 검증 (parametric test) 이란 전집에 관한 일련의 가정에 근거한 추론통계 분석이다. 
    비모수적 검증 (nonparametric test) 이란 전집에 관한 일련의 가정에 근거하지 않는 추론통계 분석이다. 

    z 검증은 모수적 검증의 대표적인 케이스이다.
    이 표본이 표본평균 분포에서 위치하는 곳, z 점수를 확인하여, 임계영역에 포함되는지를 확인한다. 

     

    7.8. 가설검증의 여섯 단계는 무엇인가?

    단계 1. 전집, 비교분포, 그리고 가정을 확인한다. 
    단계 2. 영가설과 연구가설을 진술한다. 
    단계 3. 비교분포의 특성을 결정한다.
    단계 4. 임곗값 또는 컷오프값을 결정한다.
    단계 5. 검증통계치를 계산한다.
    단계 6. 통계적 유의성에 대한 결정을 내린다. 

     

    7.9. 임곗값과 임계영역은 무엇인가?

    임곗값은 영가설을 기각하기 위해서 넘어야 하는 검증통계치 이다.
    임계영역은 비교분포에서 영가설을 기각할 수 있는 꼬리 부분의 영역이다. 

    가설검증에서 임곗값을 결정하는 데 사용하는 확률이 알파수준 (alpha level) 또는 p수준 이라고 부른다. 

     

    7.10. 대부분의 통계학자가 사용하는 임계영역의 표준 크기는 얼마인가? 

    0.05

     

    7.11. 통계학자에게 통계적 유의성이 의미하는 것은 무엇인가?

    영가설을 기각할 때 흔히 결과가 '통계적으로 유의하다'고 지칭한다. 
    우연히 기대할 수 있는 것과 차이를 보이는 결과는 통계적으로 유의하다. 

     

    7.12. 다음 기호 표현이 의미하는 것은 무엇인가?

    영가설 (Null Hypothesis)
    전집 1 의 평균값과 전집 2의 평균값은 동일하다.  


    연구가설, 대립가설 (Alternative Hypothesis)
    전집 1 의 평균값과 전집 2의 평균값은 동일하지 않다. 

     

    7.13. 연구자가 영가설을 기각하기 위해서 z 통계치가 위치해야할 영역을 정의하는 데 임계영역이라는 표현을 선택해왔던 이유를 통계학 용어 대신 일상적 표현으로 설명해보라.

    검증통계치의 값은 정상곡선에서 통계적으로 유의한 결과를 나타내는 영역을 기술하고 있기 때문에 임계영역이라는 표현을 사용해왔다.

     

    7.15. 임계영역이라는 측면에서 일방검증과 양방검증 간의 차이는 무엇인가?

    일방검증에서는 임계영역이 분포의 한쪽 꼬리에만 위치한다.
    양방검증에서는 임계영역이 절반씩 분할되어 양쪽 꼬리에 위치한다.

     

    7.18. 반복연구란 무엇이며, 그것이 행동과학 연구에서 중요한 이유는 무엇인가?

    상이한 표본을 대상으로 동일한 연구를 수행하여 매번 동일한 결과를 얻는다면, 그 결과가 정확한 것일 가능성이 더 크다. 

     

    7.19. 만일 어떤 연구를 반복하려는 시도가 실패한다면, 그 실패가 원래 연구에 관하여 지적할 수 있는 두 가지 사실은 무엇인가? 

    원래 연구의 결론이 오류 (1종 오류 또는 2종 오류) 일 가능성이 있다. 

    결과 간의 차이는 실험실, 표본, 연구자 등 연구 맥락에서의 차이를 반영하는 것일 수도 있다. 
    아니면 현상 자체가 시간 경과에 따라 변하였을 수도 있다. 방법론의 미세한 변화에 근거한 다른 설명들도 가능하겠다. 

    몇몇 과학자는 경쟁적인 가설을 검증할 뿐 아니라 어떤 결과를 검증하였던 맥락을 확장하기 위하여 지나치게 엄격하지 않은 반복연구를 요구하고 있다. (Larzelere, Cox, & Swindle, 2015)

     

    더보기

     7.39. 13명의 15세 소년으로 구성된 농구팀을 상상해보라. 팀의 평균 신장은 69.50 인치이다.
    μ = 67.00 이고, σ = 3.19 임을 기억하라.

    z 검증 - 전집, 표본, 표본평균, 특정 표본의 z 통계치

    a. z 통계치를 계산해라. 2.83

    b. 이 표본을 평균분포에 어떻게 비교하겠는가?
    z 통계치는 표본 평균이 크기가 13인 표본에서 기대하는 평균보다 2.83 표준편차만큼 위에 위치함을 나타낸다.
    다시 말해서, 이 소년 표본은 이례적으로 키가 크다.

    c. 이 표본의 퍼센타일 순위는 얼마인가?  99.77%
    표본 평균의 99.77% 가 이 표본에서 얻은 평균보다 작다는 사실을 의미한다. 

     

    가설 검증 6단계를 따라가보자.

    1. 전집, 비교분포, 그리고 가정 확인 => z 검증 채택

    전집. 15세 소년 전체
    표본. 15세 소년으로 구성된 농구팀 13명
    비교분포. 평균분포 

    13명 농구팀 표본의 평균을 소년 전체에서 13명 표본을 표집했을 때 가능한 평균 (평균분포) 에 비교한다. 
    z 검증: 단지 하나의 표본만을 가지고 있으며, 발표된 규준에서 전집의 평균과 표준편차를 알고있기 때문이다.  

    2. 가설 진술
    영가설: 농구팀 소년의 신장은 전체 소년의 신장과 그 평균과 동일하다. 
    대립가설: 농구팀 소년의 신장은 전체 소년의 신장과 그 평균이 동일하지 않다. (양방향)

    3. 비교분포의 특성
    표본평균은 평균: μ(M) 표준오차: σ(M) 의 값을 가질 것이다.

    4. 임계값 설정
    0.05 설정 (z > 1.96 or z < -1.96)

    5. 검증통계치
    z statistics = 2.83

    6. 결정
    영가설을 기각할 수 있다.
    농구팀 소년의 신장은 전체 소년의 신장보다 크다!

    댓글

Designed by Tistory.