ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 행동과학을 위한 기초 통계학 | 제 9장. 단일표본 t 검증과 대응표본 t 검증
    통계 공부 2022. 2. 20. 14:17
    단일표본 t검증(single-sample t test), 대응표본 t검증(paired-sample t test)
    자유도(degree of freedom), t 통계치*t statistic)
    순서효과(order effect), 역균형화(conterbalancing)

     

    t 분포


    9.1. 언제 t분포를 사용해야 하는가?

    전집 표준편차를 모르면서 두 집단을 비교할 때 t 분포를 사용하여야 한다.  

     

    9.2. t 검증을 사용할 때 표준편차를 계산하는 공식에 교정을 가하는 이유는 무엇인가?

    표본은 전집보다 변산이 낮을 가능성이 있다. n 대신에 N-1 을 분모로 사용하여 편차제곱의 평균을 얻는다. 

     

    9.3. t 검증에서의 표준오차 계산은 z 검증에서의 계산과 어떻게 다른가?

    두 검증 모두에서 표준오차는 표준편차를 사례 수 N 으로 나누어 주는 것으로 계산한다. 
    z 검증에서는 분모의 N 을 가지고 전집 표준편차를 계산한다.
    t 검증에서는 제곱합을 N-1 로 나누어줌으로써 전집 표준편차를 추정한다.

     

    9.4. 표본평균의 표준오차가 표본점수의 표준편차보다 작은 이유를 설명해보라.

    평균분포의 표준오차는 점수분포의 표준편차보다 작다. (중심극한정리) 

     

    9.5. 다음 t 통계치 공식의 기호들을 정의해보라.

    t 통계치
    M 표본평균
    μ(M) 평균분포의 평균
    s(M) 표본에서 추정한 표준오차

     

     

    단일표본 t 검증


    9.6. 어느 때 단일표본 t 검증을 사용하는 것이 적절한가?

    데이터를 수집한 표본을 평균을 알고 있지만 표준편차를 알지 못하는 전집에 비교하는 경우 사용한다. 

     

    9.7. 표본에 들어있는 점수의 수에 적용하는 '자유롭게 변한다' 는 구절이 통계학자에게 어떠한 의미를 갖는가?

    모수치를 알고 있을 때 상이한 값을 취할 수 있는 점수의 수를 지칭한다.

     

    9.8. 표본크기와 자유도는 t 점수의 임곗값에 어떤 영향을 미치는가?

    자유도가 증가함에 따라 임곗값은 낮아진다.
    관찰에서 표본의 크기가 증가하면 확신도의 수준이 증가한다.  확신도 수준이 증가하면 임곗값은 감소한다. 

     

    9.9. 표본크기가 증가함에 따라 t 분포가 z 분포에 수렴하는 이유는 무엇인가?

    표본크기가 증가함에 따라서, 전집 변산 추정치를 더욱 확신할 수 있다. 이 변산 추정치는 다소 부풀리기 위하여 분포에 N-1 을 사용하여 계산한다. 표본크기가 10에서 100으로, 다시 1000으로 증가함에 따라서, 1을 빼는 것이 전체 계산에서 적은 영향력을 행사하게 된다. 

    표본크기가 증가하면, t 분포는 z 분포에 수렴하게 되며, z 분포에서는 전집 표준편차를 알고 있기 떄문에 추정할 필요가 없다.

     

    9.10. APA 형식으로 보고한 다음 통계적 진술의 각 부분이 의미하는 바를 설명해보라.

    자유도 4 에 대한 t 점수는 2.87 이다.
    t 점수가 전집평균이 p수준 0.032 이 가리키는 임곗값 구간 밖, 즉 임계영역 밖에 존재할 경우 영가설을 기각한다.

     

    9.11. 단일표본 t 검증보다 신뢰구간이 더 유용한 이유는 무엇인가?

    신뢰구간은 단순한 점 추정치가 아니라 구간 추정치이며, 더 많은 정보를 제공해준다. 

     

    대응표본 t 검증


    9.13. 평균차이 분포를 가지고 있다고 말할 때의 의미는 무엇인가?

    우선 평균차이 분포가 어떻게 만들어지는지를 살펴봄으로써 그 분포의 의미를 이해할 수 있다. 표본에 들어있는 개인의 차이점수를 측정하고, 그 차이점수를 평균함으로써 평균차이 분포를 구성한다. 동일한 전집과 동일한 크기의 표본을 사용하여 이 과정을 반복적으로 수행한다. 일단 평균차이의 집합이 모이면, 그래프로 나타낼 수 있다. 대부분의 경우 산 모양의 대칭적 곡선을 형성한다. 

    집단내 설계를 하고, 처치 전후의 차이점수에 대해 표본평균분포를 계산한다. 

     

    9.14. 언제 대응표본 t 검증을 사용하는가? 

    전집의 표준오차를 모르고, 두 집단을 비교할 때,
    두 집단이 집단내 설계, 즉 모든 참가자가 두 표본에 모두에 포함되는 상황에서 두 평균을 비교하는 데 사용한다.

     

    9.15. t 검증과 관련하여 독립표본과 대응표본이라는 용어 간의 차이를 설명해보라. 

    대응표본이라는 용어는 동일인의 두 조건에서의 점수를 비교하는 검증을 기술한다.
    독립표본은 어떤 방식으로든 중복되지 않는 집단을 지칭한다. 한 집단에서 이루어진 관찰은 다른 집단에서 이루어진 관찰과 관련되지 않으며 의존적이지도 않다. 

     

    9.16.대응표본 t 검증은 단일표본 t 검증과 어떻게 유사한가?

    대응표본 t 검증은 z 검증과 단일표본 t 검증에서 사용한 가설검증의 여섯단계를 똑같이 사용한다. 

     

    9.17. 대응표본 t 검증은 단일표본 t 검증과 어떻게 다른가?

    표본 평균을 계산할 때 단일표본 t 검증은 표본 관측치에 대한 평균을 계산한다. 
    대응표본 t 검증에서는 모든 참가자의 두 점수를 갖게 되며, 두 점수의 차이점수에 대해 표본 평균을 계산한다.

     

    9.18. 양방 대응표본 t 검증에서 영가설에 따른 전집 평균이 항상 0인 이유는 무엇인가?

    대응표본 t 검증은 동일 표본에 대한 두 점수의 차이점수를 기준으로 검증한다. 
    따라서 영가설은 차이점수가 없다이며, 따라서 영가설에 따른 차이점수에 대한 전집평균은 0 이다. 

     

    9.19. 대응표본 t 검증에서 사용한 표본 평균차이를 중심으로 신뢰구간을 계산하는데, 그 구간이 0의 값을 포함하고 있다면 어떤 결론을 내릴 수 있는가?

    평균 차이점수를 중심으로 하는 신뢰구간이 0의 값을 포함한다면 0 도 가능한 평균차이가 된다.
    만일 이 데이터의 가설검증을 실시한다면, 영가설을 기각하는 데 실패하고 만다.

     

    9.21. 대응표본 t 검증보다 신뢰구간이 더 유용한 이유는 무엇인가?

    대응표본 t 검증과 신뢰구간의 결론은 동일하지만, 신뢰구간은 단순한 점 추정치가 아니라 구간 추정치로 더 많은 정보를 제공해준다. 

     

    9.23. 순서효과란 무엇인가?

    동일한 과제를 동일인에게 두 번 제시하기 때문에 과제 수행이 변할 때 순서효과가 발생한다.

     

    9.25. 순서효과가 연구자들로 하여금 집단내 설계보다 집단간 설계를 사용하도록 만드는 이유는 무엇인가?

    순서효과는 독립변인의 직접적인 결과가 아닌 종속변인의 변화를 초래하기 때문에 연구자는 집단간 설계를 사용하도록 결정할 수 있다. 특히 역균형화가 가능하지 않을 때 그렇다. 예컨대, 연구자는 연습량이 새로운 언어의 획득에 어떤 영향을 미치는지에 관심이 있을 수 있는데, 동일한 참가자가 적은 양의 연습을 하는 집단과 많은 양의 연습을 하는 집단 모두에 들어갈 수는 없다. 

     

    9.26. 제 1장에서 혼입변인을 설명하였다. 순서효과가 혼입변인의 사례인 까닭을 설명해보라.

    순서가 집단내 설계 내에서 전자에 속한 실험이 후자에 속하는 실험결과에 영향을 줄 수 있기 때문이다.

     

    9.27. 코헨의 관례를 따를 때, 단일표본 t 검증에서 0.5 인 코헨크기 d 를 어떻게 해석하는가?

    중간 정도의 효과크기라고 해석한다. 

     

     

     

    9.41. 대응표본 t 검증을 직접 해보자. 

    a. 대응표본 t 검증

    step 1. 비교분포: 차이점수에 대한 평균분포 확인한다. 

     

    step 2. 영가설, 연구가설 확인

    영가설: X 와 Y 는 점수 차이가 없다. 
    연구가설: X 와 Y 는 점수 차이가 있다. 

     

    step 3. 비교에 대한 특성 확인

     

    step 4. 임곗값 (t 점수) 결정
    95% 의 신뢰구간 N=7, df=6, a=0.05, 양방검증에 대한 t 점수 = (+/-) 2.447

     

    step 5. t 통계치  결정

     

     

     

    step 6. 대응표본 t 검증 결과 확인 

    t 통계치 4.07 은 t 점수 (+/-) 2.447 로 이루어진 신뢰구간 밖에 위치하므로 (즉, 임계영역에 포함되므로) 영가설을 기각할 수 있다. 

     

    b. 신뢰구간 계산

    95% 의 신뢰구간은 표본평균을 중심으로 다음과 같다.  

     

    c. 효과크기 계산

    개별점수에 대해 표본평균이 전집평균 대비 떨어져 있는 거리를 계산해야 한다. 
    따라서 표본평균과 전집평균의 차를 s 로 나눈다. 

     

     

     

     

    댓글

Designed by Tistory.