ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 행동과학을 위한 기초 통계학 | 제 5장. 표집과 확률
    통계 공부 2022. 2. 12. 22:56

     

     

    표본과 전집
    무선표본, 편의표본, 자원자표본 (random, convenience, volunteer sample)
    무선할당 (random assignment)
    반복연구 (replication), 일반화가능성(generalizability)


    확률
    확률 (probability)
    개인적 확률 (personal probability), 확증편향(confirmation bias), 착각상관(illusory correlation)
    상대적 빈도에 근거한 기대확률 (expected relative-frequency probability) 
    시행, 소산, 성공 (trial, outcome, success)


    추론통계
    통제집단 (control group), 실험집단 (experimental group)
    영가설 (귀무가설) (null hypothesis), 연구가설 (대립가설) (research hypothesis)
    1종 오류, 2종 오류 (type Ⅰ error, type Ⅱ error)

     

     

     

    표본과 그 전집

    5.1. 전집 대신에 표본을 연구하는 까닭은 무엇인가? 

    전체 전집에 접속하는 경우는 거의 없다.
    그렇기 때문에 표본을 연구하고 추론통계를 사용하여 전집에서 일어나고 있는 일을 추정한다.

     

    5.2. 무선표본과 편의표본 간의 차이는 무엇인가?

    무선표본은 연구 대상으로 선택될 가능성에서 전집의 모든 구성원이 동일한 표본이다.
    편의표본은 대학생과 같이 쉽게 가용한 참가자를 사용한 표본이다. 

     

    5.3. 일반화가능성이란 무엇인가?

    일반화가능성은 하나의 표본이나 맥락에서의 결과를 다른 표본이나 맥락에 적용하는 연구자의 능력을 지칭한다. 

     

    5.4. 자원자표본이란 무엇이며, 이 표본과 관련된 핵심 위험성은 무엇인가?

    자원자표본은 참가자들이 연구에 참여하겠다고 능동적으로 선택한 편의표본이다. 
    편의표본은 대규모 전집을 대표하지 못할 수 있다. 편중성. 예시. 정치적으로 별점 테러를 당한 영화.

     

    5.5. 무선표집과 무선할당 간의 차이란 무엇인가? 

    무선표집은 전집의 모든 구성원이 특정 연구에 참가하고자 선택될 가능성이 동일함을 의미한다.
    무선할당은 선택된 모든 참가자가 특정 실험조건에 배정될 가능성이 동일함을 의미한다.  

     

    5.6. 반복연구를 수행한다는 것의 의미는 무엇이며, 반복연구는 결과에 대한 확신도에 어떤 영향을 미치는가?

    반복연구란 한 연구의 반복이며, 이상적으로 그 결과가 일관적인지를 알아보기 위하여 상이한 참가자 또는 상이한 맥락에서 연구를 재차 반복하는 것이다. 반복연구를 통해 그 연구결과를 일반화할 수 있다.

     

    5.7. 이상적으로 실험은 무선표집을 사용하여 데이터가 전집을 정확하게 반영하여야 한다. 현실적인 이유로 이것은 수행하기가 어렵다. 어떻게 무선할당이 무선표집의 미사용을 보완해주는 것인가?

    무선할당은 모든 참가자가 특정 실험조건에 배정될 가능성이 동일한 과정이다. 실험조건에 걸친 편향을 제거해준다. 

     

    5.8. 확증편향이란 무엇인가?

    사람들이 이미 믿고 있는 것을 확증해주는 증거에는 주의를 기울이고, 그 믿음을 부정하는 증거를 무시하는 의도하지 않은 경향성.

     

    5.9. 착각상관이란 무엇인가?

    아무런 관련성이 없는 변인 간에 관련성이 있다고 믿는 현상. 예시. 항상 동일한 귀걸이를 걸고 출전해야 이긴다고 믿는 선수 

     

    5.10. 어떻게 확증편향이 착각상관으로 이끌어가는가?

    확증편향은 사람들이 믿고싶은 것에 대한 증거를 더 주의를 기울이게 한다.
    따라서 객관적인 데이터에 근거하지 않고 서로 관련이 없는 두 변인 간에 관련성이 있다고 믿을 수 있다.

     

     

    더보기

    5-4. 다음 시나리오 각각에 대해서 현실적인 견지에서 무선선택을 사용할 수 있었는지 여부를 진술해보라. 
    연구자가 일반화하기를 원하였을 전집에 관한 진술을 포함하면서, 여러분의 답을 해명해보라.
    그런 다음 무선할당을 사용할 수 있었는지를 진술하고, 여러분의 답을 해명해보라. 

    a. 한 건강심리학자는 수술 전에 상담을 받지 않은 환자보다 받았던 환자의 수술 후 회복시간이 짧은지를 연구하였다.

    전집: 수술을 받을 모든 환자 전체
    독립변인 수준: 수술 전에 상담을 받지 않은 환자, 수술 전에 상담을 받은 환자

    => 무선 선택 불가능 / 무선 할당 가능 

     

    b. 교육위원회는 학교심리학자에게 만일 학생들이 인쇄한 교과서 대신에 온라인 교과서를 사용하면 역사 과목에서 더 우수한 성과를 보이는지를 연구해보도록 요구하였다.

    전집: 해당 교육청에 속하는 학생 전체
    독립변인 수준: 인쇄한 교과서를 사용하는 학생, 온라인 교과서를 사용하는 학생

    => 무선 선택 가능 / 무선 할당 가능

     

    c. 한 임상심리학자는 성격장애로 진단받은 사람이 그렇지 않은 사람보다 진료 약속을 빼먹을 가능성이 더 큰지를 연구하였다. 

    전집: 진료 약속을 잡은 환자 전체
    독립변인 두 수준: 성격 장애로 진단받은 사람, 성격 장애로 진단받지 않은 사람 
    => 무선 선택 불가능 / 무선 할당 불가능

     

     

     

     

     

    확률

     

    5.11. 개인적 확률이란 무엇인가? 여러분 자신의 표현을 사용해보라.

    어떤 사건이 발생할 가능성에 관한 개인의 판단

     

    5.12. 상대적 빈도에 근거한 기대확률이란 무엇인가? 여러분 자신의 표현을 사용해보라.

    수많은 시행의 실제 결과에 근거한 특정 사건의 발생가능성

     

    5.13. 통계학자는 시행, 소산, 성공과 같은 용어를 확률이라는 측면에서 독특한 방식으로 사용한다. 동전던지기 맥락에서 이 용어 각각이 의미하는 것은 무엇인가?

    동전을 한 번 던지는 것이 시행이다.
    소산이란 시행의 결과이다. 동전 던지기 시행에서 소산은 앞면이나 뒷면이다.
    성공은 확률을 결정하고자 시도하고 있는 소산을 지칭한다. 앞면의 확률을 검증하고 있다면, 앞면이 바로 성공이 된다. 

     

    5.14. 확률과 비율은 소산의 가능성을 어떻게 나타내는 것인가? 

    확률은 궁극적으로 기대하는 비율이다. (예측치)
    비율은 성공횟수를 시행횟수로 나눈 값이다. (측정치)
    단기적으로 시행이 소수에 불과할 때에는 비율이 기저확률을 반영하지 않을 수도 있다. 

     

    5.15. 통계학자는 독립적이라는 표현을 어떤 방식으로 사용하는가? 

    각 시행의 소산이 어떤 방식으로든 직전 시행의 소산에 의존적이어서는 안된다는 사실을 의미한다. 

     

     

    추론통계

    5.16. 가설검증에 포함된 하나의 단계는 표본의 구성원들을 통제집단과 실험집단에 무선으로 할당하는 것이다. 두 집단 간의 차이는 무엇인가?

    실험집단은 참가자에게 처치나 개입을 가하는 집단이다.
    통제집단은 참가자에게 처치나 개입을 가하지 않는 집단이다. 

    실험에서는 전형적으로 처치받은 사람들 (실험집단)의 평균 반응을 처치받지 않은 유사한 사람들 (통제집단) 의 평균 반응과 비교한다. 

     

    5.17. 영가설과 연구가설 간의 차이는 무엇인가?

    영가설은 전집 간에 차이가 없다거나 연구자가 예상하는 것과는 반대 방향으로 차이가 있다고 가정하는 진술이다. 
    연구가설은 대립가설이라고도 부르며, 전집 평균 간에 차이가 있다고 상정하거나 더 구체적으로는 평균 간 차이가 특정 방향으로 나타난다고 상정하는 진술이다. 

     

    5.18. 데이터에 근거하여 가설에 관하여 내릴 수 있는 두 가지 결정이나 결론은 무엇인가?

    영가설을 기각한다. (연구가설을 지지한다.) 
    영가설을 기각하는 데에 실패한다. (연구가설을 지지하지 못한다.)

     

    5.19. 1종 오류와 2종 오류 간의 차이는 무엇인가? 

    영가설을 기각하지만 그 영가설이 참일 때 1종 오류를 범한다.
    영가설을 기각하는 데 실패하지만 그 영가설이 거짓일 때 2종 오류를 범한다. 

    실험결과 \ 실제결과 영가설 참 영가설 거짓
    영가설 기각 1종 오류
    (연구결과가 나왔다고 좋아했으나 호들갑)
    Overreacting
    -
    영가설 기각 실패 - 2종 오류  
    (연구결과가 나왔으나, 발견하지 못함)
    Underreacting

     

    연구에 본질적으로 내재한 문제점으로 인해서, 수많은 영가설을 잘못 기각하고는 1종 오류를 범한다.
    (자신이 돈과 시간을 들인 연구결과가 아무것도 아니라고 하면 허탈하다. 무슨 결과라도 발견해야 의미가 있다고 생각하고 편향되기 쉽다. )

     

    더보기

    5.57. 64명의 남학생이 학교 음주 규칙을 위반하여 학교 상담사를 찾아가라는 명령을 받았다. 보사리와 캐리(2005)는 이 학생들을 두 조건에 무선할당하였다. 첫번째 조건의 학생에게는 새롭게 개발한 간편 동기 인터뷰(BMI) 를 실시하였는데, 교육자료가 학생 자신의 경험과 관련된 개입 프로그램이다. 두 번째 조건의 학생에게는 전형적인 음주교육 (AE) 회기를 실시하였는데, 학생의 경험과 관련되지 않은 교육자료를 제시하는 프로그램이다. 추론통계에 근거하여 연구자는 추후 조사에서 BMI 집단이 평균적으로 AE 집단보다 음주 관련 문제를 더 적게 일으켰다고 결론 내렸다. 

     

    a. 전집: 음주 문제가 있는 학생 / 학교 상담사를 찾아가라는 명령을 받은 64명의 남학생
    b. 무선선택이 아니다. 
    c. 무선할당이다. 각 참가자는 두 조건에 배정될 동일한 기회를 가지고 있었다.
    d. 독립변인: 상담의 유형 / 종속변인: 추후 조사에서 음주 관련 문제의 횟수
    e. 영가설: 추후 조사에서 음주 관련 문제의 횟수는 상담의 유형에 관계없이 동일하다. / 연구가설. 다르다.
    f.  영가설을 기각하였다. 
    g. 만약 연구자가 내린 결론이 틀리다면 어떤 오류를 범한 것인가? 1종 오류를 범한 것이다. 
    이 유형의 오류가 초래하는 결과는 표준 치료법보다 우수하지 않은 새로운 치료법을 적용하였다는 것이다. 새로운 치료법을 실시하도록 상담사들을 훈련시키느라 불필요한 비용을 초래하였을 수 있다.  

    댓글

Designed by Tistory.