ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 행동과학을 위한 기초통계학 | 제 1장. 통계학과 연구설계 입문
    통계 공부 2022. 1. 31. 20:40

     

    행동과학을 위한 기초통계학

    목차

    제 1장. 통계학과 연구설계 입문 

     

    핵심용어

    표본과 전집
    기술통계 (Descriptive Statistic), 추론통계(Inferential Statistic), 표본(Sample), 전집(Population)
     
    관찰을 변인으로 변환하는 방법
    불연속 관찰(Discrete Observation), 연속 관찰(Continuous Observation),
    명목변인(Nominal Variable), 서열변인(Ordinal Variable),
    척도변인 (Scale Variable), 등간변인(Interval Variable), 비율변인(Ratio Observation), 

    변인과 연구
    변인(Variable), 독립변인(Independent Variable), 종속변인(Dependent Variable),
    신뢰도(Reliability), 타당도(Validity)

    가설검증 방식
    가설검증(Hypothesis Testing), 실험(Experiment), 상관(Correlation)
    조작적 정의(Operational Definition), 수준(Level), 
    혼입변인(Confounding Variable), 무선할당(Random Assignment), 
    집단간 연구설계(Between-groups Research Design), 집단내 연구설계(Within-groups Research Design)

     

     

    연습문제 개념 명료화하기

     

    통계의 두 갈래

    1.1 기술통계와 추론통계의 차이는 무엇인가? 

    기술통계: 일단의 관찰치에 대한 요약한다.
    추론통계: 표본 데이터를 사용하여 큰 전집에 대한 보편적인 추정치를 내놓는다.

    1.2. 표본과 전집의 차이는 무엇인가?

    표본: 관심의 대상인 전집으로부터 선택적으로 추출한 일련의 관찰치 집합
    전집: 무엇인가 알아내고자 하는 것에 관한 모든 가능한 관찰치 집합

     

    더보기

    1.23. 미국인의 평균체중: 미국 질병관리예방센터(CDC)는 지난 40년에 걸쳐서 남녀노소에 관계없이 전 미국인의 체중이 상당히 많이 증가하였다고 보고하였다. 이 데이터를 보고하고 있는 웹사이트에서 "미국인은 40년 전보다 약간 커졌고, 많이 뚱뚱해졌다. (Americans Slightly Taller, Much Heavier Than Four Decades Ago)" 라는 제목의 논문을 찾아보라.

     

    a. 1963년과 2002년에 10세 소녀의 평균 체중은 얼마이었는가?
    The average weight for a 10-year-old girl in 1963 was 77.4 pounds;
    by 2002 the average weight was nearly 88 pounds.

    b. CDC 는 이러한 평균치를 얻기 위하여 모든 미국 소녀의 체중을 재었는가?
    만일 아니라면 이것이 가능하지 않은 이유를 설명해보라.
    아니오. National Health and Nutrition Examination Survey 로 수집한 결과이다. 
    모든 미국 소녀의 체중을 비용과 시간의 문제로 현실적으로 잴 수 없다. 

    c. 2002년에 10세 소녀의 평균 체중이거나 1963년에 10세 소년의 평균 체중이
    어떻게 기술통계와 추론통계를 모두를 대표하는 것인가? 🔥
    2002년에 10세 소녀의 평균 체중이거나 1963년에 10세 소년의 평균 체중은 표본의 수치 요약이므로 기술통계값이다.
    그리고 이것이 추론통계인 까닭은 연구자들이 표본 데이터에 근거하여 전집에 대해 평균 체중에 관한 결론을 도출하였기 때문이다.

     

     

    관찰을 변인으로 변환하는 방법

    1.3. 연구자가 관찰을 수량화하는 데 사용하는 네 가지 유형의 변인을 제시하고 정의하라. 
    1.4. 통계학자가 척도(scale) 라는 단어를 사용하는 두 가지 방식을 기술하라.

    변인은 불연속적이거나 연속적인 관찰을 수량화한다. 네가지 유형의 변인은 다음과 같다: 
    - 명목변인: 범주 또는 이름을 값으로 가지는 관찰에 사용
    - 서열변인: 순위를 값으로 가지는 관찰에 사용
    - 등간변인: 수치를 값으로 가지는데, 수치 간의 간격이 동일하다고 가정하는 경우 사용 
    - 비율변인: 등간변인이면서 절대적 영점(의미있는 영점) 도 가지고 있는 경우 사용 

    척도변인이란 등간변인이나 비율변인의 기준을 만족하는 변인을 말한다.

     

    1.5. 불연속 변인과 연속 변인을 구분하라. 

    불연속변인만이 특정 값만을 취할 수 있다.
    연속 변인은 전체 범위의 모든 값을 취할 수 있다. 

     

    더보기

     

    1.25. 변인의 유형과 올림픽 수영종목: 2012년 런던 올림픽에서 미국선수 마이클 펠프스는 4개의 금메달을 획득하여 그의 생애 전체 금메달 수를 18개로 늘렸으며, 모든 스포츠 종목을 망라하여 올림픽 금메달 신기록을 수립하였다. 그가 금메달을 획득한 종목 하나가 100미터 접영이었다. 다음 사례 각각에 대해서 변인의 유형, 즉, 명목변인, 서열변인 또는 척도변인을 확인하라.

    a. 미국의 펠프스가 1등으로 골인하였고, 남아공의 채드르 클로스와 러시아의 에브게니 코로티쉬킨이 동시에 2등으로 골인하였다. 서열변인
    b. 펠프스는 51.21초에 골인하였고, 르 클로스와 코로티쉬킨은 51.44초에 골인하였다. 척도변인
    c. 펠프스와 코로티쉬킨은 북반구에 사는 반면, 르 클로스는 남반구에 살고 있다. 명목변인


    1.27. 불연속 변인 대 연속 변인: 다음 사례 각각에 대해서 척도변인이 불연속적인지 아니면 연속적인지 진술하라.

    a. 노래의 수에 근거한 스마트폰의 용량: 불연속적
    b. 개별 노래의 연주시간: 연속적
    c. 노래 하나를 합법적으로 다운로드 하는 비용: 불연속적
    d. Amazon.com 에서 어떤 앨범에 달린 리뷰의 개수: 불연속적

    1, 2, 3 셀 수 있는 것, 유한한 값을 가지는 것은 불연속 속성을 가진 변인이다.

     

     

     

    변인과 연구

    1.6. 독립변인과 종속변인 간의 관계는 무엇인가?

    종속변인은 독립변인의 변화에 의존 관계를 가진다.
    독립변인은 종속변인에 대한 효과를 결정하기 위하여 연구자가 처치를 가하거나 관찰하는 변인으로 최소한 두 개의 수준을 갖는다.
    종속변인은 독립변인의 변화와 관련이 있거나 그 변화가 야기한다고 가설을 세우는 결과변인이다.

     

    1.7. 혼입변인이란 무엇이며, 어떻게 무선할당을 사용하여 제어하는가? 

    혼입변인은 독립변인과 함께 체계적으로 변하기 때문에 어느 변인이 종속변인에 영향을 미쳤는지를 논리적으로 결정할 수 없는 변인이다. 연구자들은 독립변인과 종속변인 간의 관계를 탐구하기 위하여 실험에서 참가자들을 조건에 무선할당함으로써 현재 관심대상이 아닌 요인, 혼입변인을 제어하고자 시도한다. 무선할당이 기대하는 것은 혼입변인이 여러 조건에 등가적으로 퍼져있어서 그 효과가 무효화되는 것이다.

     

    1.8. 신뢰도와 타당도의 차이는 무엇인가? 두 개념은 어떻게 관련되는가? 

    신뢰도는 측정의 일관성을 의미하며, 타당도는 측정하고자 의도했던 결과를 제대로 측정할 수 있는 정도를 의미한다.
    타당한 측정치를 얻기 위해서는 신뢰도가 필요하지만, 신뢰도만으로는 충분하지 않다. 

     

    더보기

    1.21. 9/11 테러가 발생하였을 때 맨해튼으로부터 물리적 거리와 정서적 거리가 그 사건에 대한 기억의 정확도와 어떻게 관련되는지에 관심이 있다고 가정해보라. 

    a. 독립변인과 종속변인을 확인하라. 
    독립변인: 맨해튼으로부터의 물리적 거리와 정서적 거리 / 종속변인: 기억의 정확도

    b. 물리적 거리를 160km 이내와 이상으로 평가한다고 상상하라. 또한 정서적 거리는 피해를 당한 사람을 아무도 알지 못하는 것, 피해를 당했지만 살아남은 사람을 아는 것, 그리고 테러로 사망한 사람을 아는 것으로 평가한다고 상상하라. 독립변인은 몇 개의 수준을 가지고 있는가? 
    5개 (물리적 거리 명목변인 2개, 정신적 거리 명목변인 3개) 

    c. (a) 에서 확인한 종속변인을 어떻게 조작적으로 정의하겠는가? 
    9/11 테러의 정보에 대해 얼마나 기억하는지를 판단하는 시험지 결과로 확인한다.

    수준(level): 변인이 취할 수 있는 불연속 값이나 조건



    1.29. 신뢰도, 타당도, 와인 평가: 와인전문가가 일관성을 보이는지를 알아보았다. (Corsi & Ashenfelter, 2001) 날씨가 가격에 관한 최선의 예측자임을 알고 있는 연구자는 날씨가 전문가의 평가를 얼마나 잘 예측하는지 궁금하였다. 날씨에 사용한 변인에는 온도와 강우량이 포함되었으며, 와인 전문가 평가에 사용한 변인은 각 와인에 부여한 수치였다. 

    a. 독립변인 하나에 이름을 붙여보라. 어떤 유형의 변인인가? 불연속 변인인가? 아니면 연속 변인인가? 
    기온과 강우량, 연속적인 척도변인

    b. 종속변인에 이름을 붙여보라. 어떤 유형의 변인인가? 불연속 변인인가? 아니면 연속 변인인가? 
    각 와인에 부여한 수치, 불연속적인 척도변인 (0에서 100까지 점수화)

    c. 이 연구는 신뢰도 개념을 얼마나 반영하는가?
    연구자들은 와인 전문가가 평가를 함에 있어 일관적인지, 즉 신뢰할 만한지를 알고자 하였다. 🔥
    날씨가 좋은 경우 가격이 높고, 날씨가 좋지 않은 경우 가격이 낮도록 높은 경향성을 띄는지 확인한다.

    d. 로버트 파커가 높은 점수를 부여한 와인을 여러분이 자주 마신다고 해보자. 파커의 평가는 확실히 신뢰할 만하며, 여러분은 일반적으로 그의 평가에 동의한다. 이 사실은 타당도의 개념을 얼마나 반영하고 있는가? 🔥
    파커의 평가는 와인의 품질을 잘 측정하고 있다. 타당하다. 

     

    1.37. 실험, HIV 그리고 콜레라

    여러 연구는 HIV 양성인 사람이 콜레라에 취약하다는 사실을 언급해왔다. 인구의 20~30%가 HIV 양성인 것으로 추정되는 국가인 모잠비크에서 콜레라 구강백신이 HIV 양성인 사람에게 효과가 있는지 연구자들은 궁금하였다. (Lucas et al., 2005) 모잠비크에서 HIV 양성반응을 보인 14,000명에게 콜레라 백신을 투여하였다. 곧이어서 콜레라가 유행하여 연구자들로 하여금 자신의 가설을 검증할 기회를 제공하였다.

    a. HIV 양성인 사람들에게 콜레라 백신의 효과를 검증하는 실험을 연구자들이 수행할 수 있는 방법을 기술해보라.
    HIV 양성인 사람 절반에게 표본에 콜레라 구강백신을 투여하고, 나머지 절반에게는  위약을 투여한다.
    그리고 실험군이 대조군 대비 콜레라 예방효과가 있는지 확인한다.

    b. 만일 연구자들이 실험을 수행하였다면, 이것은 집단간 실험이겠는가 아니면 집단내 실험이겠는가? 설명해보라.
    집단간 실험이다. HIV 양성인 사람들은 백신집단이나 무백신집단 중 하나에만 속하였을 것이기 때문이다.

    c. 연구자들은 백신 조건과 무백신 조건에 참가자들을 무선할당하지 않았다. 오히려 대규모로 백신을 투여하였다. 
    이 방법이 인과적 결론의 도출을 제한하는 까닭은 무엇인가? 적어도 하나 이상의 혼입변인을 포함시켜라. 🔥
    백신을 투여받은 참가자는 애초부터 건강을 잘 관리하고 위생조건이 더 좋아서 백신의 효과와는 무관하게 콜레라에 감염될 가능성이 낮았을 수 있다. 

    집단의 자기선택 vs. 집단에의 무선할당
    사람들이 비디오 게임을 선택적으로 즐기는 까닭은 그들이 이미 외과수술에 필요한 정교한 운동재능과 눈-손 협응능력을 가지고 있으며, 비디오 게임을 통해서 자기 재능의 사용을 즐기기 때문일 수 있다. 만일 이것이 사실이라면, 비디오 게임을 즐기는 사람은 마땅히 우수한 외과술 재능을 가지고 있을 가능성이 크다. 이들은 비디오 게임을 즐기기 전부터 이미 재능을 가지고 있었던 것이다!

     

     

    가설검증 입문

    1.9. 가설을 검증하려면 독립변인과 종속변인의 조작적 정의가 필요하다. 조작적 정의란 무엇인가? 

    조작적 정의란 독립변인에 처치를 가하거나 종속변인을 측정하는 데 사용하는 조작이나 절차를 구체적으로 명시하는 것.

     

    1.10. 실험이라는 단어를 여러분 자신의 방식으로 정의해보라. 우선 일상대화에서 여러분이 사용하는 방식으로 정의한 다음에 연구자가 사용하는 방식으로 정의해보라. 

    특정 변인의 값에 따라 결과값이 어떻게 달라지는지 확인하고, 그 인과관계를 확인하는 작업
    독립변인에 대해 무선할당을 통해 나머지 변인의 영향을 최소화하면서 종속변인에 대해 인과관계를 가지는 지에 대해 분석하는 작업

     

    1.11. 실험연구와 상관연구의 차이는 무엇인가?

    실험연구는 참가자를 하나 이상의 독립변인의 각 조건이나 수준에 무선적으로 할당하여 변인들 간의 인과관계를 추론하는 연구이다.
    상관연구는 둘 이상 변인들이 관련되어 있는지를 추론하는 연구이다. 성별이나 결혼 유무와 같은 변인을 연구할 때처럼 무선할당이 불가능할 때, 또는 실험을 수행하는 데에 비윤리적이거나 비현실적이어서 실험을 수행할 수 없는 경우 상관연구를 수행한다. 상관연구에서는 변인에 처치를 가하지 않는다. 단지 존재하는 두 변인을 평가할 뿐이다. 

     

    1.12. 집단간 연구설계와 집단내 연구설계의 차이는 무엇인가? 

    집단간 연구설계는 참가자가 독립변인의 오직 한 가지 수준만을 경험하는 실험이다.
    집단내 연구설계는 모든 참가자가 독립변인의 모든 수준을 경험하는 실험이다.
    개인과 조직이 시간 경과에 따라 어떻게 변하는 지를 밝히려는 장기적 연구 (종단연구) 또는 실험실에서 반복할 수 없는 자연발생적 사건을 수반하는 연구에서 특히 그렇다. 

     

    더보기

    1.39. 자선단체의 평가: 많은 사람은 자신의 돈을 어디에 기부할 것인지를 결정하기에 앞서 자선단체들을 조사한다. 채리티 내비게이터 (Charity Navigator) 는 기부금을 모금활동이나 행정관리에 덜 사용하고 자신들이 지원하고 있는 대의명분에 더 많이 사용되는 단체를 보다 높게 평가하였다. 예컨대, 건강과 의료혜택 결핍에 초점을 맞추고 있는 비영리단체인 '국경 없는 의사회'는 채리티 내비게이터에서 재정운용, 책무성, 그리고 투명성에 근거하여 70점 중에서 57.11점을 얻고 있다. 이러한 평가는 '국경 없는 의사회'를 채리티 내비게이터의 다섯 단계 중에서 두 번째 단계에 올려놓고 있다. 

     

    a. 채리티 내비게이터는 좋은 자선단체를 어떻게 조작적으로 정의하고 있는가? 🔥
    기부금이 모금활동이나 행정관리가 아닌 본연의 목적에 사용되는 확률이 높을수록 좋은 자선단체라고 조작적으로 정의한다.

    b. 70점 중 57.11 이라는 점수는 어떤 유형의 변인인가?
    절대영점을 가지므로 연속적인 척도변인 (비율변인) 🔥

    c. '다섯 단계 중에서 두 번째 단계' 라는 표현에서 단계는 어떤 유형의 변인인가?
    범주 (1~5단계)로 순위 매김을 하므로 불연속적인 서열변인 🔥

    d. 많은 유형의 자선단체가 있다. 국경 없는 의사회는 건강/의료혜택 결핍에 초점을 맞춘다. 자선단체 유형은 어떤 유형의 변인인가?
    불연속적인 이름이나 범주를 사용하기 때문에 불연속적인 명목변인 🔥

    e. 채리티 내비게이터와 같은 웹사이트는 오드가 기브웰로 제안한 것과 같은 보다 완전한 정의에 대비하여 재정과 관련된 측정치만 들여다보는 까닭을 설명해보라. 
    측정하기 쉬우므로.

    f. 채리티 내비게이터의 평가와 기브웰의 평가 중에서 어느 것이 신뢰할 만한 가능성이 높은가? 
    채리티 내비게이터의 평가가 신뢰할 가능성이 높다. 기브웰의 평가는 문제의 중대성, 유능성과 정직성 등 기준이 추상적이라서 조작적 정의가 어려운 반면, 채리티 내비게이터의 평가가 객관적인 측정치에 바탕을 두기 때문이다. 따라서 채리티 내비게이터의 평가자들이 동일한 평가에 도달할 가능성이 높다. 

    g. 채리티 내비게이터의 평가와 기브웰의 평가 중에서 어느 것이 타당할 가능성이 높은가?
    신뢰도가 확보된다는 전제 하에, 보다 종합적인 평가기준을 갖추고 있는 기브웰의 평가가 더 타당할 가능성이 높다. 

    h. 만일 여러분이 자선기부금의 증가가 한 국가의 사망률을 낮추어주는지를 모니터링 하고 있다면, 그것은 실험연구인가 아니면 상관연구인가?
    상관연구이다. 변인에 처치를 가하기 위해 무선할당한 것이 아니라 자연스럽게 발생하는대로 관찰/모니터링 하기 때문이다.
    서로 다른 지역을 대상으로 하므로 집단간 연구설계이다. 

    i. 만일 여러분이 어떤 지역은 더 많은 기부금을 받고, 다른 지역은 더 적은 기부금을 받도록 무선할당을 하고 두 지역에서의 사망률을 추적한다면, 그것은 실험연구인가 아니면 상관연구인가? 
    실험연구이다.  독립변인 기부금 규모 수준을 서로 다른 지역에 무선할당하여, 종속변인 사망률에 대한 효과를 관측한다. 
    서로 다른 지역을 대상으로 하므로 집단간 연구설계이다. 

     

     

    Furter Study

     

    4 Scales of Measurement 

    https://www.graphpad.com/support/faq/what-is-the-difference-between-ordinal-interval-and-ratio-variables-why-should-i-care/

     

    What is the difference between ordinal, interval and ratio variables? Why should I care? - FAQ 1089 - GraphPad

    Analyze, graph and present your scientific work easily with GraphPad Prism. No coding required.

    www.graphpad.com

     

    댓글

Designed by Tistory.