-
행동과학을 위한 기초통계학 | 제 2장. 빈도분표통계 공부 2022. 2. 4. 10:40
행동과학을 위한 기초통계학
목차
제 1장. 통계학과 연구설계 입문
제 2장. 빈도분표핵심용어
빈도분포
원점수 (raw score)
빈도분포 (frequency distribution)
빈도표 (frequency table)
묶은 빈도표 (grouped frequency table)
히스토그램 (histogram)
빈도 다각형 (frequency polygon)
분포의 모양
정상분포 (normal distribution)
편중분포 (skewed distribution)
정적 편중 (positive skewness)
바닥효과 (floor effect)
부적 편중 (negative skewness)
천장효과 (ceiling effect)연습문제 개념 명료화하기
빈도분포
2.1. 원점수란 무엇인가?
아무런 처치나 조작을 하지 않은 원래의 데이터이다.
2.2. 빈도표를 작성하는 단계는 무엇인가?
원점수와 빈도 컬럼 2개를 가진 표를 작성한다.
원점수 컬럼에 원점수의 최저점수부터 최고점수를 포괄하는 모든 값을 나열한다.
빈도가 0인 값이 있더라도 범위의 모든 값을 포함시킨다.
빈도 컬럼에 원점수의 빈도를 count 집계한다.2.3. 빈도표와 묶은 빈도표의 차이는 무엇인가?
빈도표와 묶은빈도표는 모두 점수에 대한 빈도를 보고하는 시각적 제시방법이다.
빈도표는 각 점수가 얼마나 자주 발생하는지를 보여준다.
묶은 빈도표는 특정 간격을 가지는 구간으로 묶어서 구간 단위의 빈도를 보여준다.2.4. 통계학자가 간격(interval) 이라는 단어를 사용하는 두 가지 방식을 기술하라.
An interval is a range of values for a statistic.
더보기Interval Scale
An interval scale is one where there is order and the difference between two values is meaningful. Examples of interval variables include: temperature (Farenheit), temperature (Celcius), pH, SAT score (200-800), credit score (300-850).Interval Estimates
Statistical intervals represent an uncertainty that exists in the data because we work with samples that are obtained from a larger population or process.When the interval estimate has a confidence level attached, it’s called a confidence interval. The lower bound (in this example, 5%) is called a lower confidence limit and the upper bound (in this example, 15%) is called an upper confidence limit.
출처: https://www.weibull.com/hotwire/issue194/hottopics194.htm
출처: https://www.statisticshowto.com/interval-estimate/
2.5. 히스토그램과 막대그래프의 차이는 무엇인가?
히스토그램은 x 축에 척도변인 값 구간 단위로 y 축에 집계대상을 집계한 것이다.
히스토그램은 x 축 값의 간격 (interval) 은 값의 대소관계에 따라 순서를 가지고, 연속적이다.
막대그래프는 x 축에 명목변인 값 단위로 y 축에 집계대상을 집계한 것이다.
막대그래프의 범주 (category) 들은 순서가 없고, 독립적이다.2.6. 히스토그램에서 x축과 y축에 사용하는 전형적인 표지는 무엇인가?
x축: 척도변인 / y축: 빈도
2.7. 히스토그램과 빈도다각형의 차이는 무엇인가?
히스토그램은 x축 구간의 너비에 y축 빈도 높이를 가지는 막대그래프의 형태를 띈다.
빈도다각형은 x축 구간의 중앙값에 y축 빈도 점을 이은 선그래프의 형태를 띈다.2.8. 단순히 데이터 목록을 들여다보는 것에 비해서 시각적 데이터 분포를 작성하는 것의 이점은 무엇인가?
한 눈에 데이터의 패턴을 파악할 수 있다.
2.9. 분포(distribution) 라는 단어를 여러분의 방식대로 정의해보라. 우선 일상대화에서 사용하는 의미로 정의한 다음, 통계학자가 사용하는 의미로 정의하라.
통계학자는 학급의 성적과 같은 일단의 점수가 분산되어있는 방식을 기술하는 데 분포라는 단어를 사용한다. 통계학자는 데이터의 전반적인 패턴을 살핀다. 즉 분포의 모양이 어떠한지, 데이터가 어느 곳에 몰려있는지, 어느 쪽으로 꼬리를 형성하고 있는지 등을 살핀다.
분포의 모양
2.10. 정상분포란 무엇인가?
산 모양의 대칭적이고 봉우리가 하나인 독특한 빈도분포
2.11. 정적으로 편중된 분포와 부적으로 편중된 분포는 정상분포에서 어떻게 벗어나 있는가?
편중분포는 분포의 꼬리 하나가 중앙에서부터 멀리 떨어져 있는 분포이다.
정적으로 편중된 (postively skewed) 분포는 분포의 꼬리가 오른쪽으로 (정적인 방향으로) 늘어진다.
부적으로 편중된 (negatively skewed) 분포는 분포의 꼬리가 왼쪽으로 (부적인 방향으로) 늘어진다.2.12. 바닥효과란 무엇이며, 이것은 분포에 어떤 영향을 미치는가?
바닥효과란 변인이 특정 값 이하의 수치를 취하지 못하도록 어떤 제약요인이 작동하고 있는 상황을 말한다.
때때로 정적 편중은 바닥효과가 있을 때 발생한다.2.13. 천장효과란 무엇이며, 이것은 분포에 어떤 영향을 미치는가?
천장효과란 변인이 특정 값 이상의 수치를 취할 수 없도록 어떤 제약요인이 작동하고 있는 상황을 말한다.
특정 값 이상에 해당하는 점수가 없을 때 발생한다. 분포의 상위 부분이 제약을 받기 때문에 부적으로 편중된 분포를 초래한다.더보기2.33. 분포의 유형 : 다음 세 변인을 생각해보자. 다음 변인의 분포도를 예상하고, 그렇게 생각한 이유를 해명해보라.
a. 마라톤에서 완주한 시간: 정적분포
잘 뛰는 사람이 주로 마라톤에 나갈 것이다. 최저한도 2시간 초반 수준에 편중된 분포를 보일 것이다.
b. 삼시 세끼 프로그램을 실시하는 대학 구내식당에서 한 학기 동안 식사한 횟수: 부적편중분포
프로그램을 산 사람은 거의 세끼를 구내식당에서 먹을 것이다. 하지만 최대한도는 정해져있다.
c. 외향성 척도에서의 점수: 정규분포
점수 척도를 구간으로 가정했을 것이다. 따라서 정규분포이지 않을까?
다만 외향적인 것을 선호하는 특성 상 중간값이 척도범위에서 외향적이라고 응답하지 않았을까 추정해본다.Further Study
Histograms are good for showing general distributional features of dataset variables. You can see roughly where the peaks of the distribution are, whether the distribution is skewed or symmetric, and if there are any outliers.
'통계 공부' 카테고리의 다른 글
행동과학을 위한 기초 통계학 | 제 6장. 정상곡선, 표준화, z점수 (0) 2022.02.13 행동과학을 위한 기초 통계학 | 제 5장. 표집과 확률 (0) 2022.02.12 행동과학을 위한 기초 통계학 | 제4장. 집중경향과 변산성 (0) 2022.02.08 행동과학을 위한 기초 통계학 | 제 3장. 데이터의 시각적 표현 (0) 2022.02.07 행동과학을 위한 기초통계학 | 제 1장. 통계학과 연구설계 입문 (0) 2022.01.31