Notice
Recent Posts
Recent Comments
05-21 07:17
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
Archives
Today
Total
관리 메뉴

Byeol Lo

Statistics - Dispersion 본문

Math/Applied Statistics

Statistics - Dispersion

알 수 없는 사용자 2022. 9. 22. 12:44

 산포도 Dispersion : 퍼져 있는 정도를 나타내는 Measures 이다.

 

편차 deviation

 

모분산 population variance

N : number of sample set, x : 관측값, 뮤 : 모평균

 

표본분산 sample variance

n-1 : degree of freedom, bar_x : sample mean

 

모표준편차 population standard deviation : 모분산의 양의 제곱근, 그리스 문자로 시그마를 의미

 

표본표준편차 sample standard deviation : 표본분산의 양의 제곱근, 보통 s로 많이 적는다.

 

평균편차 mean deviation

 

범위 range : 최댓값과 최솟값의 차이

 

백분위 percentiles : 크기 순서로 나열된 자료집단을 100등분하는 척도

 

사분위수 qualtiles : 크기 순서로 나열된 자료집단을 4등분하는 척도 보통 Q_1, Q_2, Q_3으로 쓴다.

 

변동계수 coefficient of variation : 평균을 중심으로 한 상대적인 산포의 척도

평균의 차이가 큰 두 집단에 대해 산포의 척도를 비교할 때 많이 사용

 

상자그림(box plot)

사분위수를 이용하여 수집한 자료에 포함된 극단값을 알려주는 그림이며, 극단값을 판별하는 개념들은 다음과 같다.

  • 안울타리 inner fence : 사분위수 Q_1 와 Q_3에서 각각 1.5IQR만큼 떨어져 있는 값
  • 바깥울타리 outer fence : 사분위수 Q_1 와 Q_3에서 각각 3IQR만큼 떨어져 있는 값
  • 인접값 adjacent value : 안울타리 안에 놓이는 가장 극단적인 자료값, 즉 아래쪽 안울타리 보다 큰 가장 작은 자료값과 위쪽 안울타리보다 작은 가장 큰 자료값
  • 보통 극단 mild outlier : 안울타리와 바깥울타리 사이에 놓이는 자료값
  • 극단값 extreme outlier : 바깥울타리 외부에 놓이는 자료값
  • (upper/lower) whisker : max 또는 min 부터 Q3 또는 Q1까지 이루어지는 범위

'Math > Applied Statistics' 카테고리의 다른 글

Statistics - Representative Value ( Measures of location )  (0) 2022.09.22
Statistics - 자료의 정리  (2) 2022.09.22
Statistics - Introduction  (0) 2022.09.22
Comments