05-21 07:17
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Physical Scheme
- literal
- python
- systemd
- Reference Type
- Entity
- Class
- 리눅스
- X윈도우
- Entity Set
- Java
- Operator
- 리눅스 마스터 1급
- 셀레니움
- External Scheme
- 자바
- Mac
- descriptive statistics
- Polymolphism
- selenium
- OOP
- Binary Search
- dbms
- Inheritance
- spring
- BFS
- 백준
- X.org
- Unity
- preprocessing
Archives
- Today
- Total
Byeol Lo
Statistics - Dispersion 본문
산포도 Dispersion : 퍼져 있는 정도를 나타내는 Measures 이다.
편차 deviation
모분산 population variance
N : number of sample set, x : 관측값, 뮤 : 모평균
표본분산 sample variance
n-1 : degree of freedom, bar_x : sample mean
모표준편차 population standard deviation : 모분산의 양의 제곱근, 그리스 문자로 시그마를 의미
표본표준편차 sample standard deviation : 표본분산의 양의 제곱근, 보통 s로 많이 적는다.
평균편차 mean deviation
범위 range : 최댓값과 최솟값의 차이
백분위 percentiles : 크기 순서로 나열된 자료집단을 100등분하는 척도
사분위수 qualtiles : 크기 순서로 나열된 자료집단을 4등분하는 척도 보통 Q_1, Q_2, Q_3으로 쓴다.
변동계수 coefficient of variation : 평균을 중심으로 한 상대적인 산포의 척도
평균의 차이가 큰 두 집단에 대해 산포의 척도를 비교할 때 많이 사용
상자그림(box plot)
사분위수를 이용하여 수집한 자료에 포함된 극단값을 알려주는 그림이며, 극단값을 판별하는 개념들은 다음과 같다.
- 안울타리 inner fence : 사분위수 Q_1 와 Q_3에서 각각 1.5IQR만큼 떨어져 있는 값
- 바깥울타리 outer fence : 사분위수 Q_1 와 Q_3에서 각각 3IQR만큼 떨어져 있는 값
- 인접값 adjacent value : 안울타리 안에 놓이는 가장 극단적인 자료값, 즉 아래쪽 안울타리 보다 큰 가장 작은 자료값과 위쪽 안울타리보다 작은 가장 큰 자료값
- 보통 극단 mild outlier : 안울타리와 바깥울타리 사이에 놓이는 자료값
- 극단값 extreme outlier : 바깥울타리 외부에 놓이는 자료값
- (upper/lower) whisker : max 또는 min 부터 Q3 또는 Q1까지 이루어지는 범위
'Math > Applied Statistics' 카테고리의 다른 글
Statistics - Representative Value ( Measures of location ) (0) | 2022.09.22 |
---|---|
Statistics - 자료의 정리 (2) | 2022.09.22 |
Statistics - Introduction (0) | 2022.09.22 |
Comments