일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 자바
- Inheritance
- External Scheme
- Class
- systemd
- preprocessing
- OOP
- 리눅스
- 리눅스 마스터 1급
- Java
- spring
- 백준
- Entity
- Entity Set
- selenium
- descriptive statistics
- Physical Scheme
- dbms
- Reference Type
- Mac
- 셀레니움
- X.org
- Unity
- literal
- Polymolphism
- BFS
- Binary Search
- X윈도우
- Operator
- python
- Today
- Total
Byeol Lo
Statistics - 자료의 정리 본문
질적자료(Qualitative data, Categorical data)
도수분포표(Frequency Distribution Table) : 여러 개의 범주 안에 측정된 각 범주의 도수와 상대도수 또는 범주 백분율을 기입한 표
Qualitative Data | 도수 | 상대도수 | 백분율(%) |
가위 | 2 | 0.2 | 20 |
바위 | 3 | 0.3 | 30 |
보 | 5 | 0.5 | 50 |
- 도수 frequency : 각 범주 안에 들어가는 자료집단 안에서 관찰된 자료 수
- 상대도수 relative frequency : 각 범주의 도수를 자료집단 안의 전체 자료수로 나눈 값
- 범주 백분율 class percentage : 상대도수에 100을 곱한 값
막대그래프(bar chart) : 질적자료의 각 범주를 수평축에 나타내고, 각 범주에 대응하는 도수, 상대도수, 백분율 등을 같은 폭의 수직막대로 나타낸 그림
x<-c(5, 3, 2)
barplot(x, names=c("s","r","p"), col=c("red", "blue", "green"), ylim = c(0,6))
- 장점 : 여러 개의 범주 중에서 문제 해결에 도움을 주는 중요한 소수의 범주를 찾는데 도움을 주고, 어떤 범주가 중요한지 쉽게 파악할 수 있다.
- 단점 : 범주를 크기 순서로 재배열하므로 범주가 순서형인 순서자료에는 적합하지 않다.
원그래프(pie chart) : 질적 자료의 각 범주에 대한 비율 관계를 이용하여 각 범주를 상대적으로 나타낸 비율 그래프로, 각 범주의 백분율에 해당하는 중심각을 찾는 부채꼴 모양으로 나타낸 그림
x<-c(5, 3, 2)
name <- c("s", "r", "p")
color1 <- c("red", "blue", "green")
pie(x, label=name, col=color1, init.angle = -90)
꺾은선 그래프(graph of broken line) : 막대그래프의 상단 중심부를 직선으로 연결하여 각 범주를 비교하는 그림
단점 : 수직축의 척도 간격에 따라 달리 해석할 수 있다.
점도표(dot plot) : 수평축에 각 범주를 기입하고, 수평축 위에 각 범주 또는 측정값의 관찰 횟수를 점으로 나타낸 그림
- 장점 : 각 범주 사이의 관찰값을 쉽게 비교할 수 있다.
- 단점 : 관찰값의 수에 해당하는 점을 찍어서 나타내므로 그 수가 매우 많은 경우에는 부적당하다.
양적자료(Quantitative Data)
도수분포표 frequency distribution table : 양적 자료를 적당한 간격으로 집단화하여 계급, 도수, 상대도수, 누적도수, 누적상대도수, 계급값 등을 기입한 표
계급 class : 양적자료를 적당한 간격으로 집단화하여 나타낸 범주
계급폭 class width : 이웃하는 두 계급의 위쪽 경계에서 아래쪽 경계를 뺀 값
상대도수분포표 relative frequency distribution table : 각 계급구간과 각 계급구간의 상대도수를 기록하여 자료들을 집단화시킨 표
계급 상대도수 class relative frequency : 계급의 도수를 전체 자료수로 나눈 값
누적상대도수분포표 cumulative relative frequency distirbution table : 각 계급구간과 해당 계급구간을 포함하여 이전 계급구간에 있는 상대도수들을 모두 합한 도수분포표
- 장점 : 자료의 대략적인 중심의 위치(50%)를 알 수 있다. 전체 자료의 흩어진 정도를 파악할 수 있다.
- 단점 : 각 계급 안에 들어있는 자료의 정확한 값을 알 수 없다.
히스토그램 histogram : 수평축에는 도수분포표의 계급간격, 수직축에 각 계급의 도수를 높이로 갖는 사각형으로 작성한 그림
히스토그램의 여러가지 모양
도수다각형 frequency polygon : 히스토그램에서 연속적인 막대의 상단중심부를 선분으로 연결하여 다각형으로 표현한 그림
- 장점 : 두 개 이상의 자료집단을 비교하는데 널리 사용한다.
줄기-잎 그림 stem-leaf plot : 실제 측정값을 이용하여 변동이 적은 부분은 줄기로 하고, 변동이 많은 부분은 잎모양으로 나타낸 그림
- 장점 : 도수분포표나 히스토그램이 갖고 있는 특성을 그대로 보존하고 각 계급 안에 들어있는 개개의 측정값을 제공한다.
'Math > Applied Statistics' 카테고리의 다른 글
Statistics - Dispersion (0) | 2022.09.22 |
---|---|
Statistics - Representative Value ( Measures of location ) (0) | 2022.09.22 |
Statistics - Introduction (0) | 2022.09.22 |