Notice
Recent Posts
Recent Comments
05-21 07:17
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
Archives
Today
Total
관리 메뉴

Byeol Lo

Statistics - 자료의 정리 본문

Math/Applied Statistics

Statistics - 자료의 정리

알 수 없는 사용자 2022. 9. 22. 11:22

질적자료(Qualitative data, Categorical data)

도수분포표(Frequency Distribution Table) : 여러 개의 범주 안에 측정된 각 범주의 도수와 상대도수 또는 범주 백분율을 기입한 표

Qualitative Data 도수 상대도수 백분율(%)
가위 2 0.2 20
바위 3 0.3 30
5 0.5 50
  • 도수 frequency : 각 범주 안에 들어가는 자료집단 안에서 관찰된 자료 수
  • 상대도수 relative frequency : 각 범주의 도수를 자료집단 안의 전체 자료수로 나눈 값
  • 범주 백분율 class percentage : 상대도수에 100을 곱한 값

막대그래프(bar chart) : 질적자료의 각 범주를 수평축에 나타내고, 각 범주에 대응하는 도수, 상대도수, 백분율 등을 같은 폭의 수직막대로 나타낸 그림

x<-c(5, 3, 2)
barplot(x, names=c("s","r","p"), col=c("red", "blue", "green"), ylim = c(0,6))

  • 장점 : 여러 개의 범주 중에서 문제 해결에 도움을 주는 중요한 소수의 범주를 찾는데 도움을 주고, 어떤 범주가 중요한지 쉽게 파악할 수 있다.
  • 단점 : 범주를 크기 순서로 재배열하므로 범주가 순서형인 순서자료에는 적합하지 않다.

원그래프(pie chart) : 질적 자료의 각 범주에 대한 비율 관계를 이용하여 각 범주를 상대적으로 나타낸 비율 그래프로, 각 범주의 백분율에 해당하는 중심각을 찾는 부채꼴 모양으로 나타낸 그림

x<-c(5, 3, 2)
name <- c("s", "r", "p")
color1 <- c("red", "blue", "green")
pie(x, label=name, col=color1, init.angle = -90)

 

꺾은선 그래프(graph of broken line) : 막대그래프의 상단 중심부를 직선으로 연결하여 각 범주를 비교하는 그림

단점 : 수직축의 척도 간격에 따라 달리 해석할 수 있다.

 

점도표(dot plot) : 수평축에 각 범주를 기입하고, 수평축 위에 각 범주 또는 측정값의 관찰 횟수를 점으로 나타낸 그림

  • 장점 : 각 범주 사이의 관찰값을 쉽게 비교할 수 있다.
  • 단점 : 관찰값의 수에 해당하는 점을 찍어서 나타내므로 그 수가 매우 많은 경우에는 부적당하다.

 

양적자료(Quantitative Data)

도수분포표 frequency distribution table : 양적 자료를 적당한 간격으로 집단화하여 계급, 도수, 상대도수, 누적도수, 누적상대도수, 계급값 등을 기입한 표

 

계급 class : 양적자료를 적당한 간격으로 집단화하여 나타낸 범주

계급폭 class width : 이웃하는 두 계급의 위쪽 경계에서 아래쪽 경계를 뺀 값

 

상대도수분포표 relative frequency distribution table : 각 계급구간과 각 계급구간의 상대도수를 기록하여 자료들을 집단화시킨 표

계급 상대도수 class relative frequency : 계급의 도수를 전체 자료수로 나눈 값

 

누적상대도수분포표 cumulative relative frequency distirbution table : 각 계급구간과 해당 계급구간을 포함하여 이전 계급구간에 있는 상대도수들을 모두 합한 도수분포표

  • 장점 : 자료의 대략적인 중심의 위치(50%)를 알 수 있다. 전체 자료의 흩어진 정도를 파악할 수 있다.
  • 단점 : 각 계급 안에 들어있는 자료의 정확한 값을 알 수 없다.

히스토그램 histogram : 수평축에는 도수분포표의 계급간격, 수직축에 각 계급의 도수를 높이로 갖는 사각형으로 작성한 그림

히스토그램의 여러가지 모양

 

도수다각형 frequency polygon : 히스토그램에서 연속적인 막대의 상단중심부를 선분으로 연결하여 다각형으로 표현한 그림

  • 장점 : 두 개 이상의 자료집단을 비교하는데 널리 사용한다.

줄기-잎 그림 stem-leaf plot : 실제 측정값을 이용하여 변동이 적은 부분은 줄기로 하고, 변동이 많은 부분은 잎모양으로 나타낸 그림

  • 장점 : 도수분포표나 히스토그램이 갖고 있는 특성을 그대로 보존하고 각 계급 안에 들어있는 개개의 측정값을 제공한다.

 

'Math > Applied Statistics' 카테고리의 다른 글

Statistics - Dispersion  (0) 2022.09.22
Statistics - Representative Value ( Measures of location )  (0) 2022.09.22
Statistics - Introduction  (0) 2022.09.22
Comments