'AI/ADP' 카테고리의 글 목록 (2 Page)

Notice

Recent Posts

Recent Comments

Link

10-06 07:28

« 2024/10 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록AI/ADP (35)

Byeol Lo

[ADP] 4장 데이터 분석 - 회귀 분석(Regression Analysis)

깊이 있는 내용은 다른 포스트로 대체하면서 넘기며, 지금은 흐름을 따지자.2024.07.29 - [Math/Applied Statistics] - Simple Linear Regression Simple Linear Regression많이 부족하니 틀린 부분은 댓글로 지적해 주셨으면 좋겠습니다. 실생활에서 쓰일 수 있는 두 변수 간의 상관관계를 간단히 표현할 수 있는 일차방정식을 생각해 보자. 예를 들어, 붕어빵의seonghun120614.tistory.com R을 이용한 단순선형회귀set.seed(2)x = runif(10, 0, 11)y = 2 + 3*x + rnorm(10, 0, 0.2)dfrm = data.frame(x, y)lm(y~x, data=dfrm)Call:lm(formula = y ..

AI/ADP 2024. 7. 30. 20:10

[ADP] 4장 데이터 분석 - 비모수 검정

보통 모집단의 모수에 대한 검정에는 모수적 방법(parametric method)와 비모수적 방법(non-parametric method)가 있는데, 모수적 검정은 집단의 분포에 대한 가정을 하고, 그 가정 하에서 검정통계량과 검정통계량의 분포를 유도해 검정을 실시하는 방법이다. 반대로 비모수적 검정은 자료가 추출된 모집단의 분포에 대해 아무 제약을 가하지 않고(모집단의 분포에 대한 가정을 하지 않고), 검정을 실시하는 방법이다. 차이점은 가설 설정의 방법인데,가설 설정이 분포의 형태가 동일하다, 동일하지 않다로 나뉨관측값의 절대적인 크기에 의존하지 않는 관측값들의 순위나 두 관측값 차이의 부호 등을 이용해 검정함대표적인 비모수 검정 방법으로는 다음과 같다.부호 검정(sign test)윌콕슨의 순위합검정..

AI/ADP 2024. 7. 27. 20:48

[ADP] 4장 데이터 분석 - 통계 분석

조사 단위전수조사, 모집단 조사(census)표본조사단순랜덤추출: 임의의 난수를 통해 원소 추출계통추출: 일련의 번호를 부여한 후 n 구간으로 나누어 거기서 n개를 뽑음집락추출: 모집단을 cluster(homogeneous 함) 으로 나누어 해당 cluster에서 표본 선택층화추출: 모집단을 stratum(heterogeneous 함)으로 나누어 각 stratum에서 표본 선택 자료의 종류Categorical Data명목 척도(nominal scale): 연산, 비교 불가순서 척도(ordinal scale): 비교 가능Numerical Data구간 척도(interval scale): 비교, 덧셈, 뺄셈 가능비율 척도(ratio scale): 비교, 덧셈, 뺄셈, 곱셈, 나눗셈 가능 Statistical ..

AI/ADP 2024. 7. 25. 19:17

[ADP] 4장 데이터 분석 - 결측값 처리와 이상값 검색

데이터 분석에 들어가기 전에 데이터가 어떤 분포인지 특징을 띄는지 패턴을 가지는지 대략적으로 볼 수 있는 방법이 있는데 데이터 탐색 기술이 그 예이다. EDA 작업이라고도 불린다. Descriptive Statisticsstr 이용data(iris)str(iris) # 데이터 구조 파악> str(iris) 'data.frame': 150 obs. of 5 variables: $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ... $ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ... $ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ... $..

AI/ADP 2024. 7. 25. 18:20

[ADP] 4장 데이터 분석 - R 기초, data.table

데이터 프레임과 유사하지만 더 빠른 grouping 과 ordering을 제공한다. 특히 64비트 운영체제에서 RAM이 충분히 많으면 유용하다. R data.tableinstall.packages("data.table")library(data.table) data.table 생성set.seed(1)dt = data.table(x = c("b", "b", "b", "a", "a"), v = rnorm(5))print(dt) x v 1: b -0.62645382: b 0.18364333: b -0.83562864: a 1.59528085: a 0.3295078data.frame을 생성하는 것과 동일한 형태로 선언해주..

AI/ADP 2024. 7. 25. 17:36

[ADP] 4장 데이터 분석 - R 기초, plyr

데이터를 분리하고 처리한 다음 다시 결합하는 데이터 처리 기능을 제공한다. apply 함수와 multi-core 함수를 이용하면 for loop를 사용하지 않고 빠르게 처리할 수 있다. 이를 공부하기 전에 R언어의 data.frame, list, array 데이터 타입에 대해 자세히 알고 가야한다.data.frame: 행과 열로 구성된 2차원 표 형태list: 서로 다른 데이터 타입을 가진 요소들이 묶여있는 구조array: 다차원 배열을 표현하며, 모든 요소가 동일한 데이터 타입을 가지는 구조다. 수치 데이터의 계산 및 분석에 사용됨. 벡터이기도 함 다양한 다차원 데이터형으로 구조화시키거나 처리를 하기 위해서 plyr는 다차원 데이터에 대한 입출력을 구분하여 함수들을 만든다. 입력 data.frame..

AI/ADP 2024. 7. 24. 04:44

[ADP] 4장 데이터 분석 - R 기초, sqldf

R의 dataframe를 sql로 다루기 위해서 사용되는 패키지이다. R sqldfinstall.packages("sqldf")library("sqldf")data(iris)head(iris, n=10) head를 sqldf를 활용하여 해보자. 기본적인 sql문은 전부 지원하기 때문에 문자열 안에 아무렇게 sql문을 넣으면 된다. select statementsqldf("select * from iris")sqldf("select * from iris limit 5") Sepal.Length Sepal.Width Petal.Length Petal.Width Species1 5.1 3.5 1.4 0.2 setosa2 4.9 ..

AI/ADP 2024. 7. 24. 04:03

[ADP] 4장 데이터 분석 - R 기초, reshape

모델링: 데이터 마이닝 분야에서 다양한 분석기법을 적용하여 모델을 개발하는 과정데이터마트: 데이터의 한 부분으로서 특정 사용자가 관심을 갖는 데이터들을 담은 상대적으로 작은 규모의 데이터 웨어하우스 R reshape R언어에서는 특정 데이터의 차원을 조절할 수 있는데, reshape라는 기능을 통해 데이터 재정렬을 할 수 있고, 이 재정렬, 차원을 바꾸는 것 자체가 데이터를 여러 계층 또는 수준으로 그룹화를 시킬 수 있다는 소리가 된다. reshape의 기능 중에 차별화된 특징은 원래 데이터가 가지고 있는 모든 정보를 그대로 유지한다는 것이다. reshape는 외장 패키지이기 때문에 install.packages("reshape")를 통해 다운로드 받을 수 있다.install.packages("resha..

AI/ADP 2024. 7. 24. 03:36

[ADP] 4장 데이터 분석 - R 기초, data visualization

Scatter Plotplot을 통해 그릴 수 있으며 인자로 옵션을 줄 수 있다.plot(x, y = NULL, type = "p", xlim = NULL, ylim = NULL, log = "", main = NULL, sub = NULL, xlab = NULL, ylab = NULL, ann = par("ann"), axes = TRUE, frame.plot = axes, panel.first = NULL, panel.last = NULL, asp = NA, xgap.axis = NA, ygap.axis = NA, ...)Argumentstype1-character string 이 필요"p": 점"l": 선"b": 점, 선 (both 를 말함)"c": 선인데, 점..

AI/ADP 2024. 7. 24. 02:43

[ADP] 4장 데이터 분석 - R 기초, data cleansing

R언어 자료 구조Vectorx = c(1, 2, 3)y c는 concentration(연결)을 의미논리 연산자 벡터를 숫자형 벡터처럼 사용하는 경우 자동적으로 TRUE는 1로 FALSE는 0으로 형변환숫자형 벡터가 문자형 벡터 처럼 사용하면 문자열로 형변환, 논리 연산자 벡터도 동일하게 문자열로 형변환됨case-sensitive하다 Matrix> mat = matrix(c(1,2,3,4,5,6), ncol=2)> mat [,1] [,2][1,] 1 4[2,] 2 5[3,] 3 6> mat mat [,1] [,2][1,] 1 4[2,] 2 5[3,] 3 6> mat mat [,1] [,2][1,] 1 2[2..

AI/ADP 2024. 7. 23. 20:58

Prev 1 2 3 4 Next

목록AI/ADP (35)

Byeol Lo

티스토리툴바