[R] 데이터 구조와 기본
반응형
데이터 구조
- 스칼라(Scala) : 정수, 실수, 문자, 문자열
- 벡터(Vector) : 스칼라가 여러개
- 매트릭스(Matrix) : 2차원 벡터 = 행렬 / matrix(c(1:10), ncol = 3, byrow = TRUE)
- 배열(Array) : 2차원 이상의 벡터
- 리스트(List) : 항목의 순서가 중요한 목록. 다양한 타입 저장 가능
- Factor : 값이 대상을 분류하는 의미를 갖는 타입
- 데이터프레임(DataFrame) : data.frame(a = c(1, 2, 3), b = c('a', 'b', 'c')
벡터
a <- 2
b <- c(1, 2, 3)
c <- 1:10
d <- seq(1, 10)
# 정렬
sort(x)
# 역순
rev(x)
# 빈도수
table(x)
# 고유값
unique(x)
반복문
For
For(변수명 in 범위){
Code
}
While
While(조건){
Code
}
조건문
if(조건){
True
} else {
False
}
함수
함수명 = function(인자){
Code
}
비교연산자
# 같다
a == b
# 같지 않다
a != b
# a가 b보다 크다
a > b
# a가 b보다 크거나 같다
a >= b
# a가 b보다 작다
a < b
# a가 b보다 작거나 같다
a < = b
# 결측값인지
is.na(a)
is.null(a)
수학
# 최대값
max(x)
# 최소값
min(x)
# 합
sum(x)
# 평균
mean(x)
# 중간값
median(x)
# 사분위값
quantile(x)
# 순위
rank(x)
# 분산
var(x)
# 표준편차
sd(x)
# 로그
log(x)
# exp
exp(x)
# 반올림
round(x, n)
signif(x, n)
# 상관계수
cor(x, y)
데이터 다루기
# 데이터 선택
df[행, 열]
# df내 col1 컬럼
df$col1
df['col1']
# df내 컬럼 조회
df[c('col1', 'col2')]
# 행의 수
nrow(df)
# 열의 수
ncol(df)
# 행 열의 수
dim(df)
728x90
'정보수집' 카테고리의 다른 글
[Hadoop] HDP 설치하기 & 실행하기 :: Hortonworks Data Platform (1) | 2021.01.15 |
---|---|
[R] 데이터 csv파일로 내보내기 / 저장하기 :: write.csv (0) | 2020.12.03 |
[R] 내장 데이터 & 패키지 데이터 모음 (0) | 2020.09.06 |
[ML] 앙상블(Ensemble) :: 배깅(Bagging) & 부스팅(Boosting) (0) | 2020.04.24 |
[plotly] 티스토리/웹페이지에 반응형 그래프 올리기 (5) | 2020.04.19 |
Comments