본문 바로가기

[R] 데이터 구조와 기본

정보수집 2020. 7. 21.

반응형

데이터 구조

- 스칼라(Scala) : 정수, 실수, 문자, 문자열 

- 벡터(Vector) : 스칼라가 여러개

- 매트릭스(Matrix) : 2차원 벡터 = 행렬 / matrix(c(1:10), ncol = 3, byrow = TRUE)

- 배열(Array) : 2차원 이상의 벡터

- 리스트(List) : 항목의 순서가 중요한 목록. 다양한 타입 저장 가능

- Factor : 값이 대상을 분류하는 의미를 갖는 타입

- 데이터프레임(DataFrame) : data.frame(a = c(1, 2, 3), b = c('a', 'b', 'c')

 

벡터

a <- 2

b <- c(1, 2, 3)

c <- 1:10

d <- seq(1, 10)

 

# 정렬
sort(x)

# 역순
rev(x) 

# 빈도수
table(x) 

# 고유값
unique(x)

 

 

 

반복문

For

For(변수명 in 범위){
	Code
}

While

While(조건){
	Code
}

 

조건문

if(조건){
	True
} else {
	False
}

 

함수

함수명 = function(인자){
	Code
}

 


비교연산자

# 같다
a == b   

# 같지 않다
a != b

# a가 b보다 크다
a > b

# a가 b보다 크거나 같다
a >= b

# a가 b보다 작다
a < b

# a가 b보다 작거나 같다
a < = b

# 결측값인지
is.na(a)
is.null(a)

 

수학

# 최대값
max(x)

# 최소값
min(x)

# 합
sum(x) 

# 평균
mean(x)

# 중간값
median(x) 

# 사분위값
quantile(x) 

# 순위
rank(x)

# 분산
var(x)

# 표준편차
sd(x) 

# 로그
log(x)

# exp
exp(x)

# 반올림
round(x, n)
signif(x, n)

# 상관계수
cor(x, y)

 

데이터 다루기

# 데이터 선택
df[행, 열]

# df내 col1 컬럼
df$col1
df['col1']

# df내 컬럼 조회
df[c('col1', 'col2')]

# 행의 수
nrow(df) 

# 열의 수
ncol(df)

# 행 열의 수
dim(df)

 

 

 

728x90

Comments