[R] 데이터 구조와 기본
데이터 구조 - 스칼라(Scala) : 정수, 실수, 문자, 문자열 - 벡터(Vector) : 스칼라가 여러개 - 매트릭스(Matrix) : 2차원 벡터 = 행렬 / matrix(c(1:10), ncol = 3, byrow = TRUE) - 배열(Array) : 2차원 이상의 벡터 - 리스트(List) : 항목의 순서가 중요한 목록. 다양한 타입 저장 가능 - Factor : 값이 대상을 분류하는 의미를 갖는 타입 - 데이터프레임(DataFrame) : data.frame(a = c(1, 2, 3), b = c('a', 'b', 'c') 벡터 a
2020. 7. 21.
[chardet] 파일 인코딩을 무엇으로 지정할지 모를 때 :: Encoding Error , Encoding Detector
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 0: invalid start byte python에서 파일을 불러올 때 인코딩 설정을 제대로 해주지 않으면 파일이 불러와지지 않는다. 이때 무엇으로 인코딩할지 모를 때는 chardet 이용해 인코딩을 감지하면 된다. 설치하기 pip install chardet 탐지할 수 있는 인코딩 방식 ASCII, UTF-8, UTF-16 (2 variants), UTF-32 (4 variants) Big5, GB2312, EUC-TW, HZ-GB-2312, ISO-2022-CN (Traditional and Simplified Chinese) EUC-JP, SHIFT_JIS, CP932, IS..
2020. 5. 6.