본문 바로가기

[Python] 홀드아웃 :: train_test_split

Python/Scikit-learn 2020. 9. 25.

반응형

홀드아웃

- 모델의 성능을 측정하고자 할 때 학습할 때 사용한 데이터로 검증하지 않기 위해 train-test 데이터를 분리한다.

- 데이터를 랜덤하게 두 분류로 분리하여 교차검증을 실시

 

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.3, random_state = 100)

 

- test_size = 테스트 사이즈의 크기

   > 0.3일 경우 train:test = 7:3

 

 

 

 

Preference

 

 

 

728x90

Comments