[Python] 홀드아웃 :: train_test_split
반응형
홀드아웃
- 모델의 성능을 측정하고자 할 때 학습할 때 사용한 데이터로 검증하지 않기 위해 train-test 데이터를 분리한다.
- 데이터를 랜덤하게 두 분류로 분리하여 교차검증을 실시
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.3, random_state = 100)
- test_size = 테스트 사이즈의 크기
> 0.3일 경우 train:test = 7:3
728x90
'Python > Scikit-learn' 카테고리의 다른 글
[Python] 성능 측정 지표 :: MAE, MSE, RMSE, MAPE, MPE, MSLE (3) | 2020.12.12 |
---|---|
[Python] 데이터 스케일링 :: 표준화(Standardization) (0) | 2020.12.07 |
[Python] 오분류표 Confusion Matrix :: 분류(Classification) 모형 평가 (0) | 2020.09.14 |
[Scikit-learn] LabelEncoder() :: Labelling (0) | 2019.11.20 |
[Scikit-learn] ImportError: cannot import name 'CategoricalEncoder' (0) | 2019.11.20 |
Comments