可以使用train_test_split
函數來分割數據集為訓練集和測試集。具體操作如下:
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
其中,X
為特征數據集,y
為標簽數據集,test_size
為測試集所占比例(通常取0.2表示20%的數據作為測試集),random_state
為隨機種子,可以保證每次運行時劃分的訓練集和測試集是一樣的。分割后,X_train
和y_train
為訓練集的特征和標簽,X_test
和y_test
為測試集的特征和標簽。