在Scikit-learn中,可以使用joblib庫來實現模型的持久化。joblib庫提供了dump和load函數,可以方便地將模型保存到文件或者從文件中加載模型。
以下是一個示例代碼,演示了如何使用joblib庫來保存和加載一個訓練好的模型:
from sklearn import datasets
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn import metrics
from sklearn.externals import joblib
# 加載數據集
iris = datasets.load_iris()
X = iris.data
y = iris.target
# 劃分訓練集和測試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
# 訓練模型
model = RandomForestClassifier()
model.fit(X_train, y_train)
# 保存模型
joblib.dump(model, 'random_forest_model.pkl')
# 加載模型
loaded_model = joblib.load('random_forest_model.pkl')
# 使用加載的模型進行預測
y_pred = loaded_model.predict(X_test)
# 評估模型
print("Accuracy:", metrics.accuracy_score(y_test, y_pred))
在上面的代碼中,我們首先訓練了一個隨機森林分類器模型,然后使用joblib庫的dump函數將模型保存到文件’random_forest_model.pkl’中。接著使用load函數加載模型,并使用加載的模型進行預測和評估。