Pandas是一個用于數據分析和處理的Python庫,不直接提供調整分類模型閾值的功能。調整分類模型的閾值通常是在使用機器學習庫(如scikit-learn)訓練模型后進行的。
在scikit-learn中,可以使用predict_proba()
方法來獲取模型預測的概率值,然后根據需要調整閾值。以下是一個示例代碼:
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
# 假設已經訓練好了一個邏輯回歸模型
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
model = LogisticRegression()
model.fit(X_train, y_train)
# 獲取測試集的預測概率值
probs = model.predict_proba(X_test)[:,1]
# 自定義閾值
threshold = 0.6
y_pred = [1 if prob >= threshold else 0 for prob in probs]
# 計算準確率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy with threshold {}: {}".format(threshold, accuracy))
在上面的示例中,我們首先使用predict_proba()
方法獲取模型預測的概率值,然后根據自定義的閾值(這里設為0.6)將概率值轉換為二元分類結果,最后計算準確率。根據實際情況可調整閾值來獲得最佳模型性能。