要建立一個多元線性回歸模型,可以使用Python中的統計庫或機器學習庫來實現。以下是使用statsmodels
和scikit-learn
庫建立多元線性回歸模型的示例代碼:
使用statsmodels
庫:
import numpy as np
import pandas as pd
import statsmodels.api as sm
# 創建一個包含自變量和因變量的DataFrame
data = {
'X1': [1, 2, 3, 4, 5],
'X2': [2, 4, 6, 8, 10],
'Y': [3, 5, 7, 9, 11]
}
df = pd.DataFrame(data)
# 添加常數列
df['const'] = 1
# 擬合多元線性回歸模型
model = sm.OLS(df['Y'], df[['const', 'X1', 'X2']]).fit()
# 輸出回歸系數和統計信息
print(model.summary())
使用scikit-learn
庫:
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
# 創建自變量和因變量的數組
X = np.array([[1, 2], [2, 4], [3, 6], [4, 8], [5, 10]])
y = np.array([3, 5, 7, 9, 11])
# 將數據集分為訓練集和測試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 擬合多元線性回歸模型
model = LinearRegression()
model.fit(X_train, y_train)
# 輸出回歸系數和R^2值
print('Coefficients:', model.coef_)
print('Intercept:', model.intercept_)
print('R^2 score:', model.score(X_test, y_test))
這兩種方法都可以用來建立多元線性回歸模型,并輸出模型的系數和統計信息。可以根據具體的需求選擇合適的方法來建立模型。