您好,登錄后才能下訂單哦!
本篇內容介紹了“github線性回歸怎么實現”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
Simple Linear Regression
Data Preprocessing
1 讀入數據集
# Importing the dataset dataset <- read.csv('studentscores.csv') #時間和得分之間的關系 Hours Scores 1 2.5 21 2 5.1 47 3 3.2 27 4 8.5 75 5 3.5 30 6 1.5 20 plot(dataset$Hours,dataset$Scores) #
2 數據預處理
首先按照上次分享的進行數據預處理
R|ML_code-入門(1)
3 訓練集和測試集
將數據按照4:1拆分,每一組分別包含自變量和因變量
# Splitting the dataset into the Training set and Test set # install.packages('caTools') library(caTools) set.seed(123) split = sample.split(dataset$Scores, SplitRatio = 1/4) training_set <- subset(dataset, split == TRUE) test_set <- subset(dataset, split == FALSE) # Feature Scaling # training_set <- scale(training_set) # test_set <- scale(test_set)
4 模型擬合及預測
通過訓練集進行模型擬合得到曲線,然后將測試集的X_test帶入曲線中,得到預測結果y_pred,最后將預測結果y_pred與測試集中的y_test進行比較,確定預測是否準確。
# Fitting Simple Linear Regression to the Training set regressor = lm(formula = Scores ~ Hours, data = training_set) # Predicting the results y_pred <- predict(regressor, newdata = test_set)
5 結果可視化
# Visualising the Training results library(ggplot2) ggplot() + geom_point(aes(x = training_set$Hours, y = training_set$Scores), colour = 'red') + geom_line(aes(x = training_set$Hours, y = predict(regressor, newdata = training_set)), colour = 'blue') + ggtitle('Scores vs Hours (Training set)') + xlab('Hours') + ylab('Scores') # Visualising the Test results library(ggplot2) ggplot() + geom_point(aes(x = test_set$Hours, y = test_set$Scores), colour = 'red') + geom_line(aes(x = training_set$Hours, y = predict(regressor, newdata = training_set)), colour = 'blue') + ggtitle('Scores vs Hours (Test set)') + xlab('Hours') + ylab('Scores')
“github線性回歸怎么實現”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。