中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

R語言怎樣做Logistic回歸

發布時間:2021-11-22 15:26:38 來源:億速云 閱讀:404 作者:柒染 欄目:大數據

R語言怎樣做Logistic回歸,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

 Logistic回歸的應用場景

當因變量為二值型結果變量,自變量包括連續型和類別型的數據時,Logistic回歸是一個非常常用的工具。比如今天的例子中用到的婚外情數據 “Fair's Affairs”。因變量是是否有過婚外情,自變量有8個,分別是

  • 性別
  • 年齡
  • 婚齡
  • 是否有小孩
  • 宗教信仰程度 (5分制,1表示反對,5表示非常信仰)
  • 學歷
  • 職業 (逆向編號的戈登7種分類)這個是啥意思?)
  • 對婚姻的自我評分

因變量y是出軌次數,我們將其轉換成二值型,出軌次數大于等于1賦值為1,相反賦值為0

 

下面開始實際操作

這個數據集來自R語言包AER,如果要用這個數據集需要先安裝這個包

install.packages("AER")
 

然后使用data()函數獲取這個數據集

data(Affairs,package = "AER")
 

然后就可以在環境的窗口里看到如下R語言怎樣做Logistic回歸

這個數據集總共有601個觀察值,總共9個變量

 接下來是將變量y出軌次數,轉換成二值型
df<-Affairs
df$ynaffairs<-ifelse(df$affairs>0,1,0)
table(df$ynaffairs)
df$ynaffairs<-factor(df$ynaffairs,
                     levels = c(0,1),
                     labels = c("No","Yes"))table
table(df$ynaffairs)
   接下來是擬合模型

擬合模型用到的是glm()函數

fit.full<-glm(ynaffairs~gender+age+yearsmarried+
                children+religiousness+education+occupation+rating,
              data=df,family = binomial())
 

通過summary()函數查看擬合結果

summary(fit.full)
 
R語言怎樣做Logistic回歸  
image.png

根據回歸系數的P值可以看到 性別、是否有孩子、學歷、職業對方程的貢獻都不顯著。去除這些變量重新擬合模型

fit.reduced<-glm(ynaffairs~age+yearsmarried+
                religiousness+rating,
              data=df,family = binomial())
   接下來是使用anova()函數對它們進行比較,對于廣義線性回歸,可用卡方檢驗
anova(fit.full,fit.reduced,test = "Chisq")
 
R語言怎樣做Logistic回歸  
image.png

可以看到結果中p值等于0.2108大于0.05,表明四個變量和9個變量的模型你和程度沒有差別

 接下來是評價變量對結果概率的影響

構造一個測試集

testdata<-data.frame(rating=c(1,2,3,4,5),
                     age=mean(df$age),
                     yearsmarried=mean(df$yearsmarried),
                     religiousness=mean(df$religiousness)
 

預測概率

testdata$prob<-predict(fit.reduced,newdata = testdata,
                       type = "response")
   簡單的柱形圖對結果進行展示
library(ggplot2)
ggplot(testdata,aes(x=rating,y=prob))+
  geom_col(aes(fill=factor(rating)),show.legend = F)+
  geom_label(aes(label=round(prob,2)))+
  theme_bw()
 
R語言怎樣做Logistic回歸  
image.png

從這些結果可以看到,當婚姻評分從1(很不幸福)變為5(非常幸福)時,婚外情概率從0.53降低到了0.15。模型的預測結果和我們的經驗還挺符合的

關于R語言怎樣做Logistic回歸問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

泸水县| 鲁甸县| 大洼县| 明光市| 商都县| 蕉岭县| 梅河口市| 盘山县| 彭山县| 冕宁县| 胶南市| 鄂温| 肃北| 分宜县| 临夏市| 盐城市| 湘潭市| 军事| 永福县| 缙云县| 环江| 正定县| 大冶市| 吴川市| 车险| 洪洞县| 上高县| 汝阳县| 莱西市| 蕉岭县| 潞西市| 清镇市| 卢氏县| 新安县| 讷河市| 平度市| 鹿泉市| 阿荣旗| 黄陵县| 托克托县| 泗阳县|