中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

R語言中如何在數據可視化過程中調整因子順序

發布時間:2021-11-22 16:07:02 來源:億速云 閱讀:489 作者:柒染 欄目:大數據

這篇文章將為大家詳細講解有關R語言中如何在數據可視化過程中調整因子順序,文章內容質量較高,因此小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關知識有一定的了解。

實例操練

這個例子使用的數據集為tidyverse包自帶的數據集,大家可以使用?gss_cat查看相關變量,這兒不再贅述。

在數據可視化過程中改變因子順序是一個經常性的操作,比如我們想看看不同religions的average number of hours spent  watching TV per day有什么不同,我們可以用以下代碼:

relig_summary <- gss_cat %>%   group_by(relig) %>%   summarise(     age = mean(age, na.rm = TRUE),     tvhours = mean(tvhours, na.rm = TRUE),     n = n()   )  ggplot(relig_summary, aes(tvhours, relig)) + geom_point()

運行代碼得到輸出的點圖如下:

R語言中如何在數據可視化過程中調整因子順序

上面的這個點圖其實很不好看,我們可能會覺得能不能把religions的順序變一變,讓有最小tvhours的religion在y軸的最下面,有最大tvhours的在最上面。

怎么做呢,需要用到fct_reorder()方法,這個方法取2個參數:

  • 第一個就是你想改變順序的因子,本例中:religions

  • 第二個,改變順序的參照物,本例中:tvhours

代碼如下:

ggplot(relig_summary, aes(tvhours, fct_reorder(relig, tvhours))) +   geom_point()

R語言中如何在數據可視化過程中調整因子順序

可以看到,改變了religions的順序后這個圖就更加清晰明白了。

再看一個例子:

rincome_summary <- gss_cat %>%   group_by(rincome) %>%   summarise(     age = mean(age, na.rm = TRUE),     tvhours = mean(tvhours, na.rm = TRUE),     n = n()   )  ggplot(rincome_summary, aes(age, fct_reorder(rincome, age))) + geom_point()

上面的代碼,可以畫出按年齡排序后不同rincome和age的關系:

R語言中如何在數據可視化過程中調整因子順序

但是,問題出在按年齡排序后我們的收入(y軸)顯得很亂,所以這個方法并不好,考慮到收入本來就是有順序的,所以好的處理方法為保留收入的原始順序,于是我們寫出了如下代碼:

rincome_summary <- gss_cat %>%   group_by(rincome) %>%   summarise(     age = mean(age, na.rm = TRUE),     tvhours = mean(tvhours, na.rm = TRUE),     n = n()   )  ggplot(rincome_summary, aes(age, rincome)) + geom_point()

R語言中如何在數據可視化過程中調整因子順序

這次再看我們的圖,雖然其他的收入levels都排的挺好,但是我們不希望“Not  applicable”排在第一。這個時候我們可以用fct_relevel(),它也有2個參數:

  • 需要排序的因子,本例中:rincome

  • 需要放在最前面的levels,本例中:Not applicable

代碼如下:

ggplot(rincome_summary, aes(age, fct_relevel(rincome, "Not applicable"))) +   geom_point()

R語言中如何在數據可視化過程中調整因子順序

這一下,我們的圖形就比較滿意了。

再看一個例子:線圖的顏色控制:

by_age <- gss_cat %>%   filter(!is.na(age)) %>%   count(age, marital) %>%   group_by(age) %>%   mutate(prop = n / sum(n))  ggplot(by_age, aes(age, prop, colour = marital)) +   geom_line(na.rm = TRUE)  ggplot(by_age, aes(age, prop, colour = fct_reorder2(marital, age, prop))) +   geom_line() +   labs(colour = "marital")

上面的代碼畫的是不同的年齡中婚姻狀況的比例變化:

R語言中如何在數據可視化過程中調整因子順序

我們通過fct_reorder2實現了圖例和x變量最大時y的值的順序一致,可以更加明晰。

最后再看一個柱狀圖調整因子順序的例子

下面的代碼可以,正序逆序改變x軸標簽:

  1. gss_cat %>% 

  2.   mutate(marital = marital %>% fct_infreq() ) %>% 

  3.   ggplot(aes(marital)) + 

  4.     geom_bar() 

  5.  

  6. gss_cat %>% 

  7.   mutate(marital = marital %>% fct_infreq() %>% fct_rev()) %>% 

  8.   ggplot(aes(marital)) + 

  9.     geom_bar() 


R語言中如何在數據可視化過程中調整因子順序

R語言中如何在數據可視化過程中調整因子順序

大家可以在自己電腦上運行試試,關鍵就在于fct_rev()。

今天通過3個例子給大家介紹了可視化中因子順序的改變,感謝大家耐心看完。發表這些東西的主要目的就是督促自己,希望大家關注評論指出不足,一起進步。

關于R語言中如何在數據可視化過程中調整因子順序就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

泰宁县| 普陀区| 兴业县| 河南省| 双桥区| 乐昌市| 曲阳县| 贺兰县| 武宣县| 开鲁县| 金川县| 大港区| 新乡县| 黄龙县| 峡江县| 石门县| 岗巴县| 印江| 鄱阳县| 五华县| 昆明市| 克拉玛依市| 武平县| 渑池县| 光泽县| 化州市| 宜章县| 汤阴县| 巴彦淖尔市| 武冈市| 临澧县| 周宁县| 新乡县| 灵台县| 墨竹工卡县| 南木林县| 邵阳市| 金平| 老河口市| 安新县| 芜湖县|