您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關R語言histogram怎么用的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
最近小仙同學很是煩惱,本以為自己已經掌握了ggplot2作圖的語法,用read.csv(), ggplot()+geom_point()/boxplot()/violinplot()…就可以畫遍天下圖表,結果卻發現到真正畫圖的時候,還是會出現不少的小問題。
比如小仙最近要畫一個直方圖,最開始用hist()函數試了一下,看了下形狀, 好像因為數據取值范圍跨度太大(最大值104,724,最小值30),這個圖畫出來有點丑,于是決定用ggplot美化一下。
調整之后好看是好看了,但是大家有沒有看出什么不對的地方,明明bins=10但是只畫出8個格子,之后調整bins的值,每次都會比我指定的值少2個格子。而且,圖中第一個格子(取值范圍0-1250)應該有700多個數據,但是圖上顯示只有不到300個,問題出在哪里呢?小仙同學百思不得其解。在geom_histogram()函數中,bins就是用來指定分組數目(格子),為什么總是會少兩個?
小仙同學考慮到自己能力有限,決定量力而行,另辟蹊徑。
于是設置另外一個參數breaks,終于找回了丟失的格子
經過此事,小仙同學深刻認識到了自己的有限水平,哈哈。不過還是分享一下,希望能幫助到大家。實際的數據可真是比書上的例子難處理呢。
按照慣例寫一下整個作圖的過程。
首先要把你想要繪圖的數據調整成R語言可以識別的格式,建議大家在excel中保存成csv格式。
data<-read.csv(“your file path”, header = T) #注釋:header=T表示數據中的第一行是列名,如果沒有列名就用header=F
library(ggplot2) #注釋:package使用之前需要調用
p<-ggplot(data, aes(x=data$銷量)) + geom_histogram(breaks=seq(0,10000,1000))+ xlim(0,10000) p
感謝各位的閱讀!關于“R語言histogram怎么用”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。