您好,登錄后才能下訂單哦!
本篇文章為大家展示了如何進行R語言探索約基奇數據的分析,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。
掘金又贏了,硬生生把系列賽從3比1打成了3:3,于是大家都來調侃說
我 約基奇(約G7)的名號可不是白叫的!哈哈哈哈
那作為一個喜歡籃球的R語言初學者,當然不能只看比賽了,還要把約基奇的常規數據探索學起來!
數據來源
https://www.statmuse.com/nba/player/nikola-jokic-9226/career-stats
library(xml2)
library(rvest)
library(reshape2)
library(ggplot2)
library(dplyr)
打開數據來源的鏈接,鼠標點擊右鍵檢查,將內容復制到文本文件中,我這里命名為new1.txt
page<-read_html("new1.txt")
Jokic<-html_table(page,fill=T)
Jokic[[9]]
list(Jokic)
df1<-Jokic[[9]]
colnames(df1)
散點圖加折線圖
df1_1<-df1[1:5,]%>%
select(Season,GS,MIN,FGA,"FG%")
df1_1
df1_1<-melt(df1_1)
head(df1_1)
ggplot(df1_1,aes(x=Season,y=value,color=variable))+
geom_point(size=5)+
geom_line(aes(group=1))+
facet_wrap(~variable,scales = "free")+
theme_bw()+
theme(legend.position = "none")+
labs(x="",y="")
從上圖我們可以看到約基奇的命中率在17-18賽季最低,最近兩個賽季在穩步上升,出手次數在19-20賽季略有下降,但出手次數整體是上升趨勢,側面反映約基奇從一個二輪秀到逐漸成為掘金隊進攻核心的過程。場均出場時間17-18賽季達到最大值,恰好也是命中率最低的一個賽季,那我們可以合理猜測一下,要想最大效率的發揮約基奇的作用,應該合理安排他的出場時間。畢竟這桶行走的百歲山體力問題可能是一個較大的困擾。
df1_2<-df1[1:5,]%>%
select(Season,PTS,REB,AST,TOV,BLK)
df1_2<-melt(df1_2)
ggplot(df1_2,aes(x=Season,y=value,color=variable))+
geom_point(size=5)+
geom_line(aes(group=1))+
facet_wrap(~variable,scales = "free",ncol=3,nrow=2)+
theme_bw()+
theme(legend.position = "none",
axis.text.x = element_text(angle=60,vjust=0.5))+
labs(x="",y="")
從上圖我們可以看到約基奇的得分、籃板、助攻數據在18-19賽季達到最大值,19-20賽季略呈下降趨勢。可能的原因有很多,這里我猜可能是休賽季參加世界杯沒有得到充足的休息導致的。
數據來源是 https://www.basketball-reference.com/players/j/jokicni01/gamelog-playoffs/
df2<-read.csv("new2.txt",header=F,
stringsAsFactors = F)
df2_1<-df2%>%
select(V3,V9,V11,V13,V14,V24,V29)
colnames(df2_1)<-c("Game","w_or_l","MIN","FGA","FG%","AST","PTS")
head(df2_1)
df2_1$w_or_l<-stringr::str_sub(df2_1$w_or_l,1,1)
df2_1$MIN<-stringr::str_sub(df2_1$MIN,1,2)
df2_1$MIN<-as.numeric(df2_1$MIN)
head(df2_1)
df2_1<-melt(df2_1,ids=c("Game",'w_or_l'))
head(df2_1)
ggplot(df2_1,aes(x=Game,y=value,color=w_or_l))+
geom_point(size=5)+
geom_line(aes(group=1))+
facet_grid(variable~.,scales = "free")+
theme_bw()+
theme(
legend.title = element_blank(),
axis.text.x = element_text(angle=60,vjust=0.5))+
labs(x="",y="")
比賽的勝負是諸多因素共同作用的結果,單純從得分、及助攻等數據很難看出對比賽勝負的影響,除非你的隊中有一位叫做波普的運動員。
list(Jokic)
df3<-Jokic[[7]]
df3
colnames(df3)[1]<-"Game"
colnames(df3)
df3_1<-df3[1:2,]%>%
select(Game,MPG,PPG,RPG,APG,BPG,TPG,"FG%","3P%","FT%")
df3_2<-melt(df3_1)
df3_2
df3_2$Game<-stringr::str_replace(df3_2$Game,"2019-20 ","")
ggplot(df3_2,aes(x=Game,y=value,fill=Game))+
geom_bar(stat="identity",width=0.5)+
facet_wrap(~variable,scales = "free")+
theme_minimal()+labs(x="",y="")+
theme(legend.position = "top",
legend.title = element_blank())
從上圖可以看到 場均上場時間(MPG),場均得分(PPG)、場均蓋帽(BPG)、三分命中率(3P%)季后賽的表現均高于常規賽。場均助攻數(APG)略少于常規賽,場均失誤(TPG)也略多于常規賽。
上述內容就是如何進行R語言探索約基奇數據的分析,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。