您好,登錄后才能下訂單哦!
本篇內容介紹了“maftools有什么作用”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
maftools是一個R包,發布在bioconductor上,專門用于MAF文件中信息的可視化
首先讀取MAF文件,代碼如下
> library(maftools)
> maf <- "TCGA.LAML.somatic.maf.gz"
> laml = read.maf(maf = maf)
統計樣本水平,基因水平的不同突變類型的個數,代碼如下
# 樣本水平
> getSampleSummary(laml)
# 基因水平
> getGeneSummary(laml)
# 將summary結果輸出
> write.mafSummary(maf = laml, basename = 'laml')
通過以下代碼可以對summary的結果進行可視化
> plotmafSummary(maf = laml)
可視化結果示意如下
第一幅圖子圖是不同變異類型頻數分布柱狀圖,根據對蛋白編碼的影響劃分成了Missense_Mutation等7個類型;第二幅子圖是不同變異類別的頻數分布柱狀圖,分成了SNP, INS,DEl三種類別;第三幅子圖是SNV突變類型的頻數分布柱狀圖,考慮到突變之間的組合和正負鏈,分成了6種類別;第四幅子圖是每個樣本中不同變異類型堆積柱狀圖,對應圖一的7種類型;第五幅子圖是不同變異類型在每個樣本中分布的箱體圖,對應圖一中的7種類型,第六幅圖是突變頻率最高的top10個基因上的不同突變類型的堆積柱狀圖,對應圖一的7種類型。
oncoplot是腫瘤研究中常見的可視化方式,通過以下代碼可以實現
> oncoplot(maf = laml)
可視化結果示意如下
整張圖分成了3個部分,第一部分是中間的熱圖,每一行代表一個基因,每一列代表一個樣本,展示了每個樣本不同突變類型的分布,第二部分是右側的堆積柱狀圖,表示每個基因上不同突變類型位點的頻數分布,第三部分是上方的堆積柱狀圖,表示每個樣本中不同突變類型位點的頻數分布。
和oncoplot類似,只展示其中的熱圖部分,代碼如下
> oncostrip(maf = laml)
可視化結果示意如下
統計所有SNV中顛換和轉換的數量,并進行可視化,代碼如下
> laml.titv = titv(maf = laml, plot = FALSE, useSyn = TRUE)
> plotTiTv(res = laml.titv)
可視化結果示意如下
上方的圖為每種突變類型以及顛換,轉換的位點在所有樣本中分布的箱體圖,下方的圖為每個樣本中不同突變類型的百分比堆積柱狀圖。
lollipop plot用于展示突變對于蛋白質的影響,代碼如下
> lollipopPlot(maf = laml, gene = 'DNMT3A', AACol = 'Protein_Change', showMutationRate = TRUE)
可視化的結果如下
默認情況下,以最長轉錄本為參考,用圓點表示不同類型變異位點在轉錄本上的位置,用豎線的高度表示變異位點對應的頻率。
用于比較TCGA中不同腫瘤隊列間突變頻率的分布,代碼如下
> laml.mutload = tcgaCompare(maf = laml, cohortName = 'LAML')
可視化結果如下
橫坐標為腫瘤隊列,對應不同的腫瘤,縱坐標為該腫瘤隊列中每個樣本的體細胞突變個數,紅色的線代表中位數。
“maftools有什么作用”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。