中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么使用ballgown進行轉錄本水平的差異分析

發布時間:2021-11-10 16:58:47 來源:億速云 閱讀:299 作者:柒染 欄目:大數據

這期內容當中小編將會給大家帶來有關怎么使用ballgown進行轉錄本水平的差異分析,文章內容豐富且以專業的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

常見的轉錄組差異分析有兩種策略,一種是基于raw count的定量方式,比如DESeq2, edgeR等;另外一種是基于FPKM/RPKM的定量方式,比如cuffdiff等。

在之前的文章中,我們也提到過基于FPKM值的pipeline由tophat+cufflinks+cuffdiff 升級更新為hisat + stringTie + ballgown。ballgown這個R包也是針對FPKM值的表達量進行差異分析,有兩種方式可以得到轉錄本水平的FPKM值。

1. stringTie

為了方便下游的ballgown分析,在stringTie軟件中直接添加-b參數就可以生成ballgown的輸入文件,基本用法如下

stringtie -p 10 \
-G hg19.gtf \
-o output.gtf  \
-b ballgown_out_dir -e \
align.sorted.bam
2. tablemaker

tablemaker軟件通過調用cufflinks軟件,也可以生成ballgown的輸入文件,該軟件可以從以下鏈接下載

https://figshare.com/articles/Tablemaker_Linux_Binary/1053137

基本用法如下

tablemaker \
-p 4 \
-q -W \
-G hg19.gtf \
-o out_dir \
align.sorted.bam

對于每個樣本,都會生成一個文件夾,包含如下5個文件

e_data.ctab
e2t.ctab
i2t.ctab
i_data.ctab
t_data.ctab

e代表exon, i代表intron, t代表transcript_data的文件為不同水平的表達量值。i2t表示intron和transcript之間的對應關系,e2t表示exon和transcript的對應關系。

輸入文件準備好之后,就可以進行差異分析了。現在的R包都是高度封裝的,幾個函數就可以完成整套分析了。首先是讀取所有樣本的輸入文件,代碼如下

library(ballgown)
bg = ballgown(
  samples = c("sampleA.dir", "sampleB.dir"),
  meas='all')

samples 指定所有樣本的ballgown的輸入文件夾。導入成功之后,可以通過*expr函數在R中查看樣本在不同水平的表達量信息, *的取值范圍為i, e, tg,代表不同水平。

查看轉錄本水平的表達量的代碼示例如下

transcript_fpkm = texpr(bg, 'FPKM')

需要注意的是,intron, exon, transcript 這些水平的表達量信息在原本的ctab文件中都有,而gene水平的表達量信息,需要根據基因對應的轉錄本的表達量來計算,所以比較費時。

讀取之后,需要設置樣本分組, 代碼如下

pData(bg) <- data.frame(
  id=sampleNames(bg),
  group=rep(c(1,0), each=3)
)

其實就是一個數據框,第一列為樣本名稱,第二列為樣本對應的分組。

ballgown會自動根據group的種類進行不同類型的差異分析,如果樣本分為兩組,則進行兩組間的差異分析,如果樣本為多組,則進行多組間的差異分析。

ballgown通過stattest函數進行差異分析,支持以下4種水平的差異分析

  1. exon

  2. intron

  3. gene

  4. transcript


通過feature參數指定差異分析的水平。常規用法如下

# 轉錄本水平的差異分析
stat_results = stattest(bg,
  feature='transcript',
  meas='FPKM',
  covariate='group')

# 基因水平的差異分析
stat_results = stattest(bg,
  feature='gene',
  meas='FPKM',
  covariate='group')

ballgown還支持時間序列的差異分析,用法如下

pData(bg) <- data.frame(
  pData(bg),
  time=rep(1:10, 2)
)

results <- stattest(bg,
  feature='transcript',
  meas='FPKM',
  covariate='time',
  timecourse=TRUE
)

只需要添加timecourse=TRUE即可。ballgown還支持自定義差異分析的模型。

上述就是小編為大家分享的怎么使用ballgown進行轉錄本水平的差異分析了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

苏尼特左旗| 文水县| 合水县| 洛川县| 大埔区| 汝阳县| 裕民县| 商水县| 海盐县| 康定县| 黔西| 锡林郭勒盟| 福泉市| 蓝田县| 鄂伦春自治旗| 六盘水市| 海城市| 渝北区| 苏尼特左旗| 镇巴县| 年辖:市辖区| 博罗县| 山东省| 巧家县| 竹溪县| 扎兰屯市| 岫岩| 从化市| 汉源县| 金门县| 平定县| 阿坝县| 正定县| 日土县| 长兴县| 贵德县| 高唐县| 攀枝花市| 伊金霍洛旗| 大足县| 通江县|