您好,登錄后才能下訂單哦!
本篇文章為大家展示了如何理解基因組數據分析軟件SpeedSeq,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。
SpeedSeq是一款開源的基因組數據變異分析軟件,主要功能如下
alignments, 序列比對
variant detection, 變異檢測
functional annotation, 突變位點的功能注釋
該軟件最大的特點就是快速,對于50X的人類全基因組數據, 原始的fastq到vcf文件只需要13小時左右,對應的文章發表在nature methods上,鏈接如下
http://ucgd.genetics.utah.edu/wp-content/uploads/2015/08/nmeth.3505.pdf
該軟件是一個完整的pipeline, 集成了多款軟件,可以用于檢測以下多種基因組變異
germline and somatic mutations, 通過freebayes軟件來檢測突變微位點
structural variants,通過lumpy-sv軟件來檢測結構變異
其流程圖示意如下
源代碼保存在github上,鏈接如下
https://github.com/hall-lab/speedseq
該軟件按照功能,拆分成了以下5個子模塊
該模塊將雙端測序的fastq數據比對到參考基因組上,然后進行markduplicate, sort, index等步驟, 和GATK流程中的數據預處理步驟一致,用法如下
speedseq align \
-R "@RG\tID:sample1\tSM:sample1\tLB:sample1" \
-t 10 \
-o sample1 \
hg19.fa \
sample1_R1.fastq.gz \
sample1_R2.fastq.gz
使用bwa軟件比對參考基因組,然后使用samblaster進行markduplicate, sambamba軟件進行bam文件的sort。
該模塊用于檢測生殖變異,輸入為align模塊產生的bam文件,用法如下
speedseq var \
-t 10 \
hg19.fa \
sample1.bam
使用freebayes軟件來檢測生殖變異,輸出文件為VCF文件。
該模塊用于檢測體細胞突變,輸入為align模塊產生的bam文件,用法如下
speedseq somatic \
-t 10 \
-o tumor \
hg19.fa \
normal.bam\
tumor.bam
使用freebayes軟件來檢測體細胞突變,需要配對的腫瘤和正常樣本,輸出文件為VCF文件。
該模塊用于檢測結構變異,用法如下
speedseq sv \
-o sample \
-B sample.bam \
-D sample.discordants.bam \
-S sample.splitters.bam \
-R hg19.fa \
-o sample \
-t 10
使用lumpy-sv軟件來檢測結構變異,輸出文件為VCF文件。
該模塊從bam文件中提取雙端的fastq序列,再進行和align模塊相同的處理,用法如下
speedseq realign \
-t 10 \
-o sample \
hg19.fa \
sample.ba
要求bam文件必須包含read group信息,輸出文件和align模塊相同。對于全基因組數據的分析,使用speedseq可以大大加快處理速度。
上述內容就是如何理解基因組數據分析軟件SpeedSeq,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。