您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關pacbio如何使用Iso-Seq 3進行數據分析的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
pacbio 三代全長轉錄組數據分析流程 Iso-Seq 3
Iso-Seq的建庫方案有如下三類:
整個庫都是一個樣品的全長轉錄組,不需要加barcode區分樣品
不同樣品的全長轉錄組,加上不同barcode ,可以放在一起進行建庫測序
一些靶向獲得的部分基因也可以進行全長轉錄組的測序
Iso-Seq3 進行全長轉錄組的分析
1 ccs(Circular Consensus Calling)
ccs 獲取一致性的序列,要求每一條測序的reads至少有一端含有引物序列。
ccs test.subreads.bam ccs.bam --noPolish --minPasses 1
2 測序引物和barcode的去除
這一步是采用lima 來完成的,這個軟件也是官方最新開發出來的程序,速度和準確度都較以往的算法有了很大的提升。還能夠基于barcode序列區分不同的樣品,
lima ccs.bam barcoded_primers.fasta demux.ccs.bam --isoseq --no-pbi
3 聚類(cluster)
聚類采用IsoSeq3 軟件來完成,這一步會首先將ployA尾巴去除掉,并將連環結構去除掉,再對相似的序列進行聚類,最好形成全長的reads。
isoseq3 cluster demux.primer_5p--primer_3p.bam unpolished.bam --verbose
4 拋光(polish)
這一步主要是將聚類的轉錄本,合并成一個完整的一致性序列。
isoseq3 polish -j 16 unpolished.bam test.subreads.bam polished.bam
感謝各位的閱讀!關于“pacbio如何使用Iso-Seq 3進行數據分析”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。