中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

bwa軟件用法是怎樣的

發布時間:2021-11-23 09:19:05 來源:億速云 閱讀:154 作者:柒染 欄目:大數據

bwa軟件用法是怎樣的,相信很多沒有經驗的人對此束手無策,為此本文總結了問題出現的原因和解決方法,通過這篇文章希望你能解決這個問題。

bwa 是一款將序列比對到參考基因組上的軟件,包含了以下3種算法

  1. BWA-backtrack

  2. BWA-SW

  3. BWA-MEM


BWA-backtrack適合比對長度不超過100bp的序列;BWA-SWBWA-MEM適合于長度為70-1M bp的序列;其中BWA-MEM是最新開發的算法,對于高質量的測序數據,其比對的速度更快,精確度更高,對于70-100bp的reads, BWA-MEM算法在比對長度為70-100bp的序列時,效果比BWA-backtrack 算法的效果更好。總而言之,通常情況下,選擇BWA-MEM算法就好。

bwa 的源代碼存儲在github上,

安裝過程如下:

git clone https://github.com/lh4/bwa.git
cd bwa
make

安裝好之后,會出現一個名為bwa的可執行文件,輸入下面命令可以查看幫助信息

./bwa

Program: bwa (alignment via Burrows-Wheeler transformation)
Version: 0.7.17-r1188
Contact: Heng Li <<a href="mailto:lh4@sanger.ac.uk" _href="mailto:lh4@sanger.ac.uk">lh4@sanger.ac.uk</a>>
Usage:   bwa <command> [options]
Command: index         index sequences in the FASTA format
         mem           BWA-MEM algorithm
         fastmap       identify super-maximal exact matches
         pemerge       merge overlapping paired ends (EXPERIMENTAL)
         aln           gapped/ungapped alignment
         samse         generate alignment (single ended)
         sampe         generate alignment (paired ended)
         bwasw         BWA-SW for long queries
         shm           manage indices in shared memory
         fa2pac        convert FASTA to PAC format
         pac2bwt       generate BWT from PAC
         pac2bwtgen    alternative algorithm for generating BWT
         bwtupdate     update .bwt to the new format
         bwt2sa        generate SA from BWT and Occ
Note: To use BWA, you need to first index the genome with `bwa index'.
      There are three alignment algorithms in BWA: `mem', `bwasw', and
      `aln/samse/sampe'. If you are not sure which to use, try `bwa mem'
      first. Please `man ./bwa.1' for the manual.

可以看到由很多的子命令構成。

bwa軟件的作用是將序列比對到參考基因組上,在比對之前,首先需要對參考基因組建立索引,命令如下:

bwa  index in.fasta

索引建立好之后,會生成5個文件,后綴分別為

  • bwt

  • pac

  • ann

  • amb

  • sa


下面是對小鼠基因組構建索引的示例

bwa index mm10.fasta
├── mm10.fasta
├── mm10.fasta.amb
├── mm10.fasta.ann
├── mm10.fasta.bwt
├── mm10.fasta.pac
└── mm10.fastq.sa

建立好參考基因組之后,就可以進行比對了。不同的比對算法,命令不同。

1. BWA-backtrack 算法

對應的子命令為aln/samse/sample
單端數據用法如下:

bwa aln ref.fa reads.fq > aln_sa.sai
bwa samse ref.fa aln_sa.sai reads.fq > aln-se.sam

雙端數據用法如下:

bwa aln ref.fa read1.fq > aln1_sa.sai
bwa aln ref.fa read2.fq > aln2_sa.sai
bwa sampe ref.fa aln_sa1.sai aln_sa2.sai read1.fq read2.fq > aln-pe.sam

2. BWA-SW 算法

對應的子命令為bwasw, 基本用法如下

bwa bwasw ref.fa reads.fq > aln-se.sam
bwa bwasw ref.fa read1.fq read2.fq > aln-pe.sam

3. BWA-MEM` 算法

對應的子命令為mem, 基本用法如下

bwa mem ref.fa reads.fq > aln-se.sam
bwa mem ref.fa read1.fq read2.fq > aln-pe.sam

對于超長讀長的reads,比如PacBio和Nanopore測序儀產生的reads, 用法如下

bwa mem -x pacbio ref.fa reads.fq > aln.sam
bwa mem -x ont2d ref.fa reads.fq > aln.sam

上述的代碼中, ref.fa指的是參考基因組索引的名字,對于上面提供的小鼠的例子而言,參考基因組索引的名字為mm10.fasta, 注意是不包含后綴的。

默認用法都非常簡單,有時還需要對參數進行調整,以mem子命令為例,常用的參數包括以下幾個:

-t指定線程數,默認為1,增加線程數,會減少運行時間;-p 忽略第二個輸入序列,默認情況下,輸入一個序列文件認為是單端測序,輸入兩個序列文件則是雙端測序,加上這個參數后,會忽略第二個輸入序列文件,把第一個文件當做單端測序的數據進行比對;-Y參數對數據進行soft clipping, 當錯配或者gap數過多比對不上時,會對序列進行切除,這里的切除并只是在比對時去掉這部分序列,最終輸出結果中序列還是存在的,所以稱為soft clipping

看完上述內容,你們掌握bwa軟件用法是怎樣的的方法了嗎?如果還想學到更多技能或想了解更多相關內容,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

呼和浩特市| 吉林省| 宁陕县| 饶阳县| 瑞昌市| 木里| 哈密市| 铁力市| 海晏县| 霍山县| 华蓥市| 英吉沙县| 阳西县| 高淳县| 鄂尔多斯市| 达拉特旗| 石城县| 丹巴县| 绥化市| 九寨沟县| 兰考县| 隆昌县| 东方市| 琼海市| 岳阳县| 陇西县| 兰西县| 江阴市| 泌阳县| 陆河县| 北碚区| 遵义县| 连城县| 吕梁市| 铜陵市| 泗洪县| 竹北市| 离岛区| 湘潭市| 中牟县| 墨竹工卡县|