您好,登錄后才能下訂單哦!
本篇內容介紹了“怎么利用samtools截取指定位置的序列”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
samtools faidx 能夠對fasta 序列建立一個后綴為.fai 的文件,根據這個.fai 文件和原始的fastsa文件, 能夠快速的提取任意區域的序列
用法:
samtools faidx input.fa
該命令對輸入的fasta序列有一定要求:對于每條序列,除了最后一行外, 其他行的長度必須相同,
>one ATGCATGCATGCATGCATGCATGCATGCAT GCATGCATGCATGCATGCATGCATGCATGC ATGCAT >two another chromosome ATGCATGCATGCAT GCATGCATGCATGC
最后生成的.fai文件如下, 共5列,\t分隔;
one 66 5 30 31 two 28 98 14 15
第一列 NAME : 序列的名稱,只保留“>”后,第一個空白之前的內容;
第二列 LENGTH: 序列的長度, 單位為bp;
第三列 OFFSET : 第一個堿基的偏移量, 從0開始計數,換行符也統計進行;
第四列 LINEBASES : 除了最后一行外, 其他代表序列的行的堿基數, 單位為bp;
第五列 LINEWIDTH : 行寬, 除了最后一行外, 其他代表序列的行的長度, 包括換行符, 在windows系統中換行符為\r\n, 要在序列長度的基礎上加2;
提取序列:
samtools faidx input.fa chr1 > chr1.fa samtools faidx input.fa chr1:100-200 > chr1.fa
“怎么利用samtools截取指定位置的序列”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。