您好,登錄后才能下訂單哦!
本篇內容主要講解“怎么用biopython將cds序列翻譯成蛋白序列”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“怎么用biopython將cds序列翻譯成蛋白序列”吧!
將cds序列翻譯成蛋白序列 , 由于不同的物種或者特殊的細胞器(線粒體等)的密碼子存在差異,我們不能隨便默認的進行翻譯,這里的biopython可以根據我們的需要使用不同的密碼子進行蛋白翻譯,密碼子見:
1.普通的密碼子翻譯,rna翻譯成蛋白質
>>> from Bio.Seq import Seq >>> from Bio.Alphabet import IUPAC >>> messenger_rna = Seq("AUGGCCAUUGUAAUGGGCCGCUGAAAGGGUGCCCGAUAG", IUPAC.unambiguous_rna) >>> messenger_rna Seq('AUGGCCAUUGUAAUGGGCCGCUGAAAGGGUGCCCGAUAG', IUPACUnambiguousRNA()) >>> messenger_rna.translate() Seq('MAIVMGR*KGAR*', HasStopCodon(IUPACProtein(), '*'))
2. cds序列翻譯成蛋白序列
>>> from Bio.Seq import Seq >>> from Bio.Alphabet import IUPAC >>> coding_dna = Seq("ATGGCCATTGTAATGGGCCGCTGAAAGGGTGCCCGATAG", IUPAC.unambiguous_dna) >>> coding_dna Seq('ATGGCCATTGTAATGGGCCGCTGAAAGGGTGCCCGATAG', IUPACUnambiguousDNA()) >>> coding_dna.translate() Seq('MAIVMGR*KGAR*', HasStopCodon(IUPACProtein(), '*'))
3.指定密碼子翻譯成蛋白序列
>>> coding_dna.translate(table="Vertebrate Mitochondrial") Seq('MAIVMGRWKGAR*', HasStopCodon(IUPACProtein(), '*'))
或者用序號
>>> coding_dna.translate(table=2) Seq('MAIVMGRWKGAR*', HasStopCodon(IUPACProtein(), '*'))
批量運行示例代碼:
from Bio.Seq import Seq from Bio import SeqIO from Bio.Alphabet import IUPAC from Bio.SeqRecord import SeqRecord import sys, os, argparse, os.path,re,math,time parser = argparse.ArgumentParser(description='This script is used to translate cds to pep') #parser.add_argument('-m','--map',help='Please input ref mapped id file',required=True) parser.add_argument('-f','--fasta',help='Please fasta file',required=True) parser.add_argument('-o','--out_dir',help='Please input complete out_put directory path',default = os.getcwd(),required=False) parser.add_argument('-t','--table',type=int,default=1,help=' genetic code :https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi, default table id 1',required=False) parser.add_argument('-n','--name',default ='pep',required=False,help='Please specify the output, pep') ################################################################################ args = parser.parse_args() dout='' if os.path.exists(args.out_dir): dout=os.path.abspath(args.out_dir) else: os.mkdir(args.out_dir) dout=os.path.abspath(args.out_dir) output_handle = open(dout+'/'+args.name+'.fa', "w") for rec in SeqIO.parse(args.fasta, "fasta"): rec.seq=rec.seq.translate(table=args.table) SeqIO.write(rec, output_handle, "fasta") output_handle.close()
到此,相信大家對“怎么用biopython將cds序列翻譯成蛋白序列”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。