中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

perl對應的gff文件格式是什么

發布時間:2022-03-18 17:05:33 來源:億速云 閱讀:205 作者:iii 欄目:開發技術

本文小編為大家詳細介紹“perl對應的gff文件格式是什么”,內容詳細,步驟清晰,細節處理妥當,希望這篇“perl對應的gff文件格式是什么”文章能幫助大家解決疑惑,下面跟著小編的思路慢慢深入,一起來學習新知識吧。

對應的gff文件是下面的格式:

1     araport11   gene    3631    5899    .   +   .   ID=gene:AT1G01010;Name=NAC001;biotype=protein_coding
1    araport11   mRNA    3631    5899    .   +   .   ID=transcript:AT1G01010.1;Parent=gene:AT1G01010
1    araport11   five_prime_UTR  3631    3759    .   +   .   Parent=transcript:AT1G01010.1
1    araport11   exon    3631    3913    .   +   .   Parent=transcript:AT1G01010.1;Name=AT1G01010.1.exon1;constitutive=1
1    araport11   CDS 3760    3913    .   +   0   ID=CDS:AT1G01010.1;Parent=transcript:AT1G01010.1;protein_id=AT1G01010.1
1    araport11   exon    3996    4276    .   +   .   Parent=transcript:AT1G01010.1;Name=AT1G01010.1.exon2;constitutive=1
1    araport11   CDS 3996    4276    .   +   2   ID=CDS:AT1G01010.1;Parent=transcript:AT1G01010.1;protein_id=AT1G01010.1
1    araport11   exon    4486    4605    .   +   .   Parent=transcript:AT1G01010.1;Name=AT1G01010.1.exon3;constitutive=1
1    araport11   gene    6788    9130    .   -   .   ID=gene:AT1G01020;Name=ARV1;biotype=protein_coding
1    araport11   mRNA    6788    8737    .   -   .   ID=transcript:AT1G01020.6;Parent=gene:AT1G01020;biotype=protein_coding
1    araport11   exon    6788    7069    .   -   .   Parent=transcript:AT1G01020.6;Name=AT1G01020.2.exon8;constitutive=0
1    araport11   three_prime_UTR 6788    7069    .   -   .   Parent=transcript:AT1G01020.6
1    araport11   three_prime_UTR 7157    7314    .   -   .   Parent=transcript:AT1G01020.6
1    araport11   exon    7157    7450    .   -   .   Parent=transcript:AT1G01020.6;Name=AT1G01020.2.exon7;constitutive=0
1    araport11   CDS 7315    7450    .   -   1   ID=CDS:AT1G01020.6;Parent=transcript:AT1G01020.6;protein_id=AT1G01020.6
1    araport11   exon    7564    7649    .   -   .   Parent=transcript:AT1G01020.6;Name=AT1G01020.1.exon6;constitutive=1

腳本在遇到gff文件第三列為gene時,匹配gene_id,但是不同的平臺和軟件gene_id對應的前綴也不一樣,如上圖所示前綴是ID=gene:,所以腳本匹配時是:

            $a[8]=~ m/ID=gene:([^;]*);/;

如果你的gff文件第八列gene_id對應的前綴也不一樣,例如如下所示:

1    araport11   gene    11649   13714   .   -   .   ID=AT1G01030;Name=NGA3;biotype=protein_coding

你就需要修改一下腳本,將匹配內容改為如下所示:

$a[8]=~ m/ID=([^;]*);/;

這樣腳本才能正確匹配,提取信息。

讀到這里,這篇“perl對應的gff文件格式是什么”文章已經介紹完畢,想要掌握這篇文章的知識點還需要大家自己動手實踐使用過才能領會,如果想了解更多相關內容的文章,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

汪清县| 阳朔县| 韩城市| 沛县| 阳曲县| 松阳县| 白沙| 米易县| 获嘉县| 且末县| 遂川县| 昭苏县| 琼中| 来安县| 潮州市| 霍林郭勒市| 潞西市| 门源| 平湖市| 奉节县| 类乌齐县| 隆德县| 栾城县| 化隆| 徐州市| 阿尔山市| 张家港市| 正蓝旗| 宜良县| 金堂县| 滨州市| 山西省| 佛山市| 大连市| 汶川县| 福州市| 平凉市| 南靖县| 花垣县| 澎湖县| 凤台县|