您好,登錄后才能下訂單哦!
這篇文章主要介紹了AWK怎么提取所有基因位置信息的相關知識,內容詳細易懂,操作簡單快捷,具有一定借鑒價值,相信大家閱讀完這篇AWK怎么提取所有基因位置信息文章都會有所收獲,下面我們一起來看看吧。
從基因組注釋信息GFF文件中提取所有基因位置信息
gff文件當中存儲了基因組當中所有基因的注釋信息,如果想得到基因組當中所有基因的位置信息可以利用awk命令批量的提取,命令如下:
$ grep -v '#' Arabidopsis_thaliana.TAIR10.41.gff3|awk -F "[\t=:;]" 'BEGIN{OFS="\t"}$3=="gene"{print $1,$4,$5,$10}' |head 1 3631 5899 AT1G01010 1 6788 9130 AT1G01020 1 11649 13714 AT1G01030 1 23121 31227 AT1G01040 1 31170 33171 AT1G01050 1 33365 37871 AT1G01060 1 38444 41017 AT1G01070 1 44970 47059 AT1G01080 1 47234 49304 AT1G01090 1 49909 51210 AT1G01100
關于“AWK怎么提取所有基因位置信息”這篇文章的內容就介紹到這里,感謝各位的閱讀!相信大家對“AWK怎么提取所有基因位置信息”知識都有一定的了解,大家如果還想學習更多知識,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。