您好,登錄后才能下訂單哦!
這篇文章給大家介紹如何理解Rfam數據庫,內容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。
Rfam是一個RNA分類信息的數據庫,根據多序列比對結果,二級結構的一致性,協方差模型對各種RNA及順式作用元件進行了分類整理,網址如下
http://rfam.xfam.org/
最新版本為14.0, 在Rfam數據庫中,包括以下3大功能類型的分子
ncRNA genes
cis-regulatory elements
self-splicing RNAs
進一步對其進行更為細致的劃分,詳細列表如下所示
在對這些數據進行分類時,提供了兩個層次的分類,family
和clan
。對于family
而言,其成員是上述各種類型的RNA;對于clan
而言,其成員是各個family
。
通過官網的Browser
功能,可以方便的瀏覽數據庫中的內容
每個clan
采用CL
開頭的編號唯一識別,示意如下
以上圖中的CL00051
為例,包含了11個family
, 詳細信息如下
每個family
采用RF
開頭的編號唯一識別,示意如下
以上圖中的RF00005
為例,該家族的名字為tRNA
, 對應類型為Gene; tRNA
, 該家族包含來自9934個物種的RNA分子,其中有三維結構信息的有536個。
對于多序列比對的信息,同時提供了seed
和full
兩種,其中seed
是手工整理的已知的該家族成員的多序列比對結果,而full
是該家族所有成員序列的多序列比對結果。
示意如下
以human
為例,可以看到對應的序列數和family個數
每條序列以CM
開頭的編號唯一識別,示意如下
CM000683.2
對應的序列詳情如下
通過FTP功能,可以下載該數據庫中的內容,FTP鏈接如下
ftp://ftp.ebi.ac.uk/pub/databases/Rfam
數據庫中不僅提供了fasta
格式的序列信息,也提供了CM
模型,通過infernal
軟件可以利用這些模型對RNA序列進行判斷,從而分析RNA序列對應的family信息。
關于如何理解Rfam數據庫就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。