中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

COG數據庫有什么用

發布時間:2022-01-17 09:40:53 來源:億速云 閱讀:502 作者:小新 欄目:大數據

這篇文章給大家分享的是有關COG數據庫有什么用的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。

為了研究不同物種間保守的蛋白功能,進一步揭示其進化關系,1997年的時候科學家選取了七個完整基因組的蛋白序列,根據序列和功能相似性,將這些蛋白進行了分類。這個分類叫做cluster of orthologous group,簡稱COG。每個COG是一組同源蛋白的集合,具有相同的生物學功能。 官網如下

https://www.ncbi.nlm.nih.gov/COG/

構建原始的COG使用的蛋白序列來自以下7個物種

  1. E.coli

  2. H.influenzae

  3. M. genitalium

  4. M. pneumoniae

  5. Synechocystis sp.

  6. M. jannaschii

  7. S. cerevisiae


可以發現,這些物種都是細菌。所以COG這個概念指的是細菌中的同源蛋白。

隨著測序技術的發展,越來越多的物種擁有了完整的基因組序列。2003年的時候,又根據66個細菌物種的蛋白序列,對之前的COG結果進行了補充和拓展。

同時將orthologous group 的概念推廣到了真核生物中,根據7個真核生物的蛋白序列構建了真核生物中的同源蛋白簇, 全稱為eukaryotic orthologous groups, 簡稱KOG。

之后又陸續在不同類型的物種中建立起相關的同源蛋白簇。古菌中的同源蛋白簇簡稱為arCOG, 噬菌體中的同源蛋白簇簡稱為POG,感染真核生物的病毒中的同源蛋白簇簡稱為NCVOG,巨型病毒的同源蛋白簇簡稱為mimiCOG。

在官網上,提供了下載功能。這里以COG為例進行說明。FTP地址如下

ftp://ftp.ncbi.nih.gov/pub/COG/COG2014/data

fun2003-2014.tab 保存了COG的分類信息,將所有的COG的功能分為了以下26個類別,每個類別用一個字母表示

# Code    Name
J    Translation, ribosomal structure and biogenesis
A    RNA processing and modification
K    Transcription
L    Replication, recombination and repair
B    Chromatin structure and dynamics
D    Cell cycle control, cell division, chromosome partitioning
Y    Nuclear structure
V    Defense mechanisms
T    Signal transduction mechanisms
M    Cell wall/membrane/envelope biogenesis
N    Cell motility
Z    Cytoskeleton
W    Extracellular structures
U    Intracellular trafficking, secretion, and vesicular transport
O    Posttranslational modification, protein turnover, chaperones
X    Mobilome: prophages, transposons
C    Energy production and conversion
G    Carbohydrate transport and metabolism
E    Amino acid transport and metabolism
F    Nucleotide transport and metabolism
H    Coenzyme transport and metabolism
I    Lipid transport and metabolism
P    Inorganic ion transport and metabolism
Q    Secondary metabolites biosynthesis, transport and catabolism
R    General function prediction only
S    Function unknown

cognames2003-2014.tab 文件保存了COG的詳細信息,包括編號,對應的分類,功能描述等信息。示例如下

# COG    func    name
COG0001    H    Glutamate-1-semialdehyde aminotransferase
COG0002    E    N-acetyl-gamma-glutamylphosphate reductase
COG0003    P    Anion-transporting ATPase, ArsA/GET3 family
COG0004    P    Ammonia channel protein AmtB

cog2003-2014.csv 文件保存了蛋白和COG的對應關系,示例如下

333894695,Alteromonas_SN2_uid67349,333894695,427,1,427,COG0001,0,

第一列編號為蛋白質的GI號。

prot2003-2014.fa.gz 保存了fasta格式的蛋白序列,示例如下

>gi|118430838|ref|NP_146899.2| putative mercury ion binding protein[Aeropyrum pernix K1]
MIIFKRHSQAILFSHNKQEKALLGIEGMHCEGCAIAIETALKNVKGIIDTKVNYSRGSAI
VTFDDTLVSINDILEHYIFKVPSNYRAKLVSFIS

通過比對COG數據庫,可以確定蛋白質的功能。


感謝各位的閱讀!關于“COG數據庫有什么用”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

清涧县| 正定县| 石楼县| 炎陵县| 墨竹工卡县| 阜阳市| 新丰县| 垣曲县| 霍州市| 友谊县| 宜川县| 衢州市| 马公市| 衡东县| 邻水| 扶余县| 济阳县| 华池县| 唐山市| 信阳市| 盐边县| 清原| 中西区| 招远市| 三门峡市| 石门县| 凤山县| 信宜市| 潍坊市| 五原县| 定西市| 洛南县| 鹰潭市| 花莲县| 都匀市| 抚远县| 斗六市| 濮阳县| 秦皇岛市| 黄浦区| 大竹县|