您好,登錄后才能下訂單哦!
本篇文章給大家分享的是有關怎么使用ROSE鑒定超級增強子,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
ROSE是最經典的超級增強子預測軟件,由Richard A. Young大牛團隊開發,源代碼的網址如下
http://younglab.wi.mit.edu/super_enhancer_code.html
首先通過Oct4, Sox2, Nanog這3種轉錄因子的chip數據去識別小鼠胚胎干細胞中的增強子區域,鑒定到了8794個增強子區域。對于這些增強子,根據區域內對應的Med1這種轉錄激活通用輔助因子的chip_seq reads的密度進行排序,發現呈現兩極分化趨勢,示意如下
其中絕大部分的增強子對應的Med1的水平都很低,少部分增強子對應的Med1的水平非常高。除了Med1之外,還比較了其他幾種轉錄因子或者組蛋白修飾的數據
發現Med1的區分效果最佳,根據Med1水平的高低,可以將增強子分為以下兩類
typical enhancers
super enhancers
簡稱TE和SE, 進一步分析發現TE和SE在長度上具有非常明顯的區別,SE的長度是TE長度的10倍以上,一個普通的增強子只有幾百bp的長度,而超級增強子的長度在幾千bp左右。
除了Med1之外,還比較了Qct4等多種轉錄因子在TE和SE中的分布,結果如下圖所示
發現在SE中Klf4和Esrrb的分布比TE中更加豐富。對SE區域富集的motif進行分析,結果如下所示
發現富集到了Oct4, Sox2, Klf4等motif。從上述發現和定義超級增強子的過程可以看到,超級增強子的預測過程有以下兩個關鍵點
建立在增強子的基礎上,可以看做增強子富集的區域
相比增強子,超級增強子區域具有更高的轉錄因子的密度
ROSE這款程序也是根據這兩個關鍵點來識別超級增強子,基本過程示意如下
首先識別增強子區域,然后對增強子進行合并,定義一個閾值,將距離小于該閾值的增強子進行合并,最后比較合并后的增強子區域內的reads分布情況來識別超級增強子。
在實際操作過程中,在第一步和第三步可以使用不同的mark, 如下所示
軟件基于python編程語言開發,直接從官網下載源代碼,解壓縮就可以了。源代碼中內置了幾個物種的注釋數據庫,存放在annotation
文件夾下
annotation/
├── hg18_refseq.ucsc
├── hg19_refseq.ucsc
├── hg38_refseq.ucsc
├── mm10_refseq.ucsc
├── mm8_refseq.ucsc
└── mm9_refseq.ucsc
其實就是從UCSC下載的對應的refGene.txt
文件,該軟件的基本用法如下
python ROSE_main.py \
-g HG18 \
-i HG18_MM1S_MED1.gff \
-r MM1S_MED1.hg18.bwt.sorted.bam \
-c MM1S_WCE.hg18.bwt.sorted.bam \
-o out_dir \
-s 12500 \
-t 2500
需要注意一定要到軟件的安裝目錄去運行,因為會在運行目錄查找annotaton
這個文件夾下的物種注釋文件。
-g
指定參考基因組版本,用于檢索對應的物種注釋文件;-i
指定增強子區域對應的基因組位置,內容如下
\t
分隔的6列,第一列,第三列和第四列指定增強子區域對應的染色體位置,第五列指定正負鏈信息,.
代表不確定,第二列和第六列是一個自定義的唯一的ID, 用來表示增強子的編號。
確定了增強子區間信息之后,接下來就是比較增強子區域內某種mark因子的chip_seq reads的分布情況,-r
參數指定chip_seq中IP樣本的bam文件,-c
指定Input樣本的bam文件。
-s
指定合并增強子的距離,默認為12.5kb, 小于該距離的兩個增強子會合并為一個區間,-t
指定距離TSS的距離,如果一個peak與某個轉錄起始位點的距離小于指定的距離,則有可能是一個啟動子,這種潛在的啟動子會被過濾掉。
在輸出結果的目錄會生成很多文件,png文件內容示意如下
AllEnhancers.table.txt
和SuperEnhancers.table.txt
分別表示所有增強子和超級增強子的信息,文件內容類似,示意如下
dbSUPER和SEdb這兩個超級增強子數據庫都是使用h4K27ac組蛋白修飾作為mark來識別超級增強子,可以借鑒這個思路來識別超級增強子。
以上就是怎么使用ROSE鑒定超級增強子,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。