中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么使用ROSE鑒定超級增強子

發布時間:2022-01-04 17:51:59 來源:億速云 閱讀:486 作者:柒染 欄目:大數據

本篇文章給大家分享的是有關怎么使用ROSE鑒定超級增強子,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

ROSE是最經典的超級增強子預測軟件,由Richard A. Young大牛團隊開發,源代碼的網址如下

http://younglab.wi.mit.edu/super_enhancer_code.html

首先通過Oct4, Sox2, Nanog這3種轉錄因子的chip數據去識別小鼠胚胎干細胞中的增強子區域,鑒定到了8794個增強子區域。對于這些增強子,根據區域內對應的Med1這種轉錄激活通用輔助因子的chip_seq reads的密度進行排序,發現呈現兩極分化趨勢,示意如下

怎么使用ROSE鑒定超級增強子

其中絕大部分的增強子對應的Med1的水平都很低,少部分增強子對應的Med1的水平非常高。除了Med1之外,還比較了其他幾種轉錄因子或者組蛋白修飾的數據

怎么使用ROSE鑒定超級增強子

發現Med1的區分效果最佳,根據Med1水平的高低,可以將增強子分為以下兩類

  1. typical enhancers

  2. super enhancers


簡稱TE和SE, 進一步分析發現TE和SE在長度上具有非常明顯的區別,SE的長度是TE長度的10倍以上,一個普通的增強子只有幾百bp的長度,而超級增強子的長度在幾千bp左右。

怎么使用ROSE鑒定超級增強子
怎么使用ROSE鑒定超級增強子

除了Med1之外,還比較了Qct4等多種轉錄因子在TE和SE中的分布,結果如下圖所示

怎么使用ROSE鑒定超級增強子

發現在SE中Klf4和Esrrb的分布比TE中更加豐富。對SE區域富集的motif進行分析,結果如下所示

怎么使用ROSE鑒定超級增強子

發現富集到了Oct4, Sox2, Klf4等motif。從上述發現和定義超級增強子的過程可以看到,超級增強子的預測過程有以下兩個關鍵點

  1. 建立在增強子的基礎上,可以看做增強子富集的區域

  2. 相比增強子,超級增強子區域具有更高的轉錄因子的密度


ROSE這款程序也是根據這兩個關鍵點來識別超級增強子,基本過程示意如下

怎么使用ROSE鑒定超級增強子

首先識別增強子區域,然后對增強子進行合并,定義一個閾值,將距離小于該閾值的增強子進行合并,最后比較合并后的增強子區域內的reads分布情況來識別超級增強子。

在實際操作過程中,在第一步和第三步可以使用不同的mark, 如下所示

怎么使用ROSE鑒定超級增強子

軟件基于python編程語言開發,直接從官網下載源代碼,解壓縮就可以了。源代碼中內置了幾個物種的注釋數據庫,存放在annotation文件夾下

annotation/
├── hg18_refseq.ucsc
├── hg19_refseq.ucsc
├── hg38_refseq.ucsc
├── mm10_refseq.ucsc
├── mm8_refseq.ucsc
└── mm9_refseq.ucsc

其實就是從UCSC下載的對應的refGene.txt文件,該軟件的基本用法如下

python ROSE_main.py \
-g HG18 \
-i HG18_MM1S_MED1.gff \
-r MM1S_MED1.hg18.bwt.sorted.bam \
-c MM1S_WCE.hg18.bwt.sorted.bam \
-o out_dir \
-s 12500 \
-t 2500

需要注意一定要到軟件的安裝目錄去運行,因為會在運行目錄查找annotaton這個文件夾下的物種注釋文件。

-g指定參考基因組版本,用于檢索對應的物種注釋文件;-i指定增強子區域對應的基因組位置,內容如下

怎么使用ROSE鑒定超級增強子

\t分隔的6列,第一列,第三列和第四列指定增強子區域對應的染色體位置,第五列指定正負鏈信息,.代表不確定,第二列和第六列是一個自定義的唯一的ID, 用來表示增強子的編號。

確定了增強子區間信息之后,接下來就是比較增強子區域內某種mark因子的chip_seq reads的分布情況,-r參數指定chip_seq中IP樣本的bam文件,-c指定Input樣本的bam文件。

-s指定合并增強子的距離,默認為12.5kb, 小于該距離的兩個增強子會合并為一個區間,-t指定距離TSS的距離,如果一個peak與某個轉錄起始位點的距離小于指定的距離,則有可能是一個啟動子,這種潛在的啟動子會被過濾掉。

在輸出結果的目錄會生成很多文件,png文件內容示意如下

怎么使用ROSE鑒定超級增強子

AllEnhancers.table.txtSuperEnhancers.table.txt分別表示所有增強子和超級增強子的信息,文件內容類似,示意如下

怎么使用ROSE鑒定超級增強子

dbSUPER和SEdb這兩個超級增強子數據庫都是使用h4K27ac組蛋白修飾作為mark來識別超級增強子,可以借鑒這個思路來識別超級增強子。


以上就是怎么使用ROSE鑒定超級增強子,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

田林县| 独山县| 富源县| 海丰县| 阳城县| 河东区| 阳西县| 邹城市| 开鲁县| 神农架林区| 海南省| 沧源| 定襄县| 萍乡市| 偏关县| 夏津县| 福海县| 宣武区| 望都县| 河曲县| 荥阳市| 崇阳县| 垫江县| 库车县| 邯郸县| 班戈县| 普陀区| 徐汇区| 突泉县| 类乌齐县| 梁平县| 林芝县| 岱山县| 安阳县| 宁河县| 涡阳县| 五河县| 陆丰市| 循化| 宜川县| 黑龙江省|