您好,登錄后才能下訂單哦!
Hi-C數據處理分析的利器Juicer是怎樣的,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。
通過Hi-C數據可以分析TAD,chromatin loops等染色質空間結構的基本單元,加強我們對染色質三維結構的認知。面對海量的Hi-C數據,如何高效完成數據分析成為了一個挑戰。
目前針對Hi-C數據的分析也有很多的軟件可以用,而juicer無疑是使用的最廣泛的軟件之一。該軟件的源代碼托管在github上,
如下圖所示,和其名字一樣,juicer就像是一款榨汁機,輸入Hi-C產生的原始fastq數據,經過層層加工,直到產生有效的數據分析結果。在整個數據分析過程中,使用者不需要高深的編程技巧,只需要一些基本的操作規范,人人都可以使用該軟件來分析Hi-C數據。
juicer作為一款強大的分析軟件,有以下幾個特點
可以分析處理TB級別的海量數據,可以有效利用FPGA, GPU,集群等硬件資源來加速處理速度
提供了數據預處理,交互圖譜創建和可視化,TAD和染色質環結構預測等一些列完整的pipeline
簡單易用,不需要復雜的背景知識
該軟件按照功能拆分成了三個大的分析步驟,依次運行即可得到最終的分析結果
數據預處理,將原始的fastq序列比對參考基因組,識別其中的valid pairs, 并生成一個后綴為hic的文件
讀取hic文件,創建可視化的交互圖譜,也稱之為contact map, 并進行歸一化
采用算法預測TAD和染色質環等結構
完整功能示意如下
juicer采用ArrowHead算法對原始的交互矩陣進行轉化,并預測TAD拓撲關聯結構域,采用HiCUUPS算法識別染色質環chromatin loops。和其他Hi-C數據處理軟件相比,juicer的功能更為齊全
juicer獨創了一種名為hic
的文件格式,用來存儲Hi-C數據的相關信息,這種格式是一種高度壓縮的二進制文件格式,在以下鏈接可以查看這種格式的詳細信息
https://github.com/theaidenlab/juicebox/blob/master/HiC_format_v8.docx
在后續的文章中,會詳細介紹該軟件的用法。
關于Hi-C數據處理分析的利器Juicer是怎樣的問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。