中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

CNVnator的原理是什么

發布時間:2021-07-04 19:09:11 來源:億速云 閱讀:409 作者:Leah 欄目:大數據

這期內容當中小編將會給大家帶來有關CNVnator的原理是什么,文章內容豐富且以專業的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

1.比對參考基因組

要計算測序深度,首先需要將測序的reads比對到參考基因組上,比對是最關鍵的一個步驟就是如何比對到基因組多個區域的reads。當一條reads比對到基因組上的多個位置時,單從數據分析的角度,是完全無法區分其究竟屬于哪一個區域的,因為這些區域同源度非常的高。對于這樣的reads, 有兩種處理策略,第一種是直接剔除,保留unque-mapping的reads; 第二種是隨機選取其中的一個位置,作為該reads的真實比對位置,cnvnator算法采用的是第二種策略。

2. 構建RD signal

比對之后,就可以將基因組劃分為等長窗口,計算每個窗口內的測序深度了,這里需要注意的是, 利用gc含量在校正原始的測序深度。PCR對不同GC含量序列的擴增存在偏倚,所以在計算窗口內的RD signal, 需要校正這一系統誤差,cnvnator的校正公式如下

CNVnator的原理是什么

global表示所有bin窗口內原始RD signal的平均值,gc表示和當前bin的GC含量相同的所有bin窗口原始RD signal的平均值,將二者的比值作為一個系數,對原始的RD signal進行校正。

3. mean-shift 聚類

mean-shift是一種聚類算法,利用校正之后的RD signal值,對鄰近的bin進行聚類,理論上聚為一類的bin具有相同的cnv拷貝數,圖示如下

CNVnator的原理是什么

需要注意的是,這里只是對染色體位置接近的bin進行聚類,并不是等同于CNV分析中的segmentation。

4. segmentation

上述的聚類信號只有在染色體的局部具有意義,當放到大全基因組范圍來識別CNV時,必須通過segmentation算法來實現,cnvnator采用的是自己獨特的算法,有個關鍵的參數稱之為bandwidth, 不同的取值會影響到CNV區域的劃分,圖示如下

CNVnator的原理是什么

取值越大,小片段的CNV信號會被掩蓋,取值越小,數值越小,CNV檢測的假陽性率會高。

5. signal merging

根據與鄰近segment RD signal的差異, 將原始劃分的segment進行合并。

6. cnv calling

對劃分好的不同segment, 預測其對應的拷貝數。

在利用CNVnator軟件進行分析時,bin和bandwidth兩個參數的選擇對結果影響很大。通過該軟件可以檢測各種長度的cnv, 而且分型的準確率非常高,是一款值得推薦的cnv檢測軟件。


上述就是小編為大家分享的CNVnator的原理是什么了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

株洲县| 弥渡县| 涿州市| 嘉禾县| 静宁县| 潞西市| 怀化市| 金门县| 介休市| 尼勒克县| 富蕴县| 芜湖县| 客服| 临高县| 永丰县| 略阳县| 祁门县| 岑巩县| 友谊县| 绥宁县| 山阳县| 阿拉善右旗| 响水县| 天等县| 莫力| 东乡族自治县| 巫山县| 名山县| 荔波县| 稻城县| 牟定县| 遂溪县| 绥宁县| 临泉县| 濉溪县| 宁城县| 高邑县| 上思县| 青岛市| 和顺县| 府谷县|