CNVnator的原理是什么

發布時間：2021-07-04 19:09:11 來源：億速云閱讀：409 作者：Leah 欄目：大數據

這期內容當中小編將會給大家帶來有關CNVnator的原理是什么，文章內容豐富且以專業的角度為大家分析和敘述，閱讀完這篇文章希望大家可以有所收獲。

1.比對參考基因組

要計算測序深度，首先需要將測序的reads比對到參考基因組上，比對是最關鍵的一個步驟就是如何比對到基因組多個區域的reads。當一條reads比對到基因組上的多個位置時，單從數據分析的角度，是完全無法區分其究竟屬于哪一個區域的，因為這些區域同源度非常的高。對于這樣的reads, 有兩種處理策略，第一種是直接剔除，保留unque-mapping的reads; 第二種是隨機選取其中的一個位置，作為該reads的真實比對位置，cnvnator算法采用的是第二種策略。

2. 構建RD signal

比對之后，就可以將基因組劃分為等長窗口，計算每個窗口內的測序深度了，這里需要注意的是，利用gc含量在校正原始的測序深度。PCR對不同GC含量序列的擴增存在偏倚，所以在計算窗口內的RD signal, 需要校正這一系統誤差，cnvnator的校正公式如下

CNVnator的原理是什么

global表示所有bin窗口內原始RD signal的平均值，gc表示和當前bin的GC含量相同的所有bin窗口原始RD signal的平均值，將二者的比值作為一個系數，對原始的RD signal進行校正。

3. mean-shift 聚類

mean-shift是一種聚類算法，利用校正之后的RD signal值，對鄰近的bin進行聚類，理論上聚為一類的bin具有相同的cnv拷貝數，圖示如下

CNVnator的原理是什么

需要注意的是，這里只是對染色體位置接近的bin進行聚類，并不是等同于CNV分析中的segmentation。

4. segmentation

上述的聚類信號只有在染色體的局部具有意義，當放到大全基因組范圍來識別CNV時，必須通過segmentation算法來實現，cnvnator采用的是自己獨特的算法，有個關鍵的參數稱之為bandwidth, 不同的取值會影響到CNV區域的劃分，圖示如下

CNVnator的原理是什么

取值越大，小片段的CNV信號會被掩蓋，取值越小，數值越小，CNV檢測的假陽性率會高。

5. signal merging

根據與鄰近segment RD signal的差異, 將原始劃分的segment進行合并。

6. cnv calling

對劃分好的不同segment, 預測其對應的拷貝數。

在利用CNVnator軟件進行分析時，bin和bandwidth兩個參數的選擇對結果影響很大。通過該軟件可以檢測各種長度的cnv, 而且分型的準確率非常高，是一款值得推薦的cnv檢測軟件。

上述就是小編為大家分享的CNVnator的原理是什么了，如果剛好有類似的疑惑，不妨參照上述分析進行理解。如果想知道更多相關知識，歡迎關注億速云行業資訊頻道。

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

CNVnator的原理是什么

2. 構建RD signal

3. mean-shift 聚類

4. segmentation

5. signal merging

6. cnv calling

猜你喜歡

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

CNVnator的原理是什么

2. 構建RD signal

3. mean-shift 聚類

4. segmentation

5. signal merging

6. cnv calling

猜你喜歡

最新資訊

相關推薦

相關標簽