中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何利用CODEML中的Site Models進行正選擇基因分析

發布時間:2022-02-23 10:38:59 來源:億速云 閱讀:360 作者:小新 欄目:開發技術

小編給大家分享一下如何利用CODEML中的Site Models進行正選擇基因分析,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!

Site Models 簡介

Site Models是PAML軟件CODEML程序的一個正選擇作用分析模型,其主要觀點是同一序列不同位點的ω值不同,其中ω = dN/dS,表示非同義/同義替換率。ω比率用于度量正選擇作用。簡而言之,ω值 < 1,= 1,> 1表示負的純凈選擇,中性進化和正選擇。然而所有位點的平均ω比率和所有的種系幾乎從不 > 1,因為正選擇不可能在漫長的時間中作用于所有的位點。因此,真正要探究的只是一些種系和一些位點所受的正選擇影響。

在進行Site Models分析時,需要設置control file中的Model=0。Site Models中有多個不同的模型,可由Nssites參數指定,根據不同Model的選擇設置不同的值。值得注意的是,以此可以選擇多個Site Models。如Nssites=0 1 2 3 7 8。

不同的Site Models 表示什么意思?

  1. M0即one-ratio Model,值得是所有位點的ω值是恒定的; 

  2. M1表示加假定有一部分位點的ω值為0,其他位點的ω值為1;

  3. M2是在M1的基礎上增加了第三類ω值,該類ω是通過數據計算得到的,有可能大于1;

  4. M3假定所有位點的ω值呈簡單的離散分布趨勢;

  5. M7假定所有位點的ω屬于矩陣(0,1)且呈beta分布; 

  6. M8是在M7的基礎上增加另一類ω值,該值可通過計算得到,可以大于1;

不同Model的比較可以得到什么樣的結果? 

在Site Models 中,M0表示one ratio for all sites, M3表示所有位點的ω值呈簡單的離散分布。對于這兩個模型的比較并非用于正選擇作用的檢測,而是用于位點間ω值是否一致的檢測。

M1 and M2 以及M7 and M8是用于正選擇作用的檢測,作者推薦使用這兩組比較進行LRT檢驗來驗證正選擇。不過Prof.Yang認為,The M1-M2 comparison 與 the M7- M8 comparison相比,更加的穩定。M7和M8倆模型計算時間會長一些,如果要進行分析的基因較多,可以考慮不比較 M7- M8。

如何檢測positive sites?

CODEML computation:主要是對control file中的命令值進行設定之后,運行CODEML程序。運行CODEML程序需要三個文件,分別是序列文件(PHYLIP格式),樹文件和控制文件。控制文件示例:

      seqfile = Fungi.fasta    * sequence data file name
     treefile = Fungi.tree   * tree structure file name

      outfile = mlc          * main result file name
        noisy = 3   * 0,1,2,3,9: how much rubbish on the screen
      verbose = 0   * 1: detailed output, 0: concise output
      runmode = 0   * 0: user tree;  1: semi-automatic;  2: automatic
                    * 3: StepwiseAddition; (4,5):PerturbationNNI; -2: pairwise

      seqtype = 1   * 1:codons; 2:AAs; 3:codons-->AAs
    CodonFreq = 2   * 0:1/61 each, 1:F1X4, 2:F3X4, 3:codon table
        clock = 0   * 0: no clock, unrooted tree, 1: clock, rooted tree
       aaDist = 0   * 0:equal, +:geometric; -:linear, {1-5:G1974,Miyata,c,p,v}
        model = 0

      NSsites = 0 3 1 2 7 8
                    * 0:one w; 1:NearlyNeutral; 2:PositiveSelection; 3:discrete;
                    * 4:freqs; 5:gamma;6:2gamma;7:beta;8:beta&w;9:beta&gamma;10:3normal
        icode = 0   * 0:standard genetic code; 1:mammalian mt; 2-10:see below
        Mgene = 0   * 0:rates, 1:separate; 2:pi, 3:kappa, 4:all

    fix_kappa = 0   * 1: kappa fixed, 0: kappa to be estimated
        kappa = .3   * initial or fixed kappa
    fix_omega = 0   * 1: omega or omega_1 fixed, 0: estimate
        omega = 1.3  * initial or fixed omega, for codons or codon-based AAs
        ncatG = 10   * # of categories in the dG or AdG models of rates

        getSE = 0   * 0: don't want them, 1: want S.E.s of estimates
 RateAncestor = 0   * (0,1,2): rates (alpha>0) or ancestral states (1 or 2)

   Small_Diff = .45e-6
    cleandata = 1  * remove sites with ambiguity data (1:yes, 0:no)?
  fix_blength = 0  * 0: ignore, -1: random, 1: initial, 2: fixed, 3: proportional

Likelihood ratio test: 即對兩個模型進行顯著性水平比較,可以使用PAML軟件自帶Chi2子程序進行計算。先計算兩個對應模型 Ln L 差值,并取絕對值后的數值乘以2,即2△Ln L =|Ln L 1-Ln L2|。利用Chi2程序計算P值,命令為:Chi2  2  2.03(2為自由度df,site models中df通常使用2;2.03為2△Ln L)。

輸出值 prob <0.05視為顯著,可認為該基因受到正選擇。

PP value computation:主要是指位點后驗概率的計算,該結果是顯示在主輸出文件 mlc中。標 "*" 號的位點為顯著的正選擇位點。CODEML程序中常見的計算后驗概率的方法有BEB和NEB。與BEB相比,NEB在計算的過程中往往會忽略抽樣誤差。因此,Prof.Yang建議在讀取運算結果時,可以直接將NEB result忽略,但值得注意的是,BEB只能在M2a和M8 model下運行。

看完了這篇文章,相信你對“如何利用CODEML中的Site Models進行正選擇基因分析”有了一定的了解,如果想了解更多相關知識,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

宾川县| 新余市| 正安县| 襄城县| 高陵县| 基隆市| 襄垣县| 罗平县| 中卫市| 永善县| 大冶市| 赣榆县| 丹凤县| 宝丰县| 高要市| 苍溪县| 呼图壁县| 楚雄市| 华坪县| 随州市| 昂仁县| 桃园县| 佳木斯市| 永济市| 武乡县| 公主岭市| 陵水| 宁城县| 垣曲县| 南开区| 定边县| 麦盖提县| 洛南县| 丹棱县| 五河县| 勃利县| 盱眙县| 贺兰县| 武宣县| 垦利县| 赤城县|