您好,登錄后才能下訂單哦!
本篇文章為大家展示了WGCNA如何從module中挖掘關鍵基因,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。
識別到與表型數據相關的modules之后,還可以在該modules中進一步篩選基因,為了方便篩選,對于每個基因定義了以下三個統計量
連接度,在之前的文章中,簡單提過這個概念,類似于網絡中節點的degree
的概念,只不過在加權共表達網絡中,由于每條邊代表兩個基因間的相關性的大小,對應一個數值,所以一個基因在共表達網絡中的連接度定義為與該基因相連的所有邊的數值之和。
另外,根據相連的基因是否和該基因位于同一個module, 又可以將邊分為兩類,和該基因位于同一個module內,定義為within, 位于不同的modules, 定義為out。在WGCNA中,可以通過intramodularConnectivity
函數計算連接度,用法如下
# 計算基因間的鄰接值 ADJ1=abs(cor(datExpr,use="p"))^6 #計算連接度 Alldegrees1=intramodularConnectivity(ADJ1, colorh2)
計算的結果如下
> head(Alldegrees1) kTotal kWithin kOut kDiff Gene1 31.80186 28.37595 3.425906 24.95005 Gene2 28.88249 26.47896 2.403522 24.07544 Gene3 25.38600 23.11852 2.267486 20.85103
KTotal
代表該基因的所有邊的連接度,KWithin
代表和該基因位于同一個module下的邊的連接度,KOut
代表和該基因位于不同module下的邊的連接度,所以KTotal
是KWithin
和KOut
之和,KDiff
代表KWithin
和KOut
的差值。
在module中,會存在hub gene的概念,所謂的hub gene, 就是該module下連接度最大的基因,注意此時只考慮位于該module下的邊,就是上文的KWithin
。
簡稱MM, 將該基因的表達量與module的第一主成分,即module eigengene進行相關性分析就可以得到MM值,所以MM值本質上是一個相關系數,如果基因和某個module的MM值為0,說明二者根本不相關,該基因不屬于這個module; 如果MM的絕對值接近1,說明基因與該module相關性很高。
在WGCNA中,計算基因與module之間的MM值的代碼如下
datKME = signedKME( datExpr, datME, outputColumnName="MM.")
第一個參數為基因表達量,第二個參數為Module Eigengene值,結果如下
> head(datKME) MM.blue MM.brown MM.green MM.grey MM.turquoise MM.yellow Gene1 0.6830511 0.11547756 -0.007124794 0.2840109 0.9481457 0.09588170 Gene2 0.6342657 0.02257975 0.080277091 0.3029967 0.9356343 0.06889483 Gene3 -0.6198067 -0.12531203 0.008372054 -0.2776929 -0.9121710 -0.17852211 Gene4 0.5966736 0.06469079 0.049862112 0.2671967 0.9052030 0.11707603 Gene5 0.6642214 0.14369720 -0.017975774 0.2442237 0.9017972 -0.01038067 Gene6 -0.6018161 -0.15167072 0.006667131 -0.2053897 -0.9192597 -0.17138960
簡稱GS, 將該基因的表達量與對應的表型數值進行相關性分析,最終的相關系數的值就是GS, GS反映出基因表達量與表型數據的相關性,計算GS的代碼如下
GS1=as.numeric(cor(y,datExpr, use="p"))
通過以上三個量化指標,可以方便對module下的基因進行篩選。通常情況下,通過module和表型數據的相關性分析,我們可以篩選得到和感興趣的某一表型相關的具體的modules,在該module下面深入挖掘基因時,可以通過MM
和GS
兩個指標作為過濾手段,示例如下
FilterGenes= abs(GS1)> .2 & abs(datKME$MM.brown)>.8
假設brown是我們找到的和表型高度相關的module, 其中的關鍵基因可以定義為和brown
這一表型的GS值大于0.2,而且MM值大于0.8的基因。篩選出關鍵基因后,可以通過功能富集分析進一步挖掘其功能。
上述內容就是WGCNA如何從module中挖掘關鍵基因,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。