中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

WGCNA如何從module中挖掘關鍵基因

發布時間:2021-12-21 15:27:02 來源:億速云 閱讀:257 作者:柒染 欄目:大數據

本篇文章為大家展示了WGCNA如何從module中挖掘關鍵基因,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。

識別到與表型數據相關的modules之后,還可以在該modules中進一步篩選基因,為了方便篩選,對于每個基因定義了以下三個統計量

1.  connectivity

連接度,在之前的文章中,簡單提過這個概念,類似于網絡中節點的degree的概念,只不過在加權共表達網絡中,由于每條邊代表兩個基因間的相關性的大小,對應一個數值,所以一個基因在共表達網絡中的連接度定義為與該基因相連的所有邊的數值之和。

另外,根據相連的基因是否和該基因位于同一個module, 又可以將邊分為兩類,和該基因位于同一個module內,定義為within, 位于不同的modules, 定義為out。在WGCNA中,可以通過intramodularConnectivity函數計算連接度,用法如下

# 計算基因間的鄰接值
ADJ1=abs(cor(datExpr,use="p"))^6

#計算連接度
Alldegrees1=intramodularConnectivity(ADJ1, colorh2)

計算的結果如下

> head(Alldegrees1)
kTotal kWithin kOut kDiff
Gene1 31.80186 28.37595 3.425906 24.95005
Gene2 28.88249 26.47896 2.403522 24.07544
Gene3 25.38600 23.11852 2.267486 20.85103

KTotal代表該基因的所有邊的連接度,KWithin代表和該基因位于同一個module下的邊的連接度,KOut代表和該基因位于不同module下的邊的連接度,所以KTotalKWithinKOut之和,KDiff代表KWithinKOut的差值。

在module中,會存在hub gene的概念,所謂的hub gene, 就是該module下連接度最大的基因,注意此時只考慮位于該module下的邊,就是上文的KWithin

2. module member-ship

簡稱MM, 將該基因的表達量與module的第一主成分,即module eigengene進行相關性分析就可以得到MM值,所以MM值本質上是一個相關系數,如果基因和某個module的MM值為0,說明二者根本不相關,該基因不屬于這個module; 如果MM的絕對值接近1,說明基因與該module相關性很高。

在WGCNA中,計算基因與module之間的MM值的代碼如下

datKME = signedKME(
datExpr,
datME,
outputColumnName="MM.")

第一個參數為基因表達量,第二個參數為Module Eigengene值,結果如下

> head(datKME)
MM.blue MM.brown MM.green MM.grey MM.turquoise MM.yellow
Gene1 0.6830511 0.11547756 -0.007124794 0.2840109 0.9481457 0.09588170
Gene2 0.6342657 0.02257975 0.080277091 0.3029967 0.9356343 0.06889483
Gene3 -0.6198067 -0.12531203 0.008372054 -0.2776929 -0.9121710 -0.17852211
Gene4 0.5966736 0.06469079 0.049862112 0.2671967 0.9052030 0.11707603
Gene5 0.6642214 0.14369720 -0.017975774 0.2442237 0.9017972 -0.01038067
Gene6 -0.6018161 -0.15167072 0.006667131 -0.2053897 -0.9192597 -0.17138960
3. gene signigicancer

簡稱GS, 將該基因的表達量與對應的表型數值進行相關性分析,最終的相關系數的值就是GS, GS反映出基因表達量與表型數據的相關性,計算GS的代碼如下

GS1=as.numeric(cor(y,datExpr, use="p"))

通過以上三個量化指標,可以方便對module下的基因進行篩選。通常情況下,通過module和表型數據的相關性分析,我們可以篩選得到和感興趣的某一表型相關的具體的modules,在該module下面深入挖掘基因時,可以通過MMGS兩個指標作為過濾手段,示例如下

FilterGenes= abs(GS1)> .2 & abs(datKME$MM.brown)>.8

假設brown是我們找到的和表型高度相關的module, 其中的關鍵基因可以定義為和brown這一表型的GS值大于0.2,而且MM值大于0.8的基因。篩選出關鍵基因后,可以通過功能富集分析進一步挖掘其功能。

上述內容就是WGCNA如何從module中挖掘關鍵基因,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

新营市| 宾川县| 修武县| 甘南县| 酒泉市| 栾城县| 涞源县| 靖州| 同德县| 镇安县| 昌邑市| 东莞市| 磐石市| 尼玛县| 固安县| 浏阳市| 温泉县| 耒阳市| 大足县| 平山县| 文水县| 济南市| 松滋市| 房山区| 大丰市| 大冶市| 外汇| 桐庐县| 开原市| 和龙市| 万载县| 金山区| 岱山县| 长岭县| 河北省| 伊宁县| 治县。| 都安| 宁津县| 磴口县| 中牟县|