中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么使用R語言ComplexHeatmap繪制復雜熱圖heatmap

發布時間:2022-07-08 14:10:24 來源:億速云 閱讀:605 作者:iii 欄目:開發技術

這篇“怎么使用R語言ComplexHeatmap繪制復雜熱圖heatmap”文章的知識點大部分人都不太理解,所以小編給大家總結了以下內容,內容詳細,步驟清晰,具有一定的借鑒價值,希望大家閱讀完這篇文章能有所收獲,下面我們一起來看看這篇“怎么使用R語言ComplexHeatmap繪制復雜熱圖heatmap”文章吧。

一 載入R包 數據

1.1 載入ComplexHeatmap包,數據

為更貼近生信使用場景,直接使用內置的基因表達數據

library(ComplexHeatmap)
expr = readRDS(paste0(system.file(package = "ComplexHeatmap"), "/extdata/gene_expression.rds"))
#查看數據
str(expr)
expr[1:4,c(1:4,25:27)]

怎么使用R語言ComplexHeatmap繪制復雜熱圖heatmap

拿到一個新數據后,除了檢查[1:4,1:4]外,也許還需要看看最后幾列,另外還需要觀察列名稱的規律。

去除最后幾列,或者只選取列名字包含cell的(TCGA數據處理中也會經常遇到)

mat = as.matrix(expr[, grep("cell", colnames(expr))])

1.2 繪制最簡單的熱圖

Heatmap(mat)

二 常見“表型”注釋

文獻中經常見到的就是在熱圖的top 或者 bottom位置添加樣本的變異信息,臨床信息等的注釋,本節介紹如何實現以及常見的設置。

讀入注釋文件

anno <- read.csv("anno.csv",header = T) #非真實數據,隨便設置
head(anno)    sample stage age#1 s1_cell01     1  56#2 s2_cell02     2  43#3 s3_cell03     2  63#4 s4_cell01     3  23#5 s5_cell02     1   8#6 s6_cell03     3   3

2.1 添加注釋,且設置顏色

2.1.1 顏色設置

1) 連續變量:指定色系,根據變量范圍設置顏色范圍

col_fun2 <- colorRamp2(
  c(0, 50, 100),  #根據值的范圍設置
  c("#ff7f00", "white", "#1f78b4")
)

2)分類變量:直接指定顏色編碼

#stage = c("1" = "red", "2" = "green", "3" = "blue" , "4" = "orange") #分類

2.1.2 添加注釋

使用HeatmapAnnotation函數進行注釋,添加待注釋的內容

ha &lt;- HeatmapAnnotation(
  age = anno$age,
  stage = anno$stage,
  col = list( 
    age = col_fun2 , #連續
    stage = c("1" = "red", "2" = "green", "3" = "blue" , "4" = "orange") #分類
  )
)

1)注釋位置

#指定注釋位置 ,示例為top_annotation,此外可選 bottom_annotation ,right_annotation ,left_annotation

Heatmap(
  mat, 
  top_annotation = ha  
)

怎么使用R語言ComplexHeatmap繪制復雜熱圖heatmap

熱圖上面注釋樣本的臨床等信息,實現!

2) 指定多個注釋位置

當需要注釋的內容較多時候,可以選擇在不同的位置。需要預先根據待注釋的位置進行指定

column_ha <- HeatmapAnnotation(
  bar1 = anno_barplot(runif(24))
)
row_ha <- rowAnnotation(
  bar2 = expr$chr
)
Heatmap(
  mat, 
  show_row_names = F ,
  #cluster_rows = F ,
  top_annotation = ha ,
  bottom_annotation = column_ha, #對應的注釋
  right_annotation = row_ha
)

怎么使用R語言ComplexHeatmap繪制復雜熱圖heatmap

其他常用調整的函數

#cluster_rows/columns :是否進行聚類

#show_column/row_dend :是否顯示聚類樹

#column/row_dend_side :聚類圖繪制的位置

#column_dend_height/row_dend_widht :聚類樹的高度 和 寬度

三 添加“塊”注釋

常見的是根據聚類(kmeans等)或者 先驗知識 分為幾個簇,然后對簇進行注釋。

3.1 k-means指定K個數

1)樣本設置分為4組,基因分為3組,同時設置每個“簇”的顏色和標簽

set.seed(1234)
Heatmap(mat, 
        top_annotation = HeatmapAnnotation(foo = anno_block(gp = gpar(fill = 1:4),
                                                            labels = c("group1", "group2", "group3", "group4"), 
                                                            labels_gp = gpar(col = "white", fontsize = 10))),
        column_km = 4, # 列分為4個k
        left_annotation = rowAnnotation(foo = anno_block(gp = gpar(fill = 2:4),
                                                         labels = c("group1", "group2", "group3"), 
                                                         labels_gp = gpar(col = "white", fontsize = 10))),
        row_km = 3, #
        show_row_names = F 
)

怎么使用R語言ComplexHeatmap繪制復雜熱圖heatmap

2)設置 text的顏色

Heatmap(mat, 
        top_annotation = HeatmapAnnotation(foo = anno_block(gp = gpar(fill = 1:4),
                                                            labels = c("group1", "group2", "group3", "group4"), 
                                                            labels_gp = gpar(col = "white", fontsize = 10))),
        column_km = 4,
        left_annotation = rowAnnotation(foo = anno_block(gp = gpar(fill = 2:4),
                                                         labels = c("group1", "group2", "group3"), 
                                                         labels_gp = gpar(col = "white", fontsize = 10))),
        row_km = 3,
        show_row_names = F ,
        row_title_gp = gpar(
          col =  rainbow(5)[2:4],
          font = 1:3
        ),
        row_names_gp = gpar(
          col =  rainbow(5)[2:4],
          fontsize = 10:12
        ),
        column_title_gp = gpar(
          fill = rainbow(5)[1:4],
          alpha = 0.5
        ),
        column_names_gp = gpar(
          col = rainbow(5)[1:4]
        )
        )

怎么使用R語言ComplexHeatmap繪制復雜熱圖heatmap

關于顏色可選#rainbow,heat.colors,terrain.colors,topo.colors,cm.colors

3.2 先驗知識知道樣本分為幾個簇

指定樣本添加列注釋,假設mat中的24個樣本,已知是分別為10個,10個 和4個的三組 。

實際應用中可以根據 年齡段,性別,臨床分析,預后評分等指標進行的分組。

split =  c( rep(c("A","B"),10) , rep("C",4) ) 
ha = HeatmapAnnotation(foo = anno_block(gp = gpar(fill = 2:6), labels = c("AA","BB","CC") ))
col_fun = colorRamp2(c(0, 5, 10, 20), c("white", "cornflowerblue", "yellow", "red"))

使用column_split 函數即可按照指定拆分

Heatmap(mat,  
        name = "mat_cluster",
        column_split = split, 
        top_annotation = ha, 
        cluster_rows = T,
        cluster_columns =  F,
        #rect_gp = gpar(col="white"),  #添加白色格子線
        column_title = NULL)

怎么使用R語言ComplexHeatmap繪制復雜熱圖heatmap

3.3 根據富集結果添加行注釋

文獻中經常見到 一些基因富集的通路作為 行注釋的圖,怎么實現呢?

1)自定義通路結果(也可以是其他想展示的內容)

group <- list(
  A = "Cell cycle",
  B = "Mismatch repair",
  C = "DNA replication"
)

2)添加空白注釋

ha = rowAnnotation(
  foo = anno_empty(
    border = FALSE, 
    # 計算空白注釋的寬度
    width = max_text_width(unlist(group)) + unit(4, "mm"))
)

3)通過向量拆分對應的行和列

Heatmap(mat, name = "mat", 
        #cluster_rows = T,
        show_row_names = F,
        right_annotation = ha,
        row_split = c( rep(c("A","B"),30) , rep("C",95) ) , 
        column_split = rep(c("C", "D"), 12))

4)添加注釋塊 以及 注釋文本

for(i in 1:3) {
  decorate_annotation(
    "foo", 
    # 選擇熱圖塊
    slice = i, {
      # 添加顏色框
      grid.rect(
        x = 0, 
        width = unit(2, "mm"), 
        gp = gpar(
          fill = rainbow(3)[i], 
          col = NA
        ), 
        just = "left"
      )
      # 繪制文本
      grid.text(
        group[[i]], 
        x = unit(4, "mm"), 
        gp = gpar(
          col = rainbow(3)[i]
        ),
        just = "left")
    })
}

怎么使用R語言ComplexHeatmap繪制復雜熱圖heatmap

需要注意的是 這里需要對應好,各位有更好的方法希望不吝告知。

四 目標基因分析

4.1 標簽展示目標基因

使用anno_mark() 函數展示目標基因,至少需要兩個參數,通過at 提供原始數據矩陣的索引,labels 為相應的文本標記。

1)讀取待展示的基因名稱,也可以是geneList的向量

name &lt;- read.table('name.txt', header = T, check.names = FALSE)
head(name)
#    gene#1  gene3#2 gene53#3  gene6#4 gene78#5  gene7#6  gene9

2)獲取目標基因對應的矩陣位置;

genelist &lt;- name$gene
index &lt;- which(rownames(mat) %in% genelist)
#得到對應的文本標簽;
labs &lt;- rownames(mat)[index]

3)使用labels_gp調整字體大小;

lab2 = rowAnnotation(foo = anno_mark(at = index,
                                     labels = labs,
                                     labels_gp = gpar(fontsize = 8),
                                     lines_gp = gpar()))

標簽展示目標基因

Heatmap(mat, name = "mat", 
        cluster_rows = T, 
        right_annotation = lab2,
        row_names_side = "right", 
        show_row_names = F,
        row_names_gp = gpar(fontsize = 4))

怎么使用R語言ComplexHeatmap繪制復雜熱圖heatmap

4.2 繪制目標基因熱圖

大部分熱圖存在基因太多的情況,重點展示目的基因 。

heatmap4 <- Heatmap(
  mat, name = "expression"
)
heatmap

怎么使用R語言ComplexHeatmap繪制復雜熱圖heatmap

4.2.1 在總圖中提取出來目標基因的熱圖,顏色與大圖一致

提取目的基因所在的位置進行繪制

heatmaph5[c(1,5,6,8,9,80,144,74),]

怎么使用R語言ComplexHeatmap繪制復雜熱圖heatmap

這種方式是在總的熱圖中直接提取目的基因的部分,熱圖的顏色與總的熱圖一致。

4.2.2 提取基因數據重新繪制熱圖

labs2 &lt;- c("gene1",  "gene5",  "gene6",  "gene8",  "gene9",  "gene80" ,"gene144", "gene74")
mat2 &lt;- as.data.frame(mat) %&gt;%
  rownames_to_column("gene") %&gt;%
  filter( gene %in% labs2  ) %&gt;% 
  column_to_rownames("gene")
Heatmap(mat2)

怎么使用R語言ComplexHeatmap繪制復雜熱圖heatmap

以上就是關于“怎么使用R語言ComplexHeatmap繪制復雜熱圖heatmap”這篇文章的內容,相信大家都有了一定的了解,希望小編分享的內容對大家有幫助,若想了解更多相關的知識內容,請關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

汽车| 宜章县| 隆回县| 大方县| 子长县| 肥乡县| 本溪| 留坝县| 蓝田县| 开封市| 铁岭县| 津南区| 嘉鱼县| 道真| 南陵县| 年辖:市辖区| 雅江县| 文化| 景宁| 囊谦县| 兴化市| 凌海市| 蕉岭县| 株洲市| 莱芜市| 安达市| 湖口县| 满洲里市| 锡林浩特市| 同江市| 三河市| 台中县| 棋牌| 北碚区| 金山区| 锦州市| 万山特区| 怀集县| 唐山市| 得荣县| 西和县|