您好,登錄后才能下訂單哦!
小編給大家分享一下如何采用TCGAbiolinks 去下載TCGA臨床數據,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
采用TCGAbiolinks 去下載TCGA臨床數據,并對數據進行整合
下載和處理TCGA的臨床信息非常的麻煩,不同的癌癥,格式還不一樣,處理起來不容易。
采用TCGAbiolinks 包去下載和處理臨床信息就非常的方便。
那么我們以下載胃癌病人的臨床數據的為例,看看如何下載數據。
# 加載需要的包 library(SummarizedExperiment) library(TCGAbiolinks) ########################################################### # GDC: https://portal.gdc.cancer.gov/ ########################################################### # 設置程序參數 work_dir <- "/Users/zhangqiuxue/Documents/Train/TCGA/lab/Download_Data/Clinical" # 設置需要下載癌癥對應的project 和數據類型 project <- "TCGA-STAD" data_category <- "Clinical" data_type <- "Clinical Supplement" legacy <- FALSE # 設置工作目錄 setwd(work_dir) # 下載臨床數據的結果 DataDirectory <- paste0(work_dir,"/GDC/",gsub("-","_",project)) # 查詢可以下載的數據 query <- GDCquery(project = project, data.category = data_category, data.type = data_type, legacy = legacy) # 該癌癥總樣品數量 samplesDown <- getResults(query,cols=c("cases")) cat("Total Clinical sample to down:", length(samplesDown)) # 下載數據 GDCdownload(query = query, directory = DataDirectory,files.per.chunk=6, method='client') # 用專門的函數去整合下載好的數據 clinical <- GDCprepare_clinic(query, clinical.info = "patient",directory = DataDirectory) # 將數據保存到文件,方便后面的進一步分析 clinical_file <- paste0(DataDirectory, "_","clinical",".txt") write.csv(clinical, file = clinical_file, row.names = F, quote = F)
以上是“如何采用TCGAbiolinks 去下載TCGA臨床數據”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。