这篇文章主要为大家展示了“TCGA临床信息如何正确的保存格式”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“TCGA临床信息如何正确的保存格式”这篇文章吧。
TCGA临床信息如何正确的保存格式, 避免错行,错列的情况
TCGA的临床数据,经过TCGAbiolinks 下载之后,需要保存到文件中,一般大家都希望保存的文件能够采用excel 打开。
但是临床数据中存在几个问题:
1. 一些值缺失,没有值填充
2, 一些字段中存在空格,逗号等
如果直接采用R中的 write.table进行读写,经常会存在数据错行,字段错列的情况,主要的原因是该函数默认采用tab格式 :“\t” 进行数据分割,而excel 无法区分 空格和tab。
这就需要采用一个临床信息中没有的分隔符,对数据进行分割 ,比如,采用星号(*)去分割。
# 将数据保存到文件
clinical_file <- paste0(DataDirectory, "_","clinical",".txt")
write.table(clinical, file = clinical_file, row.names = F, col.names=T,quote = T,sep='*',na = "NA")
之后打开excel 时,对数据进行分列,同样选用星号(*) 即可。
以上是“TCGA临床信息如何正确的保存格式”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注天达云行业资讯频道!