day37 R语言

2022-07-23  本文已影响0人  meraner

第三课 外部数据导入导出

读入:

a=read.table('XX.txt',sep= '\t',header = T) #意思是从那个txt文件读数据到a,以制表符为分割,第一行是表头。参数之间要用逗号分隔。
b=read.table('xxx.txt.gz', sep='\t', comment.char='!' ,sep='\t')
也可以读压缩的txt文件。如果文件前面有很多注释,前面可能有!这样的标注,那么读入的时候要忽略这些。
还有些必须加上路径(不在工作目录下的文件)比如:
a=read.table('~/Downloads/B19D.rm.ocf.values.txt', header=T)
读入csv
read.csv('XX.csv)

读出:

write.csv(a, 'test.csv') #把a这个变量导出成csv文件

行名

rownames(b)=b[,3]
想把第三列作为行名,但是报错。原来行名必须是唯一的啊。

Error in .rowNamesDF<-(x, value = value) :
duplicate 'row.names' are not allowed
In addition: Warning message:
non-unique values when setting 'row.names': ‘APITD1’, ‘AQP1’, ‘C1QTNF5’, ‘CCDC103’, ‘CCDC177’, ‘CDRT1’, ‘CFB’, ‘CHMP3’, ‘CHTF8’, ‘CKS1B’, ‘CRYBG3’, ‘DCAF8’, ‘DEFB130’, ‘EFNA3’, ‘FAM47E-STBD1’, ‘GALT’, ‘GOLGA7B’, ‘IDS’, ‘ITFG3’, ‘KBTBD4’, ‘KRBOX1’, ‘LIMS3’, ‘LSP1’, ‘LTB4R2’, ‘MDGA2’, ‘MRPL30’, ‘MRPS17’, ‘MUC3A’, ‘NAA60’, ‘NPIPA7’, ‘NXF2’, ‘NXF2B’, ‘PAGR1’, ‘PI4K2A’, ‘PLA2G4B’, ‘PMF1-BGLAP’, ‘PRRG1’, ‘PTCD1’, ‘RBL1’, ‘RNASE11’, ‘RP11-599B13.6’, ‘RP11-73M18.2’, ‘RPP14’, ‘SEPT1’, ‘SHPK’, ‘SIGLEC5’, ‘SLC25A10’, ‘SOHLH2’, ‘SOX7’, ‘TAP2’, ‘TLR9’, ‘TM9SF1’, ‘TMEM236’, ‘TMEM239’, ‘TUBB3’, ‘UGT2A1’, ‘XXbac-BPG181M17.5’, ‘ZFP41’, ‘ZNF547’, ‘ZNF668’, ‘ZNF709’, ‘ZNF763’, ‘ZNF788’, ‘ZNF8’

读入的文件的保存成Rdata格式

save(b, file=' XX.Rdata')
保存为当前工作文件夹下

csv和txt 文件类型区别

它们都是文本文件。
csv,Comma-separated values,用半角逗号(’,’)作为字段值的分隔符。csv和excel之间互相导貌似比较方便。
txt文件则没有明确要求,可使用逗号/制表符/空格等 多种不同的符号。

R语言里读入数据的时候,写文件名有两种方式:

(1)先设定工作目录(用setwd函数)。接着读文件时只需要写文件名即可,之后操作也在工作目录进行,比较方便。
(2)如果读取非工作目录的数据,要使用完整路径。

上一篇 下一篇

猜你喜欢

热点阅读