R语言与统计分析数据科学与R语言工具

2021-10-18 从EXCEL文件中加载数据

2021-10-18  本文已影响0人  谢俊飞

从EXCEL文件中加载数据

XLS 和XLSX的区别:

XLS 就是 Microsoft Excel 工作表,是一种非常常用的电子表格格式。xls文件可以使用Microsoft Excel打开,另外微软为那些没有安装Excel的用户开发了专门的查看器Excel Viewer。 “.xls”是03版Office Microsoft Office Excel 工作表的格式,用03版Office,新建Excel默认保存的Excel文件格式的后缀是“.xls”;

“.xlsx”是07版Office Microsoft Office Excel 工作表的格式,用07版Office,新建Excel默认保存的的Excel文件格式后缀是“.xlsx”。

xlsx : xlsx是Microsoft Office EXCEL 2007/2010/2013/2016/2019文档的扩展名。其基于Office Open XML标准的压缩文件格式取代了其以前专有的默认文件格式,在传统的文件名扩展名后面添加了字母“x”(即“.docx”取代“.doc”、“.xlsx”取代“.xls”、“.pptx”取代“.ppt”)。任何能够打开“.xlsx”文件的文字处理软件都可以将该文档转换为“.xls”文件,“.xlsx”文件比“.xls”文件所占用空间更小。

“.xlsx”格式文件的主要内容是保存为XML格式的,但文件并非直接保存于磁盘。它是保存在一个ZIP文件中,然后取扩展名为“.xlsx”。将“.xlsx”格式的文件后缀改为ZIP后解压, 可以看到解压出来的文件夹中有word这样一个文件夹,它包含了Word文档的大部分内容。

R packages Function Developer 依赖
readxl read_excel() Hadley Wickham tibble
gdata read.xls() Gregory R. perl (>= 5.10.0)
xlsx read.xlsx() Cole Arendt java (>= 1.6)
ODBC odbcConnectExcel2007() Brian Ripley
openxlsx read.xlsx() Philipp Schauberger 仅适用于.xlsx格式

以前总是被这几个包的函数混淆,上面列出来就可以清晰的分辨出来。熟悉hadley的朋友应该也知道,他的包函数以下划线为标志,所以综合衡量,以后用readxl包即可。

上一篇下一篇

猜你喜欢

热点阅读