2021-10-18 从EXCEL文件中加载数据
从EXCEL文件中加载数据
XLS 和XLSX的区别:
XLS 就是 Microsoft Excel 工作表,是一种非常常用的电子表格格式。xls文件可以使用Microsoft Excel打开,另外微软为那些没有安装Excel的用户开发了专门的查看器Excel Viewer。 “.xls”是03版Office Microsoft Office Excel 工作表的格式,用03版Office,新建Excel默认保存的Excel文件格式的后缀是“.xls”;
“.xlsx”是07版Office Microsoft Office Excel 工作表的格式,用07版Office,新建Excel默认保存的的Excel文件格式后缀是“.xlsx”。
xlsx : xlsx是Microsoft Office EXCEL 2007/2010/2013/2016/2019文档的扩展名。其基于Office Open XML标准的压缩文件格式取代了其以前专有的默认文件格式,在传统的文件名扩展名后面添加了字母“x”(即“.docx”取代“.doc”、“.xlsx”取代“.xls”、“.pptx”取代“.ppt”)。任何能够打开“.xlsx”文件的文字处理软件都可以将该文档转换为“.xls”文件,“.xlsx”文件比“.xls”文件所占用空间更小。
“.xlsx”格式文件的主要内容是保存为XML格式的,但文件并非直接保存于磁盘。它是保存在一个ZIP文件中,然后取扩展名为“.xlsx”。将“.xlsx”格式的文件后缀改为ZIP后解压, 可以看到解压出来的文件夹中有word这样一个文件夹,它包含了Word文档的大部分内容。
R packages | Function | Developer | 依赖 | 值 |
---|---|---|---|---|
readxl | read_excel() | Hadley Wickham | 无 | tibble |
gdata | read.xls() | Gregory R. | perl (>= 5.10.0) | |
xlsx | read.xlsx() | Cole Arendt | java (>= 1.6) | |
ODBC | odbcConnectExcel2007() | Brian Ripley | 无 | |
openxlsx | read.xlsx() | Philipp Schauberger | 无 | 仅适用于.xlsx格式 |
以前总是被这几个包的函数混淆,上面列出来就可以清晰的分辨出来。熟悉hadley的朋友应该也知道,他的包函数以下划线为标志,所以综合衡量,以后用readxl包即可。