PowerQuery批量合并Excel,数据不是从第一行的解决办
上篇文章的末尾留了个小话题,让大家分享一下,关于批量合并还有哪些问题?其中有几位后台跟我说,如果数据不是从第一行开始的,怎样批量合并指定列呢?
这种情况确实很常见,因为大多数Excel表都会有个表头信息,具体的明细数据从下面的某行才开始,比如下面示例中的三个表就是这样:
这三张表的数据都是从第5行才开始的,并且数据字段的顺序也不一致,这种情况下怎样批量合并指定的列呢?
难道需要把每个表打开,删除表头后再合并吗?这当然也是一个笨办法,不过这不符合我们利用PowerQuery批量合并提升效率的初衷,下面就给出一个这种类型表格的批量合并思路。
总体步骤和上篇文章类似,不过中间多了一个处理步骤,以及利用了两个M函数。
下面进入分步详细操作:
↑ 获取数据>文件夹
↑ 点击“转换数据”进入PowerQuery编辑器
↑ 添加列>自定义列
↑ 自定义列公式:Excel.Workbook([Content])
这里的Excel.Workbook无需加第二个参数,因为第一行本来也不是标题行,将表的第一行作为标题没有意义。
Tips:利用PowerQuery进行数据处理时,可以先把其他无关列都删掉,看起来更加清爽,包括之后的步骤,如果展开后,发现有无用的列,可以随时删除。
↑ 展开自定义列
展开以后,并不是像上篇文章一样,接着展开[Data]列,而是再添加一个自定义列:
Table.PromoteHeaders(
Table.Skip([Data],4)
)
↑ 添加自定义列
这串M函数的含义已经用注释说明,其实逻辑很简单,由于原始数据表格是从第5行开始的,所以先跳过前4行数据,并将第五行数据,作为表的标题行,然后展开这个新的自定义列,就可以正常提取并合并特定的列了。
比起上一篇文章,只是多了一个添加自定义列的步骤,利用两个M函数:Table.PromoteHeaders和Table.Skip,就可以轻松解决批量合并时跳过表格前几行的问题,并且也可以选择合并特定的某几列数据。
关于PowerQuery批量汇总Excel,如果你还有其他问题,欢迎留言分享,我们一起解决。
本文的练习数据,可以在「PowerBI星球」公-号对话框发送关键字“批量合并Excel指定列”下载。
-精彩推荐-
采悟