记一次帮学妹写简单csv脚本

2017-03-19  本文已影响0人  homosum

一个月前,学妹找我写一个处理大量实验数据的脚本,届时刚好在看数据分析的书,大致了解了下需求,需要将一个有一万多行数据的csv文件整理在一个表内。
原始数据如下:


原始数据截图.png

每一组数据三行,第一行为数据名,第二行为列,第三行为对应列数据。
将第一组数据名提取出来作为表的表名列,其中各组数据的列不尽相同,需要找到所有数据组最大列集合并合成为一个表格,对应列没有数据的时候用NA填充。
需求很简单,大致思路是用先建立model,将各组数据提取到model中,提取表名添加到第三行中,并在第二行中添加name列,组成新的字典。用集合方法找到最全列作为key,NA作为value组成大字典,用小字典更新大字典,最后用pandas形成表格,输出处理好的csv文件。
代码如下

整个过程就这么几个函数,我们在终端运行该python如下:

运行pyhton文件.png

将要处理的原始csv文件扔进终端,回车,即可得到处理好的csv文件了

处理csv文件.png

Excel打开处理后的csv文件,如下,各组数据已经整合在一个最大化列的表格之中,缺失数据使用NA进行了填充,以后产生的实验数据也可以添加进csv文件用脚本进行处理。

处理完成的csv文件.png

数万组数据的情况下,不用脚本,人力不太可能完成,但用脚本写起来的话,也就几个简单的函数而已,甚至用到的Pandas和Numpy库的地方都很少。恩,用python帮帮学妹,提高生产力还是很不错的。

上一篇 下一篇

猜你喜欢

热点阅读