adventure案例——数据探索之获取表名及表字段的excel
2019-11-18 本文已影响0人
Gaafung峰
前言:
本次文章目的是给予数据蛙就业班朋友们的一点经验分享。
adventure案例中,在第四步数据探索过程中,需要理解每个表中每个字段的意义及相互关系,但是只存在create table.txt文件,那么如何将create table.txt中的表名、表字段形成一个Excel形式呢?
这是本文需要探讨的问题。
![](https://img.haomeiwen.com/i19593862/5ea1c84717c55ead.png)
![](https://img.haomeiwen.com/i19593862/49fd48423cd9d2a8.png)
具体步骤:
一、数据处理获得table_info{表名:[字段1,字段2,xxx]}
![](https://img.haomeiwen.com/i19593862/001cc53064946011.png)
![](https://img.haomeiwen.com/i19593862/8d9a4051c8167d77.png)
![](https://img.haomeiwen.com/i19593862/6574471fbfacc0ef.png)
二、数据整理,由于形成DataFrame需要相同行列
查看table_info的行列
![](https://img.haomeiwen.com/i19593862/8def2bd4b394f96e.png)
最多字段为36,给予未满36字段的部分填充null值
![](https://img.haomeiwen.com/i19593862/89c58b06e7fef675.png)
三、数据导出
![](https://img.haomeiwen.com/i19593862/514cb570223708a6.png)
获得结果
![](https://img.haomeiwen.com/i19593862/c928e8d636b5de32.png)