WorldLink Machine Learning Research Institute大数据 爬虫Python AI Sql程序员

第一章第四课应用GraphCreate Lab& Gra

2017-05-25  本文已影响109人  Adapa

Copyright © 2017WorldLink Big World
Dsj.WorldLink.Top
WorldLink think tank QQ 群: 188581853

图片.png

读取一个在E盘下的一个CSV数据集

图片.png 图片.png

读全表


图片.png

读头表

图片.png

读尾表

图片.png

同学们有没有发现刚读sf的头head和读它尾的tail读出的数据是一样的,是因为我们这个数据集太小了所以都一样!

图片.png

sf.show调用Graphlab Canvas来处理数据(运行会跳出一个新的页面)

图片.png 图片.png

它对当前数据进行整体分析
让Canvas数据输出重定向到ipython notebook上显示
Categorical是显示方式

图片.png 图片.png 图片.png

看一样的

<h1>SFrame中的列操作</h1>

图片.png 图片.png 图片.png 图片.png

<h1>应用apple函数转换数据</h1>

图片.png

大家发现一个问题没有 这个数据集的Country中United States 与USA都是美国是意思 数据处理时吧它们看成了不同的国家 现在我们要改变这个数据集让它正确

图片.png

第一一个函数来吧USA变成United States
测试它

图片.png 图片.png

把它应用在这个数据集中:

图片.png

<h1>OK!本讲完毕,用费曼学习法则对此节理解,达到可以教授他人的水平!</h1>

<h1>补充:</h1>
测试文件下载地址链接:http://pan.baidu.com/s/1skSrE4d 密码:me8i

图片.png 图片.png 图片.png

用记事本打开就是一串串逗号分割的文本
用Excel打开

图片.png
上一篇 下一篇

猜你喜欢

热点阅读