数据处理 | csvkit安装与简单使用

2020-11-01  本文已影响0人  水土七口刀

_文{}_\equiv{}_{\nabla \Delta \nabla \Delta \nabla \Delta} {}^{皮}{}_{实}{}^{乐}{}_{观} {}^思_考 {}^有{}_{人^{生}}{}^{才_{有}}{}_{精^{彩}}
{}^{\star\star}{}^\equiv{}^{水土七口刀} {}_{生}{}^{活}{}_{阅}{}^{读} {}^运_动 {}_有{}^{兴_{趣}}{}_{才^{有}}{}^{人_{生}}


【走在成长的路上】总纲

csvkit安装

sudo pip install csvkit
sudo apt install csvkit

csvkit使用

in2csv data.xls > data.csv 
in2csv data.json > data.csv
csvcut -n data.csv
csvcut -c column_a,column_c data.csv > new.csv
csvcut -c column_3,column_2,column_1 data.csv > new.csv
csvgrep -c column_3 -r "abc" data.csv > new.csv
csvjson data.csv > data.json
csvstat data.csv
- 数据类型Type of data: Number
- 包含空值Contains null values:  False 
- 唯一值数量Unique values: 200000 
- 最小值Smallest value:  0
- 最大值Largest value: 199999 
- 和Sum:   19999900000
- 平均数Mean:   99999.5
- 中位数Median:  99999.5
- 标准差StDev: 57735.171256
- 常见值Most common values:  0 (1x);2 (1x);3 (1x) ;4 (1x)
csvsql --query "select name from data where age > 30" data.csv > new.csv
csvsql --db postgresql:///database --insert data.csv
sql2csv --db postgresql:///database --query "select * from data" > new.csv

csvkit进阶使用

csvjoin -c fips data1.csv data2.csv > joined.csv
csvsort -c total_cost -r data.csv > new.csv
csvstack data1.csv data2.csv > region.csv
上一篇 下一篇

猜你喜欢

热点阅读