Julia之坑数据表DataFrames
2018-09-05 本文已影响83人
黑猫中度烘焙
DataFrames
是常用的包,用于读写数据
可以直接创造一个数据表
DataFrame(A = 1:4, B = ["M", "F", "F", "M"])
也可以先做一个数据表框架,然后在里面填写数据
df = DataFrame()
df[:A] = 1:8
df[:B] = ["M", "F", "F", "M", "F", "M", "M", "F"]
df
使用size
来看数据大小,相当于r
里面的dim
size(df, 1) == 8
size(df, 2) == 2
size(df) == (8, 2)
对数据表可以一行一行的添加
df = DataFrame(A = Int[], B = String[])
push!(df, [1, "M"])
push!(df, Dict(:B => "F", :A => 2))
查看数据类似r了
head(df)
tail(df)
df[1:3,:] # :代表全部
describe(df)
使用describe()
查看所有数据
下面是简单的统计方法
mean(df[:A]) == mean(df[1]) == 4.5
var(df[:A]) == var(df[1]) == 6.0
df = DataFrame(A = 1:4, B = 4.0:-1.0:1.0)
colwise(sum, df) #对列求和,结果是10 和10.0
使用CSV读取csv文件
using DataFrames, CSV
iris = CSV.read(joinpath(Pkg.dir("DataFrames"), "test/data/iris.csv"));
head(iris)