Julia 挖坑

Julia之坑数据表DataFrames

2018-09-05  本文已影响83人  黑猫中度烘焙

DataFrames是常用的包,用于读写数据
可以直接创造一个数据表

DataFrame(A = 1:4, B = ["M", "F", "F", "M"])

也可以先做一个数据表框架,然后在里面填写数据

df = DataFrame()
df[:A] = 1:8
df[:B] = ["M", "F", "F", "M", "F", "M", "M", "F"]
df

使用size来看数据大小,相当于r里面的dim

size(df, 1) == 8
size(df, 2) == 2
size(df) == (8, 2)

对数据表可以一行一行的添加

df = DataFrame(A = Int[], B = String[])
push!(df, [1, "M"])
push!(df, Dict(:B => "F", :A => 2))

查看数据类似r了

head(df)
tail(df)
df[1:3,:]  # :代表全部

describe(df)

使用describe()查看所有数据

下面是简单的统计方法

mean(df[:A]) == mean(df[1]) == 4.5
var(df[:A]) ==  var(df[1]) == 6.0
df = DataFrame(A = 1:4, B = 4.0:-1.0:1.0)
colwise(sum, df) #对列求和,结果是10 和10.0

使用CSV读取csv文件

using DataFrames, CSV
iris = CSV.read(joinpath(Pkg.dir("DataFrames"), "test/data/iris.csv"));
head(iris)
上一篇下一篇

猜你喜欢

热点阅读