大数据,机器学习,人工智能人工智能/模式识别/机器学习精华专题机器学习与数据挖掘

科学计算拓展

2018-01-29  本文已影响143人  飘涯

对值进行出现的次数统计

返回一个可迭代对象,每次迭代结果是一个元组
参数:某一列的索引
取某一列,按照某一列进行排序。

s=df6[["name",'money']].groupby(df6["address"])
for i in s:
    print(i)

对这个可迭代对象就行聚合 .mean()

类似于map()
参数:函数

行重新命名:df.columns=[" "]
把两个df合并:pd.concat([df1,df2])
new_ave=df.replace(0,int(averge))
list1=list(new_ave.columns)
list1.remove("Id")
list1.remove("zwyx")
list1
new_d=DataFrame([])
for i in list1:
    d=new_ave[i].value_counts()
    n_d=DataFrame(d)
    n_d.columns=['values']
    new_d = pd.concat([new_d,n_d])  
new_d
# 在 2010 年至 2012 年间人口平均量是怎么样的
df1 = pd.read_csv("census.csv")
df1 = df1[df1["SUMLEV"]==50]
def f(x):
    pe= x[['ESTIMATESBASE2010','RDOMESTICMIG2011','RDOMESTICMIG2012']]
    return pd.Series([x['CTYNAME'],pe.mean()])#把得到的结果也进行Series,更好看
df1.apply(f,axis=1)

我的机器学习pandas篇
我的机器学习matplotlib篇
我的机器学习numpy篇*

上一篇 下一篇

猜你喜欢

热点阅读