Pandas之数据框

2018-10-29  本文已影响0人  谢小磊

数据框(DataFrame):用于存储多行和多列的数据集合

图解.JPG
from pandas import DataFrame;

df = DataFrame({
    'age': [21, 22, 23], 
    'name': ['KEN', 'John', 'JIMI']
});
df
#   age  name
#0   21   KEN
#1   22  John
#2   23  JIMI

df = DataFrame(data={
    'age': [21, 22, 23], 
    'name': ['KEN', 'John', 'JIMI']
}, index=['first', 'second', 'third']);
df
#        age  name
#first    21   KEN
#second   22  John
#third    23  JIMI

#按列访问
df['age']
#first     21
#second    22
#third     23
#Name: age, dtype: int64

#按行访问
df[1:2]
#        age  name
#second   22  John

#按行列号访问
df.iloc[0:1, 0:1] 
#       age
#first   21
df.iloc[0:1, 0:2] 
#       age name
#first   21  KEN

#按行索引,列名访问
df.at[0, 'name']
#'KEN'

#修改列名
df.columns
#Index(['age', 'name'], dtype='object')
df.columns=['age2', 'name2']
df.columns
#Index(['age2', 'name2'], dtype='object')

#修改行索引
df.index
#Index(['first', 'second', 'third'], dtype='object')
df.index = range(1,4)
df.index
df
#   age2 name2
#1    21   KEN
#2    22  John
#3    23  JIMI

#根据行索引删除
df.drop(1, axis=0)
#   age2 name2
#2    22  John
#3    23  JIMI

#默认参数axis=0
#根据列名进行删除
df.drop('age2', axis=1)
#  name2
#1   KEN
#2  John
#3  JIMI

#第二种删除列的方法
del df['age2']
df
#  name2
#1   KEN
#2  John
#3  JIMI

#增加行,注意,这种方法,效率非常低,不应该用于遍历中
df
#   age  name
#0   21   KEN
#1   22  John
#2   23  JIMI
df.loc[len(df)] = [24, "KENKEN"];
df
#   age    name
#0   21     KEN
#1   22    John
#2   23    JIMI
#3    5  KENKEN

#增加列
df['newColumn'] = [2, 4, 6, 8];
df
#   age    name  newColumn
#0   21     KEN          2
#1   22    John          4
#2   23    JIMI          6
#3    5  KENKEN          8

点个赞?
关注不迷路。
谢谢。

上一篇下一篇

猜你喜欢

热点阅读