pandans_数据查看

2023-01-15  本文已影响0人  敬子v

数据源:链接: https://pan.baidu.com/s/1EFqJFXf70t2Rubkh6D19aw 提取码: syqg

数据源示例:

步骤1 导入必要的库

import pandas as pd

步骤2 从如下地址导入数据集

path1='pandas_exercise\exercise_data\chipotle.tsv'

步骤3 将数据集存入一个名为chipo的数据框内

chipo=pd.read_csv(path1,sep='\t')

步骤4 查看前10行内容

print(chipo.head())

步骤6 数据集中有多少个列(columns)

print(chipo.shape[1])

步骤7 打印出全部的列名称

print(chipo.columns)

步骤8 数据集的索引是怎样的

print(chipo.index)

步骤9 被下单数最多商品(item)是什么?

c=chipo[['item_name','quantity']].groupby(['item_name']).agg({'quantity':'sum'})
c.sort_values(['quantity'],ascending=False,inplace=True)
print(c.head())

步骤10 在item_name这一列中,一共有多少种商品被下单? nunique()去重计数

print(chipo['item_name'].nunique())

步骤11 在choice_description中,下单次数最多的商品是什么?

b=chipo['choice_description'].value_counts().head()
print(b)

步骤12 一共有多少商品被下单?

print(chipo['quantity'].sum())

步骤13 将item_price转换为浮点数

print(chipo['item_price'].head())
fd=lambda x:float(x[1:-1])
chipo['item_price']=chipo['item_price'].apply(fd)
print(chipo['item_price'].head())

步骤14 在该数据集对应的时期内,收入(revenue)是多少

chipo['total_sum']=round(chipo['quantity']*chipo['item_price'],2)
a=chipo['total_sum'].sum()
print(a)

步骤15 在该数据集对应的时期内,一共有多少订单?

e=chipo['order_id'].nunique()
print(e)

步骤16 每一单(order)对应的平均总价是多少?

print(a/e)
or
f=chipo[['total_sum','order_id']].groupby('order_id').agg({'total_sum':'sum'})['total_sum'].mean()
print(f)

步骤17 一共有多少种不同的商品被售出?

print(chipo['item_name'].nunique())

输出

#步骤4
   order_id  ...  item_price
0         1  ...      $2.39 
1         1  ...      $3.39 
2         1  ...      $3.39 
3         1  ...      $2.39 
4         2  ...     $16.98 
[5 rows x 5 columns]
#步骤6
5
#步骤7
Index(['order_id', 'quantity', 'item_name', 'choice_description',
       'item_price'],
      dtype='object')
#步骤8
RangeIndex(start=0, stop=4622, step=1)
#步骤9
                     quantity
item_name                    
Chicken Bowl              761
Chicken Burrito           591
Chips and Guacamole       506
Steak Burrito             386
Canned Soft Drink         351
#步骤10
50
#步骤11
[Diet Coke]                                                                          134
[Coke]                                                                               123
[Sprite]                                                                              77
[Fresh Tomato Salsa, [Rice, Black Beans, Cheese, Sour Cream, Lettuce]]                42
[Fresh Tomato Salsa, [Rice, Black Beans, Cheese, Sour Cream, Guacamole, Lettuce]]     40
Name: choice_description, dtype: int64
#步骤12
4972
#步骤13
0     $2.39 
1     $3.39 
2     $3.39 
3     $2.39 
4    $16.98 
Name: item_price, dtype: object
0     2.39
1     3.39
2     3.39
3     2.39
4    16.98
Name: item_price, dtype: float64
#步骤14
39237.02
#步骤15
1834
#步骤16
21.39423118865867
#步骤17
50
上一篇下一篇

猜你喜欢

热点阅读