matplotlib 数据可视化 - 条形图
2018-11-27 本文已影响8人
东南有大树
import numpy as np
import matplotlib.pyplot as pt
直方图
相关函数hist()
,该函数用于生成直方图,它会返回一个元组结果,包含对直方图的计算结果(n,bins,patches)
'''生成0~100的随机数作为样本'''
pop = np.random.randint(0,100,100)
pop
array([67, 55, 41, 45, 36, 75, 92, 97, 69, 63, 2, 5, 71, 71, 91, 19, 30,
82, 37, 25, 17, 96, 11, 28, 17, 37, 59, 27, 18, 23, 60, 21, 4, 53,
67, 31, 74, 41, 29, 2, 3, 1, 28, 31, 21, 5, 46, 69, 10, 44, 0,
8, 20, 30, 85, 31, 80, 29, 31, 57, 6, 43, 78, 9, 74, 22, 95, 39,
41, 71, 30, 73, 77, 76, 3, 25, 61, 32, 83, 11, 34, 18, 8, 30, 69,
20, 10, 36, 55, 71, 73, 72, 9, 92, 55, 30, 41, 93, 3, 30])
result = plt.hist(pop,bins=20)
plt.show()
print(result)
(array([ 8., 7., 4., 5., 6., 7., 11., 5., 6., 3., 1., 4., 4.,
2., 8., 7., 3., 2., 3., 4.]), array([ 0. , 4.85, 9.7 , 14.55, 19.4 , 24.25, 29.1 , 33.95, 38.8 ,
43.65, 48.5 , 53.35, 58.2 , 63.05, 67.9 , 72.75, 77.6 , 82.45,
87.3 , 92.15, 97. ]), <a list of 20 Patch objects>)
条形图
相关函数bar()
,该函数用来画条形图。其x轴表示的是类别,y轴表示的是对应的数量。示例:
index = [0,1,2,3,4]
values = [5,6,7,8,9]
plt.bar(index, values)
plt.show()
还可以为x轴重上的标签重命名,以显示分类
index = [0,1,2,3,4]
values = [5,6,7,8,9]
plt.bar(index, values)
plt.xticks(index,['A','B','C','D','E'])
plt.show()
为条状图添加与标准差的误差线
index = np.arange(5)
values = [5,6,7,8,9]
std = [0.8,1,0.4,0.9,1.3]
plt.title('条状图')
plt.bar(index, # 指定类别
values, # 指定数量值
yerr=std, # 指定对应标准差
error_kw={'ecolor':'0.1', # 指定误差线的颜色
'capsize':6 # 指定误差线两头横线的宽度
},
alpha=0.7, # 指定条头图的透明度,值的范围是0~1
label='例一' # 指定图便的名称
)
plt.xticks(index, ['A','B','C','D','E'])
plt.legend(loc=2)
plt.show()
水平条状图
相关函数barh()
,其显示的条形图与上例中的位置刚好相反,不过参数的使用一致。另外,方差使用xerr,而不是yerr.
index = np.arange(5)
values = [5,6,7,8,9]
std = [0.8,1,0.4,0.9,1.3]
plt.title('水平条状图')
plt.barh(index, # 指定类别
values, # 指定数量值
xerr=std, # 指定对应标准差
error_kw={'ecolor':'0.1', # 指定误差线的颜色
'capsize':6 # 指定误差线两头横线的宽度
},
alpha=0.7, # 指定条头图的透明度,值的范围是0~1
label='例一' # 指定图便的名称
)
plt.yticks(index, ['A','B','C','D','E'])
plt.legend(loc=5)
plt.show()
多序列条状图
'''数据源'''
index = np.arange(5)
values1 = [5,7,3,4,6]
values2 = [6,6,4,5,7]
values3 = [5,6,5,4,6]
bw = 0.3 # 偏移量
plt.title('多序列条状图',fontsize=20)
plt.bar(index,values1,bw,color='b')
plt.bar(index+bw,values2,bw,color='g')
plt.bar(index+2*bw,values3,bw,color='r')
plt.xticks(index+1.5*bw, ['A','B','C','D','E'])
plt.show()
水平的多序列条状图
'''数据源'''
index = np.arange(5)
values1 = [5,7,3,4,6]
values2 = [6,6,4,5,7]
values3 = [5,6,5,4,6]
bw = 0.3 # 偏移量
plt.title('水平多序列条状图',fontsize=20)
plt.barh(index,values1,bw,color='b')
plt.barh(index+bw,values2,bw,color='g')
plt.barh(index+2*bw,values3,bw,color='r')
plt.yticks(index+1.5*bw, ['A','B','C','D','E'])
plt.show()
为pandas DataFrame 生成多序列条状图
import pandas as pd
data = {'one':[1,3,4,5,5],
'two':[2,4,5,2,7],
'three':[3,2,4,8,9]}
df = pd.DataFrame(data)
df.plot(kind='bar') # 通过df调用plot(),指定输出类型即可
plt.show()
data = {'one':[1,3,4,5,5],
'two':[2,4,5,2,7],
'three':[3,2,4,8,9]}
df = pd.DataFrame(data)
df.plot(kind='barh') # 通过df调用plot(),指定输出类型即可
plt.show()
多序列堆积条状图
要把简单的多序列条状图转换为堆积图,需要在每个bar()函数中添加bottom关键字参数,把每个序列赋给相应的bottom关键字参数。
series1 = np.array([3,4,5,3])
series2 = np.array([1,2,2,5])
series3 = np.array([2,3,3,4])
index = np.arange(4)
plt.bar(index,series1,color='r')
plt.bar(index,series2,color='b', bottom=series1)
plt.bar(index,series3,color='g', bottom=(series2+series1))
plt.xticks(index+0.4, ['Jan15','Feb15','Mar15','Apr15'])
plt.show()
series1 = np.array([3,4,5,3])
series2 = np.array([1,2,2,5])
series3 = np.array([2,3,3,4])
index = np.arange(4)
plt.barh(index,series1,color='r')
plt.barh(index,series2,color='b', left=series1) # 注意,这里使用left而不是bottom
plt.barh(index,series3,color='g', left=(series2+series1))
plt.yticks(index+0.4, ['Jan15','Feb15','Mar15','Apr15'])
plt.show()
将条形图的背景改为影线
使用到的属性hatch
,可以使用|、/、-、\、*
等字符表示影线的类型。
series1 = np.array([3,4,5,3])
series2 = np.array([1,2,2,5])
series3 = np.array([2,3,3,4])
index = np.arange(4)
plt.title('影线背景的堆积图',fontsize=20)
plt.barh(index,series1,color='w',hatch='xx')
plt.barh(index,series2,color='w', left=series1,hatch='///')
plt.barh(index,series3,color='w', left=(series2+series1),hatch='\\\\')
plt.yticks(index+0.4, ['Jan15','Feb15','Mar15','Apr15'])
plt.show()
为pandas DataFrame 绘制堆积条状图
import pandas as pd
data = {'one':[1,3,4,5,5],
'two':[2,4,5,2,7],
'three':[3,2,4,8,9]}
df = pd.DataFrame(data)
df.plot(kind='bar',stacked=True) # stacked属性指定是否为堆积图类型
plt.show()
其它条状图(龙卷风图)
x0 = np.arange(8)
y1 = np.array([1,3,4,6,4,3,2,1])
y2 = np.array([1,2,5,4,3,3,2,1])
plt.ylim(-7,7)
plt.bar(x0,y1,0.9,facecolor='r',edgecolor='w') # facecolor 用来设置颜色,edgecolor 用来设置边框颜色
plt.bar(x0,-y2,0.9,facecolor='b',edgecolor='w') # y值需要成为负数
plt.grid(True)
for x,y in zip(x0,y1):
plt.text(x+0.4,y+0.05,'%d' % y, ha='center',va='bottom') # 添加标签
for x,y in zip(x0,y2):
plt.text(x+0.4,-y-0.05,'%d' % y, ha='center',va='top')
plt.show()