Matplotlib

matplotlib 数据可视化 - 条形图

2018-11-27  本文已影响8人  东南有大树
import numpy as np
import matplotlib.pyplot as pt

直方图

相关函数hist(),该函数用于生成直方图,它会返回一个元组结果,包含对直方图的计算结果(n,bins,patches)

'''生成0~100的随机数作为样本'''
pop = np.random.randint(0,100,100)
pop
array([67, 55, 41, 45, 36, 75, 92, 97, 69, 63,  2,  5, 71, 71, 91, 19, 30,
       82, 37, 25, 17, 96, 11, 28, 17, 37, 59, 27, 18, 23, 60, 21,  4, 53,
       67, 31, 74, 41, 29,  2,  3,  1, 28, 31, 21,  5, 46, 69, 10, 44,  0,
        8, 20, 30, 85, 31, 80, 29, 31, 57,  6, 43, 78,  9, 74, 22, 95, 39,
       41, 71, 30, 73, 77, 76,  3, 25, 61, 32, 83, 11, 34, 18,  8, 30, 69,
       20, 10, 36, 55, 71, 73, 72,  9, 92, 55, 30, 41, 93,  3, 30])
result = plt.hist(pop,bins=20)
plt.show()

print(result)
(array([ 8.,  7.,  4.,  5.,  6.,  7., 11.,  5.,  6.,  3.,  1.,  4.,  4.,
        2.,  8.,  7.,  3.,  2.,  3.,  4.]), array([ 0.  ,  4.85,  9.7 , 14.55, 19.4 , 24.25, 29.1 , 33.95, 38.8 ,
       43.65, 48.5 , 53.35, 58.2 , 63.05, 67.9 , 72.75, 77.6 , 82.45,
       87.3 , 92.15, 97.  ]), <a list of 20 Patch objects>)

条形图

相关函数bar(),该函数用来画条形图。其x轴表示的是类别,y轴表示的是对应的数量。示例:

index = [0,1,2,3,4]
values = [5,6,7,8,9]
plt.bar(index, values)
plt.show()

还可以为x轴重上的标签重命名,以显示分类

index = [0,1,2,3,4]
values = [5,6,7,8,9]
plt.bar(index, values)
plt.xticks(index,['A','B','C','D','E'])
plt.show()

为条状图添加与标准差的误差线

index = np.arange(5)
values = [5,6,7,8,9]
std = [0.8,1,0.4,0.9,1.3]
plt.title('条状图')

plt.bar(index,  # 指定类别
        values,  # 指定数量值
        yerr=std,  # 指定对应标准差
        error_kw={'ecolor':'0.1',  # 指定误差线的颜色
                  'capsize':6  # 指定误差线两头横线的宽度
                 },
        alpha=0.7,  # 指定条头图的透明度,值的范围是0~1
        label='例一'  # 指定图便的名称
       )
plt.xticks(index, ['A','B','C','D','E'])

plt.legend(loc=2)
plt.show()

水平条状图

相关函数barh(),其显示的条形图与上例中的位置刚好相反,不过参数的使用一致。另外,方差使用xerr,而不是yerr.

index = np.arange(5)
values = [5,6,7,8,9]
std = [0.8,1,0.4,0.9,1.3]
plt.title('水平条状图')

plt.barh(index,  # 指定类别
        values,  # 指定数量值
        xerr=std,  # 指定对应标准差
        error_kw={'ecolor':'0.1',  # 指定误差线的颜色
                  'capsize':6  # 指定误差线两头横线的宽度
                 },
        alpha=0.7,  # 指定条头图的透明度,值的范围是0~1
        label='例一'  # 指定图便的名称
       )
plt.yticks(index, ['A','B','C','D','E'])

plt.legend(loc=5)
plt.show()

多序列条状图

'''数据源'''
index = np.arange(5)
values1 = [5,7,3,4,6]
values2 = [6,6,4,5,7]
values3 = [5,6,5,4,6]
bw = 0.3  # 偏移量
plt.title('多序列条状图',fontsize=20) 
plt.bar(index,values1,bw,color='b')
plt.bar(index+bw,values2,bw,color='g')
plt.bar(index+2*bw,values3,bw,color='r')
plt.xticks(index+1.5*bw, ['A','B','C','D','E'])
plt.show()

水平的多序列条状图

'''数据源'''
index = np.arange(5)
values1 = [5,7,3,4,6]
values2 = [6,6,4,5,7]
values3 = [5,6,5,4,6]
bw = 0.3  # 偏移量
plt.title('水平多序列条状图',fontsize=20) 
plt.barh(index,values1,bw,color='b')
plt.barh(index+bw,values2,bw,color='g')
plt.barh(index+2*bw,values3,bw,color='r')
plt.yticks(index+1.5*bw, ['A','B','C','D','E'])
plt.show()

为pandas DataFrame 生成多序列条状图

import pandas as pd

data = {'one':[1,3,4,5,5],
        'two':[2,4,5,2,7],
        'three':[3,2,4,8,9]}
df = pd.DataFrame(data)
df.plot(kind='bar')  # 通过df调用plot(),指定输出类型即可
plt.show()
data = {'one':[1,3,4,5,5],
        'two':[2,4,5,2,7],
        'three':[3,2,4,8,9]}
df = pd.DataFrame(data)
df.plot(kind='barh')  # 通过df调用plot(),指定输出类型即可
plt.show()

多序列堆积条状图

要把简单的多序列条状图转换为堆积图,需要在每个bar()函数中添加bottom关键字参数,把每个序列赋给相应的bottom关键字参数。

series1 = np.array([3,4,5,3])
series2 = np.array([1,2,2,5])
series3 = np.array([2,3,3,4])
index = np.arange(4)
plt.bar(index,series1,color='r')
plt.bar(index,series2,color='b', bottom=series1)
plt.bar(index,series3,color='g', bottom=(series2+series1))
plt.xticks(index+0.4, ['Jan15','Feb15','Mar15','Apr15'])
plt.show()
series1 = np.array([3,4,5,3])
series2 = np.array([1,2,2,5])
series3 = np.array([2,3,3,4])
index = np.arange(4)
plt.barh(index,series1,color='r')
plt.barh(index,series2,color='b', left=series1)  # 注意,这里使用left而不是bottom
plt.barh(index,series3,color='g', left=(series2+series1))
plt.yticks(index+0.4, ['Jan15','Feb15','Mar15','Apr15'])
plt.show()

将条形图的背景改为影线

使用到的属性hatch,可以使用|、/、-、\、*等字符表示影线的类型。

series1 = np.array([3,4,5,3])
series2 = np.array([1,2,2,5])
series3 = np.array([2,3,3,4])
index = np.arange(4)
plt.title('影线背景的堆积图',fontsize=20)
plt.barh(index,series1,color='w',hatch='xx')
plt.barh(index,series2,color='w', left=series1,hatch='///')
plt.barh(index,series3,color='w', left=(series2+series1),hatch='\\\\')
plt.yticks(index+0.4, ['Jan15','Feb15','Mar15','Apr15'])
plt.show()

为pandas DataFrame 绘制堆积条状图

import pandas as pd

data = {'one':[1,3,4,5,5],
        'two':[2,4,5,2,7],
        'three':[3,2,4,8,9]}
df = pd.DataFrame(data)
df.plot(kind='bar',stacked=True)  # stacked属性指定是否为堆积图类型
plt.show()

其它条状图(龙卷风图)

x0 = np.arange(8)
y1 = np.array([1,3,4,6,4,3,2,1])
y2 = np.array([1,2,5,4,3,3,2,1])
plt.ylim(-7,7)
plt.bar(x0,y1,0.9,facecolor='r',edgecolor='w')  # facecolor 用来设置颜色,edgecolor 用来设置边框颜色
plt.bar(x0,-y2,0.9,facecolor='b',edgecolor='w')  # y值需要成为负数
plt.grid(True)
for x,y in zip(x0,y1):
    plt.text(x+0.4,y+0.05,'%d' % y, ha='center',va='bottom')  # 添加标签
for x,y in zip(x0,y2):
    plt.text(x+0.4,-y-0.05,'%d' % y, ha='center',va='top')
plt.show()
上一篇下一篇

猜你喜欢

热点阅读