Python数据处理从零开始----第四章(可视化)(3)
2018-10-28 本文已影响76人
柳叶刀与小鼠标
目录
Python数据处理从零开始----第四章(可视化)①
Python数据处理从零开始----第四章(可视化)②
Python数据处理从零开始----第四章(可视化)③
=========================================================
正文
散点图
本节开始介绍用plt.plot和ax.plot画散点图
# In[*]
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
# In[*]
x = np.linspace(0,10,30)
y = np.sin(x)
plt.plot(x,y,'o',color='black')
第三个参数‘o'是代表散点图中散点的形状,可以修改。
rng = np.random.RandomState(1234)
for marker in ['o','.',',','x','+','v','^','<','>','s','d']:
plt.plot(rng.rand(5),rng.rand(5),marker,
label="marker'='{0}'".format(marker))
plt.legend(numpoints=1)
plt.xlim(0,1.8)
可以拟合成一条曲线,其中’-ok‘中直线(-),圆圈(o),黑色(k)
rng = np.random.RandomState(1234)
for marker in ['o','.',',','x','+','v','^','<','>','s','d']:
plt.plot(rng.rand(5),rng.rand(5),marker,
label="marker'='{0}'".format(marker))
plt.legend(numpoints=1)
plt.xlim(0,1.8)
plt.plot(x,y,'-ok')
用plt.scatter画散点图
plt.scatter相对于plt.plot的主要优势在于,前者在创建散点图时具有更高的灵活性,可以单独控制每个散点与数据匹配,也可以让每个散点具有不同的属性(大小,表面颜色,边框颜色等)
rng = np.random.RandomState(1234)
x = rng.randn(100)
y = rng.randn(100)
colors = rng.rand(100)
sizes = 1000*rng.rand(100)
plt.scatter(x,y,c=colors,s=sizes,alpha=0.3,cmap='viridis')
plt.colorbar()
# In[*]
from sklearn.datasets import load_iris
iris = load_iris()
features = iris.data.T
plt.scatter(features[0],features[1],alpha=0.2,
s=100*features[3],c=iris.target,cmap='viridis')
plt.xlabel(iris.feature_names[0])
plt.ylab(iris.feature_names[1])
当面对大型数据集时,plt.plot会在效率方面优于plt.scatter,这是因为plt.scatter会对每一个单独的散点进行大小或者颜色的设置,而plt.plot是一次性复制所有的设置。
绘制基本误差线
%reset -f
%clear
# In[*]
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
# In[*]
plt.style.use('seaborn-whitegrid')
x = np.linspace(0,10,50)
dy = np.linspace(0,1,50)
y = np.sin(x) + dy*np.random.randn(50)
plt.errorbar(x,y,yerr=dy,fmt='.k')
一般来说,误差棒的颜色最好比数据点的颜色稍浅一点比较好,尤其当你的数据点非常多时。
# In[*]
plt.style.use('seaborn-whitegrid')
x = np.linspace(0,10,50)
dy = np.linspace(0,1,50)
y = np.sin(x) + dy*np.random.randn(50)
plt.errorbar(x,y,yerr=dy,fmt='o',
color='black',ecolor='gray',elinewidth=3,capsize=0)
误差棒还有一些比较少用的参数,例如水平方向的误差线(xerr),单侧误差线(one-sidederrorbar)。