python单因子探索分析与可视化
satisfaction_level 分析
# @Time : 2018/11/29 21:41
# @Author : Byron
import pandasas pd
import numpyas np
def main():
df = pd.read_csv('./data/HR.csv')
sc_l = df['satisfaction_level']
print(sc_l.isnull())# 打印出对应的行和isnull布尔值
print(sc_l[sc_l.isnull()])# 打印出cs_l中isnull为true的值
print(df[sc_l.isnull()])# 打印出df中isnull为true的行
print(sc_l.mean())# 均值
print(sc_l.std())# 标准差
print(sc_l.max())# 最大值
print(sc_l.min())# 最小值
print(sc_l.median())# 中位数
print(sc_l.quantile(q=0.5))# 等价于中位数
print(sc_l.quantile(q=0.25))# 下四分位数
print(sc_l.quantile(q=0.5))# 上四分位数
print(sc_l.quantile(q=0.75))# 下四分位数
print(sc_l.skew())# 偏度->满意度较高
print(sc_l.kurt())# 峰度->偏瘦较集中
print(np.histogram(sc_l.values, bins=np.arange(0.0, 1.1, 0.1)))# 数据分布空间和数值
if __name__ =="__main__":
main()