Pandas禁用科学计数法显示

2020-07-03 本文已影响0人 zhyuzh3d

2020.06.27

Pandas中DataFrame里面的数字经常被显示成科学计数法格式，看起来非常不舒服，但是怎么才能让它们显示成正常格式呢？

image

科学计数法

科学计数法就是把一个数字表示成X乘以10的n次方的形式，中间用E+或E-链接，也可以用小写的e+或e-，减号表示10的负n次方。比如下面的情况：

1.2E+4，表示1.2*10000即12000；
1.2E-4，表示1.2*0.0001即0.00012；

需要提前说明的是，在Python里面，所有的科学计数法表示的数字都是小数float类型，就是说type(1.2E+4)输出的是float。

如果我们想把科学计数法表示的数字变为整数，可以参考下面的代码。

image

注意这里这里直接舍弃了小数部分。

默认显示

我们用下面的代码让Pandas的小数显示恢复成默认情况。

import pandas as pd
pd.reset_option('display.float_format')

然后我们进行测试会发现这时候存在很多问题，如下所示。

image

第2个和第3个代码块都只保留了6位小数，后面的数位四舍五入了。

改进版本

我们修改显示格式参数，尝试手工将小数转为字符串，代码如下所示。

pd.options.display.float_format = '{:.10f}'.format

这样之后的效果如下图所示。

image

我们看到精度没有损失，但都使用了10位小数，看山去更加怪异了。

深入改进

我们需要设计更加复杂的格式化函数，能够根据xxxE-zz和xxxE+zz进行自动选择小数部分的精度，代码如下所示。

import re
def pdFloatFormat(x):
    li1=re.split('E+', str(x),flags=re.IGNORECASE)
    li2=re.split('E-', str(x),flags=re.IGNORECASE)
    if len(li1)>1 or len(li2)>1:        
        if len(li1)>1:            
            n1=len(li1[0].replace('.',''))-1
            n2=int(li1[1])
            nx=n2-n1
            n=0 if nx>0 else nx
        else:
            n1=len(li2[0].replace('.',''))-1   
            n2=int(li2[1])
            n=n1+n2
        print(x,n)
        x2=('{:.'+str(n)+'f}').format(x)
    else:
        x2=str(x)
    return x2
pd.options.display.float_format=pdFloatFormat

这次再测试的结果如下图所示，看山去非常合适。

image

附加内容

对于Numpy，为了避免科学计数法出现，建议添加下面几行代码。

import numpy as np
np.set_printoptions(formatter={'all': lambda x: str(x)})
np.set_printoptions(suppress=True)

注意这里后两行的顺序不能颠倒。

完整代码文件请进入本文所在项目地址的src文件夹下载。

本文所在项目的传送门

欢迎访问我的个人站点，获取最新文章和更多资源

10knet.com传送门

image

Pandas禁用科学计数法显示

科学计数法

默认显示

改进版本

深入改进

附加内容

猜你喜欢

热点阅读