python标准库+内置函数+第三方库:4.数据清洗转

2019-08-20  本文已影响0人  大白python
python标准库+内置函数+第三方库

欲善其事,必先利其器

这其器必是python的标准库+内置函数,话说许多第三方库, 也是对标准库的使用,进行封装,使得使用起来更方便。

这些库以使用场景来分类:

一. 文件读写
二. 网络抓取和解析
三. 数据连接
四. 数清洗转换
五. 数据计算和统计分析
六. 图像和视频处理
七. 音频处理
八. 数据挖掘/机器学习/深度学习
九. 数据可视化
十. 交互学习
十一. 集成开发

4、数据清洗转

数据清洗转换主用于数据正式应用之前的预处理工作。

# 4.1 frozenset([iterable])
# 类型:Python内置函数
# 描述:返回一个新的frozenset对象,可选择从iterable取得的元素

# 4.2  int(x)
# 类型:Python内置函数
# 描述:返回x的整数部分

# 4.3 isinstance(object, classinfo)
# 类型:Python内置函数
# 描述:返回object是否是指定的classinfo实例信息

# 4.4 len(s) 
# 类型:Python内置函数
# 描述:返回对象的长度或项目数量

# 4.4 long(x)
# 类型:Python内置函数
# 描述:返回由字符串或数字x构造的长整型对象

# 4.5 max(iterable[, key])
# 类型:Python内置函数
# 描述:返回一个可迭代或最大的两个或多个参数中的最大项

# 4.6 min(iterable[, key])
# 类型:Python内置函数
# 描述:返回一个可迭代或最大的两个或多个参数中的最小项

# 4.7 range(start, stop[, step])
# 类型:Python内置函数
# 描述:用于与for循环一起创建循环列表,通过指定start(开始)、stop(结束)和step(步长)控制迭代次数并获取循环值

# 4.8 raw_input(prompt)
# 类型:Python内置函数
# 描述:捕获用户输入并作为字符串返回(不推荐使用input作为用户输入的捕获函数)

# 4.9 round(number[, ndigits]) 
# 类型:Python内置函数
# 描述:返回number小数点后ndigits位的四舍五入的浮点数

# 4.10 set([iterable])
# 类型:Python内置函数
# 描述:返回一个新的集合对象,可选择从iterable获取的元素

#4.11 slice(start, stop[, step])
# 类型:Python内置函数
# 描述:返回表示由范围(start、stop、step)指定的索引集的切片对象

# 4.12 sorted(iterable[, cmp[, key[, reverse]]])
# 类型:Python内置函数
# 描述:从iterable的项中返回一个新的排序列表

# 4.13 xrange(start, stop[, step])
# 类型:Python内置函数
# 描述:此函数与range()非常相似,但返回一个xrange对象而不是列表

# 4.14 string 
# 类型:Python标准库
# 描述:字符串处理库,可实现字符串查找、分割、组合、替换、去重、大小写转换及其他格式化处理

# 4.15 re 
# 类型:Python标准库
# 描述:正则表达式模块,在文本和字符串处理中经常使用

# 4.16 random 
# 类型:Python标准库
# 描述:该模块为各种分布实现伪随机数生成器,支持数据均匀分布、正态(高斯)分布、对数正态分布、负指数分布、伽马和β分布等

# 4.17 os 
# 类型:Python标准库
# 描述:用于新建、删除、权限修改、切换路径等目录操作,以及调用执行系统命令

# 4.18 os.path 
# 类型:Python标准库
# 描述:针对目录的遍历、组合、分割、判断等操作,常用于数据文件的判断、查找、合并

# 4.19 prettytableabs 
# 类型:Python标准库
# 描述:格式化表格输出模块

# 4.20 json 
# 类型:Python标准库
# 描述:Python对象与json对象的转换

# 4.21 base64 
# 类型:Python标准库
# 描述:将任意二进制字符串编码和解码为文本字符串的Base16,Base32和Base64
大白python.png
上一篇下一篇

猜你喜欢

热点阅读