大数据、机器学习、深度学习Python库必备速查表,快来收藏!
今天,在GitHub上偶然看到了Kailash Ahirwar作者的一个项目cheatsheets-ai,该项目包含了从不同渠道收集的数十张速查表,涉及到大数据分析、机器学习和深度学习等领域,包括数据科学相关库Pandas、PySpark等,机器学习相关库Scikit-learn等,以及深度学习相关库TensorFlow等,非常适用于初学者。还等什么,赶快拿去用吧。
1. 数据科学库速查表
1. 1 Numpy
Numpy 作为Python科学计算核心库之一,能够创建高性能多维数组对象Array,并提供了处理数组的相关工具。
这里还是要推荐下小编的大数据学习QQ裙:532218147,Python学习群:483546416,不管你是小白还是大牛,小编我都欢迎,不定期分享干货,包括小编自己整理的一份2018最新的大数据资料和0基础入门教程,欢迎初学和进阶中的小伙伴。在不忙的时间我会给解答
Numpy速查表
1.2 Pandas
Pandas是基于Numpy的数据分析库,提供了python编程语言的数据结构和数据分析工具。
Pandas速查表
1.3 Scipy
Scipy也是基于Numpy的扩展包,包含一些Python语言的数学算法和便捷方程,是科学计算核心库之一。
Scipy速查表
1.4 PySpark/PySpark-RDD/PySparkSQL
PySpark、PySpark-RDD与PySparkSQL是 Spark 为 Python 开发者提供的 API,是大数据内存计算的常用框架之一。
PySpark速查表
PySparkSQL速查表
2. 数据可视化库速查表
2.1 Matplotlib
Matplotlib是python的2D绘制图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。
Matplotlib速查表
2.2 ggplot2
基于图形语法的ggplot2核心理念是把是每张图片拆解为一个数据集、一套可以展示数据点的视觉系统和一个坐标系。
ggplot2速查表
3. 机器学习库速查表
3.1 Scikit-learn
Scikit-learn是python的一个用统一接口进行机器学习预处理、交叉验证和可视化算法的开源库。
Scikit-learn速查表
4. 深度学习库速查表
4.1 TensorFlow
作为深度学习领域最流行的框架,并不需要什么介绍。
TensorFlow速查表
4.2 Karas
Karas是Theano和TensorFlow平台上一款强大易用的深度学习库。
Karas速查表
4.3 Neural Networks Zoo
神经网络结构盘点。
神经网络结构