Python 数据分析工具简介
1:Numpy
Python并没有提供数组功能,列表的速度令人感动,难以接受!Numpy提供了真正数组功能。可对数据进行快速处理,其速度是C语言级别。还是Scipy、Matplotlib、Panda的库依赖。
2:Scipy
提供真正的矩阵,以及大量基于矩阵运算的对象与函数。包含的功能有最优化、线性代数、积分、差值、拟合、特殊函数、快速傅里叶变换、信号处理、图像处理、常微分方程求解和其他工程计算。
3 :Matplotlib
这是一个绘图库,主要运用于二维绘图库,也可以进行简单三维绘图。让我们可以非常快的用python可视化数据,允许输出达到高质量的图片格式(出版质量)。
4:Pandas
最强大的数据分析工具,支持类似SQL的数据增删改查,且带有丰富的处理函数;支持时间序列分析功能;支持灵活处理数据,基本数据结构是序列与数据框。注重数据的读取、处理、探索。
5:StatsModels
更加注重数据的统计建模分析,支持与Pandas交互。
6:Scikit-Learn
强大的机器学习包,包括数据 处理、分类、回归、聚类、预测、建模分析等等。不包括人工神经网络。
7:Keras
一种强大的模型:人工神经网络。在语言处理,图像识别等领域非常重要。是一个基于Theano的强大的深度学习库。
8:Gensim
topic modelling for humans!