Python 运维Python研究刚刚开始Machine Learning && Computational Catalysis

Python 机器学习框架

2017-12-06  本文已影响174人  5fc9b6410f4f

NuPIC: Numenta Platform for Intelligent Computing

NuPIC 是一个基于一种被称为分层式即时记忆(HTM/ Hierarchical Temporal Memory)的新皮质理论的开源项目。HTM 理论中的一部分已经在应用中被实现、测试和使用了,而其他部分仍在开发中。


The Shogun Machine Learning Toolbox


Shogun 是一种提供大量高效且统一的机器学习(ML)方法的机器学习工具箱。它能容易地把多种数据表示,算法类和通用工具紧密地联系起来。


Pymc - 贝叶斯统计模型


Pymc 是一个实现贝叶斯统计模型和拟合算法的 Python 模块,其中包括马尔可夫链和蒙特卡罗方法。其灵活性和可扩展性使其适用于大量问题。


Neon - 一个基于 Python 的深度学习库


Neon 是 Nervana 公司的一个基于 Python 的深度学习库。它提供易用性的同时也提供了最高的性能。


Statsmodels: statistical modeling and econometrics in Python


Statsmodels 是一个允许用户挖掘数据、估计统计模型和执行统计测试的 Python 模块。描述性统计、统计测试、绘图函数和结果统计的详细列表可用于不同类型的数据和估计器。


Theano - Python 机器学习框架


Theano is a Python library that allows you to define, optimize, and evaluate mathematical expressions involving multi-dimensional arrays efficiently.


Orange3 - 开源机器学习和数据可视化工具


Orange3 是一个新手和专家都可以使用的开源机器学习和数据可视化工具。在交互式数据分析工作流程中拥有大型的工具箱。


Chainer: A flexible framework of neural networks for deep learning


Chainer 是一个基于 Python 并且独立的深度学习模型开源框架。Chainer 提供一种灵活、直观且高效的方法来实现整个深度学习模型,包括如循环神经网络和变分自动编码器等最先进的模型。


DEAP - 一个用于快速原型和测试思想的新颖的进化计算框架


Deap 是一个用于快速原型和测试思想的新颖的进化计算框架。它试图使算法更加浅显易懂,数据结构更加透明。它与并行机制(例如 multiprocessing 和 SCOOP)能完美协调。


PyBrain - Python 模块化机器学习库


PyBrain 是 Python 的一个模块化机器学习库。它的目标是为机器学习任务提供灵活且易于使用但仍然强大的算法,以及各种预定义环境来对你的算法进行测试和比较。


Pattern - Python 的 Web 挖掘模块


Pattern 是 Python 编程语言的 Web 挖掘模块。它捆绑了数据挖掘(Google + Twitter + 维基百科 API、网络爬虫、HTML DOM 解析器)、自然语言处理(词性标记、n-gram 搜索、情感分析、WordNet)、机器学习(向量空间模型、k-means 聚类、朴素贝叶斯 + k-NN + SVM 分类器)和网络分析(图形中心性和可视化)等工具。


Fuel - 数据管道框架


Fuel 是一个数据管道框架(data pipeline framework),它为你的机器学习模型提供所需的数据。它将被 Blocks 和 Pylearn2 神经网络库使用。


gensim: Topic modelling for humans


Gensim 是一个免费的 Python 库,它具有诸如可扩展的统计语义等特征,它可用于分析纯文本文档的语义结构和检索语义相似的文档。


Nilearn: 一个用于在 NeuroImaging 数据上快速轻松地进行统计学习的 Python 模块


Nilearn 是一个用于在 NeuroImaging 数据上快速轻松地进行统计学习的 Python 模块。它利用 scikit-learn Python 工具箱来处理如预测建模、分类、解码或连接分析等多变量统计信息。


PyMVPA - 一个用于简化大型数据集的统计学习分析 Python 包


PyMVPA 是一个用于简化大型数据集的统计学习分析 Python 包。它提供了一个可扩展的框架,具有大量用于分类、回归、特征选择、数据导入和导出等算法的高级接口。


Pylearn2: A machine learning research library


Pylearn2 is a library designed to make machine learning research easy.


TensorFlow — an Open Source Software Library for Machine Intelligence


TensorFlow™ is an open source software library for numerical computation using data flow graphs.


Annoy - Approximate Nearest Neighbors in C++/Python optimized for memory usage and loading/saving to disk


Annoy(Approximate Nearest Neighbors Oh Yeah)是一个绑定 Python 的 C ++ 库,用来搜索在空间中距离给定查询点较近的点。它还创建了基于大型只读文件的数据结构,这些数据结构被映射到内存中,以便许多进程可以共享相同的数据。


Caffe: 深度学习框架


Caffe 是一个由伯克利视觉与学习中心(BVLC)和社区贡献者开发的深度学习框架,它兼具表现力和速度,还有模块化的优点。


scikit-learn: Python 机器学习框架


Scikit-learn 是一种基于 NumPy、SciPy 和 matplotlib 的用于数据挖掘和数据分析的工具,其不仅使用起来简单高效,而且还是开源的,可供所有人使用,并且拥有商业可用的 BSD 许可证,在不同的环境下都能很好的被使用。

上一篇下一篇

猜你喜欢

热点阅读