英伟达开源GPU加速库RAPIDS
2020-04-27 本文已影响0人
冰晶雨季
基于CUDA-X AI构建的RAPIDS软件库套件使您可以自由地完全在GPU上执行端到端数据科学和分析管道。它依靠NVIDIA®CUDA®原语进行低级计算优化,但通过用户友好的Python界面公开了GPU并行性和高带宽内存速度。
RAPIDS还专注于分析和数据科学的常见数据准备任务。这包括一个熟悉的DataFrame API,该API与各种机器学习算法集成在一起以实现端到端管道加速,而无需支付典型的序列化成本。RAPIDS还包括对多节点,多GPU部署的支持,从而可以极大地加速处理和训练更大的数据集。
RAPIDS库是开源的,用Python编写,并基于Apache Arrow构建。
cuda-x-ai.pngliCKPDszfmQAM.jpg
20181024114724725.jpg
Apache Arrow:内存中的数据结构,高效灵活;
cuDF:DataFrame操作库,包含对加载、过滤、数据操作等过程的加速,基于cuda内核加速的接口与pandas无缝衔接;
cuML:GPU加速的机器学习库,包括scikit-learn中的所有机器学习算法;
cuGRAPH:图分析库,用于执行绘图任务(图论Graph Theory)
Deep Learning:深度学习接口,可以将数据保存在ApacheArrow中,无缝衔接其他深度学习框架(cuDNN);
Visualization:可视化包,GPU加持更快更清晰。