Deci AI,更小参数,终端大模型,超过 Llama、Mist
Deci AI由首席执行官Yonatan Geifman博士、Ran El-Yaniv和前谷歌高级研究员COO Jonathan Elial于2019年创立,提供端到端深度学习加速平台,该公司表示,该平台允许AI开发人员“为任何环境(包括云、边缘或移动的)构建、优化和部署更快、更准确的模型”。
Deci的目标是优化深度学习模型,使其在生产环境中能够充分发挥潜力。他们采用了一种创新的方法,利用AI来塑造下一代深度学习技术。Deci由一支多才多艺、对技术充满热情的团队推动。
Deci ai无与伦比的吞吐量和低内存占用使团队能够以低延迟实现广泛的代码生成,并将工作负载迁移到价格更实惠且广泛可用的GPU(如NVIDIA A10 G),从而大幅节省成本,不用昂贵的A100 gpu。当Deci ai在Hugging Face Inference Endpoints上与SantaCoder等成熟的代码LLMs进行基准测试时,DeciCoder在HumanEval基准测试中表现出吞吐量增加22%,内存使用量显著减少,准确性提高1.5-2.4个百分点。值得注意的是,当DeciCoder与Deci的LLM推理加速库Infery相结合时,其吞吐量比SantaCoder高出350%。
从为企业实现最快,最具成本效益的部署,到现在分支到生成AI,为开发人员提供有效实施跨行业AI驱动应用程序所需的高级模型和工具。
DeciCoder是使用Deci专有的自动神经架构构建(AutoNAC)引擎生成的,这是市场上最先进的基于神经架构搜索(NAS)的技术。AutoNAC确定了在准确性和处理速度之间取得完美平衡的理想架构,为不同的数据特征、任务、性能目标和推理环境量身定制。Deci的AutoNAC已经生成了一些世界上最有效的计算机视觉和NLP模型,如YOLO-NAS,DeciBERT和DeciSeg等。
DeciCoder的推出是一系列备受期待的发布中的一个,这些发布概述了Deci的生成AI产品,这些产品将在未来几周内发布。 DeciCoder及其预训练的权重在Apache 2.0许可证下可用,授予开发人员广泛的使用权,并将模型定位于现实世界的商业应用程序。
Deci通过使用AI构建更好的AI,使深度学习能够发挥其真正的潜力。借助该公司的深度学习开发平台,人工智能开发人员可以为包括云、边缘和移动的在内的任何环境构建、优化和部署更快、更准确的模型,使他们能够通过创新产品彻底改变行业。在有限的硬件上实现新的用例,缩短开发周期并降低计算成本。