从硬件角度看大语言模型落地的候选路径

2024-02-18 本文已影响0人黄军雷

从硬件角度来看，候选路径主要有以下几种：

第一种是最传统的方案，即自行购买GPU服务器并搭建底层硬件框架。在这种情况下，你有两种选择：一是选择英伟达的GPU相关服务器，或者选择华为的GPU服务器。

第二种选择仍是自行搭建服务器，但不是购买成型的服务器，而是自己根据需求来组装服务器，比如购买特定的显卡，根据需要去定制服务器。

第三种方式是在阿里云、华为云等云服务厂商处租用GPU服务器。这种方法的优点在于无需关注服务器硬件维护，可专注于大语言模型本身的技术研究。

第四种方式可能由于预算有限，需要压缩成本。此时，你可以选择传统的CPU服务器来搭建，并采用量化的模型，虽然降低了精度，但降低对显卡的需求。

第五种方法则是利用厂商的平台进行构建，他们已经完成了基本的架构。这样你只需要部署自己的模型就可以了。

第六种方式则是直接调用厂商的大语言模型接口，自己完成相关的知识库建设、接口应用和应用层开发。

最后一种方法是土豪级的，如OpenAI最近的新闻，他们要研发自己的GPU。这样的话他们从底层技术上是完全自主可控，而且能够更好的适应自己对于大模型技术的需求。