英伟达计划推出全新AI推理芯片与OpenAI达成重大合作

英伟达计划推出全新AI推理芯片与OpenAI达成重大合作

英伟达计划发布一款专为OpenAI及其他客户定制的全新处理器,助力打造更快、更高效的工具。这是其业务的重大调整,或将重新定义AI竞赛格局。

据知情人士透露,该公司正在为AI推理计算设计全新系统,这类计算负责让AI模型响应用户请求。这款新平台将于下月在圣何塞举办的英伟达GTC开发者大会上正式公布,将整合初创公司Groq设计的芯片。

OpenAI成为最大客户

部分知情人士称,OpenAI已同意成为这款新处理器的最大客户之一。这家ChatGPT开发者本就是英伟达的核心客户,过去数月一直在寻找英伟达芯片的更高效替代方案,并于上月与一家芯片初创公司签约,新增了供应选择。

上周五,OpenAI在宣布将向英伟达大规模采购专用推理算力时,已间接提及这款新处理器,与此同时英伟达还对其进行了300亿美元投资。OpenAI同时与亚马逊签署重大新协议,使用其Trainium芯片。

面临性能瓶颈

英伟达在设计与销售GPU领域占据主导地位,这类处理器可同时执行数十亿项简单任务。但自AI热潮兴起以来,英伟达首次面临其旗舰产品的性能瓶颈。随着市场向推理方向转移,部分客户正施压英伟达要求推出能更高效支撑AI应用的芯片。

英伟达计划推出全新AI推理芯片 与OpenAI达成重大合作 新闻

英伟达旗下Hopper、Blackwell及Rubin系列GPU,被业内公认为训练超大规模AI模型的顶级产品。多数分析师估计,英伟达掌控着90%以上的GPU市场份额。

AI智能体推动转型

随着企业纷纷部署AI智能体等工具,高端计算需求已从训练转向推理。智能体是可相对自主地代用户完成任务的AI系统。许多开发和运营AI智能体的企业发现,GPU成本过高、功耗过大,且并不完全适配模型实际运行需求。

上月,OpenAI与Cerebras达成数十亿美元的计算合作。据报道,早在去年秋天,OpenAI工程师就提出需要更快的推理芯片用于智能体编码应用。

此外,英伟达于去年底同意以200亿美元获得Groq关键技术授权,并引进其核心管理团队。Groq所设计的芯片采用与英伟达截然不同的架构,名为语言处理单元,在推理功能上效率极高。