文章上線

OpenAI 揭晓 Jalapeño:其首款定制 AI 推理芯片及其意义

OpenAI 揭晓 Jalapeño:其首款定制 AI 推理芯片及其意义

目录

你可能想知道的

• OpenAI 自行研发的芯片能否降低对像 Nvidia 这类第三方 GPU 供应商的依赖?

• 为推理设计的定制加速器,是否会在大型语言模型上显著降低成本和能耗?

主要主题

OpenAI 已公开推出 Jalapeño,这是其首款自研人工智能推理芯片,与 Broadcom 共同开发。该公告表明,OpenAI 正在朝着掌控运行大型语言模型和其他生成式 AI 系统所需硬件栈的战略方向迈进。OpenAI 表示,他们设计 Jalapeño 专门用于模型推理阶段——训练完成的模型对用户查询生成响应的那个阶段,而不是单纯依赖主要厂商提供的一般用途 GPU。

Jalapeño 的设计重点在于大型 transformer 类模型的推理。根据 OpenAI 的说法,该芯片针对语言模型推理常见的特定计算模式和内存访问行为进行了优化,而不是支持广泛的工作负载。这种专一化旨在带来性能优势:相比需要服务更广泛任务的硬件,具有更高的吞吐量、更低的延迟和更好的能源效率。

OpenAI 将 Jalapeño 描述为规划中多代计算平台的第一个产品。早期硅片已在 OpenAI 的实验室内进行验证,据称正在与先进模型测试,包括像 GPT-5.3-Codex-Spark 这样的模型开发迭代。公司声称该加速器可以在消耗更少电力的同时提供更多算力,但在宣布时尚未公布独立基准数据或详细比较资料。

与 Broadcom 的合作凸显该计划的规模与野心。Broadcom 带来生产级硅片专业知识与供应链能力,帮助将研究设计转化为可部署的硬件。Broadcom 的领导层将该伙伴关系视为对构建大规模 AI 部署所需物理基础设施的承诺。他们的联合路线图据称包括未来几代芯片,并计划支持千兆瓦级的数据中心基础设施,微软等合作伙伴也参与更广泛的部署工作。

行业报道与此前泄露的信息已暗示 OpenAI 正在追求定制硅片,以减少对现成 GPU(尤其是来自主导供应商)的依赖。Jalapeño 证实了这些报道并阐明了 OpenAI 的方向:公司打算共同设计针对现代生成式模型工作负载特性的硬件,而不是仅仅租用或购买更多 GPU 容量。这种做法类似于计算历史上的模式:大型云或 AI 厂商设计定制加速器,以获得通用设备无法达到的效率提升。

从技术角度来看,构建以推理为中心的芯片涉及权衡。为推理优化的设计通常优先考虑内存带宽与延迟、稀疏矩阵处理、专用数据流以及支持低精度算术以在降低功耗和面积的同时保留足够的模型精度。这些选择对于大规模运行大型语言模型,特别是对延迟敏感的交互式服务(如聊天机器人),可以带来显著好处。然而,这些设计也可能降低灵活性:为 transformer 推理调校的芯片在训练工作负载或非 AI 的数据中心任务上可能效果较差。

在战略上,此举提供若干潜在优势。首先,对硬件栈拥有更大控制权,可以随着时间降低运营成本,通过提升每瓦性能与每美元性能来改善 OpenAI 最常用推理工作负载的成本结构。第二,拥有设计可以降低因第三方加速器在价格、供应或政策上的暴露。第三,定制化栈可以实现当受制于商品化硬件时难以实现的性能与功能创新。OpenAI 将 Jalapeño 视为一项长期基础设施战略的一部分,目标是让算力更充足且更经济,这可能解锁更广泛的高级 AI 访问。

当然也存在风险与未解问题。设计与生产定制硅片的经济性取决于规模:巨大的前期工程与制造投资必须在大规模部署上摊销。实现该规模通常需要与数据中心运营商与云提供商的紧密合作;OpenAI 与微软及 Broadcom 的合作似乎旨在应对这一需求。另一个不确定因素是 Jalapeño 在独立基准测试中,与最新 GPU 及其他 AI 加速器在各种模型规模和真实工作负载下的比较表现。在基准数据与独立测试发布前,有关能效与性能的说法应视为公司声明而非经验证的事实。

最后,该公告对 AI 硬件生态系统具有更广泛的影响。如果 OpenAI 的定制芯片在成本与效率上带来实质改进,其他 AI 公司与云提供商可能会加速自有定制硬件计划或深化与硅片厂商的合作。行业可能会看到为推理、训练、边缘部署或特定模型类型量身定制的加速器架构多样化。这种转变将影响采购、数据中心设计以及 AI 栈的软件优化。

总之,Jalapeño 标志着 OpenAI 与 Broadcom 共同开发的首款公开披露的定制推理硅片。该芯片定位为针对大型语言模型的专用加速器,旨在提升性能与能效,同时降低对通用 GPU 的依赖。尽管战略逻辑明确,但其是否具有变革性仍取决于独立性能验证与能否达到量产规模。

要点表格

方面说明
產品Jalapeño,OpenAI 與 Broadcom 共同開發的首款定制推理芯片。
主要用途针对大型语言模型推理进行优化,以驱动聊天机器人及类似服务。
主张比领先 AI 芯片具有更高算力密度与更低能耗(尚无公开基准)。
战略目标减少对商品化 GPU 的依赖、提高效率并推动更广泛的先进 AI 可及性。
合作伙伴Broadcom 负责硅片开发;微软及其他合作方被提及将协助大规模部署。

之后⋯⋯

展望未来,Jalapeño 的成功将取决于独立性能验证、制造规模,以及 OpenAI 与合作伙伴在生产数据中心中部署该硬件的效果。如果该芯片兑现效率与成本承诺,可能会加速 AI 基础设施向更垂直整合的转变。反之,若出现技术或经济障碍,行业可能会继续倾向于通用 GPU 与其他加速器。不论结果如何,这次宣布凸显了专用硬件作为 AI 竞争与创新关键轴心的日益重要性。

最後編輯時間:2026/6/24

Claude AI

AI 智能编辑