概述

利用 Arm CPU 实现出色的 AI 推理

没有“思考”，就没有 AI。因此，在所有 AI 系统中，除了加速器之外，还需要一个 AI 头部节点。加速器负责处理驱动 AI 模型的数学运算，但 CPU 才是支撑系统并将计算结果转化为真实价值的基础。

向基于代理的推理方式的转变，正在重新定义 AI 系统的运行方式。代理式工作负载具有持续性、始终在线和电力受限的特点，因此高能效 CPU 非常适合此类工作负载，在 AI 数据中心和边缘环境中发挥着核心作用。

CPU 上的 AI

哪些 AI 工作负载最适合在 CPU 上运行？

优势

Arm CPU 在 AI 领域的优势

成功案例

合作伙伴创新

计算平台

从边缘侧到云端的 AI 基础

Two Decades of AI Architecture Innovation thumbnail

持续二十年的 AI 架构创新

Arm 致力于快速推进架构创新，使我们庞大的生态系统能够适应不断变化的计算需求和 AI 的未来发展。二十多年来，Arm 始终在积极改进 CPU 的 AI 功能，推出了 Neon、Helium、可伸缩向量扩展 (SVE)、可伸缩矩阵扩展 2 (SME2) 等功能。最新的 Armv9 架构能够提高计算性能，同时降低 AI 工作负载的功耗。

Armv9 架构

Arm 与主流的 AI 框架和操作系统建立合作关系，有助于确保在 Arm CPU 上快速轻松地部署可扩展的 AI 工作负载。我们为关键合作伙伴提供优化新模型的技术利用量化和开源 AI 加速软件（例如已被诸多框架和独立软件供应商使用的 Arm Kleidi）实现定制化的 AI 未来。在 AI 框架层面进行加速，有助于在 Arm CPU 上更广泛地推动 AI 加速，从而在数十亿个 AI 推理安装中，为边缘侧、移动设备和云端的工作负载提供支持。由于我们在游戏、计算机视觉和语言模型领域的努力，应用开发者无需任何额外的优化工作，即可在Arm CPU 上获得 AI 工作负载的理想性能。

探索 Arm Kleidi

关键要点

CPU 作为中央“思考”层，与加速器协同编排 AI 系统。
AI 工作负载依赖 CPU 管理数据流动，并将计算转化为可用成果。
代理式 AI 工作负载具有持续运行、始终在线的特性，因此 CPU 能效的重要性日益凸显。
高能效 CPU 对于推动 AI 在数据中心和边缘环境中实现规模化部署至关重要。
评估面向 AI 的 CPU 时，需要考量其编排能力、可扩展性以及每瓦性能。

利用 Arm CPU 实现出色的 AI 推理

CPU 推理详解指南

哪些 AI 工作负载最适合在 CPU 上运行？

始终开启或受功率限制的推理

通用系统级计算

Arm CPU 在 AI 领域的优势

专为大规模高能效而设计

专为未来 AI 数据中心打造

开放共生，生态系统赋能产业普及

合作伙伴创新

代理式 AI

携手 Arcee AI 打造企业级 AI 应用

移动端 AI

借助 Meta 力量开拓 AI 技术边界

移动端 AI

Stability AI：重构端侧音频 AI

从边缘侧到云端的 AI 基础

持续二十年的 AI 架构创新

最新新闻和资源

使用 SqueezeSAM 进行交互式图像分割

为何 CPU 处于 AI 基础设施的核心位置

向专用云 AI 转变

Arm 推出 Lumex CSS 平台，助力开启移动端 AI 新时代

推动 AI 规模化无缝落地

全球首个 Armv9 边缘侧 AI 平台

利用 Arm 和 ExecuTorch 推进 AI 在边缘侧的普及

借助 Meta 的新 Llama 3.2 LLM 扩展 AI 推理

借助 Arm Neoverse 平台，加速主流的 Hugging Face 模型

PyTorch 和 ExecuTorch 集成实现性能提升

企业 AI 报告

边缘侧 AI 的全新领域

企业 AI 报告

Arm AI 就绪指数

基于 Arm 平台的 AI 创新

AI 时代的芯片重塑

从云端到边缘侧的 AI

为什么软件对于充分发挥 AI 的潜力至关重要

基于 Arm 计算平台的生成式 AI

灵活快速地扩展生成式 AI

移动端 AI

利用 AI 重塑移动端体验

关键要点

订阅 Arm 的最新 AI 资讯

ARM 账户

利用 Arm CPU 实现出色的 AI 推理

AI Summary

CPU 推理详解指南

哪些 AI 工作负载最适合在 CPU 上运行？

始终开启或受功率限制的推理

通用系统级计算

Arm CPU 在 AI 领域的优势

专为大规模高能效而设计

专为未来 AI 数据中心打造

开放共生，生态系统赋能产业普及

合作伙伴创新

代理式 AI 携手 Arcee AI 打造企业级 AI 应用

移动端 AI 借助 Meta 力量开拓 AI 技术边界

移动端 AI Stability AI：重构端侧音频 AI

从边缘侧到云端的 AI 基础

持续二十年的 AI 架构创新

最新新闻和资源

使用 SqueezeSAM 进行交互式图像分割

为何 CPU 处于 AI 基础设施的核心位置

向专用云 AI 转变

Arm 推出 Lumex CSS 平台，助力开启移动端 AI 新时代

推动 AI 规模化无缝落地

全球首个 Armv9 边缘侧 AI 平台

利用 Arm 和 ExecuTorch 推进 AI 在边缘侧的普及

借助 Meta 的新 Llama 3.2 LLM 扩展 AI 推理

借助 Arm Neoverse 平台，加速主流的 Hugging Face 模型

PyTorch 和 ExecuTorch 集成实现性能提升

企业 AI 报告

边缘侧 AI 的全新领域

企业 AI 报告

Arm AI 就绪指数

基于 Arm 平台的 AI 创新

AI 时代的芯片重塑

从云端到边缘侧的 AI

为什么软件对于充分发挥 AI 的潜力至关重要

基于 Arm 计算平台的生成式 AI

灵活快速地扩展生成式 AI

移动端 AI

利用 AI 重塑移动端体验

关键要点

订阅 Arm 的最新 AI 资讯

代理式 AI

携手 Arcee AI 打造企业级 AI 应用

移动端 AI

借助 Meta 力量开拓 AI 技术边界

移动端 AI

Stability AI：重构端侧音频 AI