Arm AGI CPU 正式推出:打造代理式 AI 雲端時代的晶片基礎
為次世代 AI 基礎架構帶來突破性的機櫃級效能、規模與效率
作者:Arm 雲端 AI 事業部執行副總裁 Mohamed Awad
Arm 今日宣布推出 Arm AGI CPU,這是一款基於 Arm Neoverse 平台打造、量產就緒的全新類型晶片,專為驅動次世代 AI 基礎架構而設計。
在 Arm 超過 35 年的歷史中,我們首次推出自己的晶片產品,將 Arm Neoverse 平台從原本的 IP 與運算子系統 (Compute Subsystems,CSS) 進一步延伸,為客戶在部署 Arm 運算時提供更多部署選項——無論是打造客製化晶片、整合平台級解決方案,或採用由 Arm 設計的處理器。這項產品策略的變化也反映出 AI 基礎架構的快速演進,以及生態系對於可快速、大規模部署之量產級 Arm 平台日益提升的需求。
代理式 AI 基礎架構的興起
AI 系統正逐漸地以全球規模持續運作。在過去,人是運算的瓶頸——人們與系統互動的速度,決定了系統處理工作的速度。在代理式 AI 時代,由於軟體代理能協同處理各項任務、與多個模型互動,並即時做出決策,這項限制將不復存在。
隨著 AI 系統持續運作且工作負載日益複雜,CPU 已成為現代基礎架構的關鍵核心,負責確保分散式 AI 系統能在大規模環境下高效率地運行。在當前的 AI 資料中心中,CPU 需管理成千上萬的分散式任務——包括協調加速器、管理記憶體與儲存、進行工作負載排程,以及在系統之間傳輸資料,加上代理式 AI 時代的來臨,CPU 更需負責協調大量代理之間的任務分派與執行。
這樣的轉變為 CPU 帶來全新需求,也推動處理器持續進化。
Arm Neoverse 已成為當今眾多領先的超大規模與 AI 平台的核心基礎,包括亞馬遜網路服務的 Graviton、Google Axion、Microsoft Azure Cobalt 及輝達 (NVIDIA) 的 Vera。隨著 AI 基礎架構在全球持續擴展,生態系中的合作夥伴也期待 Arm 承擔更多角色。為因應這一轉變,Arm AGI CPU 應運而生。
Arm AGI CPU:專為機櫃級代理式效率而設計
代理式 AI 工作負載需要在大規模環境下持續提供穩定的高效能。Arm AGI CPU 正是為此而設計,它能在數千個核心併行運作、在長時間高負載運作下,維持優異的單任務效能,同時符合現代資料中心在功耗與散熱方面的限制。
Arm AGI CPU 的每一項設計——從運作頻率到記憶體與 I/O 架構——皆為支援大規模併行且高效能的代理式工作負載而打造,並能在高密度機櫃部署環境中發揮最佳效益。
![]()
Arm 的參考伺服器配置採用 1OU、雙節點設計,每個刀鋒伺服器搭載兩顆晶片,並配備專屬記憶體與 I/O,總計可提供 272 個核心。此類刀鋒伺服器可完整部署於標準的 36 千瓦 (kW) 氣冷機櫃中,透過 30 個刀鋒模組,總計可達 8,160 個核心。此外,Arm 也與美超微電腦 (SuperMicro) 合作打造 200 千瓦 (kW)) 的液冷設計,可容納 336 顆 Arm AGI CPU,總核心數超過 45,000。
在此配置下,Arm AGI CPU 相較於最新的 x86系統,每機櫃可提供超過 2 倍的效能*。這項成果來自 Arm 架構的根本優勢,以及對系統資源與運算能力之間最佳化配置的設計:
- Arm AGI CPU 具備領先同級的記憶體頻寬,使每個機櫃能支援更多有效的執行緒;相較之下,x86 CPU 在持續負載下因核心競爭資源,效能會出現下降。
- 高效能且兼具能源效率的單執行緒 Arm Neoverse V3 CPU 核心優於傳統架構——每一個 Arm 執行緒都能完成更多工作。
- 更多可有效運用的執行緒,以及每個執行緒更高的處理效率,進一步累積為每個機櫃大幅提升的整體效能。
來自 AI 生態系的初期回應
Arm AGI CPU 已在多家推動代理式 AI 基礎架構擴展的領先合作夥伴中,展現強勁的商業進展。其規劃部署包括加速器管理、代理式協同調度,以及支援代理式任務擴展所需的服務、應用與工具之高密度部署,同時也強化網路與資料平面運算能力,以支援 AI 資料中心的運作。
Meta 做為 Arm AGI CPU 的早期合作夥伴,與 Arm 共同開發此款 CPU,以最佳化其應用程式系列所需的吉瓦 (GW) 級基礎架構,同時與 Meta 自研的 MTIA 加速器協同運作。其他首批合作夥伴包括 Cerebras、Cloudflare、F5、OpenAI、Positron、Rebellions、思愛普 (SAP) 與 SK 電訊 (SK Telecom),皆與 Arm 合作導入 Arm AGI CPU,加速雲端、網路及企業環境中的 AI 驅動服務。目前,永擎電子 (ASRock Rack)、聯想 (Lenovo) 與美超微電腦 (SuperMicro) 已開始提供可供訂購的商用系統。
為加速導入,Arm 推出 Arm AGI CPU 1OU 雙節點參考伺服器,採用開放運算計畫 (Open Compute Project,OCP) DC-MHS 標準規格。Arm 計畫將此參考伺服器設計及相關韌體開放釋出,並持續提供包括系統架構規範、除錯框架,以及適用於所有 Arm 架構系統的診斷與驗證工具等資源。更多細節將於即將舉行的 OCP EMEA 高峰會中公布。
Arm 架構基礎設施的新頁
Arm AGI CPU 的推出,代表 Arm 在資料中心發展歷程中寫下全新一頁,並延續其在運算創新領域的領導地位。隨著 AI 持續重塑產業,Arm 也將致力於推動整體生態系的發展——無論是超大規模雲端服務提供商,或是 AI 新創企業,都能獲得所需的支援。
Arm AGI CPU 為 Arm 全新資料中心晶片產品線的首款產品,目前已開放訂購。後續產品規劃已確認,將持續朝向業界頂尖的效能、規模與效率邁進。同時,此發展也將與 Arm Neoverse 運算子系統 (CSS) 產品藍圖一併推進,確保所有 Arm 資料中心客戶在平台架構與軟體相容性上能同步發展。
邁入這個全新階段後,我們的使命依然不變:提供驅動各行各業創新的運算基礎。而整個生態系也全力支持我們——包括超大規模運算、雲端、晶片、記憶體、網路、軟體、系統設計與製造等領域,已有超過 50 家領先企業支持 Arm 拓展其運算平台至晶片產品。透過 Arm AGI CPU,我們不僅正在定義 AI 原生資料中心的架構,更準備將其實現。
來自更多部署 Arm AGI CPU 合作夥伴的分享:
「在 Cerebras,我們打造專為超高速、大規模推論而設計的 AI 基礎架構。隨著這類工作負載逐漸成為 AI 的主流,可組合且具高效能的系統變得空前重要——這些系統不僅需要專為 AI 設計的加速器,也需要具備高效率與可擴展性的 CPU,在大規模環境中負責資料傳輸、網路與整體協調。將 Arm 運算平台延伸至 AGI 等級的基礎架構,對整體生態系以及以全球規模部署 AI 的客戶而言,都是一項正向發展。」
— Cerebras 執行長 Andrew Feldman
「為持續實現打造更優質網際網路的使命,Cloudflare 需要能在全球網路中高效率擴展的基礎架構。Arm AGI CPU 提供專為次世代工作負載打造的高效能、且具能源效率的運算能力。」
— Cloudflare 策略長 Stephanie Cohen
「在全球規模下提供 AI 體驗,需要一套強大且具可適應性的客製化晶片產品組合,並專為加速 AI 工作負載且最佳化 Meta 各平台效能而設計。我們與 Arm 攜手開發 Arm AGI CPU,以部署一套高效率的運算平台,顯著提升資料中心的效能密度,並支援我們 AI 系統持續演進的多代產品藍圖。」
— Meta 基礎架構負責人 Santosh Janardhan
「OpenAI 以大規模運行 AI 系統。每天有數億人使用 ChatGPT,企業在我們的應用程式介面( API)上建構服務,開發者也依賴例如 Codex 等工具。隨著規模持續擴展,Arm AGI CPU 將在我們的基礎架構中扮演重要角色,強化負責協調大規模 AI 工作負載的調度層,並提升整體系統的效率、效能與頻寬表現。」
— OpenAI 工業運算負責人 Sachin Katti
「在 Positron,我們專注於打造專為推論設計的加速器,透過採用通用記憶體,實現突破性的 token 生成效率。Arm 一直以來提供業界最具能源效率的運算平台,使 Arm AGI CPU 成為次世代 AI 基礎架構的理想基礎。透過結合 Positron 的推論加速技術與具備高能源效率的 Arm AGI CPU 平台,我們看見一個強大的契機,能協助資料中心營運者以更高的每瓦效能與每美元效益,大規模部署最先進的 AI 模型。」
— Positron AI 執行長 Mitesh Agrawal
「高效能 AI 系統需要通用運算與加速器架構之間的緊密協同。透過在新一代高密度伺服器配置中結合 Arm AGI CPU 與 Rebellions 的 NPU,我們打造出一個具備可擴展性且高能源效率的平台,專為大規模 AI 推論工作負載而最佳化。」
— Rebellions 商務長 Marshall Choy
「SAP 在基於 Arm 架構的 AWS Graviton 上成功部署 SAP HANA,充分展現 Arm 生態系在企業級工作負載上的成熟度與效能。Arm AGI CPU 進一步延伸這項優勢,提供具備可擴展性與高效率的運算能力,支援下一代 AI 驅動的企業應用解決方案。」
— 思愛普 (SAP) 資深副總裁暨 HANA 與持續化技術負責人 Stefan Bäuerle
「SK Telecom 正積極拓展至大規模、全端的 AI 推論資料中心基礎架構,其中包括 Arm AGI CPU 與 Rebellions 的 AI 加速晶片。透過結合我們自主研發的 A.X 基礎模型與針對推論最佳化的 AI 伺服器,我們已準備好將其推向全球,同時提升在 AI 資料中心(AIDC)領域的競爭力。」
— SK 電訊 (SK Telecom) 技術長暨 AI CIC 負責人 Suk-geun (SG) Chung
關於 Arm
Arm 是業界效能最高且最節能的運算平台,其無可比擬的應用範疇觸及全球所有連網使用者。為因應全球對運算永無止境的需求,Arm 提供先進的解決方案,使全球領先的科技公司得以釋放前所未有的 AI 體驗與功能。透過與全球最大的運算生態系及 2,200 萬名軟體開發者的共同努力,我們正在 Arm 平台上建構 AI 的未來。
所有資訊都「依目前情況」提供,且並不帶保證或代表性。此文件可以自由分享,但不得修改且必須註明出處。Arm 是 Arm Limited(或其子公司與附屬機構)的註冊商標。所有品牌或產品名稱均為所屬公司之財產。© 1995-2026 Arm Limited.
Forward-looking statements
This press release contains forward-looking statements within the meaning of Section 27A of the Securities Act of 1933, as amended, and Section 21E of the Securities Exchange Act of 1934, as amended, and as defined in the Private Securities Litigation Reform Act of 1995. All statements other than statements of historical fact could be deemed forward-looking statements, including without limitation, statements relating to our growth opportunities and platform expansion, opportunities arising from the continued adoption of artificial intelligence (AI) technologies, including the growth of AI data centers and agentic AI; market and industry trends; our TAM expectation, expansion and our being well positioned to address such expanded opportunity; and our expectations for new AI data center capacity. In some cases, you can identify forward-looking statements because they contain words such as “may,” “might,” “will,” “could,” “would,” “should,” “expect,” “is/are likely to,” “intend,” “plan,” “objective,” “anticipate,” “believe,” “estimate,” “predict,” “potential,” “target,” “continue,” “ongoing” or similar words or phrases, or the negative of these words or phrases. These statements involve known and unknown risks, uncertainties and other important factors that may cause Arm’s actual results, levels of activity, performance or achievements to be materially different from the information expressed or implied by these forward-looking statements. There are many factors that could cause or contribute to such differences, including, but not limited to, any of the following: Arm’s dependence on the semiconductor and electronics industries and the demand for the products of its customers; Arm’s dependence on the compatibility of its products with the manufacturing and design processes of its customers; Arm’s development of compute subsystems, chiplets, or complete System-on-a-Chip (SoC) solutions as well as other more integrated compute products; Arm’s reliance on third parties to market and sell chips and end products incorporating its products, as well as add value to its licensed products; Arm’s dependence on a limited number of customers for a significant portion of its revenue; the loss of any of Arm’s senior management personnel or one or more key employees or Arm’s inability to attract and retain qualified personnel; Arm’s ability to adequately fund its research and development efforts; risks related to the availability of development tools, systems software, electronic design automation tools and operating systems compatible with its architecture; Arm’s ability to protect its proprietary products and its brand, and the costs of protecting such intellectual property rights, particularly as a result of litigation; Arm’s ability to verify royalty amounts owed to it under its licensing agreements; risks related to foreign exchange fluctuations; changes in Arm’s effective tax rate; risks associated with organic growth or growth from strategic investments or acquisitions Arm makes, and the risk of failing to effectively manage its growth; risks associated with the slow development of the market for Arm’s connectivity, device and data management platform; the possibility of cyberattacks, breaches of Arm’s security controls and unauthorized access to its data or a customer’s data; Arm’s ability to satisfy data protection, security, privacy or other government- and industry-specific requirements; risks associated with the interests of SoftBank Group Corp., Arm’s controlling shareholder, conflicting with the interests of other holders of Arm’s ordinary shares and American depositary shares; and effects of global general economic conditions, political factors, war or hostility, pandemics and other events outside of Arm’s control and those discussed in Arm’s Annual Report on Form 20-F for the fiscal year ended March 31, 2025, filed with the Securities and Exchange Commission on May 28, 2025. Any forward-looking statement in this press release speaks only as of the date hereof, and Arm does not undertake any obligation to update any forward-looking statement to reflect events or circumstances after the date of this press release except as required by applicable law. Arm cautions that you should not place undue reliance on any of Arm’s forward-looking statements.
*根據估算結果。
關於 Arm
Arm 是業界效能最高且最節能的運算平台,其無可比擬的應用範疇觸及全球所有連網使用者。為因應全球對運算永無止境的需求,Arm 提供先進的解決方案,使全球領先的科技公司得以釋放前所未有的 AI 體驗與功能。透過與全球最大的運算生態系及 2,200 萬名軟體開發者的共同努力,我們正在 Arm 平台上建構 AI 的未來。
所有資訊都「依目前情況」提供,且並不帶保證或代表性。此文件可以自由分享,但不得修改且必須註明出處。Arm 是 Arm Limited(或其子公司與附屬機構)的註冊商標。所有品牌或產品名稱均為所屬公司之財產。© 1995-2025 Arm Limited.