探索小晶片革新,Arm 運算子系統平台推動客製化 AI 晶片普及
採用小晶片技術的 Arm CSS 平台讓客製化 AI 晶片觸手可及,不僅協助全球領先的雲端服務提供者,也為更多企業加速創新。
隨著人工智慧 (AI) 工作負載在複雜性和規模方面的激增,傳統的系統單晶片 (SoC) 模式正面臨三重挑戰——能源效率低下、 效能瓶頸和產品上市時間延長。曾是領先的雲端服務提供者專屬領域的單晶片設計,已無法滿足現代 AI 基礎設施的發展需求。
在 2025 年 OCP 全球高峰會上,Arm 將重點聚焦於一大轉變:由 Arm 運算子系統 (Compute Subsystems, CSS) 和小晶片系統架構 (Chiplet System Architecture, CSA) 所促成的小晶片創新,正為晶片供應商創造新的機會,這些企業無需具備領先的雲端服務提供者的規模,也可建構 AI 最佳化的設計。
從單晶片到模組化 AI 晶片
多年來,全客製化 SoC 主導著高階 AI 基礎設施。運算單元、記憶體控制器、互連系統和加速器等都整合在一個單晶片 (die) 上。雖然這種設計可確保嚴格的控制,並帶來效能的優勢,但也存在顯著的利弊權衡,包括:
- 隨著製程節點不斷突破極限,功耗和散熱成本不斷上升;
- 大型異質處理模組的驗證和確認相對複雜;
- 設計、工具開發和製造的交付時間長。
而採用小晶片技術的運算,則透過將系統分解為更小的專用晶片(die) (包括運算、記憶體、I/O、加速器),讓 SoC 架構師和設計人員能夠靈活搭配元件,並按其需求擴展,以實現產品的快速反覆運算。目前,這種模組化仍有其侷限性,例如設計的碎片化、標準化互連的缺乏、IP 重複使用的挑戰,以及較大的前期風險和成本。
解題關鍵:Arm CSS 和 CSA 模式
Arm 正透過兩個基本框架來彌合差距:
- CSS:這是一套整合了經過預先驗證的高效能 IP 建構模組的運算子系統,涵蓋運算核心、AI 加速器、記憶體子系統等,其設計、驗證和效能特性已在真實或模擬晶片中得到驗證。透過使用 CSS,設計人員無需從頭開始打造每個模組,也無需再次驗證其可行性;而能直接利用成熟且經最佳化的組件。
- CSA:這是一個開放且以標準為導向的架構,用於實現小晶片在不同供應商間的互連、通訊與整合。CSA 定義了電氣、物理和協定層的相容性,以便不同來源的 IP(例如,來自合作夥伴 A 的加速器和來自晶圓代工廠 B 的記憶體晶片)可以在共用平台上可靠地進行互動操作。
CSS 和 CSA 讓 Socionext、Rebellions 等晶片提供商實現客製化的 AI 最佳化晶片,其效能可媲美領先雲端服務提供者的設計方案,同時所承擔的風險更低、開發週期更短,且靈活性更高。晶片提供商可根據其具體的工作負載需求(如視覺模型、推論引擎和多租戶執行個體)靈活選擇運算模組、加速器、記憶體類型及整合路徑,而非受制於單片設計的權衡取捨之中。
OCP 協助加速產業發展
開放運算計畫 (Open Compute Project, OCP) 長期以來是開放硬體協作、模組化和高效率的核心陣地,這些原則與小晶片技術的革新密切相關。在 2025 年 OCP 全球高峰會上,Arm 不僅將展示其技術理論架構,還會透過實際案例,生動呈現雲端服務提供者、OEM 廠商和晶片提供商如何結合使用 CSS 和 CSA,打造針對未來需求的 AI 基礎設施。
OCP 合作夥伴所獲得的主要優勢包括:
- 靈活性:針對特定區域的功耗、散熱或可靠性限制,靈活客製化晶片;
- 更低的總擁有成本 (TCO):透過供應鏈的擇性降低 TCO,即能夠從多家代工廠採購小晶片或Die,並隨著產量的擴大靈活組合,而非受制於單一供應商;
- 更快的上市時間:經過驗證的 CSS 模組和標準化的互連,使得大部分設計工作得以「預先完成」,進而實現更快速的原型設計、測試和部署。
對業務的影響及未來展望
對於 AI 基礎設施建設者來說,無論是雲端服務提供者、OEM 廠商還是剛剛進入 AI 領域的晶片公司,CSS 和 CSA 方法都能幫助他們實現以下的成果:
- 每瓦效能的提升:運算和記憶體被置於最高效率的位置,避免資源浪費。
- 設計風險的降低:重複使用經過驗證的 IP,以及利用標準互連技術。
- 供應鏈彈性的提高:模組化設計使更換供應商、擴展晶片 (die) 產量或選擇偏好代工廠製程節點變得更為可行。
- 設計週期的加速:設計週期的縮短能實現AI 模型、特性集和部署的快速反覆運算。
這不僅僅是晶片架構,它更是 AI 時代企業實現業務敏捷性的關鍵運用。
瞭解更多資訊
在 2025 年 OCP 全球高峰會上,Arm 舉辦了系列會議和技術簡報說明,現場展示 CSS 和 CSA 的實際應用。無論您是探索 AI 硬體未來的晶片設計人員、基礎設施架構師還是雲端服務提供者,這都將為您突破現有侷限、見證無限可能提供絕佳契機。
若想更深入瞭解推動此一轉變的工具與工作流程,請探索開發者如何運用 Arm Neoverse CSS V3 平台,加速設計生產前驗證與韌體開發:
- Develop and Validate Firmware Pre-Silicon on Arm Neoverse CSS V3
- Simulate OpenBMC and UEFI Pre-Silicon on Neoverse RD-V3
這些資源展示了軟體前期啟動、韌體驗證與系統原型設計,如何在晶片尚未進入晶圓廠生產前就已經開始進行。
資料中心的未來仰賴於各種規模的創新,Arm 始終致力於讓所有企業,且不僅是領先的雲端服務提供者,都具備打造客製化 AI 晶片的能力!
關於 Arm
Arm 是業界效能最高且最節能的運算平台,其無可比擬的應用範疇觸及全球所有連網使用者。為因應全球對運算永無止境的需求,Arm 提供先進的解決方案,使全球領先的科技公司得以釋放前所未有的 AI 體驗與功能。透過與全球最大的運算生態系及 2,200 萬名軟體開發者的共同努力,我們正在 Arm 平台上建構 AI 的未來。
所有資訊都「依目前情況」提供,且並不帶保證或代表性。此文件可以自由分享,但不得修改且必須註明出處。Arm 是 Arm Limited(或其子公司與附屬機構)的註冊商標。所有品牌或產品名稱均為所屬公司之財產。© 1995-2025 Arm Limited.