迎接小晶片時代,重塑運算的未來

August 27, 2025

從 AI 到汽車產業,業界的焦點已超越對小晶片的爭論,進入大規模實現的時代。

作者:Arm 基礎設施事業部副總裁 Eddie Ramirez

小晶片時代已經來臨,產業對小晶片已不再存疑。產業關心的焦點已從討論「小晶片能否具備規模化能力」,轉向共同解決「如何在整合的生態系中設計、驗證並部署多供應商系統」。

可擴展小晶片應用的三大支柱

要充分釋放小晶片潛力,必須遵守三大核心準則:

  1. 為軟體開發者提供便利的開發體驗
    如果沒有可擴展的軟體支援,再先進的硬體也將黯然失色。軟體必須能跨越多代 IP 保持穩定相容。開發者必須能夠在不增加複雜度的情況下,輕鬆實現基於小晶片設計的程式設計、配置和部署。這就需要產業確立通用通訊協議、模組化韌體以及一致化的軟體介面。

  2. 為整個供應鏈建構可重複使用的晶片
    如今,多數小晶片設計仍限於單一供應商內部完成。但真正的規模化需要將小晶片轉化為產品,包括跨不同設計點,甚至跨代際的可重複使用性、互通性和可組合性。這需要晶圓代工廠、IP 供應商、封裝合作夥伴和 OEM 廠商之間更深層次的整合。

  3. 全面推進系統級標準
    雖然 UCIe 等介面標準已取得重大突破,但這只能解決部分問題。真正的互通性取決於系統級規範,包括小晶片通訊機制、啟動流程、記憶體共用及揭露遙測資料。而這正是 Arm 小晶片系統架構 (Chiplet System Architecture, CSA) 的願景所在,CSA 目前已得到 70 多家合作夥伴的大力支持。

從超大規模雲端服務到邊緣端,AI 正在推動轉變

為何選擇小晶片,又為何是現在?答案只有一個:AI。


Arm 基礎設施事業部行銷副總裁 Eddie Ramirez


AI 工作負載正在重塑運算堆疊的各個面向。從資料中心到車用系統再到邊緣裝置,加速器不僅佔用更多空間,也消耗更多電力。隨著 AI 的擴展,業界亟需更靈活、更有效率的方式來整合 CPU、NPU、GPU、記憶體和 I/O。

這正是小晶片技術的優勢所在:小晶片支援模組化設計,可獨立地擴展運算單元或記憶體,高效率地實現 SKU 多樣化配置,並且更精準地最佳化功耗/散熱預算。對於小型企業來說,小晶片技術可讓他們無需投入系統單晶片 (SoC) 研發成本、即可進軍應用需求更為複雜的市場。

同時,借助 Arm KleidiAI,Arm 確保開發者可以橫跨雲端到例如樹莓派的邊緣端裝置等各類硬體實作,在一致的 AI 軟體堆疊上運行推論。

生態系工程:Arm 全面設計和 Project Leapfrog

為了支援小晶片的大規模應用,業界不僅要繼續完善規範,還需要產業鏈合作推進。這一項共同訴求催生了 Arm 全面設計 (Arm Total Design) 生態系專案,Arm 結合晶圓代工、設計公司、IP 供應商、EDA 提供商及 OEM 廠商的力量,加速開發經過晶片驗證、具備互通性的小晶片解決方案。

此次合作最具突破性的成果就是 Project Leapfrog。

Project Leapfrog 是一項由多家產業供應商聯合推廣的計畫,以打造基於小晶片的 AI 訓練平台。該平台不僅可媲美 NVIDIA GB200 等單片架構,更在能源效率、擴展性和開放性方面具有顯著優勢。

它的底層技術包括:

  • 運算子系統:ADTechnology 透過使用 Arm Neoverse 運算子系統 (Compute Subsystem, CSS) ,建構針對 AI 密集型工作負載的 64 核小晶片。
  • AI 加速器:由 Rebellions 提供專為深度學習訓練與推論最佳化的高效能加速器小晶片。
  • 結構小晶片:封裝內運算和 AI 引擎的高效互連邏輯。
  • 記憶體和 I/O:借助先進 UCIe 連接,將基於 HBM 的記憶體子系統和先進 I/O 進行整合。
  • 封裝和工藝:運用三星晶圓代工領先的 3nm/4nm 工藝和 2.5D I-Cube 封裝技術。

Project Leapfrog 的突破性不僅展現在硬體上,更在於其協作模式。這證明透過模組化多供應商小晶片組合,同樣能實現媲美垂直整合 SoC 的出色效能。早期測試顯示,Project Leapfrog 成果的能源效率,可優於傳統 GPU 架構 AI 訓練系統的三倍。

這勾勒出半導體產業的未來:專用晶片設計、協同技術創新,以及可大規模實現的效能最佳化。

標準、軟體和未來之路

在硬體不斷進步的同時,產業最大的瓶頸或許在於軟體和系統整合層面。基於小晶片的設計需要採用以下的新方法來實現:

  • 跨分解式元件的安全啟動和遙測
  • 跨小晶片邊界的除錯
  • 韌體模組化和平台支援
  • 晶片前期的系統級驗證

這就是 Arm 開發 CSA 規範的核心動力。該規範彙集 70 多家合作夥伴共同制定,涵蓋安全和遙測介面、韌體啟動序列和一致加速器整合等各種問題,並已於今年初正式發表。針對不同應用場景(如運算到加速器、基於 I/O 的設計),我們創建相應的設定檔,每個方案均包含明確定義的介面和協定。

自該規範發表以來,市場的反應令人振奮。業界對擴展 CSA 應用展現濃厚興趣,特別是在安全實作方案、機密運算,以及汽車與航空航太領域的低延遲即時系統等方面。

此外,Arm 還與新思科技 (Synopsys)、益華電腦 (Cadence) 和西門子 (Siemens) 等 EDA 產業尖端企業合作,共同開發晶片前的建模、協同驗證和模擬環境等解決方案,讓基於小晶片的系統與單片系統一樣穩健可靠。

更令人振奮的是:OEM 廠商已開始就小晶片方案(而不僅僅是 SoC)發出資訊徵詢書 (RFI)。這代表相關市場思維正在生根發芽。

齊頭並進的產業目標

預計五年內,雲端運算、汽車、行動裝置和工業領域的主流企業,都將採用相關的客製晶片方案。而小晶片是讓這一切成為可能的關鍵技術。這不僅僅是一種封裝解決方案,更是企業獲取能效優勢、差異化效能和加速上市的策略驅動力。

這一項轉型不能沒有全產業的合作推進。

小晶片經濟依賴於一個共同願景:可靈活組合的系統、可交互操作的產品和跨企業的通用語言。Arm 致力於透過開放標準、可擴展 IP 和 Project Leapfrog 等實際合作項目,推動這一願景的實現。

我們正朝著共同的目標,一步一腳印,齊頭並進,穩健踏實地建構運算未來。

關於 Arm

Arm 是業界效能最高且最節能的運算平台,其無可比擬的應用範疇觸及全球所有連網使用者。為因應全球對運算永無止境的需求,Arm 提供先進的解決方案,使全球領先的科技公司得以釋放前所未有的 AI 體驗與功能。透過與全球最大的運算生態系及 2,200 萬名軟體開發者的共同努力,我們正在 Arm 平台上建構 AI 的未來。


所有資訊都「依目前情況」提供,且並不帶保證或代表性。此文件可以自由分享,但不得修改且必須註明出處。Arm 是 Arm Limited(或其子公司與附屬機構)的註冊商標。所有品牌或產品名稱均為所屬公司之財產。© 1995-2025 Arm Limited.