深入瞭解 Armv9 架構特性及優勢,運用 Arm Cortex-A320 迎接產業未來革新
瞭解首個基於 Armv9 架構的超高效率 CPU Arm Cortex-A320 如何為物聯網市場帶來先進的 Armv9 特性和優勢。
作者:Arm 物聯網事業部軟體產品管理總監 Christophe Fava-Rivi
Arm Cortex-A320 CPU 的推出具有重要的里程碑意義:做為首個基於 Armv9 架構的超高效率 CPU,此一突破性的處理器為功耗有限的裝置,導入了之前只在尖端行動運算解決方案中使用的先進功能,使其在人工智慧(AI)處理、安全性和整體效率方面均達到顯著提升。
由於已有其他 Arm 處理器在為多樣化的邊緣端和終端點裝置提供良好支援,為何還要將 Armv9 功能導入一款服務相同目標裝置的處理器技術中呢?答案是「時機」。
當今的物聯網(IoT)環境對邊緣裝置的需求更勝以往。智慧攝影機需要在本地運行複雜的電腦視覺演算法;工業感測器須處理複雜的機器學習(ML)模型以進行預測性維護;即使是簡單的終端裝置,也越來越離不開強化的安全性和虛擬化功能。這些不斷變化的需求使得 Armv9 的先進功能不再只是「有了也不錯」的錦上添花,而是新一代物聯網創新的必備條件。
Armv9 架構將 Cortex-A320 的革新功能帶到了邊緣端,透過可擴展向量延伸指令集(SVE2)等關鍵的 Armv9 特性,強化了 AI 和數位訊號處理(DSP)效能;同時,它還運用了記憶體標籤擴充(MTE) 以及透過 Secure EL2(S-EL2)提供的先進虛擬化支援等全面的安全特性。這些功能與 Cortex-A320 高效率的微架構相結合,使其能夠維持嚴格的能耗預算,並同時為邊緣 AI 處理開創新的可能性。
讓我們一同來跟隨本文探索這些功能。
採用通用 Armv9 架構的優勢
Armv9 架構的一大突出的特性是支援 SVE2。SVE2 有助於提升 DSP 任務效能,該特性使得處理複雜演算法更加快速、更有效率。這對於 AI 和 ML 工作負載等需要高算力的應用特別有幫助。借助 SVE2,智慧攝影機可以更有效率地處理視訊流,語音介面能夠以更低的延遲進行自然語言處理,而工業感測器則可在保持長時間電池續航的同時,運行複雜的分析演算法。
請參閱:
Cortex-A320 先進的安全性
安全性在當今的數位時代極為重要。為滿足這一需求,Cortex-A320 採用了 MTE、指標驗證(PAC)和分支目標識別(BTI)等先進的安全特性,並一起協作發揮作用,以防禦各種網路安全威脅。
MTE 有助於檢測和減少 C/C++ 程式中常見的記憶體安全性漏洞。透過對記憶體分配進行標記,並在存取時檢查這些標記,MTE 可以識別並防範潛在的安全性漏洞。PAC 透過確保函數指標和返回位址的完整性,為系統增加了一層額外的安全保護,以減少攻擊者利用軟體漏洞的機會。而 BTI 則是透過確保間接分支僅指向有效位置,來保護系統免受控制流攻擊。
請參閱:
- 通過 MTE 強化安全性
- 針對 Linux 的 AArch64 上啟用 PAC 和 BTI(上)
- 針對 Linux 的 AArch64 上啟用 PAC 和 BTI(中)
- 針對 Linux 的 AArch64 上啟用 PAC 和 BTI(下)
- 架構學習 - 為複雜軟體提供保護
S-EL2 虛擬化增強隔離性
虛擬化是現代運算中的一項關鍵技術,它能夠高效率的運用資源並改善不同工作負載之間的隔離性。Cortex-A320 支援 S-EL2 虛擬化,強化了在同一硬體上運行的虛擬機器之間的隔離性。這在多使用者的環境中尤為重要,因為在此類環境中,不同的使用者或應用程式共用相同的物理資源。
S-EL2 為虛擬機器提供了一個安全的執行環境,可確保敏感性資料和操作不受其他虛擬機器以及底層虛擬機器監控程式的影響。該級別的隔離對於維護雲端運算和邊緣運算場景中資料的完整性和機密性相當重要。
為了保護敏感性資料和程式碼免受未經授權的存取,TrustZone 是 Arm 處理器內建的安全特性,它創建了一個獨立且受保護的環境,確保關鍵任務與潛在威脅隔離運行。另一個選擇是 Hafnium,這是一個針對 Arm A 系列處理器的安全韌體參考實作,為受信任的應用提供堅實基礎,並強化了系統對網路威脅的防護。
請參閱:
SVE2 提升 DSP 效能
SVE2 對於提升 Cortex-A320 的 DSP 能力至關重要。DSP 任務在音視訊處理、通訊及科學運算等眾多應用中必不可少。SVE2 透過導入一系列新指令和資料類型,優化了這些任務的處理效能,進而進一步擴展了 Armv9 架構的功能。
例如,SVE2 導入了用於矩陣乘法的新指令,這一操作是許多 ML 演算法的基礎。這些指令使得處理大資料集變得更加快速和有效率,進而提高了 ML 工作負載的效能。此外,SVE2 還支援如 BF16 等專為 ML 和 AI 應用優化的新資料類型。
請參閱:
運用龐大的 Armv9 軟體生態系
Cortex-A320 的一大優勢在於,它與廣泛的 Armv9 軟體生態系的相容性。該生態系涵蓋一系列專為新一代邊緣 AI 開發和優化的工具、函式庫和框架,如高度優化的編譯器(包括支援迴圈優化的 LLVM、加密和 SIMD)等。超過 2,000 萬名的 Arm 開發人員均能借助此一生態系,充分受惠於最新的軟體技術進展,進而加速其應用的開發。
Armv9 軟體生態系支援 Linux 和 Android 等主流的作業系統,並能夠提供更出色的效能和安全特性,以及容器化和雲端開發方法。開發人員可存取 Arm 廣泛的工具和資源,高效率地建構和部署相關應用。
請參閱:
運行即時操作系統
Cortex-A320 相容 Zephyr 等即時操作系統(RTOS),使其在物聯網和嵌入式應用中的用途更為廣泛。Zephyr 是一款專為資源有限裝置設計的可擴展 RTOS,支援多種硬體架構和通訊協定,能夠促進高效率且可靠的開發。
Kleidi 增強邊緣 AI 效能
Arm KleidiAI 是一款輕量的開源 AI 庫。受惠於關鍵的 ML 框架和運行時整合,其優化並加速了Cortex-A320 上的 AI 工作負載,使開發人員能夠利用 Armv9 架構的先進功能和靈活性。Kleidi 優化了跨不同工作負載的軟體級效能,以充分發揮 Arm CPU 上的 AI 加速。其高度優化的核心提升了 ExecuTorch、LiteRT(前身為 Tensorflow Lite)等主流 AI 框架效能,進而實現了更快速的邊緣 AI 執行,以及 CPU 和 NPU 間順暢的工作負載靈活性。
現在,Arm Kleidi 將擴展至物聯網領域,為新一代邊緣 AI 應用釋放 CPU 效能。Kleidi 在嵌入式和物聯網應用場景中實現了顯著的效能加速。例如,在 Llama.cpp 上運行微軟的 Tiny Stories 小型語言模型時,Cortex-A320 的效能提升了近 70%。這一強大的組合簡化了 AI 開發,並加速了數十億裝置的效能,使開發人員能夠更輕鬆地在適當的時間和位置上,執行合適的 AI 工作負載。
請參閱:
Cortex-A320 塑造物聯網的未來
Cortex-A320 CPU 的推出,為運算技術的演進歷程中立下一個重要里程碑。憑藉其先進的特性和強大的架構,Cortex-A320 有望革新物聯網產業,並為未來的創新應用做好準備。廣泛採用的通用 Armv9 架構、強化的安全特性、S-EL2 虛擬化、借助 SVE2 提升的 DSP 效能、與龐大的 Armv9 軟體生態系的相容性、對 Zephyr 等 RTOS 的運行支援,以及 Arm Kleidi 的導入,使其成為開發人員和企業的理想之選。
將 Armv9 功能導入超高效率裝置,為邊緣端的創新開闢了全新的可能性。開發人員現在可以構思並打造以前在功耗有限環境中無法實現的應用,譬如在本地運行複雜 AI 的智慧攝影機、即時處理複雜 ML 模型的工業系統,以及在不犧牲電池續航情況下,實現企業級安全性的物聯網裝置。
無論你正在開發物聯網解決方案、AI 和 ML 應用,還是在建構安全運算環境,Cortex-A320 都能為你提供 AI 時代所需的工具和能力。點擊此處,瞭解更多有關 Cortex-A320 的資訊,以及其卓越效能、安全性和效率,如何為物聯網領域帶來的變革性影響。
關於 Arm
Arm 是業界效能最高且最節能的運算平台,其無可比擬的應用範疇觸及全球所有連網使用者。為因應全球對運算永無止境的需求,Arm 提供先進的解決方案,使全球領先的科技公司得以釋放前所未有的 AI 體驗與功能。透過與全球最大的運算生態系及 2,000 萬名軟體開發人員的共同努力,我們正在 Arm 平台上建構 AI 的未來。
所有資訊都「依目前情況」提供,且並不帶保證或代表性。此文件可以自由分享,但不得修改且必須註明出處。Arm 是 Arm Limited(或其子公司與附屬機構)的註冊商標。所有品牌或產品名稱均為所屬公司之財產。© 1995-2025 Arm Limited.