在 Arm 平台上運行 Gemma 4：易於使用、即時且經最佳化的裝置端 AI，協助加速行動應用體驗

April 22, 2026

運行在 Arm 運算平台上的 Gemma 4 可將高速、具備隱私保護、高能源效率的 AI 直接部署到 Android 裝置，開發者能為數十億使用者帶來更豐富的即時應用體驗，無需依賴雲端。

如今，全球數十億智慧手機使用者已將即時輔助、流暢溝通與高度個人化視為基礎體驗。在智慧手機的功耗限制下實現高效能裝置端人工智慧 (AI)，這對規模化地提供即時智慧體驗、釋放 AI 未來潛力相當重要。

Google 近期推出的 Gemma 4 進一步加速了產業向裝置端 AI 轉型的進程，讓開發者能夠輕鬆獲得最佳化後的效能，並將更強大的 AI 體驗直接融入使用者日常使用的各類應用中。想要在全球智慧手機上實現這些優勢，離不開底層算力基礎，而貫穿整個 Android 生態系統的基礎正是 Arm 運算平台。

Gemma 4 全新特性

Gemma 4 進一步提升了裝置端 AI 的效能與能源效率，同時擴展了對 Arm 架構裝置最關鍵的多模態體驗支援，包括邏輯推論、AI 代理的工作流程，以及視聽融合類的應用場景。該模型在文字、音訊* 和圖像功能上全面強化，支援更多語言，並為即時輔助體驗奠定基礎，可在不增加記憶體佔用的情況下，在裝置端實現更靈敏、更符合前言後語的互動。

*僅適用於 E2B (等效 20 億參數) 和 E4B (等效 40 億參數) 版本

探索 Gemma 4 在 Arm CPU 上的效能

在 Arm 早期工程測試中，SME2 在運行 Gemma 4 工作負載時展現出可觀的效能提升。針對 Gemma 4 E2B (等效 20 億參數) 模型的初步測試顯示，預填充階段 (處理使用者輸入) 平均升速 5.5 倍，解碼階段 (生成回覆) 最高升速 1.6 倍，充分展現 Armv9 CPU 創新技術在裝置端 AI 工作負載中的潛力。這些工程測試已包含即將針對 Google XNNPACK 和 Arm KleidiAI 推送的修補。

此類最佳化的早期落地案例來自 Envision，這是一款針對失明與低視力民眾的無障礙應用，目前正評估採用裝置端方案提供更多在裝置上運行體驗。在此之前，Envision 的場景識別功能依賴於雲端連接。而在這個新版原型中，Gemma 4 在啟用 SME2 功能的 Arm CPU 上本地運行，使用者拍攝照片後，能直接在裝置端獲得詳細場景描述，無需連網，也無需將敏感性資料傳出裝置。

這些基於 Arm CPU 的探索充分展現 Arm 運算平台的廣泛靈活性，以及在 CPU 與異質運算路徑上持續創新的潛力。

這樣一來，開發者便能實現更低延遲、更強隱私保護且不受網路狀況影響的更穩定使用者體驗。 從依賴雲端轉向本地推論，對行動應用而言意義重大，既能為開發者降低基礎設施成本、為使用者提升體驗可靠性，還能催生出全新類別的即時應用。

Envision 執行長 Karthik Mahadevan 表示：「Envision 很高興能與 Arm 和 Google 合作，將強大的無障礙體驗直接落實在智慧手機上。在啟用 SME2 的 Arm CPU 上本地運行 Gemma 4 等視覺理解模型，為失明與低視力使用者帶來可靠度高、低延遲的場景描述與視覺問答功能。對我們的使用者來說，離線使用這些功能意義重大，它既能確保技術隨時隨地可用，又能讓更多資料處理留在裝置端，進一步提升隱私安全性。」

Envision 是 Gemma 4 在行動端與 Arm 運算平台相結合的一個早期應用案例。 隨著越來越多的開發者整合 Gemma 4，裝置端 AI 將逐漸成為主流架構，而非小眾選擇。

為何 Arm 對 Android 生態規模化部署裝置端 AI 如此重要

Armv9 架構是目前在安全性、普及度與技術先進程度上均處於領先水準的指令集架構 (ISA)。 Arm 第二代可擴展矩陣延伸指令集 (SME2) 做為 Armv9 架構中的一組先進 CPU 指令，它是一項核心技術，能夠在智慧手機的功耗範圍內高效率地加速矩陣密集型 AI 工作負載。 SME2 已內建於最新 Android 智慧手機搭載的 Arm C1 CPU 中，可實現更高且更穩定的效能，同時提升能源效率。

Arm KleidiAI 是 Arm 推出的軟體加速層，已整合到 Google XNNPACK 等主流 runtime 函式庫，以及 Google LiteRT 和 MediaPipe 等框架中。行動端開發者無需修改現有程式碼、模型或部署管線，即可直接享受 SME2 帶來的效能優勢。 因此，開發者只要針對啟用 SME2 的 Arm 架構 Android 裝置進行開發，就能自動獲得立即可用的效能最佳化。

實際上，這些軟體層面的最佳化會直接轉化為更出色的裝置端體驗。使用者可獲得更快的回應速度、更流暢穩定的互動，以及更可靠的裝置端 AI，同時在模型能力持續強化的情況下，依舊保持電池續航和溫控表現。

Android 工程總監 Sandeep Patil 表示：「想要在 Android 生態系中高效率地落實 Gemma 4，就需要軟硬體深度協同。 我們與 Arm 的合作彰顯了雙方共同推進裝置端 AI 發展的決心，將 Armv9 架構以及 SME2 等內建加速技術的優勢，與 Android 作業系統相結合，規模化地釋放更高的效能和能源效率。我們正攜手降低開發門檻，讓開發者無需修改現有應用，就能為使用者帶來高速、靈敏且兼顧隱私安全的 AI 體驗。」

Arm 與 Google 攜手共築裝置端 AI 未來

隨著越來越多的應用將 AI 遷移到裝置端，Arm 與 Google 將持續為開發者提供易於使用的效能最佳化方案和清晰的指導，協助 Gemma 4 在所有基於 Arm 架構的行動裝置上全面加速應用體驗。

行動端 AI 的未來並非只取決於更大的模型，而在於模型能否在 Android 生態系中高效率地、安全地、廣泛地規模化運行。 透過此次合作，全球數十億 Android 智慧手機使用者都將享受到裝置端 AI 帶來的體驗升級。

關於 Arm

Arm 是 AI 時代的基礎平台，其兼具卓越效能與節能優勢的運算能力，觸及全球所有連網使用者。為因應對運算永無止境的需求，Arm 平台橫跨核心 IP、先進運算子系統及專用晶片，使國際頂尖的科技公司能靈活設計、打造並大規模部署 AI 應用。透過與規模最大的運算生態系及業界超過 2,200 萬名開發者的共同努力，我們正於 Arm 平台上建構 AI 的未來。

Arm 帳號

在 Arm 平台上運行 Gemma 4：易於使用、即時且經最佳化的裝置端 AI，協助加速行動應用體驗