在 Arm 平台上運行 Gemma 4:易於使用、即時且經最佳化的裝置端 AI,協助加速行動應用體驗
運行在 Arm 運算平台上的 Gemma 4 可將高速、具備隱私保護、高能源效率的 AI 直接部署到 Android 裝置,開發者能為數十億使用者帶來更豐富的即時應用體驗,無需依賴雲端。
如今,全球數十億智慧手機使用者已將即時輔助、流暢溝通與高度個人化視為基礎體驗。在智慧手機的功耗限制下實現高效能裝置端人工智慧 (AI),這對規模化地提供即時智慧體驗、釋放 AI 未來潛力相當重要。
Google 近期推出的 Gemma 4 進一步加速了產業向裝置端 AI 轉型的進程,讓開發者能夠輕鬆獲得最佳化後的效能,並將更強大的 AI 體驗直接融入使用者日常使用的各類應用中。想要在全球智慧手機上實現這些優勢,離不開底層算力基礎,而貫穿整個 Android 生態系統的基礎正是 Arm 運算平台。
Gemma 4 全新特性
Gemma 4 進一步提升了裝置端 AI 的效能與能源效率,同時擴展了對 Arm 架構裝置最關鍵的多模態體驗支援,包括邏輯推論、AI 代理的工作流程,以及視聽融合類的應用場景。該模型在文字、音訊* 和圖像功能上全面強化,支援更多語言,並為即時輔助體驗奠定基礎,可在不增加記憶體佔用的情況下,在裝置端實現更靈敏、更符合前言後語的互動。
*僅適用於 E2B (等效 20 億參數) 和 E4B (等效 40 億參數) 版本
探索 Gemma 4 在 Arm CPU 上的效能
在 Arm 早期工程測試中,SME2 在運行 Gemma 4 工作負載時展現出可觀的效能提升。針對 Gemma 4 E2B (等效 20 億參數) 模型的初步測試顯示,預填充階段 (處理使用者輸入) 平均升速 5.5 倍,解碼階段 (生成回覆) 最高升速 1.6 倍,充分展現 Armv9 CPU 創新技術在裝置端 AI 工作負載中的潛力。這些工程測試已包含即將針對 Google XNNPACK 和 Arm KleidiAI 推送的修補。
此類最佳化的早期落地案例來自 Envision,這是一款針對失明與低視力民眾的無障礙應用,目前正評估採用裝置端方案提供更多在裝置上運行體驗。在此之前,Envision 的場景識別功能依賴於雲端連接。而在這個新版原型中,Gemma 4 在啟用 SME2 功能的 Arm CPU 上本地運行,使用者拍攝照片後,能直接在裝置端獲得詳細場景描述,無需連網,也無需將敏感性資料傳出裝置。
這些基於 Arm CPU 的探索充分展現 Arm 運算平台的廣泛靈活性,以及在 CPU 與異質運算路徑上持續創新的潛力。
這樣一來,開發者便能實現更低延遲、更強隱私保護且不受網路狀況影響的更穩定使用者體驗。 從依賴雲端轉向本地推論,對行動應用而言意義重大,既能為開發者降低基礎設施成本、為使用者提升體驗可靠性,還能催生出全新類別的即時應用。
Envision 執行長 Karthik Mahadevan 表示:「Envision 很高興能與 Arm 和 Google 合作,將強大的無障礙體驗直接落實在智慧手機上。在啟用 SME2 的 Arm CPU 上本地運行 Gemma 4 等視覺理解模型,為失明與低視力使用者帶來可靠度高、低延遲的場景描述與視覺問答功能。對我們的使用者來說,離線使用這些功能意義重大,它既能確保技術隨時隨地可用,又能讓更多資料處理留在裝置端,進一步提升隱私安全性。」
Envision 是 Gemma 4 在行動端與 Arm 運算平台相結合的一個早期應用案例。 隨著越來越多的開發者整合 Gemma 4,裝置端 AI 將逐漸成為主流架構,而非小眾選擇。
為何 Arm 對 Android 生態規模化部署裝置端 AI 如此重要
Armv9 架構是目前在安全性、普及度與技術先進程度上均處於領先水準的指令集架構 (ISA)。 Arm 第二代可擴展矩陣延伸指令集 (SME2) 做為 Armv9 架構中的一組先進 CPU 指令,它是一項核心技術,能夠在智慧手機的功耗範圍內高效率地加速矩陣密集型 AI 工作負載。 SME2 已內建於最新 Android 智慧手機搭載的 Arm C1 CPU 中,可實現更高且更穩定的效能,同時提升能源效率。
Arm KleidiAI 是 Arm 推出的軟體加速層,已整合到 Google XNNPACK 等主流 runtime 函式庫,以及 Google LiteRT 和 MediaPipe 等框架中。行動端開發者無需修改現有程式碼、模型或部署管線,即可直接享受 SME2 帶來的效能優勢。 因此,開發者只要針對啟用 SME2 的 Arm 架構 Android 裝置進行開發,就能自動獲得立即可用的效能最佳化。
實際上,這些軟體層面的最佳化會直接轉化為更出色的裝置端體驗。使用者可獲得更快的回應速度、更流暢穩定的互動,以及更可靠的裝置端 AI,同時在模型能力持續強化的情況下,依舊保持電池續航和溫控表現。
Android 工程總監 Sandeep Patil 表示:「想要在 Android 生態系中高效率地落實 Gemma 4,就需要軟硬體深度協同。 我們與 Arm 的合作彰顯了雙方共同推進裝置端 AI 發展的決心,將 Armv9 架構以及 SME2 等內建加速技術的優勢,與 Android 作業系統相結合,規模化地釋放更高的效能和能源效率。我們正攜手降低開發門檻,讓開發者無需修改現有應用,就能為使用者帶來高速、靈敏且兼顧隱私安全的 AI 體驗。」
Arm 與 Google 攜手共築裝置端 AI 未來
隨著越來越多的應用將 AI 遷移到裝置端,Arm 與 Google 將持續為開發者提供易於使用的效能最佳化方案和清晰的指導,協助 Gemma 4 在所有基於 Arm 架構的行動裝置上全面加速應用體驗。
行動端 AI 的未來並非只取決於更大的模型,而在於模型能否在 Android 生態系中高效率地、安全地、廣泛地規模化運行。 透過此次合作,全球數十億 Android 智慧手機使用者都將享受到裝置端 AI 帶來的體驗升級。
關於 Arm
Arm 是 AI 時代的基礎平台,其兼具卓越效能與節能優勢的運算能力,觸及全球所有連網使用者。為因應對運算永無止境的需求,Arm 平台橫跨核心 IP、先進運算子系統及專用晶片,使國際頂尖的科技公司能靈活設計、打造並大規模部署 AI 應用。透過與規模最大的運算生態系及業界超過 2,200 萬名開發者的共同努力,我們正於 Arm 平台上建構 AI 的未來。
所有資訊都「依目前情況」提供,且並不帶保證或代表性。此文件可以自由分享,但不得修改且必須註明出處。Arm 是 Arm Limited(或其子公司與附屬機構)的註冊商標。所有品牌或產品名稱均為所屬公司之財產。© 1995-2026 Arm Limited.