基於 Arm Neoverse 的 Cobalt 100 虛擬機器提升關鍵工作負載的效能與能效

December 11, 2025

實際基準測試顯示,基於 Arm Neoverse 平台的 Microsoft Azure Cobalt 100 執行個體,在資料庫、網路和量化金融工作負載方面,效能表現優於基於 AMD 的執行個體。

自從微軟推出基於 Arm 架構的 Azure Cobalt 100 虛擬機器 (VM) 以來,已有眾多客戶選擇這款新執行個體運行各類應用。目前,Cobalt 100 虛擬機器已在全球微軟 Azure 雲端運算服務的 32 個地區上線,並且持續快速擴展,為次世代資料中心工作負載帶來效能、能源效率和可擴展性的大幅提升。這些提升源自於專為促成現代雲端原生應用設計的創新 Arm Neoverse 運算子系統 (Compute Subsystems, CSS) ,能實現更高的輸送量和更低的能耗。

包括 One Trust 和 Databricks 在內的領先軟體供應商對於該款執行個體均給予高度認可,強調不僅能顯著提升效能和能源效率,還有助於節省成本。這與產業向異質運算架構轉型的趨勢相契合,Arm 可擴展且具備高能源效率的運算平台,讓超大規模雲端服務提供者在滿足日益成長的效能需求時,不必犧牲永續發展目標。同時,Teams 和 Microsoft Defender for Endpoint 等微軟服務在此類執行個體上的效能最高提升了 45%。

Arm 近期在 Cobalt 100 執行個體上,對記憶體中資料庫、Web 伺服器和量化金融等多項工作負載進行了基準測試,並和基於 AMD Genoa 的 Azure 執行個體進行比較。測試結果明確地展現了在基於 Arm 架構的 Azure Cobalt 100 虛擬機器上運行工作負載,能獲得的效能與能源效率提升,也印證了 Cobalt 100 的設計目標:提供顯著的性價比優勢、廣泛適用於各類工作負載,以及大幅節約成本。

在 Cobalt 100 上通用工作負載的效能提升

Redis 仍是現代分散式應用的核心元件,尤其是在即時資料處理和快取方面。D4ps_v6 Cobalt 100 執行個體在效能和性價比上表現亮眼,與 AMD Genoa D4as_v6 執行個體相比,效能提升 48%,性價比提高 91%。這充分體現在微服務和對延遲敏感的即時資料交互主導的雲端原生應用軟體堆疊中,Arm 架構能有效提升實際運行效能。

同時,對 Nginx 等 Web 基礎設施和網路工作負載的測量,顯示了 Cobalt 100 在運算、記憶體和 I/O 方面具有均衡的效能。基準測試顯示,在負載均衡方面,基於 Arm 架構的 D4ps_v6 Cobalt 100 執行個體與 AMD Genoa D4as_v6 執行個體相比,效能提升 53%,性價比提高 99%。

最後,在 QuantLib(一個用於金融工具建模、定價和風險管理的開源量化金融庫)的 GCC/G++-15 基準測試中,D4ps_v6 Cobalt 100 執行個體相較於 AMD Genoa D4as_v6 執行個體,效能提升 47%,性價比提高 89%。


Cobalt 100 上通用工作負載的效能資訊圖表


能源效率、可擴展性與實際價值

Arm 與 Microsoft Azure 在創新技術方面不斷保持密切合作,包括近期 Cobalt 200 處理器的推出。雙方的合作展示了基於 Arm 架構的客製晶片正協助 AI 驅動的雲端基礎設施,規模化地實現新的效能與能源效率水準。

Cobalt 100 執行個體延續 Arm 為人熟知的能源效率優勢——在效能提升的同時,能耗並沒有等比例增加。此一特性讓雲端運算營運商和雲端服務客戶都能獲得更好的性價比。例如,ONNX Runtime 中的 Arm 最佳化與 Cobalt 100 處理器相結合,大幅提升大語言模型 (LLM) 推論的 AI 效能,與基於 AMD Genoa 的執行個體相比,效能最高提升 1.9 倍,性價比最多提高 2.8 倍

無論客戶是運行高頻率交易系統、快取層、API 前端還是 Java 微服務,Cobalt 100 都能提供卓越的效能與能源效率,協助客戶自信地推進未來的規模化發展。 隨著 Arm 生態系在軟體、工具和晶片合作夥伴方面的持續拓展,開發者將受惠於此一專為雲端運算長期創新和永續發展打造的平台。

備註

所有基準測試結果均在可控且可重複的測試環境中取得,採用最新可用的軟體與平台配置。測試基於 Ubuntu 25.04 系統機型,所有對比平台(Cobalt100、Genoa 和 Emerald Rapids)均使用一致的核心 (Kernel)、編譯器與 runtime 環境。每項工作負載均執行多次,以確保測量結果的一致性和統計有效性。

通用測試原則

所有平台的基準測試均採用相同的執行緒數、用戶端配置和 runtime 參數NUMA 和記憶體設置按執行個體類型進行一致化設置; HugePages、THP 與 swapiness 設置進行了標準化。所有系統均使用相同的作業系統映像、編譯器版本 (GCC/G++ 15.0.1) 和函式庫版本 (OpenSSL 3.4.1, GlibC 2.41)。

基準測試範圍

  • Redis、PostgreSQL 和 MySQL:透過 Memtier 和 HammerDB (TPROC-C) 測量輸送量和每美元輸送量。
  • SPECjbb 2015:在 Ubuntu 25.04 上使用 OpenJDK 21,評估綜合效能、max-jOPS 和 critical-jOPS /$。
  • Nginx:使用 wrk 工具,在固定連接數和執行緒數的條件下,測量第 99 百分位元延遲下的 HTTPS 負載均衡輸送量。
  • QuantLib:採用 GCC 15 與供應商 LLVM 工具鏈建構金融分析工作負載,分別測量單執行緒與使能所有 vCPU 時的效能。

關於 Arm

Arm 是業界效能最高且最節能的運算平台,其無可比擬的應用範疇觸及全球所有連網使用者。為因應全球對運算永無止境的需求,Arm 提供先進的解決方案,使全球領先的科技公司得以釋放前所未有的 AI 體驗與功能。透過與全球最大的運算生態系及 2,200 萬名軟體開發者的共同努力,我們正在 Arm 平台上建構 AI 的未來。


所有資訊都「依目前情況」提供,且並不帶保證或代表性。此文件可以自由分享,但不得修改且必須註明出處。Arm 是 Arm Limited(或其子公司與附屬機構)的註冊商標。所有品牌或產品名稱均為所屬公司之財產。© 1995-2025 Arm Limited.