SME2 – 利用 Armv9 CPU 进行 AI 加速

优势

为什么 SME2 如此重要？

*在相同条件下与上一代 CPU 集群比较。

特性

专为现代 AI 而打造

请参阅 SME2 文档

开发者

专为开发者打造

SME2 已在 iPhone 16 和基于 M4 的设备上启用，使开发者能够立即开始优化 AI 应用。

得益于一系列前沿的 AI 框架和运行时库（包括 PyTorch、ONNX Runtime、XNNPACK 和 llama.cpp）对 SME2 的原生支持，开发者无需改动任何代码，即可享受 SME2 带来的优势。SME2 带来的性能增强还可移植到基于 Arm 架构的平台上，从 iOS 和 iPadOS 到 macOS，很快也将扩展到 Android。

浏览全新的 Arm SME2 开发者入门指南，了解 SME2 加速和典型用例，并通过分步教程和实践学习路径进行上手。

使用 SME2 开始构建阅读开发者博客

常见问题：SME2

1.什么是 SME2？

SME2（可伸缩矩阵扩展 2）Armv9.3-A 架构中的一组高级 CPU 指令，旨在加速 AI 和 ML 工作负载，特别是矩阵密集型任务，如 LLM 和计算机视觉。它通过 Arm KleidiAI , 与热门 AI 框架无缝集成，无需更改代码即可实现更高的性能和效率。

2. SME2 如何提升设备的 AI 性能？

SME2 通过在 CPU 上直接执行矩阵运算，使大语言模型 (LLM) 的推理速度提高 6 倍，视觉和音频处理速度提高 3 倍，而无需单独的 NPU 或云资源。

3.哪些设备将支持 SME2？

SME2 已部署在 iPhone 16 和 Apple M4 芯片中，with 即将支持 Android 设备。它可从入门级设备扩展到旗舰级设备，确保性能始终如一。

4. SME2 对开发者有何益处？

SME2 可自动与 Pytorch, ONNX Runtime 和 XNNPACK 等框架集成，因此开发者无需重写代码即可加速 AI 工作负载。开发者可以浏览 Arm 移动端 AI 工具链、SDK 和培训资源，以便快速入门。

5. SME2 能否为生成式 AI 应用提供帮助？

绝对适合。SME2 可直接在端侧加速生成式 AI 任务，例如实时翻译、照片/视频增强、音频生成和运动分析。这将带来更快、更私密、更高能效的用户体验。开发者可以借助 Arm 移动端 AI 资源，学习如何实现这些功能。

利用 Arm SME2 加速端侧 AI

为什么 SME2 如此重要？

专为现代 AI 而打造

专为开发者打造

借助 Arm SME2 与 Google Android 提升移动端 AI 性能

最新新闻和资源

利用 Arm Lumex CSS 平台赋能移动端 AI 的未来发展

借助 SME2 提升 Android 应用效率

借助全新 Arm C1 CPU 加速 AI 性能

掌握最新动态

常见问题：SME2

ARM 账户

利用 Arm SME2 加速端侧 AI

AI Summary

为什么 SME2 如此重要？

专为现代 AI 而打造

专为开发者打造

借助 Arm SME2 与 Google Android 提升移动端 AI 性能

最新新闻和资源

利用 Arm Lumex CSS 平台赋能移动端 AI 的未来发展

借助 SME2 提升 Android 应用效率

借助全新 Arm C1 CPU 加速 AI 性能

掌握最新动态

常见问题：SME2