加速边缘侧 AI 创新
边缘侧 AI 数据处理工作负载已为各类用例和用户体验带来巨大改变。第三代 Ethos NPU 将助力满足未来边缘侧 AI 用例的需求。
Ethos-U85 支持在边缘侧运行基于 Transformer 的模型,是新一代语言模型和视觉模型的基础,MAC 单元从 128 个扩展到 2048 个,能效相较于 Arm Ethos-U55 和 Arm Ethos-U65 提高 20%,能够以可持续的方式助力实现更高性能的边缘侧 AI 用例。Ethos-U85 沿用前几代 Ethos-U 的工具链,合作伙伴因此能够实现无缝迁移,充分发挥基于 Arm 架构的现有机器学习 (ML) 工具的价值。
特性与优势
能效相较于 Ethos-U55 和 Ethos-U65 提高 20%,能够以可持续的方式助力实现未来用例。
MAC 单元从 128 个扩展到 2048 个,在 1 GHz 下实现高达 4 TOP 的性能。
原生支持 Transformer 网络,同时兼容标准化的张量算子集架构 (TOSA)。
由 Arm Corstone-320 提供支持的参考设计,整合了统一工具链和庞大的 Ethos-U 生态系统。
Ethos-U85 规格
Arm Ethos-U85 是 Arm Ethos-U NPU 系列中性能最高的实现方案。Ethos-U85 支持基于 Transformer 的模型,有效增强边缘侧 AI 处理,同时相较于前几代 Ethos,能效提升了 20%。Ethos-U85 的主要特性包括:
- 可扩展性能 - 256 GOP/s,1 GHz 频率时高达 4 TOP
- 从 128 扩展到 2048 个 MAC
- 进一步降低能耗 - 相较于之前的 Ethos-U NPU 降低 20%
- 原生支持基于 Transformer 的网络
Ethos-U85 适用于多种应用,既可用于高性能 Arm Cortex-A,也可部署在基于 Arm Cortex-M 的低功耗嵌入式设备中。
重要文档
比较所有 Ethos-U 处理器:下载规格比较 PDF 文件
助力芯片设计实现成功的基础
Arm Compute Library (ACL)
ACL 软件库整合了针对 Arm Cortex-A CPU 和 Arm Mali GPU 优化的底层函数,用于支持主流图像处理、计算机视觉和 ML 应用。与 OSS 替代方案相比,ACL 软件库可实现显著的性能提升,并可基于宽松的 MIT 开源技术授权许可免费使用。
CMSIS-NN
CMSIS-NN,全称“通用微控制器软件接口标准 - 高效神经网络实现”,是一套高效的神经网络内核,旨在充分提高神经网络在 Cortex-M 处理器内核上的运行性能,同时尽可能缩减内存占用。
Arm NN
Arm NN 弥合了现有 NN 框架和底层 IP 之间的技术断层,支持对 TensorFlow 和 Caffe 等现有神经网络框架进行高效转换,确保无需修改,即可直接在 Arm Cortex-A CPU、Arm Mali GPU 和 Ethos-N NPU 上高效运行此类框架。



