Arm 计算子系统 (CSS) 是什么?
AI Summary
Arm 计算子系统 (CSS) 是预先集成并根据市场进行了调整的子系统,它结合了优化的计算、互连和系统 IP。Arm CSS 不是一个单一的、静态产品;它是一种交付 Arm 技术产品组合的现代化方式,专为移动端、基础设施和汽车等关键市场而打造。它们帮助合作伙伴缩短设计周期,加快产品上市时间 (TTM),并实现出色的性能。从云到边缘侧,CSS 提供了开创下一代创新所需的速度、灵活性和 AI 就绪基础。
为什么 Arm 计算子系统 (CSS) 如此重要?
CSS 实现以平台为核心的方法,帮助合作伙伴克服设计复杂性,减少集成时间和成本。合作伙伴无需从零开始组装核心、内存、安全防护和互连,而是从根据其目标应用定制的、经过验证的计算基础开始入手。
Arm CSS 的优势:
加速开发
合作伙伴报告产品上市时间 (TTM) 最多可缩短 12 个月。
降低成本和工作量
节省数千万美元的非经常性工程费用 (NRE)。
针对 AI 进行了优化
所有市场中面向未来的计算。
可定制基础
旨在支持差异化设计。
跨市场可扩展性
从云到边缘侧。
Arm 计算子系统由哪些部分组成?
Arm 计算子系统 (CSS) 包含构建高性能、可扩展 SoC 所需的基本计算组件,这些组件已预先集成,以降低设计复杂性并加速交付。虽然每种实现方式都针对特定的市场用例,但每个 CSS 通常都包含:
针对各个市场量身定制的最新一代核心(例如,Arm Neoverse 平台、Arm Cortex-A CPU 和 汽车增强 (AE) IP)。
CMN 网格或 CoreLink 可优化带宽和可扩展性。
内存控制器、中断控制器、SMMU 和安全元件。
根据平台需求,采用 Arm Mali GPU、ISP 和 NPU 接口。
参考软件栈可实现软件快速启动。
芯片合作伙伴的布局规划、功耗/性能目标和可配置性。
这些组件作为经过验证并根据市场进行了调整的计算基础架构的一部分交付,该基础架构是每个 Arm 平台的核心。
Arm 计算子系统 (CSS) 如何使用
-
云和基础设施
-
移动端
-
汽车
Arm Neoverse CSS
Arm Neoverse CSS 赋能云、AI 和 5G 高性能、高能效 SoC。它能够实现可扩展、可定制的基础设施,并在各种工作负载中保持一致的架构。
它集成了 Neoverse CPU、CMN 网格互连、系统 IP 和支持性软件。专为以下用途打造:
- 数十到数百个核心
- AI、云、电信和 5G 工作负载
- 系统配置可将芯片上市时间最多缩短 13 个月
采用公司:亚马逊、Google、微软、ADTechnology、NeuReality 和 XSight Labs
Arm Lumex CSS 平台
Arm Lumex CSS 将 Armv9 CPU、Mali GPU 和先进的工艺技术相结合,为智能手机、笔记本电脑和 AR/VR 提供优异的性能,适应任何外形尺寸或工作负载。
它包括 Armv9 CPU、Mali GPU、物理 IP 和高速缓存。主要优势包括:
- 3nm 上提供旗舰级性能与能效
- 可根据手机、笔记本电脑和 AR/VR 进行定制
- 三星已经采用了此平台(例如,Galaxy Z Flip 7)。
Arm Zena CSS
Zena CSS 为 SDV、ADAS 和 IVI 提供安全认证的计算,集成安全、安全防护和 AI 加速,帮助汽车制造商加快开发速度并实现平台标准化。
Zena CSS 基于 Armv9-AE 技术构建,采用:
- Cortex-A CPU、汽车增强 (AE) IP、安全岛和安全飞地
- 可选 GPU/ISP 和支持自定义逻辑
- 符合 ISO 26262 和 ISO 21434 标准
- SDV、ADAS 和 IVI 系统中的用例
Arm 计算子系统 (CSS) 的实际成果
Arm 计算子系统 (CSS) 为世界上一些先进的移动端和 AI 体验提供助力,帮助合作伙伴提升性能、效率和加速创新。
Arm 计算子系统 (CSS) 最新新闻和资源
- 新闻和博客
Arm 计算子系统 (CSS):常见问题
目前哪些公司在使用 CSS?
微软 (Neoverse CSS)、三星(终端 CSS)以及使用 Zena CSS 的领先汽车 OEM。
CSS 如何缩短芯片上市时间?
CSS 提供经过验证的计算基础,无需定制集成和验证,缩短了数月的开发时间。
CSS 可以定制吗?
是。合作伙伴可以根据具体产品目标定制内存、加速器和系统配置。
为什么公司纷纷转向基于芯粒的设计?
随着 AI 工作负载的扩展,基于芯粒的设计有助于克服单芯片 SoC 的局限性。通过将计算、内存和加速器分离到模块化晶粒中,公司可以提高能效比,降低设计复杂性,并加快迭代速度。
结合 Arm 计算子系统 (CSS) 和标准化芯粒互连,这种方法能够提供高性能 AI 芯粒,风险更低和上市时间 (TTM) 更快。
与传统 SoC 设计相比,芯粒究竟改变了什么?
芯粒将 AI 芯片设计从单个单片芯片转变为模块化方法,其中计算、内存、I/O 和加速器作为单独晶粒进行构建和扩展。这提高了效率,减轻功耗和散热限制,并实现了更快的迭代。结合 Arm 计算子系统 (CSS) 和芯粒系统架构 (CSA),芯粒能够提供高性能,成本和风险更低,开发时间更短,优于完全定制的 SoC。
关键要点
Key Takeaways
- CSS 助推以平台为核心的 Arm 战略,为基础设施、客户端、汽车和新兴市场提供计算基础。
- 上市时间 (TTM) 显著缩短,合作伙伴报告称芯片交付时间快 12 个月,并节省了数百万美元的非经常性工程费用。
- 每个 CSS 都是预先集成并根据市场进行了调整,包括 CPU、互连、系统 IP 和支持固件。
- 已用于包括微软、三星和领先的汽车 OEM 在内的众多公司 SDV、云和 AI 赋能设备的实际部署。
- CSS 具有高度可配置性和可定制性,使合作伙伴能够根据所有市场的特定产品目标来定制性能、集成和功能。