Cortex-R7 是为通过高级硅工艺(从 65 nm 直至 28 nm 及更低)进行产品实现而设计的,重在实现更高能效、实时响应性、高级功能和系统设计的简易化。基于 40 nm G 工艺,Cortex-R7 处理器可以实现以超过 1 GHz 的频率运行,此时它可提供 2,700 Dhrystone MIPS 的性能。
此处理器提供了一个灵活的本地内存系统,此系统支持紧密耦合内存 (TCM) 本地共享内存和外设端口的,可使 SoC 设计人员通过有限的芯片资源满足苛刻的硬实时要求。
(View Larger Cortex-R7 处理器 Image)
Cortex-R7 是为通过高级硅工艺(从 65 nm 直至 28 nm 及更低)进行产品实现而设计的,重在实现更高能效、实时响应性、高级功能和系统设计的简易化。基于 40 nm G 工艺,Cortex-R7 处理器可以实现以超过 1 GHz 的频率运行,此时它可提供 2,700 Dhrystone MIPS 的性能。
此处理器提供了一个灵活的本地内存系统,此系统支持紧密耦合内存 (TCM) 本地共享内存和外设端口的,可使 SoC 设计人员通过有限的芯片资源满足苛刻的硬实时要求。
处理器面积、频率和功耗在很大程度上取决于工艺、库和优化。下表估计了使用高密度、标准性能单元库和 RAM 基于主流工艺技术针对 Cortex-R7 处理器的双处理器实现。
| 双处理器系统 |
28 纳米 |
65 纳米 LP |
|
时钟频率 |
估计 1GHz | 估计 360MHz |
|
性能 (DMIPS) |
估计 4,600 | 估计 1650 |
|
总面积 (sq mm) |
估计 1.7 | 估计 5.3 |
|
功效 (DMIPS/mW) |
估计 > 11 | 估计 > 5 |
特点 |
说明 |
|
微架构 |
带有指令预取、跳转预测、超标量和乱序执行以及寄存器重命名的十一级流水线;用于存取、MAC、移位 ALU、除法和浮点的并行执行路径;2.53 Dhrystone MIPS/MHzARM9、ARM11、Cortex-R4 和 Cortex-R5 嵌入式处理器二进制兼容硬件除法器 |
|
指令集 |
具有 Thumb®-2 和 Thumb 的 ARMv7-R 架构。DSP 扩展。可选浮点单元。 |
|
高速缓存控制器 |
具有可选的集成指令和数据高速缓存控制器的哈佛内存架构。从 4 到 64 KB 的可配置高速缓存大小。高速缓存行是透写的 |
|
紧密耦合内存 |
可选的紧密耦合内存接口。TCM 用在高度群定性以及低延迟的应用中,这些应用可能不会对,比如中断服务程序的指令代码和需要集中处理的数据进行捕获时,做出较好的反应。指令和/或数据 TCM。TCM 大小最高可达 128 KB。 |
|
中断接口 |
一个全面集成的通用中断控制器会提供标准中断、IRQ、非屏蔽快速中断和 FIQ 这些输入,并支持基于复杂优先级的中断处理。此处理器包含低延迟中断技术,通过这种技术,可以中断和重新启动较长的多周期指令。在某些情况下,时间较长的内存访问会发生延迟。最差情况下的中断响应可能低至 20 个周期。 |
|
内存保护单元 |
可选 MPU 可配置十六个区域的属性,每个区域都具有低至 32 字节的分辨率。区域可以重叠,编号最高的区域具有最高优先级。 |
|
浮点单元 |
可选浮点单元 (FPU) 可实现具有 16 个双精度寄存器且符合 IEEE754 的 ARM 矢量浮点架构 VFPv3。支持两种 FPU 选项:仅为单精度,或者兼有单精度和双精度。FPU 性能已针对单精度和双精度计算进行了优化。运算包括加、减、乘、除、乘积累加、平方根、定点和浮点之间的转换,以及浮点常数指令。 |
|
ECC |
针对具有 ECC 位的高速缓存和/或 TCM 内存的可选单比特纠错和两个比特检错。处理器将自动更正单比特软错误。此外,还为管理硬错误提供了完全且灵活的支持。 |
|
主 AMBA AXI 总线 |
2 级内存和外设访问的 64 位 AMBA® AXI™ 总线主设备。 |
|
低延迟内存端口 |
一个专门用于连接到本地内存的 64 位 AXI 主端口。此本地内存提供了 TCM 的诸多优势,可降低速度和功耗,还可轻松地在一致的外设和一个或两个 Cortex-R7 处理器内核之间共享。 |
|
低延迟外设端口 (LLPP) |
一种专用的 32 位 AXI 端口,用于将延迟敏感型外设与处理器更紧密地集成到一起。 |
|
加速器一致性端口 (ACP) |
一种 64 位 AXI 辅助端口,支持处理器和外部智能外设(如 DMA 控制器、以太网或 Flexray 接口)保持一致。 |
|
从属 AXI 总线 |
可选 64 位 AMBA AXI 总线从属设备端口允许 DMA 主设备访问 TCM ,以使数据可以快速流入和流出处理器。 |
|
调试 |
提供了调试访问端口。可以使用 CoreSight SoC-400 扩展其功能。 |
|
跟踪 |
提供了适合连接到 CoreSight 嵌入式跟踪模块的接口。 |
|
双核锁步支持 |
处于锁步模式的冗余 Cortex-R7 CPU 支持可靠的容错/检错系统。配置可综合的 Verilog RTL,易于配置综合选项。 |
ARM 系统 IP、开发工具和物理 IP 可完全实现 Cortex-R7 系统。
CoreLink 和 CoreSight 系统 IP
|
用于 AMBA 3 AXI、AHB-Lite 和 APB 组件的可配置分层低延迟互连。配置的范围可从单个桥组件(如 AHB 到 AXI 协议桥)到不同 AMBA 协议组合中 128 个主设备和 64 个从属设备的大型基础结构。 |
|
QOS-301 |
已添加到 NIC-301 以最大限度地减少平均延迟并保证关键接口(如 DDR 内存)在最坏情况下的延迟和带宽。 |
DMC-34x |
动态内存控制器通过利用 AXI 互连功能优化内存请求调度并使用内置“服务质量”控件管理启动程序的延迟和带宽要求,为 DRAM 提供高效接口。支持的内存类型包括 SDR、DDR、LPDDR(移动 DDR)、eDRAM、DDR2 和 LPDDR2(移动 DDR2)。 |
SMC-35x |
静态内存控制器使用高度可配置的参数将 AXI 互连连接到一系列的非易失性内存。支持的内存类型包括 SRAM、NAND 闪存和 NOR 闪存。 |
L2C-310 |
2 级高速缓存控制器,旨在提升性能的同时降低发送至系统内存的总体流量并因此降低 SoC 功耗。减少对芯片外内存带宽的需求可释放资源以供其他主设备使用。 |
DMA-330 |
一种高度灵活的可微编程直接内存访问控制器,用于高端高性能高能效的基于 AXI 的处理系统。 |
PL192 |
一种 AMBA AHB 高级矢量中断控制器 (VIC),支持高达 32 个具有可编程优先级和屏蔽的矢量中断。 |
GIC390 |
在内存中存储矢量地址的 AMBA AHB 和 AXI 可扩展、可配置、低门数中断控制器。选项包括多处理器和 TrustZone 支持。 |
ETM-R7 |
此嵌入式跟踪宏单元提供了实时指令和数据跟踪,可被配置当处理器全速运行时去捕获特定事件之前及之后的信息。 |
CoreSight SoC-400 |
全面的调试和跟踪设计工具,包括 CoreSight SoC 组件(调试访问端口、交叉触发逻辑、跟踪接口等)以及用于快速而强大的系统设计及实现的设计和验证环境。 |
开发工具
ARM Development Suite 5 (DS-5™) 工具套件以及广泛的第三方工具、操作系统和 EDA 流程完全支持所有 Cortex-R 处理器。ARM DS-5 软件开发工具具有独一无二的能力,可提供能够充分利用完整 ARM 技术组合优势的解决方案。特定于 Cortex-R7 的工具包括:
ARM DS-5 |
已针对 Cortex-R7 进行优化的具有 Thumb-2 的 ARM 编译器 5.0。 |
|
免除专利使用费的、具有确定性的 RTOS(带有源代码),用于以低中断延迟和灵活的调度进行高速实时运算。占用空间小,适用于资源受限制的系统;多线程和线程安全运算;MDK-ARM 中具有内核可识别的调试支持。 |
物理 IP
ARM 优化的物理 IP 平台,用于基于领先的半导体工艺技术获得 Cortex-R7 的同类最佳实现。
|
ARM 标准单元库在多种不同的架构中可用,支持一个适用于所有 SoC 设计类型的、十分广泛的性能范围。设计人员可以选择不同的库,并针对速度、功耗和/或面积优化其设计。 |
|
内存编译器和寄存器 |
各种不同的经过硅验证的 SRAM、寄存器文件和 ROM 内存编译器,它们适用于所有类型的 SoC 设计,包括性能关键应用以及成本敏感和低功耗应用。 |
接口 IP |
为符合不断变化的系统架构和标准而设计的一系列硅验证接口 IP。通用 I/O、专用 I/O、高速 DDR 和串行接口经过优化,可以通过低针数实现高数据吞吐量性能。 |
Delivering real-time, high-performance embedded systems with the ARM Cortex-R processors (March 2011)
New Cortex-R Processors for LTE and 4G Mobile Baseband (680Kb PDF)
New ARM Cortex-R Technology for Safe and Reliable Systems (570Kb PDF)