Login

Important information

本网站使用cookie来存储信息在您的计算机上。继续使用我们的网站,您必須同意我们 cookies.

ARM网站使用两款浏览器缓存数据(cookie):(1)缓存数据(cookie)可以使网站按需要完成功能执行 (2)分析性缓存数据(cookie)在用户登录网站时会进行匿名记录和数据分析。如果您不希望应用这些缓存数据(cookie),请通过查阅我们的安全隐私政策获知如何设置禁用缓存数据(cookie)。网站的某些功能会因设置禁用缓存数据(cookie)不能使用。

Cortex-R4 处理器

Cortex-R4 处理器 Image (View Larger Cortex-R4 处理器 Image)

Cortex™-R4 处理器是第一款基于 ARMv7-R 架构的深度嵌入式实时处理器。它用在产量高、深度嵌入式的片上系统,例如,可用于硬盘驱动器控制器、无线基带处理器、消费类产品和汽车系统的电子控制单元。

Cortex-R4 提供的性能、实时响应性大大高于同类中的其他处理器,它提供的功能也远远多于同类中的其他处理器。此处理器为 ASIC、ASSP 和 MCU 嵌入式应用提供出色的能效和成本效益。并且,可以在合成时配置 Cortex-R4 处理器以优化其功能集以便精确匹配应用需求。

 


Cortex-R4 是成熟的处理器,于 2006 年 5 月投放市场,如今已在数百万的 ASIC、ASSP 和 MCU 设备中使用。它是高性能实时 SoC 的标准,取代了许多基于 ARM9 和 ARM11 处理器的设计。

Cortex-R4 是为在高级硅工艺(从 90 纳米到 20 纳米,甚至更低)上实现而设计的,重在实现更高能效,实时响应性,高级特性以及系统设计简易化。基于 40 nm G 工艺的 Cortex-R4 可在几乎 1 GHz 的频率下运行,此时它可提供超过 1,500 Dhrystone MIPS 的性能。此处理器提供了高度灵活且高效的双周期本地内存接口,可使 SoC 设计人员最大限度地降低系统成本和能耗。

下图对基于 90 nm G 工艺实现的 Cortex-R4 与经典 ARM 处理器的 Dhrystone 基准性能进行了比较。Cortex-R4 的配置选项可以进行选择以最大限度地减少处理器的芯片面积,重要的是这还可以最大限度地降低漏泄功率。

Cortex-R4 性能更好、能效更高

Cortex-R PPA 图表

Cortex-R4 与以前的 ARM9 和 ARM11 处理器相比具有其他许多显著优势:

内核

ARM946E-S

ARM1156T2-S

Cortex-R4

架构

ARMv5TE

ARMv6T2

ARMv7-R

预取单元

指令预取和分支预测

超标量执行

双执行指令

Thumb-2 指令

浮点支持

VFP9

VFP11

已集成 (Cortex-R4F)

总线接口

AMBA AHB

AMBA3 AXI

紧密耦合内存 (TCM)

基本

代码和数据分离

完全灵活

中断

ARMv5

ARMv6 增强功能、NMI

软错误管理

针对所有 RAM 的可选奇偶校验和 ECC

内存保护单元 (MPU)

8 个区域

16 个区域

12 个区域

最小区域大小

4k 字节

32 字节,重叠区域

合成可配置性

I 和 D 高速缓存。0 或 2 个 TCM。软错误处理。MPU

I 和 D 高速缓存。0、1、2 或 3 个 TCM。FPU。软错误处理。MPU。AXI 从属设备


ARM Cortex-R4 处理器

功能说明
微架构带指令预取、分支预测和所选双指令执行功能的八阶段管道。加载存储、MAC、移位 ALU、除法和浮点的并行执行路径。1.66 Dhrystone MIPS/MHz。硬件除法器。与经典 ARM9 和 ARM11 嵌入式处理器的二进制兼容性。
指令集具有 Thumb-2 和 thumb 的 ARMv7-R 架构。DSP 扩展。可选浮点单元。
高速缓存控制器具有可选的集成指令和数据高速缓存控制器的哈佛内存架构。从 4 到 64 KB 的可配置高速缓存大小。高速缓存行是回写的或是透写的。
紧密耦合内存可选的紧密耦合内存接口。TCM 用在高度群定性以及低延迟的应用中,这些应用可能不会对,比如中断服务程序的指令代码和需要集中处理的数据进行捕获时,做出较好的反应。一或两个逻辑 TCM(A 和 B)可用于任意混合的代码和数据。TCM 大小最高可达 8 MB。TCM B 具有两个物理端口 B0 和 B1,用于交叉传输传入的 DMA 数据流。
中断接口标准中断 IRQ、不可屏蔽的快速中断以及 FIQ 输入将通过一个 VIC 中断控制器矢量端口一起提供。如果需要更复杂的基于优先级的中断处理,还可以使用 GIC 中断控制器。此处理器包含低延迟中断技术,通过这种技术,可以中断和重新启动较长的多周期指令。在某些情况下,还会推迟冗长的内存访问。单独使用 FIQ 时,最差情况下的中断响应可能低至 20 个周期。
内存保护单元可选 MPU 可配置八或十二个区域的属性,每个区域都具有低至 32 字节的分辨率。区域可以重叠,编号最高的区域具有最高优先级。
浮点单元可选浮点单元 (FPU) 可实现具有 16 个双精度寄存器且符合 IEEE754 的 ARM 矢量浮点架构 VFPv3。针对单精度计算进行了优化的 FPU 性能完全支持双精度计算。运算包括加、减、乘、除、乘积累加、平方根、定点和浮点之间的转换,以及浮点常数指令。
ECC针对具有 ECC 位的高速缓存和/或 TCM 内存的可选单比特纠错和两个比特检错。处理器将自动更正单比特软错误。
奇偶校验对高速缓存和/或 TCM 中奇偶校验位错误检测的可选支持。
主 AXI 总线2 级内存和外设访问的 64 位 AMBA AXI 总线主设备。
从属 AXI 总线可选 64 位 AMBA AXI 总线从属设备端口允许 DMA 主设备访问双端口 TCM B 接口,以使数据可以快速流入或流出处理器。
调试提供了调试访问端口。可以使用 DK-R4 扩展其功能。
跟踪提供了适合连接到 CoreSight 嵌入式跟踪模块的接口。
双核双处理器配置以带有偏移时钟和比较逻辑的锁步方式实现冗余 Cortex-R4 CPU,以获得可靠的容错/故障检测系统。
配置

带用于配置合成选项的工具的可合成 Verilog RTL。


Cortex-R4 性能、功率和面积

处理器面积、频率和功耗在很大程度上取决于工艺、库和优化。该表说明使用高密度、标准性能单元库和 RAM 的基于主流工艺技术的实现。

实现目标

性能优化1功率优化2 面积优化2

工艺技术

65 nm GP

65 nm LP

65 nm GP

标准单元库

Artisan™ SC10

Artisan SC10

Artisan SC10

时钟频率

620 MHz3

270 MHz4

380 MHz4

性能

1,030 DMIPS

450 DMIPS

630 DMIPS

内核动态功率5

0.12 mW/MHz

0.17 mW/MHz6

0.09 mW/MHz

内核泄漏功率5

4.4 mW

0.02 mW

1.4 mW

内核布局面积5

0.8 sq mm

0.5 sq mm

0.4 sq mm

内核效率

13.8 DMIPS/mW

9.8 DMIPS/mW

18.4 DMIPS/mW

  1. 配置有用于 8 KB I 和 D 高速缓存的控制器,三个 TCM 端口,带 8 个区域的 MPU,无 FPU,可对一级内存和 AXI 总线执行奇偶校验,通过一个视点和两个断点进行调试。
  2. 带有用于 8 KB I 和 D 高速缓存的控制器的最低配置。无 TCM 端口,AXI 从设备总线,MPU、FPU、ECC 或奇偶校验以及最低调试能力。
  3. 将最坏情况(即,最低电压(低于额定电压 10%)、最高温度 (125 ºC)、慢硅)下的最大时钟频率作为目标。
  4. 时钟频率目标已放宽并且处于典型情况(即额定电压、25 ºC、标准硅)下。
  5. 不包括内存面积和功率。
  6. 低漏电工艺的动态功耗很高,但系统范围的能耗会随时间而降低。

完全配置的 Cortex-R4 处理器的平面规划说明如下:

Cortex-R4 配置选项概要

Cortex-R4 配置选项


可使用 ARM 系统 IP、开发工具和物理 IP 来实现完整的 Cortex-R4 系统。

CoreLink 和 CoreSight 系统 IP

NIC-301 用于 AMBA 3 AXI、AHB-Lite 和 APB 组件的可配置分层低延迟互连。配置的范围可从单个桥组件(如 AHB 到 AXI 协议桥)到不同 AMBA 协议组合中 128 个主设备和 64 个从属设备的大型基础结构。
QOS-301已添加到 NIC-301 以最大限度地减少平均延迟并保证关键接口(如 DDR 内存)在最坏情况下的延迟和带宽。
DMC-34x动态内存控制器通过利用 AXI 互连功能优化内存请求调度并使用内置“服务质量”控件管理启动程序的延迟和带宽要求,为 DRAM 提供高效接口。支持的内存类型包括 SDR、DDR、LPDDR(移动 DDR)、eDRAM、DDR2 和 LPDDR2(移动 DDR2)。
SMC-35x静态内存控制器使用高度可配置的参数将 AXI 互连连接到一系列的非易失性内存。支持的内存类型包括 SRAM、NAND 闪存和 NOR 闪存。
L2C-3102 级高速缓存控制器,旨在提升性能的同时降低发送至系统内存的总体流量并因此降低 SoC 功耗。减少对芯片外内存带宽的需求可释放资源以供其他主设备使用。
DMA-330一种高度灵活的可微编程直接内存访问控制器,用于高端高性能高能效的基于 AXI 的处理系统。
PL192一种 AMBA AHB 高级矢量中断控制器 (VIC),支持高达 32 个具有可编程优先级和屏蔽的矢量中断。
GIC390一个 AMBA AHB 和 AXI 可扩展、可配置、低门数,并在内存中存储矢量地址的中断控制器。选项包括多处理器和 TrustZone 支持。
ETM-R4该嵌入式跟踪宏单元提供实时指令和数据跟踪,并且配置为全速捕获指定的处理器事件序列之前和之后的信息。
DK-R4一个包括 ETM-R4 和全功能调试访问端口 (DAP) 的完整调试工具包,用于补充每个 Cortex-R4 随附的 DAP-Lite。DK 组件包括 DAP、交叉触发器、ETM、AMBA 总线跟踪、串行线调试、跟踪聚合器、跟踪缓冲区、跟踪端口接口和串行线查看器。

 

开发工具

ARM Development Suite 5 (DS-5™) 工具套件以及广泛的第三方工具、操作系统和 EDA 流程支持所有 Cortex-R 处理器。ARM DS-5 软件开发工具具有独一无二的能力,可提供能够充分利用完整 ARM 技术组合优势的解决方案。特定于 Cortex-R4 的工具包括:

ARM DS-5已针对 Cortex-R4 进行优化的具有 Thumb-2 的 ARM 编译器 5.0。
CoreTile用于性能评估和硅前应用程序开发的 CT-R4M-BD-0243A。
VersaTile EB通用仿真基板 VEREB-BD-0228A 是承载内核片所必需的。
MCBTMS570 评估板 (Keil)外部站点此 Keil MCU 和 IO 组合承载 Texas Instruments TMS570 基于 Cortex-R4 的微控制器。它带有 SRAM 和闪存和包括 USB、汽车 CAN 和 FlexRay、以太网、触摸屏显示器、JTAG 和 ETM 在内的接口。
RTX 实时内核 (Keil)外部站点免除专利使用费的、具有确定性的 RTOS(带有源代码),用于以低中断延迟和灵活的调度进行高速实时运算。适用于资源受限系统的小空间占用、多线程和线程安全运算、MDK-ARM 中内核识别的调试支持。

 

物理 IP

ARM 优化的物理 IP 平台,用于基于领先的半导体工艺技术获得 Cortex-R4 的同类最佳实现。

标准单元逻辑库 ARM 标准单元库在多种不同的架构中可用,支持一个适用于所有 SoC 设计类型的、十分广泛的性能范围。设计人员可以选择不同的库,并针对速度、功耗和/或面积优化其设计。
内存编译器和寄存器各种不同的经过硅验证的 SRAM、寄存器文件和 ROM 内存编译器,它们适用于所有类型的 SoC 设计,包括性能关键应用以及成本敏感和低功耗应用。
接口 IP为符合不断变化的系统架构和标准而设计的一系列硅验证接口 IP。通用 I/O、专用 I/O、高速 DDR 和串行接口经过优化,可以通过低针数实现高数据吞吐量性能。


白皮书 



 
» 
Latest Forum Posts
» 
Blogs
 
» 
Cortex-R4 Powered Products
Go Left
Go Right

Maximise