Login

Important information

本网站使用cookie来存储信息在您的计算机上。继续使用我们的网站,您必須同意我们 cookies.

ARM网站使用两款浏览器缓存数据(cookie):(1)缓存数据(cookie)可以使网站按需要完成功能执行 (2)分析性缓存数据(cookie)在用户登录网站时会进行匿名记录和数据分析。如果您不希望应用这些缓存数据(cookie),请通过查阅我们的安全隐私政策获知如何设置禁用缓存数据(cookie)。网站的某些功能会因设置禁用缓存数据(cookie)不能使用。

Cortex-A9 处理器

Cortex-A9 处理器 Image (View Larger Cortex-A9 处理器 Image)
ARM Cortex™-A9 处理器提供了史无前例的高性能和高能效,从而使其成为需要在低功耗或散热受限的成本敏感型设备中提供高性能的设计的理想解决方案。  

ARM Cortex™-A9 处理器既可用作单核处理器,也可用作可配置的多核处理器,同时可提供可合成实现或硬宏实现。该处理器适用于各种应用领域,从而能够对多个市场进行稳定的软件投资。

 

 


与高性能计算机平台消耗的功率相比,ARM Cortex-A9 处理器可提供功率更低的卓越功能,其中包括:
  • 无与伦比的性能,2GHz 标准操作可提供 TSMC 40G 硬宏实现 
  • 以低功耗为目标的单核实现,面向成本敏感型设备
  • 利用高级 MPCore 技术,最多可扩展为 4 个一致的内核
  • 可选 NEON™ 媒体和/或浮点处理引擎

应用

通过共享以下常见需求,Cortex-A9 处理器可提供满足各种不同市场应用需求的可扩展解决方案,包括移动手机以及高性能的消费类产品和企业产品:

  • 通过提高性能、降低功耗来提高能效;
  • 提高最高性能,满足要求更高的应用需求;
  • 能够在多个设备之间共享软件和工具投资;

Cortex-A9 简介

Cortex-A9 是性能最高的 ARM 处理器,可实现受到广泛支持的 ARMv7 架构的丰富功能。Cortex-A9 处理器的设计旨在打造最先进的、高效率的、长度动态可变的、多指令执行超标量架构,提供采用乱序猜测方式执行的 8 阶段管道处理器,凭借范围广泛的消费类、网络、企业和移动应用中的前沿产品所需的功能,它可以提供史无前例的高性能和高能效。

Cortex-A9 微架构既可用于可伸缩的多核处理器(Cortex-A9 MPCore™ 多核处理器),也可用于更传统的处理器(Cortex-A9 单核处理器)。可伸缩的多核处理器和单核处理器支持 16、32 或 64KB 4 路关联的 L1 高速缓存配置,对于可选的 L2 高速缓存控制器,最多支持 8MB 的 L2 高速缓存配置,它们具有极高的灵活性,均适用于特定应用领域和市场。

下载 Cortex-A9 白皮书

 

Cortex-A9 MPCore 多核处理器

 

Cortex-A9 MPCore 多核处理器集成了经验证非常成功的 ARM MPCore 技术以及更多增强功能,以此简化了多核解决方案,并使其应用范围得到扩展。Cortex-A9 MPCore 处理器可提供史无前例的可扩展的最高性能,同时还支持灵活设计和新功能,从而进一步降低和控制处理器和系统级的能耗。借助 Cortex-A9 MPCore 处理器的定向实现,移动设备的最高性能还可在现在的解决方案的基础上不断提高,具体方法是:利用设计灵活性和 ARM MPCore 技术提供的高级功率管理技术,在散热受限以及移动电源预算紧张的情况下维持运行。使用可伸缩的最高性能,该处理器可超过现今类似的高性能嵌入式设备的性能,并可在拓宽市场的基础上进行稳定的软件投资。

 

Cortex-A9 单核处理器

Cortex-A9 处理器提供了史无前例的高性能和高能效,从而使其成为需要在低功耗、成本敏感、基于单核处理器的设备中提供高性能的所有设计的理想解决方案。使用便利的可合成流和 IP 成品,Cortex-A9 处理器可为基于 ARM11™ 处理器的现有设计提供理想的升级途径,这类设计需要在相似的硅成本和电源预算基础上提供更高的性能和更高级别的能效,同时使软件环境保持兼容。Cortex-A9 单核处理器为独立指令和数据事务提供了双重、低延迟、Harvard 64 位 AMBA® 3 AXI™ 主接口,在内存的缓存区域之间复制数据时,它能够维持每五个处理器周期执行四次双字写入。 

 

Cortex-A9 的 TSMC 40G 硬宏实现

 

除了单核和多核软宏外,常用的双核配置也可用作 TSMC 40G/GL 工艺的硬宏实现,从而最大程度地缩短高性能 Cortex-A9 处理器的上市时间,降低与其上市关联的风险和成本。利用优化的 ARM 物理 IP 和先进的实现技术,该硬宏可用作功率优化实现或性能优化实现

速度优化:速度优化硬宏实现可向系统设计人员提供行业标准 ARM 处理器的整合低功率技术,从而使 ARM 的性能领先优势进一步延伸到紧凑、高密度和散热受限的环境所需的功率包络中的高利润消费类设备和企业设备。从标准硅中选择该硬宏实现后,它的运行频率超过 2GHz,代表了面向性能的高利润应用中的理想解决方案。

功率优化:在许多散热受限的应用领域(如机顶盒DTV、打印机和其他功能丰富的消费类应用和高密度的企业应用)中,能效极为重要。从标准硅中选择 Cortex-A9 功率优化硬宏实现后,其提供的最高性能达到 4000 DMIPS,而每个 CPU 的能耗不到 250mW。

该硬宏实现包括符合 ARM AMBA 标准的高性能系统组件,可以最大程度地提高数据通信速度,同时使能耗和硅面积降到最低。各 Cortex-A9 硬宏实现还包括 CoreSight™ 程序跟踪宏单元 (PTM),它使处理器的指令流完全可见,从而使软件社区成员能够开发优化性能的代码。此外,该宏还包括 ARM 高性能 L2 高速缓存控制器,它支持 L2 高速缓存内存介于 128K 和 8M 之间的配置。

 


ARM Cortex-A9 性能、功耗和面积

 

Cortex-A9 单核
软宏试用实现

 Cortex-A9 双核
 硬宏实现

工艺

TSMC 65G

  TSMC 40G

优化方式 

 性能优化

性能优化 

功率优化 

标准单元库

 ARM SC12

 ARM SC12 + 高性能工具包

ARM SC12 + 高性能工具包

性能(DMIPS 总计)

2,075 DMIPS

10,000 DMIPS

4,000 DMIPS

频率

830 MHz

2000 MHz(标准)

800 MHz (wc/ss)

能效 (DMIPS/mW)

  5.2

 5.26

8.0

目标频率下的总功率

0.4 W

1.9 W

0.5 W

芯片面积

1.5 mm2(不包括高速缓存)

6.7 mm2
(包括 L1 奇偶校验
和所有 DFT/DFM)

4.6 mm2
(包括所有 DFT/DFM)

 

 

 

内核面积、频率范围、功耗主要取决于工艺、库和优化情况。

上面引述的数字说明了合成内核,这些内核使用通用工艺技术、标准单元库RAM

单核处理器的面积不包括 NEON™浮点单元。以 64 个表项的 TLB、32KB I 高速缓存和 32KB D 高速缓存为衡量基准。

双核多处理器的面积包括 SCU / GIC 和支持逻辑。两个内核都包括 NEON 引擎支持、128 个表项的 TLB、32K I 高速缓存和 32KB D 高速缓存。

 


 Cortex-A9

架构 ARMv7-A Cortex

Dhrystone 性能

 每个内核 2.50 DMIPS/MHz
多核

1-4 个内核
还提供单核版本

ISA 支持
内存管理内存管理单元
调试和跟踪CoreSight™ DK-A9(单独提供) 

 

 Cortex-A9 主要功能

TrustZone®技术确保安全应用的可靠实现,适合从数字版权管理到电子支付等应用。获得技术和行业合作伙伴的广泛支持
Thumb-2 技术可为传统 ARM 代码提供最高性能,对于存储指令占用的内存,最多可节省 30% 的空间。
Jazelle RCT 和 DBX 技术最多可使即时生产 (JIT) 和提前编译的字节码语言的代码大小缩小 3 倍,同时还支持 Java 指令的直接字节码执行,以便提高传统虚拟机的速度
优化的 1 级高速缓存性能和功率优化的 L1 高速缓存结合了最低访问延迟技术,可以在最大程度上提高性能和降低能耗。还为实现高速缓存一致性提供了增强处理器间通信的选项或支持富 SMP 功能操作系统的选项,以便简化多核软件开发
可选的 2 级高速缓存控制器在高频率设计或需要降低与芯片外内存访问关联的能耗的设计中,最多可对 8 MB 高速缓存内存提供低延迟、高带宽访问

先进的多核技术

侦测控制单元SCU 是 ARM 多核技术的中央智能单元,负责管理互连、仲裁、通信、高速缓存之间的传输和系统内存传输、高速缓存一致性以及支持所有多核技术的处理器的其他功能。Cortex-A9 MPCore 处理器也是首次向其他系统加速器和未经缓存的 DMA 驱动的主外设公开这些功能,以便通过共享对处理器高速缓存层次结构的访问来提高性能并降低系统范围内的能耗。这一系统一致性还可降低在各个操作系统驱动程序中维持软件一致性所涉及的软件复杂性。
加速器一致性端口SCU 上的此 AMBA® 3 AXI™ 兼容的辅助接口为各种系统主机提供了一个互连点,出于总体系统性能、功耗或软件简化的原因,这些接口更易于直接连接 Cortex-A9 MPCore 处理器。该接口可用作标准的 AMBA 3 AXI 辅助接口,它支持所有标准读写事务,而对连接的组件没有任何其他一致性要求。不过,针对一致的内存区域的任何读事务都会与 SCU 交互,以测试所需信息是否已存储在处理器的 L1 高速缓存内。如果存储在其中,则会将其直接返回到请求组件。如果未存储在 L1 高速缓存中,则在最后转发到主内存之前还有机会存储在 L2 高速缓存中。对于针对任何一致的内存区域的写事务,在将写入数据转发到内存系统之前,SCU 会强制其保持一致性。此外,此事务还可分配到 L2 高速缓存,从而消除直接写入对芯片外内存产生的功率和性能影响。
通用中断控制器实现标准化、基于架构的中断控制器后,GIC 可提供内容丰富、使用灵活的方式来中断处理器间通信以及路由系统中断和确定其优先次序。在软件控制下,最多支持 224 次独立中断,每次中断均可在 CPU 之间分布,经过硬件确定优先级,然后在操作系统和 TrustZone 软件管理层之间路由。借助虚拟机监控程序,此路由灵活性以及支持虚拟化操作系统中断这一特性赋予了增强解决方案功能所需的主要功能之一。

先进的可选技术

Cortex-A9 NEON 媒体处理引擎 (MPE)Cortex-A9 MPE 可用于任一 Cortex-A9 处理器,并可提供一个具有 Cortex-A9 浮点单元的性能和功能以及 NEON 高级 SIMD 指令集实现的引擎,以便进一步提高媒体和信号处理功能的速度。MPE 可扩展 Cortex-A9 处理器的浮点单元 (FPU),提供一个 quad-MAC 以及附加的 64 位和 128 位寄存器集,在每个周期 8 位、16 位和 32 位整型以及 32 位浮点数据量的基础上支持一组丰富的 SIMD 操作。
Cortex-A9 浮点单元 (FPU)在与任一 Cortex-A9 处理器一起实现时,FPU 可提供与 ARM VFPv3 架构兼容的高性能的单双精度浮点指令,该架构是与上一代 ARM 浮点协处理器兼容的软件。 

 


Cortex-A9 处理器通常作为许多下一代设备的核心与许多其他 IP 块集成。

系统 IP

系统 IP 组件对于在芯片上构建复杂的系统至关重要,通过利用系统 IP 组件,开发人员可以显著缩短开发和验证周期,从而节省成本并缩短产品的上市时间。

说明AMBA 总线系统 IP 组件
高级 AMBA 3 互连 IP

AXI

NIC-301、PL301

DMA 控制器

AXI

DMA-330、PL330

2 级高速缓存控制器

AXI

L2C-310、PL310

动态内存控制器

AXI

DMC-340、PL340

DDR2 动态内存控制器

AXI

DMC-342

静态内存控制器

AXI

SMC-35x、PL35x

TrustZone 地址空间控制器

AXI

PL380

CoreSight™ 设计工具包

ATB

CDK-11

媒体处理器
Mali™ 系列产品组合可提供完整的图形栈以满足所有嵌入式图形要求,从而使设备制造商和内容开发商能够为范围广泛的消费类设备提供最高质量的尖端图形解决方案。
Mali-400 GPU世界上第一个符合 OpenGL ES 2.0 标准的多核 GPU,可提供 2D 和 3D 加速,性能最高可以扩展到 1080p 分辨率
Mali-200 GPU高性能图形处理器,可提供高级 2D 和 3D 加速。支持 OpenGL ES 2.0

 

物理 IP

ARM® 物理 IP 平台可提供工艺上得到优化的 IP,从而能够在采用 40nm 及以下工艺时获得同类最佳的 Cortex-A9 处理器实现。
标准单元逻辑库ARM 标准单元库适用于各种不同的架构,可支持所有类型的 SoC 设计的较宽性能范围。设计人员可以选择不同的库,并针对速度、功耗和/或面积优化其设计
内存编译器和寄存器各种不同的经过硅验证的 SRAM寄存器文件ROM 内存编译器,它们适用于所有类型的 SoC 设计,包括性能关键应用以及成本敏感和低功耗应用。
接口库为符合不断变化的系统架构和标准而设计的一系列硅验证接口 IP。通用 I/O专用 I/O、高速 DDR串行接口已经过优化,可通过较少的引脚数提供较高的数据吞吐量性能。

 

工具支持

ARM Development Studio 5 (DS-5™) 工具套件以及各种第三方工具、操作系统和 EDA 供应商都支持所有 ARM 处理器。ARM DS-5 软件开发工具独一无二,能够提供的解决方案充分利用完整 ARM 技术组合的优势。  


» 
Latest Forum Posts
 
» 
Cortex-A9 Powered
Go Left
Go Right

Maximise