Login

重要なお知らせ

このサイトはcookieを利用して、コンピュータに情報を保存しています。続けるには、同意が必要です。 cookie.

ARMのWebサイトでは2種類のcookieを利用しています:(1)サイトの機能を有効にし、要求に対して素早く反応できるようにするもの。(2)分析のためのcookieで、当サイト利用時に限り匿名でWeb訪問者をトラックするもの。cookieの利用に同意されない場合は、弊社のプライバシーポリシーをご確認いただき、cookieを無効にする方法を選択できます。cookieを無効にすると、サイトのいくつかの機能が使用できなくなりますのでご注意ください

Cortex-R4プロセッサ

Cortex-R4プロセッサ Image (View Larger Cortex-R4プロセッサ Image)

Cortex™-R4プロセッサは、ARMv7-Rアーキテクチャに基づいた最初のディープ エンベデッド リアルタイム プロセッサです。 ハード ディスク ドライブ コントローラ、ワイヤレス ベースバンド プロセッサ、コンシューマ製品、車載システム用の電子制御ユニットなど、大規模量産型のディープ エンベデッドSoC(System-on-Chip)アプリケーションをターゲットとしています。

Cortex-R4は、同じクラスの他のプロセッサよりも非常に高い性能、リアルタイム応答性、および多くの機能を備えています。 このプロセッサは、ASIC、ASSP、およびMCUエンベデッド アプリケーションにおいて優れたエネルギー効率とコスト効率を実現します。 また、合成時に、アプリケーションの要件に的確に合わせて機能セットを最適化するように構成できます。

 


Cortex-R4は、2006年5月に発売され、現在、数百万台のASIC、ASSP、およびMCUデバイスに搭載されて出荷されている、完成度の高いプロセッサです。 ARM9およびARM11プロセッサ ベースの数多くの設計に代わる、高性能なリアルタイムSoCの標準となっています。

Cortex-R4は、エネルギー効率、リアルタイム応答性、高度な機能、および容易なシステム設計の強化に重点を置き、90 nmから28 nm以降までの先進のシリコン プロセスで実装するように設計されています。 40 nm Gプロセスでは、Cortex-R4をほぼ1 GHzで稼働するように実装して、1,500 Dhrystone MIPSを超すパフォーマンスを実現できます。このプロセッサは非常に柔軟で効率的な2サイクルのローカル メモリ インタフェースを備えているため、SoC設計者はシステム コストとエネルギー消費を最小限に抑えることができます。

以下の図では、Cortex-R4と、90 nm Gプロセスで実装されたClassic ARMプロセッサのDhrystoneベンチマーク性能を比較しています。 Cortex-R4のコンフィギュレーション オプションを選択して、プロセッサのダイ面積を最小化できます。重要なことは、それによりリーク電力も最小限に抑えられることです。

Cortex-R4の高い性能、高い電源効率

Cortex-RのPPAの表

Cortex-R4には、以前のARM9およびARM11プロセッサよりも多くの優れている点があります。

コア

ARM946E-S

ARM1156T2-S

Cortex-R4

アーキテクチャ

ARMv5TE

ARMv6T2

ARMv7-R

プリフェッチ ユニット

なし

命令のプリフェッチと分岐予測

スーパースカラ実行

なし

デュアル発行命令

Thumb-2命令

なし

あり

浮動小数点のサポート

VFP9

VFP11

内蔵(Cortex-R4F)

バス インタフェース

AMBA AHB

AMBA3 AXI

密結合メモリ(TCM)

基本

コードとデータで独立

完全に自由

割り込み

ARMv5

ARMv6の拡張機能、NMI

ソフト エラーの管理

なし

すべてのRAMのパリティおよびECC(オプション)

メモリ保護ユニット(MPU)

8領域

16領域

12領域

最小の領域サイズ

4kバイト

32バイト、重複領域

合成のコンフィギュラビリティ

なし

IキャッシュとDキャッシュ。 0または2個のTCM。 ソフト エラー処理。 MPU

IキャッシュとDキャッシュ。 0、1、2、または3個のTCM。 FPU。 ソフト エラー処理。 MPU。 AXIスレーブ


ARM Cortex-R4プロセッサ

機能説明
マイクロアーキテクチャ命令のプリフェッチ、分岐予測、および選択したデュアル発行実行を備えた8段パイプライン。 ロード/ストア、MAC、シフトALU、除算、および浮動小数点の並列実行パス。 1.66 Dhrystone MIPS/MHz。 ハードウェア除算。 Classic ARM9およびARM11エンベデッド プロセッサとのバイナリ互換性。
命令セットThumb-2およびThumbをサポートするARMv7-Rアーキテクチャ。 DSP拡張機能。 (オプション)浮動小数点ユニット。
キャッシュ コントローラオプションの統合された命令キャッシュ コントローラとデータ キャッシュ コントローラを備えたハーバード メモリ アーキテクチャ。 4~64 KBの範囲でコンフィギュラブルなキャッシュ サイズ。 キャッシュ ラインはライトバックとライトスルーのいずれかです。
密結合メモリオプションの密結合メモリ インタフェース。TCMは、キャッシュでは十分に対応できない可能性のある非常に確定的なアプリケーションや低レイテンシ アプリケーション(割り込みサービス ルーチンの命令コード、集中的に処理する必要があるデータなど)に使用します。 論理TCM (AとB)の一方または両方を、コードとデータのあらゆる組み合わせに使用できます。 TCMのサイズは最大で8 MBです。 TCM Bには、受信DMAデータ ストリームをインターリーブするB0とB1という2つの物理ポートがあります。
割り込みインタフェース標準の割り込み(IRQ)およびマスク不可の高速割り込み(FIQ)の入力は、VIC割り込みコントローラ ベクタ ポートを使用して一緒に渡されます。 また、優先度に基づいたさらに複雑な割り込み処理を行う必要がある場合は、GIC割り込みコントローラを使用することもできます。 このプロセッサには、長い複数サイクル命令に対する割り込みおよび再開を可能にする低レイテンシの割り込みテクノロジが組み込まれています。 また、非常に長いメモリ アクセスは、状況によっては保留されることがあります。 割り込み応答の最悪値は、FIQを単独で使用することで20サイクルまで下げることができます。
メモリ保護ユニットオプションのMPUでは、8領域または12領域の属性を構成します。それぞれの最小サイズは32バイトです。 領域は重ね合わせることができます。また、最も大きな番号の領域の優先順位が最も高くなります。
浮動小数点ユニットオプションの浮動小数点ユニット(FPU)は、ARM Vector Floating Pointアーキテクチャ(VFPv3)の実装であり、16個の倍精度レジスタを備え、IEEE 754に準拠しています。FPUのパフォーマンスは単精度の計算に最適化されています。また、倍精度も完全にサポートしています。 演算には、加算、減算、乗算、除算、積和、平方根、固定小数点数と浮動小数点数間の変換、および浮動小数点定数命令があります。
ECCECCビットを使用したキャッシュとTCMメモリのシングル ビット エラーの訂正と2ビット エラーの検出(オプション)。 シングル ビットのソフト エラーは、プロセッサによって自動的に訂正されます。
パリティキャッシュとTCMのパリティ ビット エラーの検出をオプションでサポートしています。
マスタAXIバスレベル2メモリおよびペリフェラルのアクセス用の64ビットAMBA AXIバス マスタ。
スレーブAXIバスオプションの64ビットAMBA AXIバス スレーブ ポートを使用すると、DMAマスタからデュアル ポートのTCM Bインタフェースにアクセスして、プロセッサとの間のデータ ストリーミングを高速で行うことができます。
デバッグデバッグ アクセス ポートが提供されます。 この機能は、DK-R4を使用して拡張できます。
トレースCoreSightエンベデッド トレース モジュールへの接続に適したインタフェースが提供されます。
デュアル コアデュアル プロセッサ構成では、フォールト トレランス/フォールト検出に対応した信頼性の高いシステム用に、オフセット クロックと比較ロジックを備えたロック ステップ動作をする冗長Cortex-R4 CPUが実装されます。
コンフィギュレーション

合成のオプションを構成するための機能を備えた論理合成可能なVerilog RTLです。


Cortex-R4のパフォーマンス、電力、および面積

プロセッサ面積、周波数範囲、および消費電力は、プロセス、ライブラリ、および最適化に大きく依存します。 次の表には、高密度で、標準的なパフォーマンスのセル ライブラリとRAMを使用したメインストリームのプロセス テクノロジでの実装を示しています。

実装のターゲット

パフォーマンスに最適化1電力に最適化2 面積に最適化2

プロセス テクノロジ

65 nm GP

65 nm LP

65 nm GP

スタンダード セル ライブラリ

Artisan™ SC10

Artisan SC10

Artisan SC10

クロック周波数

620 MHz3

270 MHz4

380 MHz4

パフォーマンス

1,030 DMIPS

450 DMIPS

630 DMIPS

コアのダイナミック電力5

0.12 mW/MHz

0.17 mW/MHz6

0.09 mW/MHz

コアのリーク電力5

4.4 mW

0.02 mW

1.4 mW

コアのレイアウト面積5

0.8 sq mm

0.5 sq mm

0.4 sq mm

コアの効率

13.8 DMIPS/mW

9.8 DMIPS/mW

18.4 DMIPS/mW

  1. コントローラは、8 kバイトのIキャッシュとDキャッシュ、3つのTCMポート、8領域のMPU、FPUなし、レベル1メモリとAXIバスのパリティ チェック、1つのウォッチポイントと2つのブレークポイントを使用したデバッグという構成になっています。
  2. コントローラは、8 kバイトのIキャッシュとDキャッシュという最小構成になっています。TCMポート、AXIスレーブ バス、MPU、FPU、ECC、およびパリティはなく、最小限のデバッグ機能を備えています。
  3. ワースト ケース条件(つまり、低電圧(通常の10%未満)、高温(125ºC)、スロー シリコン)で最高クロック周波数をターゲットにしています。
  4. TYPケース条件(つまり、通常の電圧、25ºC、ティピカル シリコン)であまり高くないクロック周波数をターゲットにしています。
  5. メモリの面積と電力は含まれていません。
  6. リーク電力の少ないプロセスでは、ダイナミック電力の消費は大きくなりますが、長期的にはシステム全体のエネルギー消費は大幅に削減されます。

完全構成のCortex-R4プロセッサのフロアプランを以下に示します。

Cortex-R4のコンフィギュレーション オプションの概要

Cortex-R4のコンフィギュレーション オプション


完全なCortex-R4システム全体を実装するために、ARMシステムIP、開発ツール、およびフィジカルIPが使用されます。

CoreLinkシステムIPとCoreSightシステムIP

NIC-301 AMBA 3 AXI、AHB-Lite、およびAPBコンポーネント用のコンフィギュラブルな階層型の低レイテンシ インターコネクトです。 AHB-AXIプロトコル ブリッジなどの1つのブリッジ コンポーネントから、さまざまなAMBAプロトコルを組み合わせて128個のマスタと64個のスレーブで構成された大規模なインフラストラクチャまで、さまざまなコンフィギュレーションが可能です。
QOS-301平均レイテンシを最小化し、DDRメモリなどの重要なインタフェースのワースト ケースのレイテンシと帯域幅を保証するために、NIC-301に追加されました。
DMC-34xダイナミック メモリ コントローラは非常に効率的なDRAMインタフェースで、AXIインターコネクト機能を利用してメモリ要求のスケジューリングを最適化し、組み込みのクオリティ オブ サービス制御を使用してイニシエータのレイテンシと帯域幅の要件を管理します。 サポートするメモリ タイプは、SDR、DDR、LPDDR(Mobile DDR)、eDRAM、DDR2、およびLPDDR2(Mobile DDR2)です。
SMC-35xスタティック メモリ コントローラは、高度な設定が可能なパラメータを備えたさまざまな不揮発性メモリとのAXIインターコネクトとの接続を可能にします。 サポートしているメモリ タイプは、SRAM、NANDフラッシュ、およびNORフラッシュです。
L2C-310パフォーマンスを向上させつつ、システム メモリへのトラフィック全体を軽減して、SoCのエネルギー消費を削減するように設計されたレベル2キャッシュ コントローラです。 オフチップ メモリの帯域幅に対する要求が軽減されるため、リソースが他のマスタに解放されます。
DMA-330高性能でエネルギー効率の高いAXIベースのハイエンドな処理システム向けの非常に柔軟なマイクロプログラマブル ダイレクト メモリ アクセス コントローラです。
PL192プログラマブルな優先レベルとマスク処理を使用した、最大32個のベクタ割り込みをサポートする、AMBA AHBの高度なベクタ割り込みコントローラ(VIC)です。
GIC390メモリ内にベクタ アドレスを格納する、AMBA AHBおよびAXIのスケーラブルでコンフィギュラブルな、ゲート数の少ない割り込みコントローラです。 オプションで、マルチ プロセッサとTrustZoneをサポートします。
ETM-R4Embedded Trace Macrocellは、リアルタイムの命令とデータのトレースを提供します。プロセッサがフルスピードで動作した状態で、指定した一連のイベントの前後で情報をキャプチャするように構成されています。
DK-R4すべてのCortex-R4に付属しているDAP-Liteを補完するための包括的なデバッグ キットで、ETM-R4と多機能なデバッグ アクセス ポート(DAP)が含まれています。 DKコンポーネントには、DAP、クロス トリガ、ETM、AMBAバス トレース、シリアル ワイヤ デバッグ、トレース ファネル、トレース バッファ、トレース ポート インタフェース、およびシリアル ワイヤ ビューアがあります。

 

開発ツール

すべてのCortex-Rプロセッサは、ARM Development Suite 5(DS-5™)ツール スイートのほか、幅広いサードパーティ製ツール、オペレーティング システム、EDAベンダによってサポートされています。ARM DS-5ソフトウェア開発ツールは、完全なARM技術ポートフォリオを最大限に活用する、他に例のないソリューションです。 Cortex-R4には、以下の固有のツールがあります。

ARM DS-5Cortex-R4に最適化されたThumb-2をサポートするARMコンパイラ5.0です。
CoreTileパフォーマンス評価およびプリシリコン アプリケーション開発のためのCT-R4M-BD-0243Aです。
VersaTile EBVersatileエミュレーション ベースボードVEREB-BD-0228Aは、CoreTileをホストするのに必要です。
MCBTMS570評価ボード(Keil)外部サイトこのKeil MCUとIOの組み合わせによって、Texas InstrumentsのCortex-R4ベースのマイクロコントローラTMS570をホストします。 このボードは、SRAMとフラッシュ メモリに加え、USB、車載用のCANとFlexRay、イーサネット、タッチ スクリーン ディスプレイ、JTAG、ETMなどのインタフェースを備えています。
RTXリアルタイム カーネル(Keil)外部サイト低い割り込みレイテンシと柔軟なスケジューリングによる高速なリアルタイム動作を実現する、ソース コード付きでロイヤリティ無償の確定的なRTOSです。 リソースに制約があるシステムに適した小さなフットプリント、マルチスレッドとスレッド セーフな動作、MDK-ARMでのカーネル認識デバッグのサポートといった特徴があります。

 

フィジカルIP

ARMに最適化されたフィジカルIPプラットフォームは、最先端の半導体プロセス テクノロジに基づくCortex-R4のクラス最高の実装を実現します。

スタンダード セル ロジック ライブラリ さまざまなアーキテクチャで利用できるARMスタンダード セル ライブラリは、あらゆる種類のSoC設計のさまざまなパフォーマンス範囲をサポートします。 設計者は、各種のライブラリを選択し、動作速度、消費電力、面積の点で設計を最適化できます。
メモリ コンパイラおよびレジスタあらゆる種類のSoC設計に対するシリコン実証済みのSRAM、レジスタ ファイル、およびROMメモリ コンパイラは、パフォーマンス重視のアプリケーションからコストや低消費電力が重視されるアプリケーションに至るまでのすべての種類に対応します。
インタフェースIPシリコン実証済みの幅広いインタフェースIP製品群は、さまざまなシステム アーキテクチャおよび標準を満たすように設計されています。 汎用I/O、特殊I/O、高速DDR、およびシリアル インタフェースは、少ないピン数で高いデータ スループット性能を実現するように最適化されています。


ホワイト ペーパー 



 
» 
Latest Forum Posts
» 
Blogs
 
» 
Cortex-R4 Powered Products
Go Left
Go Right

Maximise