Login

Important information

本网站使用cookie来存储信息在您的计算机上。继续使用我们的网站,您必須同意我们 cookies.

ARM网站使用两款浏览器缓存数据(cookie):(1)缓存数据(cookie)可以使网站按需要完成功能执行 (2)分析性缓存数据(cookie)在用户登录网站时会进行匿名记录和数据分析。如果您不希望应用这些缓存数据(cookie),请通过查阅我们的安全隐私政策获知如何设置禁用缓存数据(cookie)。网站的某些功能会因设置禁用缓存数据(cookie)不能使用。

ARM 技术资源、客座讲座/讲习班和科研论文

ARM 大学计划为希望研究基于真实硬件的 ARM 项目、希望将 ARM 融入新的或现有课程、或者希望增进对 ARM 熟悉程度的学员和教职人员提供各种资源和材料。 其中包括书刊、实时 OS、培训材料、实际学术课程、学术研究论文、应用程序说明和其他文档的链接。    

“Like”ARM 大学计划的 Facebook 主页!
在 Twitter 上关注 ARM 大学计划!
订阅大学新闻稿!
在 iTunes U 上观看播客!
 
 


ARM 汇编语言:基础知识与技术

英语,作者:William Hohl
出版商:CRC

ISBN-10:1439806101
ISBN-13:978-1439806104
勘误表

 嵌入式系统:ARM Cortex-M3 简介

英语,作者:Jonathan W. Valvano
出版商:CreateSpace

ISBN-10:1477508996
ISBN-13:978-1477508992

 嵌入式系统:ARM Cortex-M3 的实时接口

英语,作者:Jonathan W. Valvano
出版商:CreateSpace

ISBN-10:1463590156
ISBN-13:978-1463590154

 嵌入式系统:用于 ARM Cortex-M3 的实时操作系统

英语,作者:Jonathan Valvano
出版商:CreateSpace

ISBN-10:1466468866
ISBN-13:978-1466468863

 计算机组织与设计:硬件/软件接口 — ARM 版本

英语,作者:David Patterson 和 John Hennessy
第四版
出版商:Morgan Kaufman

ISBN-10:8131222748
ISBN-13:978-8131222744

快速有效的嵌入式系统设计:应用 ARM mbed

英语,作者:Rob Toulson 和 Tim Wilmshurst
出版商:Newnes

ISBN:978-0-08-097768-3

ARM 微控制器接口

英语,作者:Warwick A. Smith
出版商:Elektor

ISBN-10:0905705912
ISBN-13:978-0905705910

ARM 微控制器,第 1 部分:面向初级用户的 35 个项目

英语,作者:Bert Van Dam
出版商:Elektor

ISBN-10:0905705947
ISBN-13:978-0905705941

汇编语言编程:ARM Cortex-M3

英语,作者:Vincent Mahout
出版商:Wiley-ISTE

ISBN-10:1848213298
ISBN-13:978-1848213296

基于 ARM® Cortex-M3 的嵌入式软件开发基础

英语,作者:Daniel W. Lewis
出版商:Prentice Hall

ISBN-10:0132916541
ISBN-13:978-0132916547

物联网快速入门:将传感器和微控制器连接到云

英语,作者:Cuno Pfister
出版商:O'Reilly Media

ISBN-10:1449393578
ISBN-13:978-1449393571

ARM Cortex-M3 权威指南

英语,作者:Joseph Yiu
出版商:Newnes
第一版勘误表文档 (71KB PDF)

ISBN-10:0750685344
ISBN-13:978-0750685344

ARM Cortex-M0 权威指南

英语,作者:Joseph Yiu
出版商:Newnes

ISBN-10:0123854776
ISBN-978-0123854773

ARM SoC 架构

英语,作者:Steve Furber
第二版
出版商:Addison Wesley

ISBN 0-201-67519-6

计算机作为组件:嵌入式计算系统设计原则

英语,作者:Wayne Wolf
出版商:Morgan Kaufmann

ISBN:1-5586-0541-X

ARM 汇编语言——简介

英语,作者:J.R.Gibson
出版商:Lulu.com

ISBN:978-1-84753-696-9

ARM 系统开发指南

英语,作者:Andrew Sloss、Dominic Symes 和 Chris Wright
出版商:Morgan Kaufmann

ISBN:1-55860-874-5

嵌入式微控制器的 C 语言程序设计

英语,作者:Warwick A. Smith
出版商:Elektor

ISBN:978-0-905705-80-4

免费的 Cortex-A 系列程序员指南(需要免费注册)

英语,编辑:ARM
出版商:ARM

免费 ARMv7-AR、ARMv7-M、ARMv6-M 和 ARMv5 架构参考手册下载

英语,编辑:David Seal
出版商:Addison-Wesley

ISBN:0-201-73719-1

ARM 嵌入式系统基础教程

ARM嵌入式系统基础教程
中文,作者:周立功
作者:周立功
出版商:北京航空航天大学出版社

ISBN:7811240408

ARM 嵌入式系统实验教程(二)

ARM嵌入式系统实验教程
中文,作者:周立功
作者:周立功
出版商:北京航空航天大学出版社

ISBN:7810777297

ARM 嵌入式系统软件开发实例

ARM嵌入式系统软件开发实例
中文,作者:周立功
作者:周立功
出版商:北京航空航天大学出版社

ISBN:7810775774


 实验室手册和练习 

幻灯片和学术教学资料

学生和教职人员应用说明

其他项目和资源


ARM 目前向世界各地的大学提供技术讲习班和研讨会。根据名额和语言环境,我们的大学员工或实际的 ARM 工程师可能到您的学校提供讲座。目前提供以下讲座:
 

ARM 处理器和架构概述

这个持续 1 - 2 个小时的讲座介绍了公司的经营模式和行业情况、ARM 架构的基础知识,包括程序员模型、基本指令集、内核系列的管道、AMBA 和开发工具。该讲座面向三年级或四年级学生以及教职人员,旨在解答学生和教职人员的深层技术问题。该讲座还包括最新 ARM 硬件和软件技术的演示。 
 

ARM 架构综述

这个持续 1.5 - 2 小时的讲座介绍了公司的经营模式和行业情况、ARM 架构(包括所有架构系列)的基础知识,以及程序员模型、指令集、内核系列的管道、AMBA、Mali 图形处理器概述、能源管理方案和开发工具。该讲座面向三年级或四年级学生以及教职人员,旨在解答学生和教职人员的深层技术问题。该讲座还包括最新 ARM 硬件和软件技术的演示。
 

ARM/NXP mbed 动手操作讲习班

这个持续 1 - 1.5 小时的动手操作讲习班显示了 ARM/NXP mbed 平台的威力和灵活性,以及在学术背景下它是多么有用。随着处理器的成本下降和复杂性上升,微控制器正在变得更廉价、更强大和更有交互性。MCU 现在是真正能找出问题的解决方案,任何人都能在其中构想微控制器应用程序。到目前为止,这个问题始终是如何迅速地把想法变成原型并用技术来实验。借助于 mbed,ARM 改变了这种状况,mbed 是为简化微控制器快速入门而设计的快速原型设计平台。这些应用程序使用基于 Web 的编译器和极为简单的拖放界面,对于一个开发新手,不需要昂贵的工具就可以在大约 60 秒内编写并执行一个“hello world”程序。需要一个配备主机的实验室环境,这些主机应具有 Internet 连接。
 
 

ARM Cortex-M 和 v6/7-M 简介

这个持续 1 小时或 1.5 小时的讲座(提供长短两种版本)涵盖了 Cortex-M0、M3 或 M4 处理器的基础知识,其中简要介绍了 ARM v7-M 或 v6-M 架构、指令集、程序员模型、异常和中断的处理、数据通道、管道、推荐的编程工具,并且还演示了基于 Cortex-M 的最新硬件。
 

ARM Cortex-A 和 v7-A 简介

这个持续 1 小时或 1.5 小时的讲座(提供长短两种版本)涵盖了 Cortex-A 处理器的基础知识,其中简要介绍了 ARM v7-A 架构、指令集、程序员模型、异常和中断的处理、数据通道、管道、推荐的编程工具,并且还演示了基于 Cortex-A 的最新硬件。

采用 AMBA 的 ARM SoC 设计

这个持续 1 小时或 1.5 小时的讲座(提供长短两种版本)涵盖了 ARM 处理器和架构的基础知识、SoC 设计、AMBA 总线协议以及如何在 SoC 中使用不同的外设连接 ARM 内核。
 
 

ARM 和微处理器行业简介

这个持续 0.5 - 1 小时的讲座介绍公司的经营模式和行业现状。该讲座还包括最新 ARM 硬件和软件技术的演示。
 

我们还可应要求提供其他讲座,包括多核问题和 GPU 等高级主题。

请注意,在演讲期间没有任何市场营销或广告内容,讲座的重点完全是技术问题。如果您对聘用客座演讲者感兴趣,请向 university@arm.com 发送电子邮件,在电子邮件中写明您的大学名称、地址和联系人信息。


希望在此处列出您的与 ARM 有关的科研论文?请与 ARM 大学关系部门联系以待审批:

近来有许多关于 ARM 技术的科研论文问世:

移动式 Internet 设备的精确系统级性能建模和工作负载特征描述2008 年
摘要:随着移动应用程序和设备的普及,消费者对于性能、能源效率和连接性的要求越来越高。移动 Internet 设备中现有的软件框架是实时任务、非实时应用程序和操作系统管理例程的复杂交互。传统的模拟方法不适合对此类系统的总体性能特征进行建模。此外,已经发现学术界和微处理器基准测试与设计行业中使用的许多传统基准套件不能代表移动工作负载。本文提出利用多重框架为用于移动应用程序的嵌入式系统的系统级性能进行精确建模。

功率转换器开源平台的教学2009 年
摘要:本文提出了通过使用功率变换器示例试验来进行功率转换器教学的新方法。该方案基于定制设计的硬件和基于多种开源工具的软件平台。该平台由 32 位微处理器控制,使学员能通过控制器固件来修改实验。设计和实现该控制器的所有必需的硬件和软件都是开源的。

跨虚拟页边界预取硬件的分析2007 年
摘要:L2 中的数据高速缓存预取处于预取研究的最前沿。在本文中,作者分析了虚拟页边界对这些预取器的影响。

AnySP:任何时间、任何地点、任何方式的信号处理2009 年
摘要:本文为下一代移动信号处理提出一种称为 AnySP 的示例架构。AnySP 使用共同设计的方法来分析下一代无线信号的处理和高清视频算法,以创建特定于域的可编程架构。AnySP 的核心是可配置的单指令多数据的数据通道,它能同时处理宽向量或多个窄向量。结果显示,AnySP 能够保持 4G 的无线处理和高清视频吞吐率,并在缩放到 45nm 时达到 1000 Mops/mW 的效率屏障。

ARM Cortex-A8:用于低功耗应用的高性能处理器2007 年 11 月
摘要:本文详述了 ARM Cortex-A8 微处理器,其目标应用系统对于通用和媒体应用需要高性能,同时可保持 1 瓦以下的低功耗和小的硅印迹

供穷人用的 ARM 产品:选择用于计算机架构教学的处理器2010 年 10 月
摘要: 计算机架构和组织的教学课程必须选择目标处理器,以便阐释指令集设计的基本原理。本文建议,现在应该选择与目前的大多数课程大不相同的 ARM 处理器架构。

软件无线电 Turbo 解码器的设计与实现2006 年 10 月
摘要:本文为 SDR 提出了一种 Turbo 解码器算法-架构共同设计的案例研究。

用不可靠组件设计可靠的多核系统2009 年 6 月
摘要:由于各种设计和可靠性难题,单核芯片架构不能很好地进行缩放。为了充分利用摩尔定律,采用大量内核的多核系统正在普及。然而,由于空间、时间和动态差异,在纳米级时代仍存在各种可靠性问题。实现多核系统可持续缩放的唯一方法是通过使用自适应设计技术和配备能取代有故障内核的冗余内核,使架构稳定可靠。

开发侧重协作的中间嵌入式系统课程2011 年 10 月
摘要: 嵌入式系统是设计为在大型系统(如数码相机、测量仪器、汽车等)中执行特定任务的计算设备。技术进步增加了嵌入式系统开发的复杂性,这需要在学术课程中反映出来。本文在对微控制器做过一般介绍之后讨论中间嵌入式系统课程的设计和教授方式;在此期间,举例说明了采用协作式学习、对外联系和实践社区学习模式的设计课程开发情况。文章阐述了课程规划、学习目标、活动及其他方面,包括所使用的硬件和软件工具以及所学的功课。有一节专门介绍学生项目和当前成果。

使用 BLADES 的循环加速器中的 DVFS2008 年
摘要:在嵌入式系统中,硬件加速器很常见。嵌入式系统有很高的性能要求,但仍然必须在严格的能耗约束下运行。为了便于缩短上市时间和降低非重复性工程成本,能迅速生成既考虑能耗、又顾及性能的硬件的自动化系统极为诱人。本文提出了 BLADES(自动选优式循环加速器设计)系统,用于自动设计能自动优化的硬件加速器。这种加速器能根据环境条件、硅差异和输入数据特性,动态地选择最佳工作频率和电压。

从软实时 SMT 处理器中的不同高速缓存级别获取高能效同时线程2008 年
摘要:本文重点探讨实时 SMT 处理器中的指令提取资源,以便为软实时应用提供高能效配置,在尽可能快速运行高优先级线程的同时仍可在低优先级或非实时线程中提供足够的进度。作者提出了一种称为 Fetch-around 的提取机制,其中高优先级线程访问 L1 ICache,而低优先级线程直接访问 L2。这样可以让高低两种优先级的线程同时提取指令,防止低优先级线程冲击高优先级线程的 ICache 数据。总之,作者展示了一个能源性能尺度,当高性能线程的优先级是低性能线程的 10 倍时,该尺度比下一个最好的策略高 13%。

探索 200 mV 以下处理器的可变性和性能2008 年 4 月
摘要:在本研究中,我们探索用于超低能耗传感器系统的阈下处理器的设计。我们描述一个 8 位阈下处理器,其设计以能效作为主要约束。该处理器在 Vdd=200 mV 以下仍可工作,在 Vdd=350 mV 时能耗仅为 3.5 pJ/实例,在逆向体偏压下,在 Vdd=160 mV 时能耗只有 11 nW。在阈下电路中,进程和温度差异可能造成性能和能耗的明显波动,并可能导致可靠性问题。我们对使用体偏压来适应进程和温度差异进行了研究。对测试芯片的测量显示,体偏压在阈下电路中特别有效,并能以极小的能耗消除性能差异。在低电压下性能下降也是个问题,所以我们研究了全球和当地的技术,以求在保持能效的同时改善性能。

从 SODA 到 Scotch:无线基带处理器的演变2008 年 11 月
摘要:本文介绍了 SODA 的架构发展历程,从研究设计到商用原型,包括目标、折衷和最终选择。SODA 是完全可编程的多核架构,能满足 3G 无线协议的实时要求。

在纳米级 CMOS 中技术和电压缩放对软错误敏感度的影响2008 年
摘要:随着每个工艺节点的缩小,硅芯片变得越来越容易发生软错误。随着电压为了节能而下降,这种脆弱性进一步增加。基于对商业库中单元的分析,作者使用基于 Qcrit 的模拟方法,在不同的供电电压下,对 65nm 和 45nm 工艺节点范围内软错误概率的上升进行了量化分析。当设计从 65nm 缩小到 45nm 时,位单元和锁存器的 Qcrit 都下降了大约 30%。预期这种下降会随着技术的进一步缩放而继续。结果显示,在额定电压下,在 65nm 以下的技术节点中,锁存器的 Qcrit 仅比位单元高 20% 左右。该研究显示,在 65nm 以下的技术节点中,随着电压的过度缩放,在逻辑电路中(锁存器、触发器)解决软错误问题与在 SRAM 中同样重要。

在双虚拟 CPU 系统中实现嵌入式安全2007 年 11 月
摘要:本文介绍一种新型硬件技术,这种技术能提供低成本、高性能的隔离环境,用于存储和处理嵌入式系统的敏感数据。本文还介绍关于设计可编程安全软件框架的案例研究。

在低端 FPGA 中实现 Cortex-M0 DesignStart 处理器, 2010 年10 月
(西班牙语原文刊登在 SASE 2011 期上)
摘要:
 ARM 最近推出了 Cortex-M0 处理器的低成本精简版 (Cortex-M0 DesignStart™),它可以合成到 FPGA 中或用于硅实现。本文显示了在 Xilinx 中的低端 FPGA 中实现 Cortex-M0 DesignStart 处理器的成果,在 FPGA 中扩展 Cortex-M 处理器的可用实现。

在软实时嵌入式多线程处理器中减少分支上下文污染的低成本技术2007 年 10 月
摘要:本文提出两种低成本而且新颖的分支历史记录缓冲区处理方案,旨在偏移分支预测准确性,支持软实时嵌入式多线程处理器的实时线程。

PicoServer:使用三维堆栈技术构建高能效服务器2008 年 10 月
摘要:本文扩展了先前的研究,说明直接使用三维堆栈技术设计紧凑的高能效服务器。建议的架构称为 PicoServer,使用三维技术将一个含有多个简单低速处理内核的芯片分别接合到多个内存芯片,它们足以用作主内存。

RazorII:PVT 和 SER 容差的原位错误检测与修正2009 年 1 月
摘要:补偿 PVT 差异的传统自适应方法需要安全边际量,并且不能对迅速的环境变化作出反应。在本文中,作者提出一种设计 (RazorII),该设计可实现对差异诱发的延迟错误进行原位检测和架构修正的触发器。错误检测基于状态保持锁存器节点中的标记虚假转换。RazorII 触发器自然地检测到逻辑和寄存器 SER。

可重新配置的高能效近阈值高速缓存架构2008 年
摘要:电池寿命是现代嵌入式处理器的重要因素。电源电压缩放技术能将能耗降低一个数量级。目前商业内存技术一直受到电源电压缩放程度的限制,因为只有在这种技术能满足产量和可靠性的约束时才能执行缩放。这就限制了设计人员探索嵌入式处理器的近阈值操作区。作者总结了先前的研究后指出,内存单元的正确大小可以确保近阈值电源电压区内的内存单元的可靠性与标准内存单元的可靠性相匹配。

可靠状态保留电源门控设计的基于扫描的方法2010 年
摘要:电源门控是减少泄漏能耗的有效技术,它涉及通过电源开关来关闭空闲电路,但需要保留其状态的门控电路仍能将数据保存在状态保留寄存器中。当电源门控电路从睡眠模式切换到活动模式时,突然的电流冲击有可能损坏状态保留寄存器中存储的数据,这可能成为可靠性问题。本文提出一种改善电源门控设计的方法,即通过监控和修正状态来保护状态保留寄存器的完整性。这可以通过扫描链数据编码和解码来实现。该方法与 EDA 工具设计和电源门控控制流兼容。有关所建议的方法在检测和修正错误方面的功能的详细分析已经给出,包括保护电路的面积开销和能耗。该方法已使用 FPGA 验证,结果表明,可以用 Hamming 代码纠正所有单个错误,用 CRC-16 代码检测所有多重错误。据作者所知,这是在可靠电源门控设计领域中通过状态监控和修正来设计的第一项研究。

使用符号模拟的选择性状态保留设计2009 年 4 月
摘要:本文提出一个通过符号模拟来协助设计人员正确设计和实现选择性保留的案例研究。据作者所知,这是在选择性状态保留的慎密设计和实现领域中的第一项研究。

SOC-C:片上异类多核系统的有效编程抽象概念2008 年
摘要:本文解决了用一组语言扩展将应用程序映射到复杂 SoC 时所遇到的问题,使程序员能够将管道并行度引入后序程序,管理分布式内存和将所需要的任务映射表达到资源。

SODA:软件无线电的高性能 DSP 架构2007 年 2 月
摘要:软件无线电 (SDR) 属于新兴应用之类,它既有超级计算机的处理要求,又有移动终端的能耗限制。作者通过检查两种有很大不同的协议,即 W-CDMA 和 802.11a,开发了信号按需处理架构 (SODA),这是一种支持 SDR 的完全可编程架构。它通过将控制和数据处理分离,并通过使用超宽 SIMD 执行来满足能耗性能要求。

STEEL:应力增强的标准单元库设计技术2008 年
摘要:移动性降级和设备缩放的局限性迫使工艺工程师开发新技术,将机械应力引进 MOSFET 通道,从而增强了载体运输。新的制造步骤致力于提高载体的移动性,结果提高了 CMOS 设备中的 Ion 和 Ioff。然而,大多数应力增强技术取决于布局参数,其成果可在标准单元库设计内加以利用。在本文中,作者提出一种新的标准单元库设计方法,可跨越标准单元边界共享 VDD 和 VSS 源/排出连接。

应力感知布局优化2008 年
摘要:目前的 CMOS 技术利用过程诱发的机械应力来增强载体运输并实现更高的驱动电流。在本文中,作者研究了布局属性如何影响应力诱发的性能增强,并提出了改善布局以使性能增益最大化的准则。

嵌入式多传感器接口发展教学2011
摘要: 本文概述了基于 ARM 的课程的教学经验,在现有基础结构支持的基础上,通过有意义的感知和激励功能进行嵌入式无线系统设计培训。概述了适用的开发平台、设计工具包和实验室实验的作用,并强调了预期的结果。我们强调脚手架原理的作用,现在这项原理不仅适用于单一课程,而且适用于我们在开发这类课程中的全面经验。
 
 
高变异性 CMOS 进程中关联硅片和模型的挑战2009 年
摘要:本文讨论了后硅验证的关键性挑战之一:即把观测到的行为与建模的行为相关联的内在困难。验证时必须考虑硅的大量内在可变源,从设备和线模型本身的内在源到库建模、提取、工具算法等产生的近似值。文中举出一些验证标准单元和基于内存的设计示例以及可以用于实现芯片引入的一般方法。

编译器优化对嵌入式系统软件的应用2008 年 9 月
摘要:本文讨论了为充分利用特定处理器的编译器而对代码进行手动优化和对经过验证并且形制规整的代码应用内置优化选项之间的基本区别。使用模拟的 ARM 处理器和 C 编译器以及使用可应用于任何嵌入式编译器以便查找最佳的一组编译器选项的简单方法,演示了常用的内置编译器选项的示例。

高性能实时 SMT 处理器 TLB 中的线程优先级感知随机置换2007 年
摘要:本文提出一种新颖的随机置换法,可在完全的或设定的关联结构中(例如 TLB)改善与其他低优先级线程一起在 SMT 处理器中运行的主线程或高优先级线程的性能。

对嵌入式微控制器系统使用 Web 2.0 方法,2010 年
摘要: 
本文描述了佐治亚理工学院教职人员使用新方法开展嵌入式系统设计课程和相关实验室教学的经验。  基于云的 C/C++ 编译器和文件服务器与低成本 32 位微控制器板一起用于软件开发。学员资源包括电子书籍、基于 Web 的参考材料和作业、在线用户论坛以及具有示例微控制器应用程序代码的 wiki 页。在实验室作业中,使用模拟板以快速构建原型系统,该系统使用微控制器、网络和其他 I/O 子系统,这些子系统使用带有各种传感器、显示器和驱动程序的小分线板。软件开发在任何 Web 浏览器上进行,所有的学员文件都存储在 Web 服务器上,将代码下载到微控制器的方式与简单的 USB 闪存驱动器相同。

Way guard:一种采用分段计数布隆过滤器来减少集关联高速缓存能耗的方法2009 年
摘要:在现代处理器中,调整缓存的设计趋势是通过提高关联性继续提高其容量,以处理大的数据占位并利用特征大小收缩,但这也会导致能耗增加。本文提出一种使用分段计数布隆过滤器的技术,称为“Way Guard”,可减少在大型集关联高速缓存中查找冗余通道的数量,从而实现动态节能。这种 Way Guard 机制仅查找平均 25-30% 的高速缓存通道,并节省高达 65% 的 L2 能耗和高达 70% 的 L1 高速缓存能耗。

嵌入式 SRAM 的最坏情况设计和余量2007 年
摘要:对于嵌入式 SRAM 而言,面向产量的设计的一个重要方面是确定预期的最坏情况行为,以确保提供充分的设计余量。以前,这涉及多个模拟角和极端的测试条件。基于极值理论,统计因素和设备可变性要求采用不同的方法。该方法用于改进内存中可变性相关成品率的下限。

已经撰写的有关 ARM 技术的有教育价值的科研论文:


低功耗 SoC 的软硬件组合方法:应用自适应电压缩放和智能能源管理软件
2002 年 12 月
摘要:越来越高的功能和性能需求迫使片上系统 (SoC) 设计人员为便携式应用中可用电池能量的优化寻找更好的方法。探索的关键领域包括动态电压缩放和改善电源模式控制的软件算法。自适应电压缩放基于时间环境条件优化能源使用,而智能能源管理 (IEM) 算法基于处理器的动态工作负载优化能耗。IEM 软件和硬件可监视工作负载的执行和通信特性,并预先将处理器的性能设置为可以最少地消耗能源,同时仍满足应用程序安全界限的水平。

AMBA:实现可重复使用的片上设计1997 年 8 月
摘要:AMBA 的目标是帮助嵌入式 CPU 系统设计人员满足低功耗设计和测试访问等难题的要求。本文介绍 AMBA 的一些设计方法并提供一组可帮助设计人员与其他总线进行详细比较的规范

ARM MPEG-4 AAC LC 解码器技术规范2003 年 6 月
摘要:ARM MPEG-2 AAC 低复杂性配置文件解码器的技术规范。本文档详细介绍了集成到 ARM 提供的示例播放器中的解码器的性能。

ARM7TDMI 的功耗1997 年 8 月
摘要:便携式和手持产品要求处理器的功耗比台式机和其他具有供电装置的应用更低。因此,设计人员必须在设计的早期阶段,在电路层面和系统层面上分析能源的使用。RISC 处理器,例如 ARM7TDMI,在能耗方面同时具有优点和缺点。

动态电压缩放的自动性能设置2001 年 5 月
摘要:由于注重处理器的低能耗和高性能特性,因而在处理器设计中融入了动态电压缩放技术。这项功能让人在功耗和性能之间进行细致的折衷,前提是在 OS 中有控制该折衷方案的机制。本文介绍了一种为优化能源使用而自动控制动态电压缩放的新的软件方法。

为动态工作负载下的低功耗微处理器结合使用动态电压缩放和自适应体偏压2002 年 8 月
摘要:动态电压缩放 (DVS) 可在不需要峰值性能时降低处理器的功耗。然而,随着泄漏能耗的增加,仅靠 DVS 所能实现的功率节省量很有限。在本文中,作者说明了如何同时使用自适应体偏压 (ABB) 和 DVS 来降低高性能处理器的功耗。

呆滞高速缓存:减少泄漏能耗的简单技术2003 年 11 月
摘要:片上高速缓存功耗占微处理器总功耗的很大一部分。虽然大的高速缓存能显著改善性能,但会潜在地增加功耗。随着特征尺寸的缩小,功率损耗的主要部分将是漏流功耗。然而,在一个固定的时期内,高速缓存中的活动仅集中在一个小的行子集中。可以利用这种行为,通过将冷高速缓存行置于节能的低功耗呆滞模式,从而削减大型高速缓存的泄漏能耗。使这些行进入或离开半呆滞状态会导致性能轻微的轻微降低。在本文中,我们研究了实现呆滞高速缓存的策略和电路技术。作者表示,使用简单的架构技术,大约 80%-90% 的高速缓存行可以保持在呆滞状态,而对性能的影响不超过 1%。

呆滞指令高速缓存2002 年 9 月
摘要:本文扩展了呆滞高速缓存的架构控制机制以降低指令高速缓存的泄漏能耗,而对执行时间没有显著影响。结果显示,数据和指令高速缓存需要不同的控制策略才能有效地执行。

嵌入式控制器问题、Thumb 和 ARM7TDMI1995 年 10 月
摘要:高端嵌入式控制器应用(例如手机、磁盘驱动器和调制解调器)要求控制器提供更高的性能,同时仍然要求低成本。通过实现第二个压缩式指令集,我们的架构创新 Thumb 可降低 RISC 代码的大小,以 8/16 位系统的成本提供 32 位 RISC 性能。

嵌入式密码系统的功率智能片上系统架构2005 年 9 月
摘要:在嵌入式密码系统中,敏感信息可能会通过计时、功率和电磁通道而泄露。本文介绍一种新颖的功率智能片上系统架构,它能通过以实时方式将系统的功率和电流消耗控制在预定义的可编程值,从而为屏蔽这些通道提供支持。

Razor:基于电路级计时预测的低功耗管道2003 年 11 月
摘要:随着时钟频率和硅集成度的提高,功率感知计算已经成为嵌入式处理器和片上系统设计中的重要因素。功率感知计算的一种更有效且广泛使用的方法是动态电压缩放 (DVS)。为了通过 DVS 获得最大的节能效果,将电源电压缩放到尽可能低的水平,同时确保处理器正常运行是至关重要的。在本文中,作者为 DVS 提出了一种新方法,称为“Razor”,该方法基于电路计时错误的动态检测和修正。Razor 的要旨是通过在电路操作期间监测错误发生率来调节电源电压,从而不再需要电压余量,并可利用电路延迟的数据独立性。

与 X(隐藏在 Verilog 中的错误)共处的危险2003 年 10 月
摘要:X 在 Verilog RTL 中的语义极其危险,因为 RTL 错误可以被掩盖,从而当网表模拟失败时,会允许 RTL 模拟错误地通过。这种 X 错误通常会被忽略,因为正式的等效检查器配置为忽略这些错误,如果等效检查快速替换网表模拟,这种情况就要特别注意。本文给出了此类问题的示例,以便在设计流程的很多不同部分提高对 X 问题的认识,而对这种问题,RTL 设计人员往往理解得不好,EDA 供应商也一样。

桌面应用程序的线程级并行度和交互性能2000 年 8 月
摘要:与服务器工作负载不同的是,交互式应用程序的主要要求是对人的知觉范围内的用户事件做出反应,而不是使端到端吞吐量最大化。在本文中,作者报告了各种桌面应用程序的线程级并行度和交互响应时间。

桌面应用程序的线程级并行度2004 年 4 月
摘要:多重处理已在服务器中盛行,其中多个客户端提供线程级并行度的明显来源。对于桌面应用程序,多重处理不是很明显,然而处理器设计师已经在设计期望能应用可同时运行多个线程的处理器。在本文中,作者分析了多种(50 种以上)现有的桌面工作负载,包括 3 种不同的操作系统(Windows NT、BeOS 和 Linux),并量化分析了系统中的线程级并行度 (TLP) 的数量和性质。结果显示 OS 和应用程序结构对 TLP 有显著影响。虽然大多数工作负载仅展示出中等数量的并行度(小于 1.5),但有证据表明其中的很多工作负载本质上并不是单线程的。

Vertigo:Linux 的自动性能设置2002 年 10 月
摘要:将高性能与低功耗相结合正在成为处理器设计的主要目标之一。越来越多的处理器不是仅仅依靠睡眠模式来节能,而是利用这样的事实:降低 CPU 的时钟频率和相应的操作电压可以使消耗的能源以二次曲线的形式降低。然而,性能的下降只有在透明而且不会引起软件超出安全界限的情况下才是有益的。在本文中,作者介绍了 Linux 电源管理扩展 Vertigo 的实现和性能设置算法。


Maximise