고성능 컴퓨팅(HPC)의 혁신
네오버스(Neoverse) V1 CPU는 까다로운 HPC, 클라우드 내 HPC 및 AI/ML 지원 워크로드에서 최고의 코어당 성능을 제공하도록 설계되었습니다. 또한, Neoverse V1은 스케일러블 벡터 익스텐션(SVE)을 탑재한 첫 네오버스 프로세서로, 최대 벡터 성능, HPC 코드 재사용 및 긴 수명을 지원합니다.
기능 및 이점
코어당 성능을 극대화하도록 설계된 새로운 마이크로아키텍처 설계를 통해 네오버스 N1 코어 대비 50% 향상된 IPC 성능을 제공합니다.
256b 벡터 유닛 2개를 포함하며, 코어당 네오버스 N1의 정수 및 부동소수점 실행 능력을 배로 향상시킴으로써 HPC 및 AI/ML 성능을 개선합니다. SVE는 후지쯔(Fujitsu)와 공동으로 후카쿠(Fugaku) 프로젝트를 위해 개발되었으며, 벡터 폭에 구애 받지 않는 프로그래밍을 가능하게 합니다. SVE는 네오버스 V1에서 다시 컴파일할 필요 없이 128b에서 2048b에 이르는 벡터 코드 실행을 지원합니다.
고대역폭 DDR5 및 HBM2e/3 메모리 시스템을 배포하여 네오버스 V1 코어의 최고 성능을 가동할 수 있습니다. 설계자들은 유연한 CMN-700 인터커넥트에 사용자 지정 또는 타사 가속기를 연결함으로써 코어 성능을 향상시킬 수 있습니다.
제품 사양 및 주요 문서
| Architecture | Armv8-A (Harvard) | |
| Extensions |
|
|
| ISA support |
|
|
| Microarchitecture | Pipeline | Out-of-order |
| Superscalar | Yes | |
| SVE/ Neon / Floating Point Unit | Included | |
| Cryptography unit | Included | |
| Max number of CPUs in cluster | Direct-connect | |
| Physical addressing (PA) | 48-bit | |
| Memory system and external interfaces | L1 I-Cache /D-Cache | 64KB |
| L2 Cache | 1MB or 512kB | |
| ECC Support | Yes | |
| LPAE | Yes | |
| Bus interfaces | AMBA CHI | |
| Other | Security | TrustZone |
| Interrupts | GIC interface, GICv4 | |
| Generic timer | Armv8-A | |
| PMU | PMUv3 | |
| Debug | Armv8-A (plus Armv8.2-A extensions) | |
| CoreSight | CoreSightv3 | |
| Embedded Trace Macrocell | ETMv4.2 (instruction trace) |
주요 문서
자원
ETRI 및 SiPearl의 전문가들은 어떻게 Arm 네오버스 V1이 최첨단 전력과 성능 효율성으로 AI와 기타 HPC 프로젝트를 위한 엑사스케일급(exascale-class) CPU 구축을 지원하는지에 대해서 설명합니다.
기타 문서
- 네오버스 V1 레퍼런스 설계
고성능 DDR5와 PCle Gen5 IO를 통해 최대 128코어 지원.