
**번역본뉴스입니다. 오역이 있을수 있습니다.
AWS가 자사의 클라우드 컴퓨팅 플랫폼 및 AI 추론 인프라 전반에 배포하기 위해 안나푸르나 랩스(Annapurna Labs)에서 개발한 차세대 프로세서 '그라비톤5(Graviton5)'를 처음으로 공개했습니다. 이 새로운 프로세서는 하이퍼스케일 데이터 센터 워크로드에 특별히 맞춤화된 자체 실리콘을 개발하려는 AWS의 지속적인 노력에서 중대한 진전을 나타냅니다. 그라비톤5는 TSMC의 첨단 3nm 공정 기술을 사용하여 제조된 4개의 컴퓨트 다이(Compute die)를 중심으로 구축된 칩렛 기반 아키텍처를 채택했습니다. 이 패키지는 결합을 통해 192개의 Arm v3 성능 코어를 제공하며, 이는 공개적으로 밝혀진 Arm 서버 프로세서 중 가장 높은 코어 수를 자랑하는 제품 중 하나입니다. 각 코어에는 1MB의 전용 캐시가 포함되어 있어, 고도로 병렬화된 워크로드 전반에서 성능 일관성을 향상시키는 동시에 메모리 접근 지연 시간을 줄여줍니다. 이번 디자인의 주요 초점은 메모리 대역폭입니다. 이 프로세서는 최대 DDR5-8800의 속도를 지원하는 12채널 DDR5 메모리 서브시스템을 통합했습니다. AWS는 이 플랫폼이 800GB/s 이상의 총 메모리 대역폭을 제공할 수 있다고 밝혔습니다. 이러한 대역폭은 대규모 데이터베이스, 가상화, 분석, 그리고 메모리와 컴퓨팅 자원 간의 신속한 데이터 이동에 의존하는 AI 추론 애플리케이션을 포함한 현대적 클라우드 서비스에서 갈수록 중요해지고 있습니다.

연결성은 96레인의 PCI 익스프레스(Express) Gen 6 루트 컴플렉스를 통해 제공됩니다. PCIe Gen 6로의 전환은 가속기, GPU, 네트워킹 하드웨어 및 스토리지 장치에 사용할 수 있는 I/O 대역폭을 크게 증가시킵니다. AI 인프라의 복잡성이 계속해서 커짐에 따라, 프로세서와 연결된 장치 간의 더 빠른 통신은 갈수록 더 가치 있는 요소가 되고 있습니다. 4개의 독립된 칩렛으로 구성되어 있음에도 불구하고, 그라비톤5는 완전히 일관성 있는(coherent) 하나의 프로세서로 작동합니다. AWS는 420GB/s의 대역폭을 제공하는 다이 간(die-to-die) 상호 연결을 구현하여, 모든 칩렛이 데이터를 공유하는 동시에 패키지 전반에서 캐시 일관성을 유지할 수 있도록 했습니다. 이러한 접근 방식은 소프트웨어가 이 프로세서를 독립된 컴퓨트 다이의 집합체가 아닌 하나의 통합된 플랫폼으로 바라볼 수 있게 해줍니다. 각 칩렛은 시스템 자원을 동일한 비율로 분담합니다.
단일 다이 하나에는 48개의 Arm v3 성능 코어, 3채널 DDR5 메모리 컨트롤러, 그리고 24레인의 PCIe Gen 6 루트 컴플렉스가 포함되어 있습니다. 이 균형 잡힌 구성을 통해 컴퓨팅, 메모리 및 I/O 자원이 전체 프로세서 패키지 전반에서 일관되게 확장되도록 돕습니다. AWS는 그라비톤5가 현재 인텔 제온 스케일러블 캐스케이드 레이크(Intel Xeon Scalable Cascade Lake) 및 AMD 에픽 제노아(AMD EPYC Genoa) 프로세서 기반의 AWS G4 인스턴스 대비 최대 25%의 성능 향상을 목표로 하고 있다고 명시했습니다. 상세한 벤치마크 결과는 아직 발표되지 않았지만, 공개된 사양은 컴퓨팅 밀도, 메모리 처리량 및 플랫폼 대역폭 측면에서 의미 있는 이득이 있음을 시사합니다. 이 프로세서는 클라우드 제공업체들이 점차 자신들의 워크로드에 맞춰 하드웨어를 최적화하고자 함에 따라, 자체 실리콘에 대한 AWS의 지속적인 투자를 극명히 보여줍니다. 192개의 Arm 코어, DDR5-8800 지원, PCIe Gen 6 연결성, 그리고 고대역폭의 일관성 있는 상호 연결을 갖춘 그라비톤5는 대규모 클라우드 및 AI 배포의 증가하는 요구 사항을 해결하도록 설계된 것으로 보입니다.
AWS blog - https://aws.amazon.com/ko/blogs/korea/now-available-amazon-ec2-m9g-and-m9gd-instances-powered-by-new-aws-graviton5-processors/
| 사양 (Specification) | AWS 그라비톤5 (AWS Graviton5) |
| 공정 기술 (Process Technology) | TSMC 3nm |
| 아키텍처 (Architecture) | Arm v3 |
| 총 CPU 코어 수 (Total CPU Cores) | 192 |
| 칩렛 수 (Chiplets) | 4 |
| 칩렛당 코어 수 (Cores per Chiplet) | 48 |
| 코어당 캐시 (Cache per Core) | 1 MB |
| 메모리 채널 (Memory Channels) | 12x DDR5 |
| 최대 메모리 속도 (Maximum Memory Speed) | DDR5-8800 |
| 메모리 대역폭 (Memory Bandwidth) | 800 GB/s 이상 |
| PCI 익스프레스 (PCI Express) | 96 레인 PCIe Gen 6 |
| 다이 간 대역폭 (Die-to-Die Bandwidth) | 420 GB/s |
| 목표 성능 향상 (Target Performance Gain) | 최대 25% |
--------------------------------------------------------------------------------------광고(Advertising)--------------------------------------------------------------------------------------------------------