*번역본뉴스입니다. 오역이 있을수 있습니다.
AMD는 Advancing AI 행사에서 오라클 클라우드 인프라스트럭처(OCI)가 AMD의 최신 Instinct MI350X 시리즈 GPU와 함께 업계 최초의 울트라 이더넷 규격 준수 NIC인 펜산도 폴라라 400GbE 네트워크 인터페이스 카드(NIC)를 배포할 예정이라고 발표했습니다. 이번 발표는 울트라 이더넷 컨소시엄이 이번 주에 대규모 AI 및 HPC 데이터 센터를 위해 설계된 울트라 이더넷 기술의 사양 1.0을 발표한 직후에 이루어졌습니다.
AMD의 Instinct MI350X 시리즈 GPU와 펜산도 폴라라 400GbE NIC가 탑재된 시스템은 올해 후반에 OCI 및 아마도 다른 클라우드 서비스 제공업체를 통해 광범위하게 사용 가능할 예정입니다. 펜산도 폴라라 400GbE 네트워크 카드는 오라클이 AMD의 최신 AI GPU를 광범위하게 배포하고 최대 131,072개의 Instinct MI355X로 구성된 제타스케일(zettascale) AI 클러스터를 구축할 계획인 점을 감안하면 특히 유용합니다. 이를 통해 고객은 대규모로 AI 모델을 학습 및 추론할 수 있습니다.
AMD의 펜산도 폴라라 400GbE NIC는 다른 울트라 이더넷 규격 준수 네트워크 하드웨어와 마찬가지로 최대 백만 개의 AI 프로세서 또는 GPU를 포함하는 대규모 확장 환경을 위해 설계되었으며, AI 워크로드에 최대 6배의 성능 향상을 제공합니다. AMD는 폴라라 400GbE 카드가 Nvidia CX7보다 10% 더 높은 RDMA(원격 직접 메모리 액세스) 성능과 Broadcom Thor2 솔루션보다 20% 더 높은 RDMA 성능을 제공한다고 주장합니다. 또한 UEC 1.0의 효율적인 로드 밸런싱, 선택적 재전송 및 경로 인식 혼잡 제어와 같은 기능은 기존 RoCEv2에 비해 RDMA 성능을 최대 25% 향상시킬 수 있습니다.
펜산도 폴라라 400GbE NIC는 자체 설계된 특수 프로세서 기반으로 제작되었으며, RDMA, 조정 가능한 전송 프로토콜 및 통신 라이브러리 오프로딩을 지원하는 사용자 정의 가능한 하드웨어를 갖추고 있습니다. 이 NIC는 데이터 스트림을 여러 경로에 지능적으로 분산하여 병목 현상을 방지하고 대규모 GPU 배포에서 일관된 처리량을 보장하기 위해 과부하된 네트워크 경로로부터 트래픽을 동적으로 재라우팅합니다.
또한 AMD의 폴라라 400GbE 카드는 고속 GPU-GPU 링크를 유지하기 위해 연결을 신속하게 감지하고 우회하는 페일오버 기술을 특징으로 합니다. 이러한 기능은 수만 개의 상호 연결된 가속기를 갖춘 환경에서 클러스터 활용률을 유지하고 지연 시간을 줄이는 데 매우 중요합니다.
OCI가 AMD의 폴라라 400GbE NIC를 처음으로 대규모로 배포할 예정이지만(AMD Instinct MI355X 기반 클러스터를 가장 많이 보유할 가능성이 높음), 대규모 AMD Instinct 배치를 계획하는 다른 회사들도 곧 뒤따라 울트라 이더넷 장비의 보급을 촉진할 것입니다. 해당 카드는 현재 관심 있는 파티들에게 발송되고 있습니다.
--------------------------------------------------------------------------------------광고(Advertising)--------------------------------------------------------------------------------------------------------