
**번역본뉴스입니다. 오역이 있을수 있습니다.
NVIDIA는 오늘 에이전트 AI(agentic AI) 및 강화 학습(reinforcement learning) 시대를 위해 특별히 제작된 세계 최초의 프로세서인 NVIDIA Vera CPU를 출시했습니다. 이 제품은 기존 랙 스케일 CPU보다 두 배의 효율성과 50% 더 빠른 속도로 결과를 제공합니다. 추론 및 에이전트 AI가 발전함에 따라 작업을 계획하고, 도구를 실행하며, 데이터와 상호 작용하고, 코드를 실행하며, 결과를 검증하는 모델을 지원하는 인프라에 의해 규모, 성능 및 비용이 점점 더 좌우되고 있습니다.
NVIDIA Vera CPU는 NVIDIA Grace CPU의 성공을 바탕으로 구축되었으며, 모든 규모와 산업 분야의 조직이 대규모로 에이전트 AI를 실현하는 AI 팩토리를 구축할 수 있도록 지원합니다. 코어당 가장 높은 단일 스레드 성능과 대역폭을 갖춘 Vera는 코딩 어시스턴트와 같은 대규모 AI 서비스는 물론 소비자 및 엔터프라이즈 에이전트를 위해 더 높은 AI 처리량, 응답성 및 효율성을 제공하는 새로운 차원의 CPU입니다.
Vera를 배포하기 위해 NVIDIA와 협력하는 선도적인 하이퍼스케일러로는 Alibaba, CoreWeave, Meta, Oracle Cloud Infrastructure가 있으며, 글로벌 시스템 제조업체인 Dell Technologies, HPE, Lenovo, Supermicro 등도 포함됩니다. 이러한 광범위한 도입은 Vera를 개발자, 스타트업, 민관 기관 및 기업에게 가장 중요한 AI 워크로드를 위한 새로운 CPU 표준으로 자리매김하게 하여, AI에 대한 접근을 민주화하고 혁신을 가속화하는 데 도움을 줍니다.
"Vera는 AI의 전환점에 도착하고 있습니다. 인텔리전스가 추론하고 행동할 수 있는 에이전트 형태로 변모함에 따라, 그 작업을 조율하는 시스템의 중요성이 높아지고 있습니다"라고 NVIDIA의 창립자이자 CEO인 젠슨 황(Jensen Huang)은 말했습니다. "CPU는 더 이상 단순히 모델을 지원하는 것이 아니라 모델을 주도하고 있습니다. 획기적인 성능과 에너지 효율성을 갖춘 Vera는 더 빠르게 생각하고 더 멀리 확장하는 AI 시스템을 구현합니다."

모든 데이터 센터를 위한 구성 가능성
NVIDIA는 각각 최고의 성능으로 독립적으로 실행되는 22,500개 이상의 동시 CPU 환경을 유지하기 위해 256개의 수랭식 Vera CPU를 통합한 새로운 Vera CPU 랙을 발표했습니다. AI 팩토리는 단일 랙에서 수만 개의 동시 인스턴스 및 에이전트 도구를 신속하게 배포하고 확장할 수 있습니다.
새로운 Vera 랙은 전 세계 80개의 에코시스템 파트너가 지원하는 NVIDIA MGX 모듈형 레퍼런스 아키텍처를 사용하여 구축되었습니다.
NVIDIA Vera Rubin NVL72 플랫폼의 일부로서, Vera CPU는 CPU와 GPU 간의 고속 데이터 공유를 위해 PCIe 6세대 대역폭의 7배인 1.8TB/s의 일관성 대역폭(coherent bandwidth)을 갖춘 NVIDIA NVLink-C2C 인터커넥트 기술을 통해 NVIDIA GPU와 페어링됩니다. 또한 NVIDIA는 NVIDIA HGX Rubin NVL8 시스템을 위한 호스트 CPU로 Vera를 사용하여 GPU 가속 워크로드에 대한 데이터 이동 및 시스템 제어를 조정하는 새로운 레퍼런스 디자인을 도입했습니다.
Vera 시스템 파트너들은 강화 학습, 에이전트 추론, 데이터 처리, 오케스트레이션, 스토리지 관리, 클라우드 애플리케이션 및 고성능 컴퓨팅과 같은 워크로드에 최적화된 듀얼 및 단일 소켓 CPU 서버 구성을 모두 제공하고 있습니다.
모든 구성에 걸쳐 Vera 시스템은 에이전트 AI에 필수적인 가속화된 네트워킹, 스토리지 및 보안을 위해 NVIDIA ConnectX SuperNIC 카드 및 NVIDIA BlueField-4 DPU를 통합합니다. 이를 통해 고객은 NVIDIA 플랫폼 전반에서 단일 소프트웨어 스택을 유지하면서 특정 워크로드에 맞게 최적화할 수 있습니다.
에이전트 확장을 위한 설계
고성능, 에너지 효율적인 CPU 코어, 고대역폭 메모리 하위 시스템 및 2세대 NVIDIA Scalable Coherency Fabric을 결합함으로써 Vera는 에이전트 AI 및 강화 학습에 흔히 나타나는 극한의 활용 조건에서도 더 빠른 에이전트 응답을 가능하게 합니다.
Vera는 NVIDIA가 맞춤 설계한 88개의 Olympus 코어를 특징으로 하며 컴파일러, 런타임 엔진, 분석 파이프라인, 에이전트 툴링 및 오케스트레이션 서비스를 위한 높은 성능을 제공합니다. 각 코어는 NVIDIA Spatial Multithreading을 사용하여 두 개의 작업을 실행함으로써 일관되고 예측 가능한 성능을 제공할 수 있어, 한 번에 많은 작업을 실행하는 멀티 테넌트(multi-tenant) AI 팩토리에 이상적입니다.
에너지 효율성을 더욱 향상시키기 위해, Vera는 이제 LPDDR5X 메모리를 기반으로 구축되어 최대 1.2TB/s의 대역폭을 제공하는 2세대 NVIDIA 저전력 메모리 하위 시스템을 도입합니다. 이는 범용 CPU와 비교하여 절반의 전력으로 두 배의 대역폭을 제공하는 것입니다.
광범위한 에코시스템 지원
AI 네이티브 소프트웨어 개발의 혁신 기업인 Cursor는 AI 코딩 에이전트의 성능을 높이기 위해 NVIDIA Vera를 도입하고 있습니다.
Cursor의 공동 창립자이자 CEO인 마이클 트루엘(Michael Truell)은 "고객에게 더 빠르고 반응성이 뛰어난 코딩 에이전트 경험을 제공하기 위해 전반적인 처리량과 효율성을 개선할 수 있는 NVIDIA Vera CPU를 사용하게 되어 기쁩니다"라고 말했습니다.
선도적인 스트리밍 데이터 및 AI 플랫폼인 Redpanda는 성능을 획기적으로 높이기 위해 Vera를 사용하고 있습니다.
Redpanda의 창립자이자 CEO인 알렉스 갈레고(Alex Gallego)는 "Redpanda는 최근 Apache Kafka 호환 워크로드를 실행하는 NVIDIA Vera를 테스트했으며 우리가 벤치마킹한 다른 시스템보다 획기적으로 향상된 성능을 확인하여 지연 시간(latency)을 최대 5.5배까지 낮췄습니다"라고 말했습니다. "Vera는 코어당 더 많은 메모리와 더 적은 오버헤드를 갖춘 CPU 아키텍처의 새로운 방향을 제시하며, 고객이 실시간 스트리밍 워크로드를 그 어느 때보다 더 확장하고 새로운 AI 및 에이전트 애플리케이션을 구현할 수 있도록 지원합니다."
Vera CPU 배포를 계획 중인 국립 연구소에는 라이프니츠 슈퍼컴퓨팅 센터(Leibniz Supercomputing Centre), 로스앨러모스 국립 연구소(Los Alamos National Laboratory), 로렌스 버클리 국립 연구소의 국립 에너지 연구 과학 컴퓨팅 센터(Lawrence Berkeley National Laboratory's National Energy Research Scientific Computing Center), 텍사스 첨단 컴퓨팅 센터(TACC)가 있습니다.
TACC의 고성능 컴퓨팅 책임자인 존 카제스(John Cazes)는 "TACC에서는 곧 선보일 Horizon 시스템 배포를 준비하면서 최근 NVIDIA의 Vera CPU 플랫폼을 테스트했으며, 6개의 과학 애플리케이션을 실행한 결과 인상적인 초기 결과를 확인했습니다"라고 말했습니다. "Vera의 코어당 성능과 메모리 대역폭은 과학 컴퓨팅을 위한 거대한 진전을 의미하며, 올해 말 Horizon을 통해 CPU 사용자에게 Vera 기반 노드를 제공할 수 있기를 기대합니다."
Vera CPU 배포를 계획 중인 선도적인 클라우드 서비스 제공업체로는 Alibaba, ByteDance, Cloudflare, CoreWeave, Crusoe, Lambda, Nebius, Nscale, Oracle Cloud Infrastructure, Together.AI, Vultr가 있습니다.
Vera CPU를 채택하는 선도적인 인프라 제공업체로는 Aivres, ASRock Rack, ASUS, Compal, Cisco, Dell, Foxconn, GIGABYTE, HPE, Hyve, Inventec, Lenovo, MiTAC, MSI, Pegatron, Quanta Cloud Technology(QCT), Supermicro, Wistron, Wiwynn이 있습니다.
출시 일정
NVIDIA Vera는 본격적인 생산에 들어갔으며, 올해 하반기에 파트너를 통해 제공될 예정입니다.
NVIDIA뉴스룸 - https://nvidianews.nvidia.com/news/nvidia-launches-vera-cpu-purpose-built-for-agentic-ai
--------------------------------------------------------------------------------------광고(Advertising)--------------------------------------------------------------------------------------------------------