macsplex.com 로그인

검색

Extra Form
출처/참고/홈페이지 https://www.nvidia.com/en-us/data-center...hitecture/

Screenshot 2024-03-19 at 22-37-00 NVIDIA Blackwell Architecture.png

**번역본 뉴스입니다. 오역이 있을수 있습니다.

 

가속화된 컴퓨팅 및 생성 AI의 장벽을 허물다

엔비디아 블랙웰 아키텍처가 제너레이티브 AI와 가속화된 컴퓨팅에 가져온 획기적인 발전을 살펴봅니다. 수 세대에 걸친 엔비디아 기술을 기반으로 하는 블랙웰은 타의 추종을 불허하는 성능, 효율성 및 규모로 제너레이티브 AI의 다음 장을 정의합니다.


새로운 등급의 AI 슈퍼칩

블랙웰 아키텍처 GPU는 2080억 개의 트랜지스터를 패키징하고 맞춤형 TSMC 4NP 프로세스를 사용하여 제조됩니다. 모든 블랙웰 제품은 통합된 단일 GPU에서 10TB/s(초당 10테라바이트) 칩 대 칩 상호 연결로 연결된 두 개의 레티클 제한 다이를 특징으로 합니다.

 

2세대 변압기 엔진

2세대 트랜스포머 엔진은 NVIDIA® TensorRT™-LLM 및 NeMo™ Framework 혁신과 결합된 맞춤형 Blackwell Tensor Core 기술을 사용하여 대형 언어 모델(LLM) 및 전문가 혼합(MoE) 모델에 대한 추론 및 훈련을 가속화합니다.

MoE 모델의 추론을 강화하기 위해 블랙웰 텐서 코어는 커뮤니티 정의 마이크로스케일링 형식을 포함한 새로운 정밀도를 추가하여 더 큰 정밀도에 대한 높은 정확도와 교체 용이성을 제공합니다. 블랙웰 트랜스포머 엔진은 마이크로 텐서 스케일링이라는 세분화된 스케일링 기술을 활용하여 4비트 부동 소수점(FP4) AI를 가능하게 하는 성능과 정확도를 최적화합니다. 이는 메모리가 높은 정확도를 유지하면서 지원할 수 있는 차세대 모델의 성능과 크기를 두 배로 증가시킵니다.


보안 AI

Blackwell에는 NVIDIA Confidential Computing이 포함되어 있어 강력한 하드웨어 기반 보안으로 기밀 데이터 및 AI 모델을 무단 액세스로부터 보호합니다. Blackwell은 업계 최초의 TEE-I/O 지원 GPU이며, NVIDIA® NVLink®를 통해 TEE-I/O 지원 호스트와 인라인 보호 기능을 갖춘 가장 성능이 뛰어난 기밀 컴퓨팅 솔루션을 제공합니다. Blackwell Confidential Computing은 암호화되지 않은 모드와 비교하여 거의 동일한 처리량 성능을 제공합니다. 기업은 이제 AI 지적 재산권(IP)을 보호하고 기밀 AI 교육, 추론 및 연합 학습을 안전하게 가능하게 할 뿐만 아니라 성능 면에서 가장 큰 모델도 보호할 수 있습니다.

NVLink 및 NVLink 스위치

엑사스케일 컴퓨팅 및 조 파라미터 AI 모델의 잠재력을 최대한 발휘하는 것은 서버 클러스터 내의 모든 GPU 간의 신속하고 원활한 통신 필요성에 달려 있습니다. NVIDIA® NVLink® 인터커넥트의 5세대는 최대 576 GPU를 확장하여 조 및 다중 trillion 파라미터 AI 모델에 대한 가속화된 성능을 제공할 수 있습니다.  

NVIDIA NVLink Switch Chip은 하나의 72-GPU NVLink 도메인(NVL72)에서 130TB/s의 GPU 대역폭을 지원하며 NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol(SHARP)™ FP8 지원으로 4배의 대역폭 효율성을 제공합니다. 엔비디아 NVLink Switch Chip은 동일한 1.8TB/s 인터커넥트로 단일 서버 이상의 클러스터를 지원합니다. NVLink를 사용하는 다중 서버 클러스터는 증가된 컴퓨팅과 균형을 맞춰 GPU 통신을 확장하므로 NVL72는 단일 8-GPU 시스템보다 9배의 GPU 처리량을 지원할 수 있습니다.

 

압축 해제 엔진

데이터 분석 및 데이터베이스 워크플로우는 전통적으로 컴퓨팅을 위해 CPU에 의존해 왔습니다. 가속화된 데이터 과학은 엔드투엔드 분석의 성능을 크게 향상시켜 가치 창출 속도를 높이는 동시에 비용을 절감할 수 있습니다. 아파치 스파크를 포함한 데이터베이스는 데이터 분석을 위해 대용량 데이터를 처리, 처리 및 분석하는 데 중요한 역할을 합니다.

Blackwell의 압축 해제 엔진과 NVIDIA Grace™ CPU의 대용량 메모리에 고속 링크(900GB/s의 양방향 대역폭)를 통해 액세스할 수 있는 기능은 LZ4, Snappy 및 Deflate와 같은 최신 압축 형식을 지원하여 데이터 분석 및 데이터 과학 분야에서 최고의 성능을 제공하는 전체 데이터베이스 쿼리 파이프라인을 acceler합니다.

 

RAS(신뢰성, 가용성 및 서비스성) 엔진

블랙웰은 다운타임을 최소화하기 위해 초기에 발생할 수 있는 잠재적 결함을 식별하기 위해 전용 RAS(Reliability, Availability, Serviceability) 엔진으로 지능적 복원력을 추가합니다. 엔비디아의 AI 기반 예측 관리 기능은 하드웨어와 소프트웨어 전반에 걸쳐 수천 개의 데이터 포인트를 지속적으로 모니터링하여 다운타임과 비효율성의 원인을 예측하고 차단합니다. 이를 통해 시간, 에너지 및 컴퓨팅 비용을 절약하는 지능적 복원력을 구축합니다. NVIDIA의 RAS Engine은 문제가 있는 부분을 식별하고 유지 관리 계획을 세울 수 있는 심층적인 진단 정보를 제공합니다. RAS Engine은 문제의 근원지를 신속하게 파악하여 처리 시간을 단축하고 효과적인 복구를 촉진하여 다운타임을 최소화합니다.





--------------------------------------------------광고(Advertising)-------------------------------------------------------------------------------------


TAG •

Who's DNAVI

profile

안녕하세요 macsplex.com 웹마스터 DNAVI입니다.

오픈소스를 좋아하고 컴퓨터에서 돌아가는 OS와 소프트웨어를 설치하고 웹사이트를 운영하는데 관심이 많습니다.

 

가지고 있는 제품리스트

PC  :

homebuilt computer(Intel i7-4790K, ASUS MAXIMUS Ranger Vii, AMD Radeon R290),

homebuilt computer(AMD Phenom X4 630, GIGABYTE GA-61P-S3, NVIDIA GT8600),

Apple iMac 2009 late(Intel E7600)

Apple MacMini 2018(Intel i5-8500B, A1993)

homebuilt computer(AMD Ryzen 3200G, Asrock B450 Steel Legend)

Beelink SER(AMD Ryzen 7840HS, 64GB)

 

Notebook :

Apple Macbook Air 2022 (M2, A2681)

Lenovo LEGION 5 Pro 16ACH R7 STORM (AMD R7-5800H, NVIDIA RTX3060 laptop)

Lenovo Thinkpad T420s(Intel i5-2540M)

Apple Macbook Air 2011 Mid( i5-2467M, A1370)

 

Server :

Dell PowerEdge R420(Intel XEON E5-2407)

Dell PowerEdge R710(Intel XEON E5620 x2, 32GB)

HP Proliant Microserver Gen8(Intel XEON E3-1230V2)

 

NAS :

Synology.DS218+

BUFFALO LinkStation Live LS-XL/E

 

Smartphone:

Motorola Edge 20 pro

Apple iPhone 12

Apple iPhone 15 Pro Max

Samsung Galaxy S8

Xiaomi Redmi Note 4, Mi 8

Lenovo Phab2 Pro

Apple iPhone 5

Huawei X3, Nova Smart

Blackberry 9790

 

Tablet :

Apple iPad Air2

Samsung Galaxy Tab S7+

 

Game Console :

Sony PSP, PS3, PS4 Pro, PS5

Microsoft Xbox 360, Xbox One X

Nintendo DS Lite, 3DS XL, Switch Lite, Switch

HardKernel Odrid Go Advance Black Edition

Gamepark GP2X-F100


List of Articles
분류 제목 글쓴이 날짜
제품 WD Ultrastar DCHS760은 582MB/s의 전송 속도와 동시 읽기 및 쓰기 속도를 자랑하는 가장 빠른 HDD입니다 file DNAVI 2023.02.02
제품 ThinkPad X1 Carbon 8세대 file DNAVI 2020.02.01
제품 SEAGATE IRONWOLF 510 NVME 출시 file DNAVI 2020.03.20
제품 RTX30시리즈 출시일과 가격 루머 file DNAVI 2020.01.31
ReactOS 0.4.9 릴리즈 file DNAVI 2018.07.27
제품 QNAP 쿼드코어 AMD Ryzen 기반의 TS-x73A 시리즈 NAS 출시 file DNAVI 2021.05.24
제품 QNAP 듀얼 포트 100GbE 네트워크 확장 카드를 출시 file DNAVI 2021.06.21
제품 Phison PCIe Gen5 SSD 컨트롤러 E26 file DNAVI 2023.01.05
제품 NVIDIA’s GeForce RTX 3090 기판 사진 file DNAVI 2020.09.03
제품 Nvidia RTX 2000 Ada는 가장 작은 GeForce RTX 4000 GPU와 16GB VRAM 및 70W TGP를 결합합니다 file DNAVI 2024.02.15
제품 NVIDA Blackwell 아키텍쳐 새로운 산업혁명의 엔진. file DNAVI 2024.03.19
제품 MSI는 24GB 및 48GB DDR5 DIMM, 최대 192GB RAM을 지원합니다 file DNAVI 2023.02.13
제품 MSI, 코어 울트라를 탑재한 세계 최초의 게이밍 핸드헬드 클로를 공개합니다. file DNAVI 2024.01.09
제품 MSI, 온라인 게이밍을 위한 새로운 네트워킹 라인업 공개 file DNAVI 2023.02.20
제품 MSI, TRI FROZR3 쿨러 탑재 화이트 모델 'GeForce RTX 4080 16GB GAMING X TRIO WHITE' 등 4개 제품 file DNAVI 2023.02.09
제품 MSI GeForce RTX 4070 TI SUPRIM, GAMING 그리고 VENTUS 그래픽카드 file DNAVI 2023.01.04
모바일 MIUI 10 새로운 기능들 file DNAVI 2018.06.13
모바일 MIUI 10 개발시작 file DNAVI 2018.01.24
업계동향 Microsoft는 수천 개의 Nvidia GPU가 어떻게 ChatGPT를 구축했는지 설명합니다 file DNAVI 2023.03.14
업계동향 Microsoft, 코파일럿 및 Windows AI 기능의 최소 요구 사양으로 16GB RAM 설정 file DNAVI 2024.01.18
Board Pagination Prev 1 2 3 4 5 6 7 Next
/ 7