NVIDIA Blackwell: B200 e GB200 NVL72, l'era del rack-scale AI
In una frase Al GTC 2024 NVIDIA annuncia Blackwell B200 (208B transistor, dual-die) e il sistema GB200 NVL72 (72 GPU + 36 Grace CPU in un rack). Inference 30x più veloce per LLM frontier.
Una volta all'anno NVIDIA fa la sua conferenza, GTC. Nel 2024 Jensen Huang sale sul palco vestito di pelle nera e annuncia Blackwell, la nuova famiglia di chip AI.
Il numero che colpisce: il chip B200 ha 208 miliardi di transistor (Hopper H100 ne aveva 80). È così grande che è in realtà due chip cuciti insieme. E il prodotto vero non è il singolo chip, è il rack: il GB200 NVL72 è un armadio alto 2 metri con 72 GPU collegate da NVLink interno, pensato come "un solo computer gigante".
Per chi addestra i modelli più grandi (OpenAI, Anthropic, Meta, xAI, Google) significa: stesso modello addestrato in metà tempo, o modelli 4x più grandi nello stesso tempo. La fila per ordinare questi rack si forma immediata, con consegne per il 2025.
Aziende
NVIDIA
Tool
B200, GB200 NVL72, NVLink
Tag
Fonti