Physical AI e Blackwell — Jensen Huang al GTC 2024

Chi è: Jensen Huang, cofondatore e CEO di NVIDIA dal 1993. Taiwan-americano. Ha trasformato NVIDIA da produttore di GPU per videogiochi a infrastruttura mondiale dell'AI. Valore di mercato NVIDIA: da $300B nel 2022 a $3T+ nel 2024. Il GTC (GPU Technology Conference) è diventato il keynote più atteso del settore AI — il "WWDC dell'AI."

La tesi del keynote

"Stiamo attraversando una rivoluzione industriale dell'AI." Con questa frase Jensen Huang ha aperto il GTC 2024 davanti a 11.000 persone al SAP Center di San Jose, California. Ma la tesi centrale del keynote non riguarda l'AI di testo e immagini che già conosciamo — riguarda il passo successivo: l'AI che comprende e opera nel mondo fisico. Jensen chiama questa frontiera Physical AI: sistemi intelligenti che possono percepire lo spazio tridimensionale, ragionare sulla fisica degli oggetti, pianificare azioni nel mondo reale, e agire attraverso corpi robotici o sistemi di controllo industriale.

La visione è ambiziosa e precisa nello stesso tempo. L'AI del testo e del codice — GPT-4, Claude, Gemini — ha già dimostrato capacità sorprendenti nella comprensione linguistica. Ma la lingua è solo una parte del mondo. Il novanta percento del valore economico che Jensen intende catturare con NVIDIA è nei mondi fisici: fabbriche, magazzini, logistica, costruzione, agricoltura, chirurgia. Questi mondi richiedono AI che capisca la gravità, l'attrito, la collisione, la deformazione dei materiali. La GPU non è più un chip per gamer o per data center che processa testo: è l'unità fondamentale della nuova economia fisica dell'AI.

Architettura Blackwell

L'annuncio tecnico principale del GTC 2024 è l'architettura Blackwell, che prende il nome dal matematico David Blackwell. Il chip B100/B200 rappresenta la nuova generazione di GPU NVIDIA dopo Hopper (H100). I numeri tecnici: 208 miliardi di transistor, prodotto a processo 4nm da TSMC con tecnologia "die-to-die NVLink" che unisce due chip in un unico package logico. La connettività tra GPU: NVLink Switch di quinta generazione con 1.8TB/s di bandwidth totale nell'intero rack NVL72.

Il confronto con la generazione precedente è impietoso per Hopper: Blackwell offre 2.5x le performance in training e fino a 5x in inference, con efficienza energetica per token significativamente migliorata. Un DGX B200 — il sistema con otto GPU B200 — vale circa $300.000. Un NVL72 (rack completo con 72 GPU) supera il milione di dollari. La domanda, all'uscita del keynote, supera la produzione prevista di 12-18 mesi: Microsoft, Google, Amazon, Meta, Oracle hanno già prenotato miliardi di dollari di Blackwell. TSMC non riesce a produrre abbastanza wafer. Jensen Huang ha il problema più bello del mondo: non riesce a vendere tutto quello che i clienti vogliono comprare.

NIM e l'ecosistema software

Jensen annuncia NVIDIA Inference Microservices (NIM): container pre-ottimizzati per deployare modelli AI — Llama, Mistral, Stable Diffusion, modelli verticali per healthcare, finance, design — su infrastruttura NVIDIA con un singolo comando. La mossa strategica è evidente a chi conosce la storia dell'informatica: CUDA era il lock-in hardware — chi scrive codice CUDA dipende da GPU NVIDIA. NIM è il lock-in software — chi usa NIM per il deployment dipende da NVIDIA per l'intera stack, hardware e software.

Il modello è quello di Apple: non vendere solo chip, ma vendere un ecosistema integrato dove hardware e software sono ottimizzati insieme e difficilmente separabili. Microsoft non fa questo — Azure supporta AMD e Intel. Google lo fa parzialmente con TPU. NVIDIA con NIM lo fa in modo aggressivo su tutto il mercato enterprise. La conseguenza: un'azienda che costruisce la propria pipeline AI su NIM non ha solo costi di switching hardware (sostituire GPU è costoso), ha costi di switching software (riscrivere la pipeline è ancora più costoso). Jensen lo sa, e lo dice esplicitamente come punto di forza per gli investitori.

Robotica e Physical AI

La parte del keynote più visionaria e meno immediatamente commerciale riguarda la robotica. NVIDIA annuncia Project GR00T (Generalist Robot 00 Technology): un modello foundation per robot umanoidi, addestrato su dati simulati e reali, capace di apprendere nuovi comportamenti dall'osservazione video. L'idea è analoga ai modelli linguistici large: come GPT ha pre-addestrato capacità linguistiche generaliste da trasferire a task specifici, GR00T pre-addestra capacità motorie e di pianificazione generaliste da trasferire a robot specifici.

Isaac Sim è il simulatore fisico che rende possibile l'addestramento in scala: i robot vengono addestrati in ambienti virtuali fisicamente accurati, poi trasferiti nel mondo reale (sim-to-real transfer). NVIDIA Omniverse diventa il layer di digital twin: rappresentazione virtuale accurata di fabbriche, magazzini, infrastrutture reali su cui testare sistemi AI prima del deploy. Le partnership annunciate — Boston Dynamics, Agility Robotics, Figure AI, Apptronik, Fourier Intelligence — coprono i principali sviluppatori di robot umanoidi. Il messaggio di Jensen è diretto: il robot umanoide è il "general purpose computer" del futuro fisico, e NVIDIA vuole essere il sistema operativo su cui gira.

NVIDIA come infrastruttura sovrana

Jensen introduce al GTC 2024 un concetto nuovo nella retorica NVIDIA: l'AI sovereignty. Ogni nazione, argomenta, dovrebbe controllare la propria infrastruttura AI — i dati dei propri cittadini, i modelli addestrati sulla propria cultura e lingua, la capacità computazionale su suolo nazionale. L'alternativa — affidarsi a cloud stranieri per l'AI di stato — è equiparata a perdere sovranità digitale. Non è solo retorica: è una strategia di business precisa.

Annuncia deal con i governi di Francia (€1B per AI sovrana nazionale), Giappone, India, Singapore, e — nota per il pubblico italiano — Italia, con un accordo con il governo Meloni per costruire infrastruttura AI nazionale basata su NVIDIA. NVIDIA non vende più solo chip ai lab AI: vende blueprint completi per costruire infrastruttura AI nazionale a governi che non vogliono dipendere da Microsoft Azure o Google Cloud per i propri sistemi strategici. Questa mossa posiziona NVIDIA non come fornitore tecnologico ma come partner geopolitico degli stati sovrani — un salto di posizionamento che nessun produttore di chip aveva mai tentato con questa scala.

Perché questo keynote conta

Jensen Huang non fa previsioni fumose: fa annunci con nomi, numeri, partnership e date. Il GTC 2024 ha segnato il momento in cui NVIDIA ha smesso di essere un fornitore hardware e ha dichiarato pubblicamente di essere la piattaforma su cui si costruisce l'era AI — dall'inferenza cloud alla robotica fisica, dall'AI enterprise alla sovranità digitale nazionale. L'analogia più precisa non è Tesla o Apple: è Intel nel 1993-1995, quando il "Intel Inside" è diventato il marchio dell'intera industria PC, non solo dei chip.

Per chi lavora in AI — sviluppatori, CTO, decision maker aziendali, policy maker — capire la stack NVIDIA significa capire dove va l'infrastruttura AI nei prossimi cinque anni. Non è informazione accademica: è competenza operativa. I modelli che usi girano su GPU NVIDIA. Il cloud su cui li deploi usa GPU NVIDIA. I robot che vedremo nelle fabbriche italiane nei prossimi anni probabilmente gireranno su Isaac Sim e GR00T. Conoscere il keynote GTC 2024 è capire la mappa del territorio su cui si sta costruendo l'economia AI.

Link alla fonte originale

nvidia.com/gtc →

Keynote completo su YouTube (~2 ore). EN. Registrazioni GTC disponibili gratuitamente.