HBM3e — Il Vero Collo di Bottiglia AI Sono le Memorie, non le GPU

Cos'è: La narrativa pubblica della corsa AI si concentra sulle GPU NVIDIA, ma il vero collo di bottiglia dell'industria è la memoria HBM (High Bandwidth Memory) che alimenta queste GPU. SK Hynix produce circa metà del totale mondiale, Samsung è in difficoltà sulla qualifica HBM3e con NVIDIA, Micron è il terzo entrante tardivo. La capacità HBM 2024-2025 è completamente preallocata; il margine di SK Hynix sull'HBM supera il 60%. Il prossimo nodo (HBM4) è atteso per il 2026 e ridefinirà il chokepoint dell'industria.

Cos'è l'HBM e perché è il vero collo di bottiglia

L'HBM — High Bandwidth Memory — è un tipo di memoria DRAM impilata verticalmente (3D stacking) che si trova fisicamente integrata sullo stesso package della GPU tramite interposer di silicio. A differenza della memoria GDDR usata nelle GPU consumer (gaming, workstation), l'HBM offre bandwidth di un ordine di grandezza superiore — oltre 3 TB/s per stack nelle ultime generazioni — al costo di una maggior complessità manifatturiera e di un prezzo unitario significativamente superiore. La generazione attualmente in produzione di massa è HBM3 (2022) e HBM3e (2024), con HBM4 attesa per il 2026.

Il motivo per cui l'HBM è il collo di bottiglia reale dell'industria AI è strutturale: i workload di training e inference dei large language model sono memory-bound, non compute-bound. Ogni parametro del modello — 70 miliardi per Llama 70B, oltre 400 miliardi stimati per GPT-4 — deve essere caricato in memoria durante l'inference, e durante il training i gradient devono essere accumulati e scambiati continuamente tra memoria e compute units. Una GPU H100 senza HBM è inutilizzabile per LLM; e la capacità della GPU di processare token è limitata in primo luogo dalla velocità con cui la memoria può alimentare le compute units. Il costo dell'HBM rappresenta oggi oltre il 50% del BOM (bill of materials) di una GPU AI di frontiera, una quota in crescita rispetto al ~30% delle generazioni precedenti.

SK Hynix: il fornitore primario NVIDIA e profit record 2024

SK Hynix è il produttore coreano di memoria che oggi detiene la quota di mercato più elevata sull'HBM — stimata intorno al 50% globale con picchi superiori al 60% sul segmento HBM3e nei primi 12 mesi dal lancio. SK Hynix è il fornitore primario di HBM per NVIDIA: ogni GPU H100, H200 e Blackwell B200 produced nel 2023-2024 monta in larga parte stack HBM SK Hynix, con quote minoritarie da Samsung e Micron. La leadership SK Hynix è il risultato di scelte strategiche degli ultimi dieci anni: l'azienda ha investito anticipatamente nello sviluppo del 3D stacking e nell'integrazione con i partner GPU, ed è stata la prima a portare in produzione di massa HBM3 (2022) e HBM3e (2024).

Il risultato finanziario è straordinario. Nel terzo trimestre 2024 SK Hynix ha dichiarato un profitto operativo di oltre $7 miliardi (₩9,4 trilioni KRW), il più alto trimestre della sua storia e superiore al competitor Samsung sui ricavi memoria. Il margine operativo sull'HBM è stimato sopra il 60%, contro margini intorno al 20% del business DRAM standard. L'intera capacità HBM produced da SK Hynix per il 2024 e il 2025 è già stata preallocata a contratti pluriennali con NVIDIA, AMD, Intel e gli hyperscaler — non c'è capacità spot disponibile per nuovi entranti. Il CEO Kwak Noh-Jung ha pubblicamente dichiarato che la roadmap HBM dell'azienda è "venduta fino al 2026 incluso".

Samsung in difficoltà: il caso qualifica HBM3e NVIDIA

Il caso più interessante del 2024 è la difficoltà di Samsung Electronics nel qualificare il proprio HBM3e con NVIDIA. Samsung è storicamente il leader mondiale nelle memorie (DRAM, NAND, foundry), con quote di mercato superiori al 40% nei segmenti DRAM standard. Sull'HBM tuttavia è stata progressivamente superata da SK Hynix tra il 2020 e il 2024, in parte per scelte tecniche differenti (Samsung ha investito più nella variante HBM-PIM, un'architettura process-in-memory innovativa ma che NVIDIA non utilizza), in parte per problemi industriali specifici. Nel corso del 2024 multiple coperture di Reuters, Bloomberg e Nikkei Asia hanno riportato che gli stack HBM3e Samsung non hanno superato i test di qualifica con NVIDIA per problemi di thermal management e di resa produttiva sui wafer più avanzati.

L'impatto finanziario è significativo. A maggio 2024 Samsung ha annunciato una riorganizzazione del team semiconduttori (Device Solutions division), sostituendo il responsabile DRAM e nominando Lee Jung-Bae capo della divisione memorie. Nel terzo trimestre 2024 Samsung ha confermato di aver iniziato spedizioni HBM3e a "un grande cliente AI" (non confermato come NVIDIA), ma le quote di mercato HBM 2024 mostrano Samsung dietro a SK Hynix per la prima volta dopo decenni. Per il management Samsung il recupero HBM è la priorità strategica 2025-2026: l'azienda ha annunciato investimenti capex superiori a $15 miliardi sulla produzione HBM nei prossimi tre anni e una roadmap aggressiva su HBM4. Il timing del recupero — e la capacità di Samsung di catturare quota su HBM4 entro il 2026 — definirà la struttura del mercato per gli anni successivi.

Micron come terzo entrante: la quota americana

Il terzo player è Micron Technology, l'unico produttore HBM statunitense, con sede a Boise (Idaho). Micron ha sviluppato HBM3e in parallelo con i competitor coreani e ha iniziato le spedizioni commerciali a inizio 2024, con qualifica positiva per NVIDIA H200 e per alcune SKU AMD MI300. La quota di mercato 2024 di Micron sull'HBM è stimata tra il 5% e il 10%, in crescita rispetto allo zero del 2022. Per il management Micron, e per l'amministrazione statunitense, l'HBM rappresenta una priorità strategica: il governo USA ha allocato a Micron oltre $6 miliardi di sussidi CHIPS Act per la costruzione di una fab semiconduttori a New York (sito Clay), che includerà capacità HBM dedicata.

Il contesto geopolitico è centrale per capire la logica Micron. Oltre il 90% della capacità HBM globale 2024 è prodotta in Corea del Sud — concentrazione comparable a quella della logica di frontiera in Taiwan (TSMC). In uno scenario di crisi nella penisola coreana (con la Corea del Nord come fattore di rischio strutturale e la tensione USA-Cina come amplificatore), la produzione HBM globale verrebbe interrotta, con effetti a cascata su NVIDIA, AMD e tutta l'industria AI. Costruire capacità HBM negli Stati Uniti — anche se più costosa e meno efficiente nel breve termine — è considerata dal Department of Commerce una priorità di sicurezza nazionale. Per Micron il vantaggio competitivo è duplice: i sussidi pubblici riducono il capex effettivo, e la collocazione USA è preferita dai clienti governativi e dai data center federali. Lo svantaggio è la curva di apprendimento: Micron è in ritardo strutturale di 2-3 anni sulla scala produttiva rispetto a SK Hynix e dovrà accelerare significativamente per non restare il "terzo lontano".

La roadmap HBM4 e le implicazioni di lungo periodo

La prossima generazione di memoria — HBM4 — è attesa per la produzione di massa nel 2026, con primi sample già in test 2025. Le specifiche preliminari pubblicate dal consorzio JEDEC (l'organismo che standardizza le memorie semiconduttori) prevedono 16 die stacked verticalmente (rispetto agli 8-12 dell'HBM3e), bandwidth oltre i 1,6 TB/s per stack e capacità per stack fino a 64 GB. HBM4 introdurrà anche cambiamenti significativi nell'interfaccia logica-memoria, con possibilità di integrare logica custom (compute-in-memory parziale) sul base die — uno sviluppo che potrebbe modificare la struttura competitiva del mercato.

La concorrenza su HBM4 è apertissima: SK Hynix punta a mantenere la leadership con qualifica anticipata su NVIDIA Rubin (la generazione di GPU 2026); Samsung scommette sul recupero combinando capacità manifatturiera e investimenti R&D superiori; Micron mira a portare la propria quota verso il 15-20% sfruttando i sussidi USA e una qualifica più stretta con i clienti governativi statunitensi. L'industria del settore — analisti di TrendForce, Counterpoint, Yole — considera plausibile che entro il 2027 SK Hynix detenga ancora il 40-45% del mercato HBM4, Samsung recuperi al 35-40% e Micron raggiunga il 15-20%. La concentrazione resta strutturalmente alta: tre fornitori per un mercato che, sulla base delle proiezioni capex AI 2025-2028, dovrebbe superare i $50 miliardi annui di TAM HBM entro il 2027 — un sotto-segmento del semiconduttore che oggi vale circa il 10% di NVIDIA in market cap ma che è strutturalmente più scarso. Le implicazioni per la geopolitica tecnologica sono significative: come Taiwan è strategica per la logica di frontiera, la Corea del Sud lo è per le memorie HBM, e ogni discontinuità sulla penisola coreana avrebbe impatto immediato sull'intera filiera AI globale.

Link alla fonte originale

SK Hynix — HBM3e mass production →

Comunicato ufficiale SK Hynix sul primo mass production HBM3e. Per i dati di mercato e quote HBM si vedano i report TrendForce, Counterpoint Research e Yole Group. Per i ritardi qualifica Samsung NVIDIA si vedano le coperture di Reuters, Bloomberg e Nikkei Asia 2024. Per il contesto geopolitico CHIPS Act e capacità Micron si rimanda ai comunicati del US Department of Commerce e ai filing SEC di Micron Technology.