Lightmatter — Il Photonic Computing che Promette di Sostituire l'Elettronica per AI

Cos'è: Lightmatter è una società di semiconduttori di Boston, spinout MIT del 2017, che sta cercando di realizzare la più radicale rottura tecnologica nell'AI hardware degli ultimi quarant'anni — sostituire il silicio elettronico con il silicio fotonico per le operazioni matriciali alla base del deep learning. Il chip Envise usa la luce invece degli elettroni per fare matrix multiplication, l'interconnect Passage promette bandwidth ottica 30 volte superiore a NVLink. Una Serie D di 400 milioni di dollari nel ottobre 2024 a valutazione 4,4 miliardi ha dato all'azienda il capitale per portare la tecnologia dal laboratorio agli hyperscaler nel 2025.

Le origini al MIT e la promessa fotonica

Lightmatter è stata fondata nel 2017 da Nicholas Harris, Darius Bunandar e Thomas Graham, tutti dottorandi al MIT nei laboratori di photonic computing del Research Laboratory of Electronics e del Quantum Photonics Lab. La tesi di partenza nasce dalla constatazione di un limite fisico osservato negli ultimi quindici anni nel scaling del silicio CMOS: la frequenza dei processori si è essenzialmente fermata intorno ai 3-5 GHz dal 2005, l'efficienza energetica per operazione è migliorata molto più lentamente di quanto le leggi di Moore-Dennard prevedessero, e ogni nuovo nodo manifatturiero (5nm, 3nm, 2nm) restituisce miglioramenti incrementali sempre meno rilevanti. Per gli use case AI, in cui le operazioni dominanti sono le moltiplicazioni di matrici dense, il costo energetico per operazione è oggi il vincolo principale.

La proposta di Lightmatter è realizzare le matrix multiplication non con transistor elettronici, ma con interferenza di luce. L'idea fisica di base è elegante: una rete di interferometri Mach-Zehnder integrati in un chip fotonico può eseguire una moltiplicazione matrice-vettore semplicemente facendo passare la luce attraverso una serie di phase shifter calibrati. L'operazione richiede zero corrente elettrica nel momento del calcolo, perché è la propagazione della luce a fare il lavoro. Il consumo energetico è dominato dalla conversione tra dominio elettrico (per i dati di input) e dominio ottico (per il calcolo), non dal calcolo stesso. Per workload di inference con pesi fissi, dove la matrice da moltiplicare cambia raramente, il guadagno teorico di efficienza energetica è di un ordine di magnitudine rispetto al CMOS.

L'idea era stata teorizzata accademicamente da decenni — il "photonic computing" è oggetto di paper dagli anni Ottanta — ma fino al 2015-2017 mancava la capacità manifatturiera di integrare componenti fotonici su scala industriale con la precisione richiesta. Lightmatter ha sfruttato l'evoluzione recente delle fonderie silicon photonic, in particolare la collaborazione con GlobalFoundries che dispone di processi maturi di silicio fotonico a 90nm. È la combinazione di idea accademica matura con capacità manifatturiera disponibile che ha reso Lightmatter una scommessa fattibile invece di un esperimento accademico.

Envise: il chip Photonic per Inference

Il primo prodotto commerciale annunciato di Lightmatter è Envise, un chip pensato per l'inference di neural network. Architettura mista: un substrato CMOS standard per la gestione dei dati e la conversione di dominio, sovrapposto a un livello fotonico che esegue le matrix multiplication. Le specifiche pubbliche annunciate parlano di un sistema 4U server-class che integra 16 chip Envise per un totale di circa 500 trilioni di operazioni al secondo (TOPS) in INT8 con un consumo energetico circa cinque volte inferiore a quello di un sistema NVIDIA equivalente per workload comparabili.

La limitazione critica di Envise è che oggi è efficace solo per inference con pesi pre-caricati. La fase di scrittura dei pesi sulla matrice fotonica è lenta — richiede di calibrare fisicamente migliaia di phase shifter — il che rende impraticabile usare Envise per training, dove i pesi cambiano a ogni step di backpropagation. Anche per inference, Envise lavora meglio quando un singolo modello rimane caricato per molte richieste consecutive (un pattern tipico di chatbot e raccomandatori) e meno bene quando si fa swap continuo di modelli diversi. Sono limitazioni che restringono drasticamente i casi d'uso ma che lasciano comunque aperto un segmento importante del mercato — l'inference di modelli stabili a volume di richieste alto.

Il software stack di Lightmatter è chiamato Idiom e prende modelli scritti in PyTorch o TensorFlow standard, li ottimizza per l'esecuzione su Envise e li deploya tramite un'API simile a quella di NVIDIA Triton. Il toolchain è proprietario e closed-source, una scelta diversa da quella di Tenstorrent ma più tradizionale per l'industria semiconduttori. Lightmatter sostiene che mantenere Idiom chiuso permette di iterare più rapidamente sulle ottimizzazioni a basso livello senza dover gestire compatibilità verso una community esterna.

Passage: l'interconnect ottico 30x più veloce di NVLink

Il secondo prodotto di Lightmatter è ancora più rilevante strategicamente. Passage è un'interconnect ottica per data center AI che permette di collegare chip di calcolo (di qualsiasi vendor, incluso NVIDIA) con bandwidth fino a 30 volte superiore a NVLink di NVIDIA e a latenze significativamente inferiori. Non è un acceleratore di calcolo ma un substrato di comunicazione: pensato per le configurazioni multi-GPU di training distribuito in cui il bottleneck non è il calcolo del singolo chip ma il movimento dei dati tra chip e tra rack.

Il pitch di Passage agli hyperscaler è particolarmente potente. I cluster di training di GPT-4 e Claude 3 hanno richiesto di collegare decine di migliaia di GPU in topology elaborate, e la bandwidth aggregata di interconnect è cresciuta a un ritmo molto più lento del compute aggregato. Per i modelli del 2025-2026, che richiedono cluster ancora più grandi, le limitazioni di bandwidth tra rack diventano un vincolo dominante. Un substrato ottico che permetta di trattare un intero data center come un fabric unificato con bandwidth aggregata di petabit per secondo è esattamente il tipo di tecnologia che Amazon, Microsoft, Google e Meta vorrebbero adottare per restare nella corsa.

Lightmatter ha annunciato partnership pubbliche con almeno due hyperscaler (i nomi non sono stati rilasciati ma le indiscrezioni puntano a Microsoft e Google) per pilotare Passage in cluster di training nel 2025. Se la tecnologia mantiene le promesse, il prodotto Passage potrebbe diventare strategicamente più rilevante di Envise — perché compatibile con l'intera installed base di GPU NVIDIA esistente invece di richiedere di sostituirla.

$400M Serie D, $4,4B di valutazione e la corsa con Ayar Labs e Celestial AI

Il ottobre 2024 Lightmatter ha annunciato una Serie D da 400 milioni di dollari a valutazione 4,4 miliardi, lead investor T. Rowe Price e Fidelity, con partecipazione di GV (Google Ventures), Viking Global e Hewlett Packard Pathfinder. Il funding cumulativo dell'azienda supera ormai gli 850 milioni di dollari. La valutazione è particolarmente notevole considerando che Lightmatter non ha ancora ricavi commerciali significativi — i prodotti sono in fase di pilot con clienti early adopter. È una scommessa esplicita degli investitori sulla potenziale dirompenza tecnologica della photonic computing per il prossimo decennio AI.

Lightmatter non è l'unica startup a perseguire il photonic computing. I principali competitor diretti sono Ayar Labs (focus su interconnect ottici chip-to-chip, partnership Intel e clienti governativi), Celestial AI (Photonic Fabric come substrato di interconnessione, Serie C di 175 milioni a valutazione 1,1 miliardi nel 2024) e Lightelligence (spinout MIT parallelo, focalizzata su Asia). Ognuno persegue varianti leggermente diverse della stessa idea fisica di base, e il vincitore commerciale non è ancora deciso. Quasi certamente più di un attore sopravviverà perché il mercato è abbastanza grande da assorbire molteplici fornitori, ma la posizione di leadership tecnica e di clienti referenziali sarà determinante.

I limiti strutturali della photonic computing restano significativi. Il training rimane elettronico: nessuna delle architetture fotoniche oggi commercializzabili può addestrare modelli, perché il problema di scrivere i pesi a velocità di un layer al microsecondo non è risolto. La photonic computing oggi compete solo per inference con pesi fissi, un segmento che è importante ma non è l'intera spesa AI hardware. La variabilità manifatturiera dei componenti ottici è ancora alta rispetto al CMOS standard, il che rende difficile garantire performance uniforme su grandi volumi. E la curva di learning del processo manifatturiero silicon photonic è dietro di vent'anni rispetto al CMOS: ci vorranno cicli di prodotto multipli prima che la maturità sia paragonabile.

Lo scenario di medio termine è quello di una tecnologia che troverà la sua nicchia specifica — probabilmente data center di inference per modelli stabili a volume elevato e interconnect tra rack — invece di sostituire integralmente il CMOS per ogni workload AI. Per gli hyperscaler, la photonic computing diventerà un complemento utile dello stack, non una sostituzione totale. Per Lightmatter, sopravvivere significa diventare il fornitore di riferimento di questa nicchia, costruire deal multi-anno con due o tre hyperscaler, e usare quel revenue base per finanziare la R&D che porterà la tecnologia a maturazione completa nei dieci anni successivi. Una traiettoria di tipo ASML — fornitore strategico irrinunciabile di un componente specifico — più che NVIDIA — leader generale di tutto il mercato — ma comunque preziosa.

Link alla fonte originale

lightmatter.co →

Sito ufficiale di Lightmatter con accesso alla documentazione tecnica di Envise, Passage e Idiom. Per il dettaglio della Serie D di ottobre 2024 si vedano i comunicati ufficiali e la copertura di Reuters, Bloomberg e The Boston Globe. Per approfondimenti tecnici sulla photonic computing si vedano i paper di Nicholas Harris pubblicati su Nature Photonics e i talk di Hot Chips 2023-2024.