GNoME — DeepMind Discovers 2.2 Million New Materials with AI

Cos'è: GNoME (Graph Networks for Materials Exploration) è una pipeline di deep learning sviluppata da Google DeepMind e pubblicata su Nature nel novembre 2023. Ha predetto la stabilità di 2.2 milioni di strutture cristalline inorganiche, di cui circa 380.000 considerate sufficientemente promettenti da essere rilasciate pubblicamente nel Materials Project. Per confronto, l'intera letteratura scientifica e i database storici contenevano circa 48.000 cristalli stabili noti. GNoME ha aumentato di un ordine di grandezza il catalogo a disposizione di chimici e ingegneri dei materiali.

L'idea: graph networks per la struttura cristallina

I materiali cristallini si prestano naturalmente a una rappresentazione a grafo: ogni atomo è un nodo, ogni legame chimico un arco, le proprietà fisiche emergono dalla topologia globale. Le Graph Neural Network (GNN) sono la famiglia di modelli che processa esattamente questo tipo di dato, aggregando informazioni dai vicini di ogni nodo attraverso passi successivi di message passing.

GNoME estende questa intuizione su scala industriale. Il modello prende in input una struttura cristallina candidata e ne predice l'energia di formazione — il valore termodinamico che dice se quel materiale, se sintetizzato, resterebbe stabile o decadrebbe in altri composti. Un materiale stabile è la condizione necessaria perché abbia senso provare a produrlo in laboratorio. Senza questo filtro a monte, lo spazio delle combinazioni atomiche possibili è troppo vasto perché un team umano possa esplorarlo in modo sistematico.

Il workflow ibrido: GNN, LLM, laboratorio autonomo

La parte più interessante del paper non è solo il modello, ma l'integrazione end-to-end tra previsione computazionale e verifica sperimentale. DeepMind ha collaborato con il Lawrence Berkeley National Laboratory, dove opera A-Lab — un laboratorio autonomo in cui bracci robotici dosano polveri, accendono forni, raffreddano campioni e analizzano i prodotti via diffrattometria a raggi X, tutto sotto la supervisione di un sistema di pianificazione AI.

Il flusso funziona così: GNoME genera candidati promettenti; un Large Language Model legge la letteratura scientifica esistente per estrarre ricette di sintesi note per famiglie chimiche simili; A-Lab traduce questi suggerimenti in protocolli eseguibili; i robot li eseguono. In 17 giorni A-Lab ha sintetizzato con successo 41 nuovi materiali a partire dalle predizioni GNoME, con un tasso di successo del 71%. Per confronto, una sintesi manuale di un singolo materiale può richiedere settimane di lavoro di un dottorando.

Le critiche: quanti sono davvero "nuovi" e "stabili"?

L'entusiasmo iniziale si è scontrato con un commento pubblicato su Nature nel febbraio 2024 da un gruppo guidato da Robert Palgrave e Anthony Cheetham. Gli autori hanno analizzato un campione delle 380.000 strutture rilasciate e hanno trovato problemi rilevanti: circa il 36% dei candidati era ridondante rispetto a materiali già noti o ad altre predizioni della stessa famiglia, mentre circa il 24% conteneva errori cristallografici — composizioni che un chimico esperto avrebbe riconosciuto come non plausibili.

Il commento non delegittima il lavoro di DeepMind, ma lo riporta a proporzioni più realistiche. Le 2.2 milioni di predizioni sono un risultato computazionale impressionante; il numero di materiali genuinamente nuovi, stabili e utili è probabilmente uno o due ordini di grandezza inferiore. Resta comunque una crescita significativa rispetto al baseline pre-AI. La lezione metodologica è che la validazione sperimentale non è opzionale: un modello generativo può produrre molte ipotesi plausibili, ma il filtro reale arriva solo in laboratorio.

Le applicazioni che contano: batterie, semiconduttori, superconduttori

Le tre aree dove GNoME e successori avranno il maggior impatto economico nel breve termine sono materiali per batterie next-gen, semiconduttori e potenzialmente superconduttori operanti a temperature accessibili. Le batterie agli ioni di litio attuali si avvicinano al limite teorico della loro chimica; il salto a batterie a stato solido, sodio-ione o litio-zolfo richiede nuovi elettroliti solidi e nuovi catodi. GNoME ha già identificato decine di candidati per elettroliti solidi che vengono ora testati industrialmente.

In parallelo, Microsoft Research ha replicato l'approccio con il suo progetto MatterGen e MatterSim, applicandolo alla scoperta di materiali per cattura della CO₂ e celle solari di nuova generazione. La replica indipendente è cruciale: indica che il metodo non è un risultato isolato di un singolo gruppo, ma una nuova classe di strumenti che entreranno stabilmente nel workflow della scienza dei materiali. Il Materials Project, finanziato dal Department of Energy americano e ospitato a Berkeley, è il repository pubblico dove queste predizioni vengono rese accessibili a ricercatori di tutto il mondo.

L'Italia partecipa a questa frontiera attraverso il CNR e il progetto Materials Cloud, che federa risorse di calcolo e database con partner europei. La capacità di accedere a — e contribuire a — questi cataloghi è oggi un asset strategico tanto quanto la capacità di estrarre materie prime fisiche.

Link alla fonte originale

Nature — Scaling deep learning for materials discovery →

Paper open access su Nature, Merchant et al., novembre 2023. EN. Accesso libero senza paywall.