Neuroscienze e AI — Cosa il Cervello Insegna alle Macchine

Cos'è: "A Thousand Brains" è il libro di Jeff Hawkins (fondatore di Palm Computing e di Numenta) pubblicato nel 2021 in cui presenta la Thousand Brains Theory of Intelligence: una teoria unificata del funzionamento del neocortex che, se corretta, ha implicazioni profonde su come costruire AI più simile all'intelligenza biologica. Hawkins non è un accademico nel senso classico, ma un tecnologo che ha dedicato vent'anni allo studio delle neuroscienze cognitive — e la sua teoria ha trovato attenzione sia nel campo delle neuroscienze che in quello dell'AI.

L'AI moderna è ispirata al cervello ma non lo copia

Una delle confusioni più comuni nella divulgazione AI è equiparare le reti neurali artificiali al cervello biologico. Il nome è storicamente accurato — McCulloch e Pitts nel 1943 si ispirarono esplicitamente ai neuroni biologici — ma la similitudine si ferma al nome e all'ispirazione originale. Il cervello di un adulto ha circa 86 miliardi di neuroni, ognuno connesso in media ad altri 7.000, per un totale di circa 100 trilioni di sinapsi. Opera a 20 watt. Il cervello non usa backpropagation — l'algoritmo fondamentale con cui si addestrano le reti neurali artificiali: non esiste meccanismo biologico che propaghi gradienti all'indietro attraverso strati neurali con la precisione richiesta dal backprop.

Questo non significa che l'ispirazione biologica non abbia prodotto risultati: l'attenzione dei transformer è vagamente analoga ai meccanismi di attenzione selettiva del cervello. Il reinforcement learning si ispira esplicitamente alla psicologia comportamentista (Skinner, Pavlov) e alla neuroscienza dei sistemi di ricompensa dopaminergici. Le reti convoluzionali si ispirano alla corteccia visiva di Hubel e Wiesel. Ma "ispirazione" e "replicazione" sono concetti molto diversi. La domanda aperta è se per costruire AGI sia necessario capire più profondamente il cervello — o se l'ingegneria pura basterà.

La Thousand Brains Theory di Jeff Hawkins

La tesi centrale del libro è una revisione della teoria standard del neocortex. Il modello classico descrive il neocortex come una gerarchia di elaborazione: informazione sensoriale entra nei layer inferiori, viene progressivamente astratta salendo nella gerarchia, e produce percezione e comportamento ai livelli superiori. Hawkins argomenta che questa visione gerarchica è incompleta e fuorviante. La sua proposta: il neocortex è composto da circa 150.000 mini-colonne corticali, ognuna delle quali costruisce un modello completo e indipendente del mondo. Non c'è una sola rappresentazione del concetto "mela" nel tuo cervello: ce ne sono migliaia, distribuite in colonne diverse che processano dati sensoriali diversi (vista, tatto, posizione, memoria semantica) e che votano tra loro per produrre una percezione coerente.

L'implicazione per l'AI è radicale: i transformer e le reti neurali classiche costruiscono una singola rappresentazione per oggetto, aggiornata iterativamente. Un'architettura ispirata alla Thousand Brains Theory costruirebbe invece rappresentazioni multiple e parallele dello stesso concetto, ognuna ancorata a un "reference frame" diverso (spaziale, temporale, semantico), con un meccanismo di consensus tra rappresentazioni invece di una gerarchia rigida. Hawkins non ha ancora prodotto un sistema AI funzionante basato su questa teoria — Numenta lavora su implementazioni sperimentali — ma la teoria ha stimolato ricerca in direzioni nuove e ha influenzato il dibattito sulla natura delle rappresentazioni nei sistemi AI.

Karl Friston e l'Active Inference

Karl Friston (University College London) è uno dei neuroscienziati computazionali più citati al mondo e l'autore del framework dell'Active Inference, un'alternativa teorica al reinforcement learning per spiegare il comportamento agentivo biologico. L'idea fondamentale: il cervello non cerca di massimizzare una ricompensa esterna (come nel RL standard) — cerca invece di minimizzare la "sorpresa" percepita, formalmente definita come energia libera variazionale. Un agente che minimizza l'energia libera predice costantemente il futuro, agisce per confermare le proprie predizioni, e aggiorna il proprio modello interno quando la realtà diverge dalle aspettative.

La differenza pratica rispetto al RL convenzionale: nell'Active Inference, le credenze sull'ambiente e le azioni per modificarlo emergono dallo stesso processo di minimizzazione. Non c'è separazione netta tra percezione e azione — sono due facce dello stesso processo inferenziale. Friston ha argomentato che questo framework potrebbe essere più adeguato del RL per modellare comportamenti complessi come l'esplorazione curiosa, l'apprendimento auto-motivato, e — provocatoriamente — persino alcune forme di coscienza. L'Active Inference ha trovato applicazione in robotica e negli agenti AI, ma rimane più un framework teorico unificante che un algoritmo deployabile in sistemi large scale.

DeepMind, place cells e la memoria spaziale

Un esempio concreto di trasferimento neuroscienze→AI è la ricerca di DeepMind sulla navigazione spaziale. Nel 2018, DeepMind e il Wellcome Centre for Human Neuroimaging hanno pubblicato su Nature uno studio che collega le grid cells (cellule del cervello che codificano la posizione nello spazio in pattern regolari a griglia esagonale, scoperte da May-Britt e Edvard Moser — Nobel 2014) con strutture emergenti nelle reti neurali addestrate per navigare in spazi virtuali. Le reti, senza supervisione esplicita, sviluppavano rappresentazioni interne che mimavano le grid cells biologiche. Il risultato era un agente capace di path integration (calcolare la propria posizione integrando il movimento senza GPS) e di navigazione shortcut — trovare percorsi diretti non visti durante il training.

Questa ricerca ha avuto influenza concreta sulle architetture di memoria e navigazione nei sistemi AI. La scoperta che meccanismi biologici di navigazione spaziale emergono spontaneamente in reti neurali addestrate con RL suggerisce che c'è qualcosa di fondamentale nella struttura del problema che porta a soluzioni simili indipendentemente dal substrato. È una conferma sperimentale che lo studio del cervello può indicare soluzioni architetturali che la sola ingegneria non avrebbe trovato facilmente.

Neuromorphic computing: chip che imitano i neuroni

La frontiera più radicale dell'intersezione neuroscienze-AI non è nell'algoritmo — è nel silicio. Il neuromorphic computing tenta di costruire chip che imitano non solo la funzione del cervello ma la sua struttura computazionale: neuroni artificiali che comunicano tramite spike discreti (eventi) invece che valori continui, con sinapsi il cui peso cambia localmente in base all'attività (plasticità sinaptica). Intel ha sviluppato Loihi (2017, poi Loihi 2 nel 2021): un chip con 128 core neuromorphic, capace di apprendimento online senza backpropagation. IBM ha TrueNorth (2014): 4.096 core con 1 milione di neuroni e 256 milioni di sinapsi, consumando 70 milliwatt — paragonabile al cervello di un'ape.

Il vantaggio teorico dei chip neuromorphic è l'efficienza energetica: i sistemi spike-based computano solo quando arriva un segnale, invece di consumare energia continuamente come le GPU. Per applicazioni edge (dispositivi mobili, sensori IoT, robot autonomi) dove la batteria è un vincolo critico, questo vantaggio è significativo. Il limite attuale: la programmabilità e il software per neuromorphic computing sono molto meno maturi di CUDA. Nessun framework mainstream supporta nativamente il calcolo spike-based. La ricerca è attiva ma il deploy commerciale rimane limitato ad applicazioni di nicchia.

La domanda aperta: serve capire il cervello per AGI?

Il campo è diviso su questa questione fondamentale. Un fronte — rappresentato da Hawkins, Friston, e molti ricercatori di neuroscienze computazionali — argomenta che i LLM e i transformer hanno già raggiunto i loro limiti strutturali: mancano di radicamento fisico (embodiment), di apprendimento continuo, di causalità esplicita, di modelli del mondo robusti. Senza princìpi ispirati alla biologia, non si arriverà ad AGI. Il fronte opposto — rappresentato da Yann LeCun in modo paradossale rispetto alla sua affiliazione con Meta — argomenta diversamente: le architetture attuali non bastano, ma la soluzione è ingegneristica (JEPA, world models, self-supervised learning) non necessariamente biologica.

La posizione empiricamente più onesta è probabilmente intermedia: lo studio del cervello ha già contribuito in modo dimostrato all'AI (attenzione, RL, convolutional network, grid cells) e probabilmente contribuirà ancora, ma non come modello da copiare fedelmente — come fonte di ispirazione da cui estrarre principi computazionali profondi. Il cervello è il solo esempio noto di intelligenza generale biologica: ignorarlo sarebbe scientifico quanto ignorare l'evoluzione nello studio della biologia.

Link alla fonte originale

numenta.com — A Thousand Brains →

Pagina ufficiale del libro con estratti, paper di ricerca correlati e video di Jeff Hawkins. EN. Il libro è disponibile su tutti i principali store.