UK AI Safety Institute — Il Primo Ente Governativo al Mondo per la Safety AI

Cos'è: L'AI Safety Institute (AISI) del governo britannico è la prima agenzia governativa al mondo dedicata specificamente alla valutazione della sicurezza dei sistemi AI di frontiera. Fondato nell'ottobre-novembre 2023 in occasione del Bletchley Park AI Safety Summit, ha ottenuto accordi di accesso pre-deployment ai modelli di OpenAI, Anthropic e Google DeepMind. Il modello britannico è stato poi replicato dagli Stati Uniti con la creazione dell'US AI Safety Institute sotto il NIST.

Bletchley Park: il contesto fondativo

Il 1-2 novembre 2023, il governo britannico ha ospitato il primo AI Safety Summit internazionale a Bletchley Park — il sito storico dove Alan Turing e il Government Code and Cypher School decifravano i messaggi nazi durante la Seconda Guerra Mondiale. La scelta del luogo non era casuale: Bletchley è nella narrativa britannica il simbolo di come la tecnologia applicata con intelligenza e urgenza può determinare l'esito di conflitti esistenziali.

Al Summit hanno partecipato rappresentanti di 28 paesi — inclusi Stati Uniti, Cina, e tutte le principali potenze europee — insieme ai CEO dei principali laboratori AI frontier: Sam Altman per OpenAI, Demis Hassabis per Google DeepMind, Dario Amodei per Anthropic. L'evento si è concluso con la "Bletchley Declaration" — un documento non vincolante firmato da tutti i paesi partecipanti che riconosce l'esistenza di rischi gravi associati ai modelli AI frontier e la necessità di cooperazione internazionale per affrontarli.

In questo contesto, l'annuncio della creazione dell'AI Safety Institute britannico aveva una funzione deliberatamente strategica: il UK si posizionava come primo paese a tradurre il consenso politico sulla safety AI in un'istituzione operativa con accesso tecnico reale ai modelli.

Struttura e mandato: cosa fa l'AISI

L'AI Safety Institute è stato inizialmente collocato all'interno del Department for Science, Innovation and Technology (DSIT). La struttura è quella di un'unità tecnica specializzata, non di un'agenzia regolatoria con poteri di enforcement — una distinzione importante che verrà discussa nelle critiche.

Il mandato operativo si articola in tre aree principali. Primo: la valutazione delle capability dei modelli frontier, con focus specifico sulle capability potenzialmente pericolose — capacità di assistere nella sintesi di agenti patogeni, di condurre attacchi informatici avanzati, di inganno sistemático degli operatori. Il testing include red-teaming strutturato: esperti cercano attivamente di far produrre al modello output pericolosi o di aggirare le sue salvaguardie, documentando cosa è possibile e cosa no.

Secondo: l'accesso pre-deployment ai modelli frontier. Questo è l'elemento più innovativo istituzionalmente: OpenAI, Anthropic, e Google DeepMind hanno firmato accordi che danno all'AISI accesso ai modelli prima che vengano rilasciati pubblicamente. I dettagli esatti degli accordi — quanto tempo prima del rilascio, con quale accesso, con quali diritti di pubblicazione dei risultati — non sono completamente pubblici, ma il principio è stabilito: un ente governativo indipendente può esaminare sistemi AI frontier prima che arrivino agli utenti finali.

Terzo: la ricerca metodologica. L'AISI pubblica report e sviluppa metodologie di valutazione che possono essere usate da altri enti — laboratori privati, altre agenzie governative, comunità di ricerca — per standardizzare il modo in cui si valuta la sicurezza dei modelli AI. Questo lavoro metodologico è forse il contributo più duraturo, perché crea un linguaggio comune per l'evaluation che può scalare oltre le risorse dirette dell'istituto.

Ian Hogarth e la leadership

Ian Hogarth è stato nominato primo chair dell'AI Safety Institute nel 2023. Hogarth è un imprenditore tecnologico britannico — co-fondatore di Songkick — con una storia di interesse per la governance dell'AI: nel 2023 aveva pubblicato su FT un saggio intitolato "We Must Slow Down the Race to God-Like AI" che aveva ottenuto ampia diffusione nella comunità tech e aveva contribuito a costruire il suo profilo come figura capace di comunicare i rischi AI a un pubblico non specialistico mantenendo credibilità tecnica.

La scelta di Hogarth riflette una strategia istituzionale specifica: non nominare un accademico pure-research senza esperienza nel mondo tech, né un burocrate governativo senza background tecnico, ma qualcuno con credibilità in entrambi i mondi. Il messaggio implicito: l'AISI non è né un think tank né una commissione parlamentare — è un'entità che deve mantenere relazioni operative con i laboratori AI e allo stesso tempo rappresentare l'interesse pubblico.

Il modello che gli USA hanno copiato

Nel 2024, l'executive order sulla AI del presidente Biden ha mandatato la creazione di un AI Safety Institute parallelo negli Stati Uniti, collocato all'interno del National Institute of Standards and Technology (NIST). L'US AISI ha firmato accordi di accesso pre-deployment simili a quelli britannici con OpenAI e Anthropic.

La sequenza — UK primo, USA seguono — è insolita per il pattern tipico della governance tecnologica, dove normalmente gli USA guidano e gli altri paesi adottano framework americani. La velocità con cui gli USA hanno replicato il modello britannico suggerisce che l'AISI ha stabilito una proof of concept convincente: è possibile costruire un ente governativo con accesso tecnico reale ai sistemi AI frontier, senza che i laboratori smettano di cooperare.

La cooperazione UK-US è poi diventata più esplicita: i due istituti hanno pubblicato report congiunti e hanno coordinato le loro metodologie di evaluation, con l'obiettivo esplicito di evitare duplicazione e costruire standard comuni che possano diventare riferimento per altri paesi.

Critiche: budget piccolo, nessun enforcement, accesso limitato

L'AISI è stato oggetto di critiche significative da due direzioni opposte. Da un lato, critici nel campo della safety ritengono che l'istituto sia strutturalmente debole: il budget iniziale era di circa £100 milioni su tre anni — significativo per un'unità di ricerca governativa, ma modesto rispetto ai budget di training dei laboratori che dovrebbe supervisionare. Il numero di ricercatori tecnici è nell'ordine di decine, non centinaia. E soprattutto: l'AISI non ha poteri di enforcement. Non può bloccare il rilascio di un modello. Non può imporre penali. Può produrre report e fare raccomandazioni, ma la decisione finale rimane ai laboratori privati.

Dall'altro lato, critici nell'industria AI — e alcuni nel mondo accademico — ritengono che anche un ente advisory senza enforcement powers crei incentivi negativi: i laboratori potrebbero adattare i loro modelli per passare le valutazioni dell'AISI senza che questo corrisponda a sistemi genuinamente più sicuri; o peggio, potrebbero diventare dipendenti dall'approvazione implicita dell'AISI come scudo contro critiche di sicurezza.

La risposta a entrambe le critiche è istituzionale: l'AISI è un primo passo, non una soluzione definitiva. Il suo valore non è nell'enforcement che non ha, ma nel precedente che stabilisce — che enti governativi possono e devono avere accesso tecnico ai sistemi AI prima che raggiungano il pubblico, e che questo accesso può essere negoziato con i laboratori senza che l'industria collassi. Il precedente è reale, anche se insufficiente.

Link alla fonte originale

UK Government · AI Safety Institute →

Sito ufficiale con report pubblicati, metodologie di evaluation, e aggiornamenti istituzionali. EN. Per il parallelo americano: aisi.gov (US NIST AI Safety Institute).