OpenAI Preparedness Framework: valutare i rischi catastrofici prima del rilascio
In una frase OpenAI pubblica il Preparedness Framework: metodologia strutturata per valutare rischi catastrofici nei modelli frontier (CBRN, cyberweapons, CSAM) con scorecard pubblica prima di ogni rilascio.
Prima di pubblicare un modello AI molto potente, come si fa a sapere se è abbastanza sicuro? Fino al 2024 non esisteva un metodo standard: ogni azienda decideva autonomamente. OpenAI ha creato un framework formale per rispondere a questa domanda.
Il Preparedness Framework definisce quali categorie di rischio vanno valutate (armi chimiche/biologiche/nucleari/radiologiche, cyberweapons, contenuti pedopornografici, capacità di ingannare su larga scala), come si misurano, e qual è la soglia oltre la quale il modello non può essere rilasciato.
I risultati delle valutazioni vengono pubblicati come scorecard: per ogni modello, un punteggio per categoria di rischio, dal livello "low" al livello "critical". È il primo tentativo di rendere trasparente il processo di safety evaluation prima del deployment.
Aziende
OpenAI
Tool
GPT-4, GPT-4o
Tag
Fonti