Anthropic Model Spec: la prima costituzione pubblica per un'AI commerciale

In una frase Anthropic pubblica il Model Spec di Claude: documento che definisce valori, priorità e comportamenti attesi, primo standard pubblico di governance comportamentale per un AI commerciale di scala.

Verificato Fonte ufficiale

CondividiLinkedIn X

Fino al 2024, le aziende di AI non spiegavano pubblicamente perché i loro modelli si comportavano in certi modi. I valori e le regole erano segreti aziendali. Anthropic rompe questa convenzione pubblicando integralmente le linee guida comportamentali di Claude.

Il documento stabilisce una gerarchia chiara: Claude deve essere prima utile, poi onesto, poi non dannoso. Descrive come gestire i conflitti tra queste priorità, come comportarsi con operatori diversi (aziende che usano l'API) e utenti finali, e quali sono i comportamenti assolutamente inviolabili.

Per il settore è un precedente importante: dimostra che è possibile rendere trasparente il sistema di valori di un AI, e crea una base per valutare se il modello si comporta coerentemente con quanto dichiarato.