Sicurezza Intermedio Anche noto come: AI costituzionale · CAI
Constitutional AI
/constitutional ay-eye/
Approccio sviluppato da Anthropic in cui il modello viene addestrato a seguire un insieme di principi scritti (una 'costituzione') invece che solo preferenze umane caso per caso.
In pratica
È il metodo dietro Claude. Vantaggio: i criteri di comportamento sono espliciti e leggibili, non nascosti in milioni di valutazioni. Per chi sceglie un modello aziendale aiuta a capire le scelte di policy del fornitore.
Termini collegati
Visto in azione
4 voci che lo citano- AltoCAIS Dangerous Capabilities Evaluations: il framework standard per misurare le capacità pericolose degli LLM
- AltoClaude entra in scena: il primo competitor serio di ChatGPT
- MedioConstitutional AI: il modello si autocorregge senza umani nel loop
- Pietra miliareAnthropic: nasce il laboratorio focalizzato su AI safety