Sicurezza Intermedio Anche noto come: AI costituzionale · CAI

Constitutional AI

/constitutional ay-eye/

Approccio sviluppato da Anthropic in cui il modello viene addestrato a seguire un insieme di principi scritti (una 'costituzione') invece che solo preferenze umane caso per caso.

CondividiLinkedIn X

In pratica

È il metodo dietro Claude. Vantaggio: i criteri di comportamento sono espliciti e leggibili, non nascosti in milioni di valutazioni. Per chi sceglie un modello aziendale aiuta a capire le scelte di policy del fornitore.

Termini collegati

RLAIF RLHF Alignment

Visto in azione

4 voci che lo citano

15 gennaio 2025

CAIS Dangerous Capabilities Evaluations: il framework standard per misurare le capacità pericolose degli LLM

Alto
14 marzo 2023

Claude entra in scena: il primo competitor serio di ChatGPT

Alto
15 dicembre 2022

Constitutional AI: il modello si autocorregge senza umani nel loop

Medio
28 maggio 2021

Anthropic: nasce il laboratorio focalizzato su AI safety

Pietra miliare

← Tutti i termini