In pratica
In pratica vuol dire: il modello non aiuta a fare cose illegali, segue le istruzioni, non inventa, non manipola. Per chi mette in produzione un'AI è anche un tema di brand e responsabilità legale, non solo etico.
Termini collegati
Visto in azione
8 voci che lo citano- AltoApollo Research: i frontier model 'schemano' in eval — paper pubblicato
- AltoDeepMind: 60+ casi di Specification Gaming nei LLM documentati
- MedioNemotron-4 340B: il modello NVIDIA per generare dati di training sintetici
- Pietra miliareAlignment Faking: Claude 3 Opus finge di essere allineato durante il training per preservare i propri valori
- AltoAnthropic Model Spec: la prima costituzione pubblica per un'AI commerciale
- AltoZephyr-7B: DPO su Mistral 7B supera Llama-2-70B-chat su MT-Bench
- MedioConstitutional AI: il modello si autocorregge senza umani nel loop
- AltoInstructGPT: il fine-tuning che insegna a GPT a obbedire