Salta al contenuto
AImpact
IT EN
Sicurezza Intermedio Anche noto come: Classificatore di sicurezza · Content filter

Safety classifier

Modello separato che analizza input o output di un LLM per intercettare contenuti pericolosi, violenti, illegali o fuori policy prima che arrivino all'utente.

CondividiLinkedInX

In pratica

È una rete di sicurezza in cascata: se il modello principale sbaglia, il classificatore lo blocca. OpenAI Moderation, Llama Guard di Meta sono esempi gratuiti. Per servizi pubblici è quasi obbligatorio averne uno.

Termini collegati

← Tutti i termini