Inferenza Intermedio Anche noto come: LLM giudice · Model-graded eval

LLM-as-judge

/el-el-em as judge/

Tecnica in cui si usa un LLM (di solito potente) per valutare le risposte di un altro modello o di sé stesso secondo criteri scritti in linguaggio naturale.

CondividiLinkedIn X

In pratica

Velocizza enormemente le valutazioni rispetto a giudizi umani, ma soffre di bias (preferisce risposte lunghe, stile simile al proprio). Va calibrato con un sottoinsieme di giudizi umani come ancora.

Termini collegati

RLAIF Constitutional AI Alignment

Visto in azione

0 voci che lo citano

Nessuna voce dell'archivio lo cita esplicitamente. Compare in contesti più ampi.

← Tutti i termini