Salta al contenuto
AImpact
IT EN
Inferenza Intermedio Anche noto come: LLM giudice · Model-graded eval

LLM-as-judge

/el-el-em as judge/

Tecnica in cui si usa un LLM (di solito potente) per valutare le risposte di un altro modello o di sé stesso secondo criteri scritti in linguaggio naturale.

CondividiLinkedInX

In pratica

Velocizza enormemente le valutazioni rispetto a giudizi umani, ma soffre di bias (preferisce risposte lunghe, stile simile al proprio). Va calibrato con un sottoinsieme di giudizi umani come ancora.

Termini collegati

Visto in azione

0 voci che lo citano

Nessuna voce dell'archivio lo cita esplicitamente. Compare in contesti più ampi.

← Tutti i termini