Salta al contenuto
AImpact
IT EN
Addestramento Intermedio Anche noto come: Reinforcement Learning from Human Feedback

RLHF

/ar-el-aitch-ef/

Tecnica di addestramento in cui umani valutano e classificano le risposte del modello, e queste preferenze vengono usate per guidare l'apprendimento verso risposte più utili e sicure.

CondividiLinkedInX

In pratica

È il passaggio che ha reso ChatGPT utile rispetto a un modello solo predittivo. Per chi usa LLM via API il RLHF è già stato fatto dal fornitore. Conoscerlo aiuta a capire perché modelli più 'allineati' a volte rifiutano richieste lecite.

Termini collegati

← Tutti i termini