Addestramento Intermedio Anche noto come: Reinforcement Learning from Human Feedback

RLHF

/ar-el-aitch-ef/

Tecnica di addestramento in cui umani valutano e classificano le risposte del modello, e queste preferenze vengono usate per guidare l'apprendimento verso risposte più utili e sicure.

CondividiLinkedIn X

In pratica

È il passaggio che ha reso ChatGPT utile rispetto a un modello solo predittivo. Per chi usa LLM via API il RLHF è già stato fatto dal fornitore. Conoscerlo aiuta a capire perché modelli più 'allineati' a volte rifiutano richieste lecite.

Termini collegati

RLAIF Constitutional AI Alignment

Visto in azione

5 voci che lo citano

25 ottobre 2023

Zephyr-7B: DPO su Mistral 7B supera Llama-2-70B-chat su MT-Bench

Alto
18 luglio 2023

Llama 2: i pesi diventano commercialmente usabili

Pietra miliare
30 novembre 2022

ChatGPT: l'AI entra nei browser di tutti

Pietra miliare
27 gennaio 2022

InstructGPT: il fine-tuning che insegna a GPT a obbedire

Alto
16 dicembre 2021

WebGPT: OpenAI insegna a GPT-3 a navigare il web

Alto

← Tutti i termini