Addestramento Intermedio Anche noto come: Supervised Fine-Tuning · Fine-tuning supervisionato

SFT

/es-ef-tee/

Fine-tuning in cui il modello impara da coppie input-output scritte da umani, ad esempio domande con risposte ideali.

In pratica

È il primo passo per trasformare un modello base in un assistente che segue istruzioni. Bastano migliaia di esempi di buona qualità per ottenere grossi miglioramenti su un dominio. In azienda è quasi sempre la prima opzione prima di passare a RLHF o DPO.

Termini collegati

Fine-tuning Pretraining RLHF DPO LoRA

Visto in azione

0 voci che lo citano

Nessuna voce dell'archivio lo cita esplicitamente. Compare in contesti più ampi.

← Tutti i termini