WizardLM: istruzioni evolutive generate da GPT-4 per il fine-tuning
In una frase WizardLM usa Evol-Instruct — istruzioni semplificate e complicate automaticamente da GPT-4 — e raggiunge il 97% di ChatGPT su WizardEval con un modello 70B.
Per addestrare un modello a seguire istruzioni complesse, servono molti esempi di istruzioni difficili. Ma raccogliere questi dati è lento e costoso. WizardLM risolve il problema chiedendo a GPT-4 di "evolvere" istruzioni semplici, rendendole più complesse in modo automatico.
Il processo si chiama Evol-Instruct: un'istruzione di base viene espansa, resa più specifica, o aumentata di vincoli, finché non diventa molto più impegnativa dell'originale.
Il modello fine-tuned su questi dati evolutivi raggiunge prestazioni molto vicine a ChatGPT su benchmark di valutazione, dimostrando che la complessità delle istruzioni conta quanto la loro quantità.
Aziende
Microsoft
Tool
WizardLM, GPT-4
Tag
Fonti