WizardLM: istruzioni evolutive generate da GPT-4 per il fine-tuning

In una frase WizardLM usa Evol-Instruct — istruzioni semplificate e complicate automaticamente da GPT-4 — e raggiunge il 97% di ChatGPT su WizardEval con un modello 70B.

Verificato Fonte ufficiale

CondividiLinkedIn X

Per addestrare un modello a seguire istruzioni complesse, servono molti esempi di istruzioni difficili. Ma raccogliere questi dati è lento e costoso. WizardLM risolve il problema chiedendo a GPT-4 di "evolvere" istruzioni semplici, rendendole più complesse in modo automatico.

Il processo si chiama Evol-Instruct: un'istruzione di base viene espansa, resa più specifica, o aumentata di vincoli, finché non diventa molto più impegnativa dell'originale.

Il modello fine-tuned su questi dati evolutivi raggiunge prestazioni molto vicine a ChatGPT su benchmark di valutazione, dimostrando che la complessità delle istruzioni conta quanto la loro quantità.