In pratica
Lo fai quando il modello base non risponde bene allo stile, al gergo o ai formati che ti servono. Richiede dati etichettati di buona qualità e GPU. Spesso si parte da una variante leggera come LoRA prima del fine-tuning completo.
Termini collegati
Visto in azione
11 voci che lo citano- Mediobitsandbytes 0.43: QLoRA e quantizzazione NF4/FP4 per fine-tuning 4-bit
- MedioDatabricks Mosaic AI: fine-tuning e inferenza unificati sul data lakehouse
- AltoS-LoRA e Punica: serving di centinaia di fine-tuning LoRA da un singolo modello base
- AltoBackdoor negli LLM fine-tuned: comportamenti nascosti attivabili su comando
- MedioWizardLM: istruzioni evolutive generate da GPT-4 per il fine-tuning
- MedioGorilla: LLaMA fine-tuned che chiama le API senza sbagliare
- AltoVicuna-13B: il chatbot open che raggiunge il 90% di ChatGPT
- MedioTextual Inversion: inietta un concetto personalizzato nei modelli di diffusione
- AltoDreamBooth: genera il tuo soggetto in qualsiasi stile con 3-5 foto
- AltoInstructGPT: il fine-tuning che insegna a GPT a obbedire
- AltoFLAN: l'instruction tuning che insegna ai modelli a seguire istruzioni