Salta al contenuto
AImpact
IT EN
Addestramento Intermedio Anche noto come: Quantized LoRA

QLoRA

/kew-lor-ah/

Variante di LoRA che mantiene il modello base in formato quantizzato a 4 bit durante il fine-tuning, riducendo drasticamente la memoria GPU richiesta.

CondividiLinkedInX

In pratica

Permette di adattare modelli da 13B-70B parametri su una singola GPU consumer (es. RTX 4090 o A100 da 24-40 GB). È la tecnica preferita per fine-tuning amatoriale o aziendale a basso budget. La perdita di qualità rispetto a un fine-tuning full-precision è quasi trascurabile.

Termini collegati

← Tutti i termini