Llama 3.3 70B: Meta porta il 70B alle performance del 405B con post-training

In una frase Meta rilascia Llama 3.3 70B Instruct: stesso conteggio parametri di 3.1 70B ma performance dichiarate vicine al 405B grazie a nuovo post-training pipeline, niente nuovo modello base.

Verificato Fonte ufficiale

CondividiLinkedIn X

A luglio 2024 Meta aveva pubblicato Llama 3.1 in tre taglie: 8B, 70B, e l'enorme 405B. Quest'ultimo era pesantissimo da usare (richiede multipli GPU di server) ma molto bravo.

A dicembre rilasciano "Llama 3.3 70B": stesso modello base del 3.1 70B (gli stessi 70 miliardi di parametri), ma raffinato con nuove tecniche post-training. Il risultato dichiarato: il 70B ora va quasi come il 405B su molti benchmark, ma è 6 volte più leggero.

In pratica: chi ha una macchina seria (2 GPU H100 o Mac Studio M2 Ultra) può far girare in casa qualcosa che pareggia l'API GPT-4-Turbo, gratis e on-prem.