Percorso
Sviluppatore open source nell'era dei modelli
Llama, Mistral, Gemma, DeepSeek: la storia dei pesi aperti che contano.
Sei uno sviluppatore che non vuole dipendere da API chiuse e crede nel valore dei modelli open weight: puoi ispezionare i pesi, fare fine-tuning, girare tutto in locale. Questo percorso segue la storia della comunità open — da EleutherAI e GPT-Neo fino a Llama 4 e DeepSeek — con le tappe che hanno ridefinito cosa si riesce a fare senza pagare token a nessuno.
- 01
Perché conta per te
Il primo modello large open weight di EleutherAI: la prova che la ricerca open poteva sfidare OpenAI sul terreno della scala, prima ancora che Hugging Face diventasse il centro del mondo.
Alto Modelli open sourceGPT-Neo: il primo clone open source di GPT-3
EleutherAI rilascia GPT-Neo 1.3B e 2.7B, modelli linguistici open source addestrati su The Pile, primo tentativo serio di replicare l'architettura GPT-3 con pesi pubblici.
- 02
Perché conta per te
176 miliardi di parametri, addestrato in modo collaborativo da centinaia di ricercatori: il modello che ha dimostrato che la communità distribuita può competere con i lab privati.
Alto Modelli open sourceBLOOM 176B: il primo grande LLM multilingue veramente aperto
Il collettivo BigScience rilascia BLOOM, un modello da 176 miliardi di parametri addestrato in 46 lingue e 13 linguaggi di programmazione, sotto licenza RAIL aperta.
- 03
Perché conta per te
Il leak che ha cambiato tutto: i pesi di LLaMA circolano liberamente e nel giro di settimane chiunque può fare fine-tuning su laptop. Nasce l'ecosistema open moderno.
Alto Modelli open sourceLLaMA: Meta apre la porta dei modelli foundation alla ricerca
Meta pubblica LLaMA in quattro taglie (7B, 13B, 33B, 65B) accessibili su richiesta a ricercatori. Una settimana dopo, i pesi finiscono in leak pubblico.
- 04
Perché conta per te
7 miliardi di parametri che battono Llama 2 13B su quasi tutti i benchmark: Mistral prova che efficienza e architettura contano più della scala bruta.
Alto Modelli open sourceMistral 7B: l'Europa entra nella partita open-source
Mistral AI (Parigi), startup di tre mesi fondata da ex Meta/DeepMind, rilascia Mistral 7B con licenza Apache 2.0. Batte Llama 2 13B sulla maggior parte dei benchmark con metà dei parametri.
- 05
Perché conta per te
Mixture-of-Experts aperto alla comunità: la tecnica che permette qualità da 70B con costi di inferenza da 13B diventa accessibile a chiunque abbia una GPU seria.
Pietra miliare Modelli open sourceMixtral 8x7B: Mixture of Experts open source che batte GPT-3.5
Mistral rilascia Mixtral 8x7B via magnet link senza preavviso: SMoE con 8 esperti da 7B, 13B parametri attivi su 47B totali. Performance pari/superiore a GPT-3.5. Apache 2.0.
- 06
Perché conta per te
Google rilascia pesi aperti ottimizzati per deployment su singola GPU: il segnale che anche i big lab devono fare i conti con l'ecosistema open weight.
Alto Modelli open sourceGemma: Google entra nel gioco open-weights
Google rilascia Gemma 2B e 7B, modelli open-weights derivati dalla ricerca Gemini. Per la prima volta Google compete direttamente con Llama e Mistral sul terreno open.
- 07
Perché conta per te
Un modello open weight con reasoning competitivo a OpenAI o1, addestrato a una frazione del costo: la dimostrazione più forte che l'open source è entrato nel livello frontier.
Pietra miliare Modelli open sourceDeepSeek-R1: il reasoning open compete con o1 a 1/30 del costo
Startup cinese DeepSeek rilascia R1, modello reasoning con pesi MIT open. Performance pari a OpenAI o1, prezzo API $0.55/$2.19 per 1M token (vs o1 $15/$60). Mercato Nasdaq AI perde $1T in due giorni.