◦

Percorso

Sviluppatore open source nell'era dei modelli

Llama, Mistral, Gemma, DeepSeek: la storia dei pesi aperti che contano.

Sei uno sviluppatore che non vuole dipendere da API chiuse e crede nel valore dei modelli open weight: puoi ispezionare i pesi, fare fine-tuning, girare tutto in locale. Questo percorso segue la storia della comunità open — da EleutherAI e GPT-Neo fino a Llama 4 e DeepSeek — con le tappe che hanno ridefinito cosa si riesce a fare senza pagare token a nessuno.

01

Perché conta per te

Il primo modello large open weight di EleutherAI: la prova che la ricerca open poteva sfidare OpenAI sul terreno della scala, prima ancora che Hugging Face diventasse il centro del mondo.

22 marzo 2021 Alto Modelli open source

GPT-Neo: il primo clone open source di GPT-3

EleutherAI rilascia GPT-Neo 1.3B e 2.7B, modelli linguistici open source addestrati su The Pile, primo tentativo serio di replicare l'architettura GPT-3 con pesi pubblici.
02

Perché conta per te

176 miliardi di parametri, addestrato in modo collaborativo da centinaia di ricercatori: il modello che ha dimostrato che la communità distribuita può competere con i lab privati.

12 luglio 2022 Alto Modelli open source

BLOOM 176B: il primo grande LLM multilingue veramente aperto

Il collettivo BigScience rilascia BLOOM, un modello da 176 miliardi di parametri addestrato in 46 lingue e 13 linguaggi di programmazione, sotto licenza RAIL aperta.
03

Perché conta per te

Il leak che ha cambiato tutto: i pesi di LLaMA circolano liberamente e nel giro di settimane chiunque può fare fine-tuning su laptop. Nasce l'ecosistema open moderno.

24 febbraio 2023 Alto Modelli open source

LLaMA: Meta apre la porta dei modelli foundation alla ricerca

Meta pubblica LLaMA in quattro taglie (7B, 13B, 33B, 65B) accessibili su richiesta a ricercatori. Una settimana dopo, i pesi finiscono in leak pubblico.
04

Perché conta per te

7 miliardi di parametri che battono Llama 2 13B su quasi tutti i benchmark: Mistral prova che efficienza e architettura contano più della scala bruta.

27 settembre 2023 Alto Modelli open source

Mistral 7B: l'Europa entra nella partita open-source

Mistral AI (Parigi), startup di tre mesi fondata da ex Meta/DeepMind, rilascia Mistral 7B con licenza Apache 2.0. Batte Llama 2 13B sulla maggior parte dei benchmark con metà dei parametri.
05

Perché conta per te

Mixture-of-Experts aperto alla comunità: la tecnica che permette qualità da 70B con costi di inferenza da 13B diventa accessibile a chiunque abbia una GPU seria.

11 dicembre 2023 Pietra miliare Modelli open source

Mixtral 8x7B: Mixture of Experts open source che batte GPT-3.5

Mistral rilascia Mixtral 8x7B via magnet link senza preavviso: SMoE con 8 esperti da 7B, 13B parametri attivi su 47B totali. Performance pari/superiore a GPT-3.5. Apache 2.0.
06

Perché conta per te

Google rilascia pesi aperti ottimizzati per deployment su singola GPU: il segnale che anche i big lab devono fare i conti con l'ecosistema open weight.

21 febbraio 2024 Alto Modelli open source

Gemma: Google entra nel gioco open-weights

Google rilascia Gemma 2B e 7B, modelli open-weights derivati dalla ricerca Gemini. Per la prima volta Google compete direttamente con Llama e Mistral sul terreno open.
07

Perché conta per te

Un modello open weight con reasoning competitivo a OpenAI o1, addestrato a una frazione del costo: la dimostrazione più forte che l'open source è entrato nel livello frontier.

20 gennaio 2025 Pietra miliare Modelli open source

DeepSeek-R1: il reasoning open compete con o1 a 1/30 del costo

Startup cinese DeepSeek rilascia R1, modello reasoning con pesi MIT open. Performance pari a OpenAI o1, prezzo API $0.55/$2.19 per 1M token (vs o1 $15/$60). Mercato Nasdaq AI perde $1T in due giorni.