Salta al contenuto
AImpact
IT EN
← Percorsi

Percorso

Sviluppatore open source nell'era dei modelli

Llama, Mistral, Gemma, DeepSeek: la storia dei pesi aperti che contano.

Sei uno sviluppatore che non vuole dipendere da API chiuse e crede nel valore dei modelli open weight: puoi ispezionare i pesi, fare fine-tuning, girare tutto in locale. Questo percorso segue la storia della comunità open — da EleutherAI e GPT-Neo fino a Llama 4 e DeepSeek — con le tappe che hanno ridefinito cosa si riesce a fare senza pagare token a nessuno.

  1. 01

    Perché conta per te

    Il primo modello large open weight di EleutherAI: la prova che la ricerca open poteva sfidare OpenAI sul terreno della scala, prima ancora che Hugging Face diventasse il centro del mondo.

    Alto Modelli open source

    GPT-Neo: il primo clone open source di GPT-3

    EleutherAI rilascia GPT-Neo 1.3B e 2.7B, modelli linguistici open source addestrati su The Pile, primo tentativo serio di replicare l'architettura GPT-3 con pesi pubblici.

  2. 02

    Perché conta per te

    176 miliardi di parametri, addestrato in modo collaborativo da centinaia di ricercatori: il modello che ha dimostrato che la communità distribuita può competere con i lab privati.

    Alto Modelli open source

    BLOOM 176B: il primo grande LLM multilingue veramente aperto

    Il collettivo BigScience rilascia BLOOM, un modello da 176 miliardi di parametri addestrato in 46 lingue e 13 linguaggi di programmazione, sotto licenza RAIL aperta.

  3. 03

    Perché conta per te

    Il leak che ha cambiato tutto: i pesi di LLaMA circolano liberamente e nel giro di settimane chiunque può fare fine-tuning su laptop. Nasce l'ecosistema open moderno.

    Alto Modelli open source

    LLaMA: Meta apre la porta dei modelli foundation alla ricerca

    Meta pubblica LLaMA in quattro taglie (7B, 13B, 33B, 65B) accessibili su richiesta a ricercatori. Una settimana dopo, i pesi finiscono in leak pubblico.

  4. 04

    Perché conta per te

    7 miliardi di parametri che battono Llama 2 13B su quasi tutti i benchmark: Mistral prova che efficienza e architettura contano più della scala bruta.

    Alto Modelli open source

    Mistral 7B: l'Europa entra nella partita open-source

    Mistral AI (Parigi), startup di tre mesi fondata da ex Meta/DeepMind, rilascia Mistral 7B con licenza Apache 2.0. Batte Llama 2 13B sulla maggior parte dei benchmark con metà dei parametri.

  5. 05

    Perché conta per te

    Mixture-of-Experts aperto alla comunità: la tecnica che permette qualità da 70B con costi di inferenza da 13B diventa accessibile a chiunque abbia una GPU seria.

    Pietra miliare Modelli open source

    Mixtral 8x7B: Mixture of Experts open source che batte GPT-3.5

    Mistral rilascia Mixtral 8x7B via magnet link senza preavviso: SMoE con 8 esperti da 7B, 13B parametri attivi su 47B totali. Performance pari/superiore a GPT-3.5. Apache 2.0.

  6. 06

    Perché conta per te

    Google rilascia pesi aperti ottimizzati per deployment su singola GPU: il segnale che anche i big lab devono fare i conti con l'ecosistema open weight.

    Alto Modelli open source

    Gemma: Google entra nel gioco open-weights

    Google rilascia Gemma 2B e 7B, modelli open-weights derivati dalla ricerca Gemini. Per la prima volta Google compete direttamente con Llama e Mistral sul terreno open.

  7. 07

    Perché conta per te

    Un modello open weight con reasoning competitivo a OpenAI o1, addestrato a una frazione del costo: la dimostrazione più forte che l'open source è entrato nel livello frontier.

    Pietra miliare Modelli open source

    DeepSeek-R1: il reasoning open compete con o1 a 1/30 del costo

    Startup cinese DeepSeek rilascia R1, modello reasoning con pesi MIT open. Performance pari a OpenAI o1, prezzo API $0.55/$2.19 per 1M token (vs o1 $15/$60). Mercato Nasdaq AI perde $1T in due giorni.