DeepSeek R2: la cinese rilancia il modello reasoning open-weight

In una frase DeepSeek pubblica R2, successore di R1: ragionamento step-by-step più efficiente, pesi aperti, training cost contenuto. Nuova pressione sui modelli reasoning chiusi.

Da rivedere Fonte autorevole

CondividiLinkedIn X

Esattamente un anno dopo R1 (gennaio 2025), DeepSeek rilascia R2: il successore del modello che a inizio 2025 aveva scosso il mercato dimostrando che si può fare reasoning di alto livello con un budget di training molto inferiore a quello americano.

R2 ripete la formula: pesi aperti su HuggingFace, licenza permissiva, focus sul ragionamento step-by-step (chain-of-thought) addestrato via reinforcement learning. La differenza è che ora c'è un anno di vantaggi cumulati: architettura MoE rifinita, dati migliori, distillation più aggressiva su modelli più piccoli.

Per chi self-hosta: la versione più piccola gira su una singola GPU consumer di fascia alta, e arriverà in versioni quantizzate per Ollama / llama.cpp nei giorni successivi al rilascio.

Politica e mercato: la Cina mostra che la rincorsa al frontier reasoning non si è fermata con i controlli export USA. Il dibattito su "AI sovrana europea" guadagna un altro argomento.