Salta al contenuto
AImpact
IT EN
Alto Modelli open source · 1 min lettura

DeepSeek R2: la cinese rilancia il modello reasoning open-weight

In una frase DeepSeek pubblica R2, successore di R1: ragionamento step-by-step più efficiente, pesi aperti, training cost contenuto. Nuova pressione sui modelli reasoning chiusi.

Da rivedere Fonte autorevole
CondividiLinkedInX
Livello di lettura

Esattamente un anno dopo R1 (gennaio 2025), DeepSeek rilascia R2: il successore del modello che a inizio 2025 aveva scosso il mercato dimostrando che si può fare reasoning di alto livello con un budget di training molto inferiore a quello americano.

R2 ripete la formula: pesi aperti su HuggingFace, licenza permissiva, focus sul ragionamento step-by-step (chain-of-thought) addestrato via reinforcement learning. La differenza è che ora c'è un anno di vantaggi cumulati: architettura MoE rifinita, dati migliori, distillation più aggressiva su modelli più piccoli.

Per chi self-hosta: la versione più piccola gira su una singola GPU consumer di fascia alta, e arriverà in versioni quantizzate per Ollama / llama.cpp nei giorni successivi al rilascio.

Politica e mercato: la Cina mostra che la rincorsa al frontier reasoning non si è fermata con i controlli export USA. Il dibattito su "AI sovrana europea" guadagna un altro argomento.

Aziende

DeepSeek

Tool

DeepSeek R2

Tag

DeepSeekOpen SourceReasoningMoEChina

Fonti