Salta al contenuto
AImpact
IT EN
Medio Modelli open source · 1 min lettura

DeepSeek-V3-0324: l'update silenzioso che mette in difficoltà il vendor lock-in

In una frase DeepSeek rilascia un aggiornamento di DeepSeek-V3 (685B param MoE, 37B attivi) con licenza MIT. Performance vicine a Claude 3.7 Sonnet su coding, costo training stimato 20x inferiore.

Da rivedere Fonte ufficiale
CondividiLinkedInX
Livello di lettura

Due mesi dopo R1 (gennaio), DeepSeek rilascia in silenzio — senza press release — un aggiornamento del suo modello principale, DeepSeek-V3. Il file appare su Hugging Face il 24 marzo: 685 miliardi di parametri totali, ma solo 37 miliardi attivi per ogni risposta (architettura "Mixture of Experts").

La cosa importante: è gratis. Licenza MIT, scaricabile e usabile in commerciale. E sui benchmark di coding e matematica si avvicina molto a Claude 3.7 Sonnet, che però costa $3/$15 per milione di token. DeepSeek lo offre via API a $0.27/$1.10.

Effetto: i provider cloud (Together, Fireworks, OpenRouter) lo aggiungono in 48 ore. Le aziende che usavano Claude o GPT-4o per coding iniziano a valutare seriamente l'alternativa cinese open weight.

Aziende

DeepSeek

Tool

DeepSeek-V3-0324

Tag

DeepSeekOpen SourceMoEChina

Fonti