DeepSeek V4 Preview: 1.6T parametri, contesto 1M e open weight in due taglie

In una frase DeepSeek rilascia V4 Preview open source: V4-Pro (1.6T totali, 49B attivi) e V4-Flash (284B totali, 13B attivi). Contesto nativo 1M token, attenzione ibrida CSA+HCA per ridurre KV cache del 90%.

Verificato Fonte ufficiale

CondividiLinkedIn X

Esattamente un anno dopo il "Sputnik moment" di DeepSeek R1 (gennaio 2025), che aveva sorpreso il mercato con prestazioni frontier a costi 1/20 dei competitor occidentali, DeepSeek torna il 24 aprile 2026 con V4 Preview. Open source, pesi scaricabili, due taglie.

DeepSeek-V4-Pro: 1.6 trilioni di parametri totali (49 miliardi attivi a ogni token, è un Mixture-of-Experts). Il più grande modello open weight pubblicato finora.
DeepSeek-V4-Flash: 284 miliardi totali, 13 miliardi attivi. Pensato per chi vuole velocità + economia.

Entrambi supportano contesto nativo di 1 milione di token. La novità tecnica vera: usano un'architettura di attenzione ibrida (CSA + HCA, sigle interne DeepSeek) che riduce la KV cache del 90% rispetto a V3.2. Tradotto: girano su molta meno memoria GPU per la stessa lunghezza di input.

Per ricercatori, enterprise IT che self-hosta, paesi che non vogliono dipendere da modelli US: V4 è un'opzione frontier-grade aperta. Disponibile su Hugging Face, API DeepSeek (compatibile sia con OpenAI sia con Anthropic API format).