Modelli Intermedio Anche noto come: Mixture of Experts · Miscela di esperti

MoE

/em-oh-ee/

Architettura in cui il modello è diviso in molti sotto-modelli specializzati ('esperti') e per ogni token viene attivata solo una piccola parte di essi.

CondividiLinkedIn X

In pratica

Permette di avere modelli da centinaia di miliardi di parametri ma con il costo di inferenza di uno molto più piccolo. Mixtral, DeepSeek e GPT-4 lo usano. In pratica per chi usa l'API non cambia nulla, ma spiega rapporti qualità/prezzo sorprendenti.

Termini collegati

LLM Inference compute

Visto in azione

20 voci che lo citano

13 giugno 2026

Alibaba lancia Qwen 3.5: modelli aperti da 7B a 235B MoE con contesto da 128K

Alto
10 giugno 2026

Meta rilascia Llama 4.1: tre modelli MoE open source con finestra da 10 milioni di token

Pietra miliare
24 aprile 2026

DeepSeek V4 Preview: 1.6T parametri, contesto 1M e open weight in due taglie

Pietra miliare
28 gennaio 2026

DeepSeek R2: la cinese rilancia il modello reasoning open-weight

Alto
28 maggio 2025

Llama 4 Scout: 109B MoE multimodale con 10M di context e vision SOTA

Alto
29 aprile 2025

Qwen 3: Alibaba rilascia una famiglia open weight da 0.6B a 235B con thinking nativo

Alto
5 aprile 2025

Llama 4: Meta passa a MoE e multimodale nativo, ma la community accoglie con freddezza

Alto
24 marzo 2025

DeepSeek-V3-0324: l'update silenzioso che mette in difficoltà il vendor lock-in

Medio
10 gennaio 2025

DeepSeek-V3: qualità GPT-4o a $0.55/M token tramite MLA e pipeline FP8

Alto
26 dicembre 2024

DeepSeek-V3: la Cina rilascia un modello frontier open a costo basso scioccante

Pietra miliare
28 maggio 2024

DeepSeek-Coder-V2: qualita GPT-4 Turbo su coding con pesi aperti

Alto
6 maggio 2024

DeepSeek-V2: Multi-head Latent Attention e il primo MoE cinese open ad alta efficienza

Alto
17 aprile 2024

Mixtral 8x22B: il MoE Apache 2.0 di Mistral con 39B attivi

Alto
14 aprile 2024

Snowflake Arctic: MoE 480B totale / 17B attivi, SOTA enterprise SQL

Medio
27 marzo 2024

DBRX: il MoE open di Databricks da 132B totali e 36B attivi

Medio
15 febbraio 2024

Gemini 1.5 Pro: 1 milione di token nel contesto

Alto
11 dicembre 2023

Mixtral 8x7B: Mixture of Experts open source che batte GPT-3.5

Pietra miliare
4 novembre 2023

Grok-1: il chatbot di xAI con accesso ai dati real-time di X

Medio
1 giugno 2021

Wu Dao 2.0: la Cina annuncia un modello da 1,75T parametri

Medio
12 gennaio 2021

Switch Transformer: Google scala a 1,6T parametri con Mixture of Experts

Alto

← Tutti i termini