Modelli Intermedio Anche noto come: Modello decoder-only · Solo decoder

Decoder-only

Architettura Transformer composta solo dalla parte di decoder, dove ogni token guarda solo i token precedenti per prevedere il successivo.

CondividiLinkedIn X

In pratica

È l'architettura di GPT, Llama, Mistral, Claude e di praticamente tutti gli LLM generativi moderni. Si contrappone a encoder-only (BERT, per classificazione) ed encoder-decoder (T5, per traduzione). La sua semplicità è il motivo per cui scala così bene in pretraining.

Termini collegati

Transformer Autoregressive Causal Mask LLM

Visto in azione

0 voci che lo citano

Nessuna voce dell'archivio lo cita esplicitamente. Compare in contesti più ampi.

← Tutti i termini