Modelli Intermedio Anche noto come: Autoregressivo

Autoregressive

Modello che genera una sequenza un elemento alla volta, usando ogni volta l'output precedente come parte del nuovo input.

CondividiLinkedIn X

In pratica

È il modo di funzionare di tutti gli LLM di tipo GPT: ogni token nuovo dipende da tutti quelli generati prima. Spiega perché la generazione è intrinsecamente sequenziale e difficile da parallelizzare, ed è il motivo dietro tecniche come speculative decoding per accelerare l'output.

Termini collegati

Causal Mask Decoder-only Transformer LLM Greedy Decoding

Visto in azione

3 voci che lo citano

20 ottobre 2024

EMU3: un unico transformer per testo, immagini e video

Alto
18 maggio 2023

SoundStorm: Google genera 30 secondi di dialogo naturale in mezzo secondo

Alto
20 gennaio 2023

Speculative Decoding: 2-3x speedup per l'inferenza LLM senza modificare l'output

Alto

← Tutti i termini