Inferenza Base Anche noto come: Token

Token

Unità di base in cui il modello scompone il testo: può essere una parola intera, una sillaba o pochi caratteri, a seconda del tokenizzatore.

CondividiLinkedIn X

In pratica

Le API degli LLM si pagano a token in ingresso e in uscita. In inglese 1 token corrisponde circa a 0,75 parole, in italiano un po' meno. Misurare i token del prompt aiuta a stimare costi e a stare dentro il limite di contesto.

Termini collegati

Tokenizer Context window LLM

Visto in azione

6 voci che lo citano

26 giugno 2025

Cerebras tocca 2.500+ token/sec su Llama: record inferenza dell'anno

Medio
20 ottobre 2024

EMU3: un unico transformer per testo, immagini e video

Alto
20 giugno 2024

Rebuff: difesa a tre livelli dalla prompt injection con canary token

Medio
15 febbraio 2024

Gemini 1.5 Pro: 1 milione di token nel contesto

Alto
28 settembre 2023

AudioPaLM: il primo LLM che processa e genera audio come testo

Alto
9 luglio 2020

HuggingFace Transformers 3.0: i tokenizer Rust e l'hub modelli

Alto

← Tutti i termini