Salta al contenuto
AImpact
IT EN
Inferenza Intermedio Anche noto come: NIAH · Ago nel pagliaio

Needle in a Haystack

Test in cui si nasconde una frase specifica in mezzo a un lungo testo irrilevante e si chiede al modello di recuperarla, per misurare la qualità reale del context window.

CondividiLinkedInX

In pratica

È diventato il benchmark de facto per i modelli a contesto lungo (100K, 1M token). Un modello può avere un context enorme ma fallire il NIAH oltre una certa profondità, segnale che la finestra è 'finta'.

Termini collegati

Visto in azione

0 voci che lo citano

Nessuna voce dell'archivio lo cita esplicitamente. Compare in contesti più ampi.

← Tutti i termini