Nemotron-4 340B: il modello NVIDIA per generare dati di training sintetici
In una frase NVIDIA rilascia Nemotron-4 340B ottimizzato per la generazione di dati sintetici di alta qualità, permettendo alle aziende di addestrare modelli più piccoli e specializzati senza raccogliere dati reali.
Addestrare un modello AI richiede enormi quantità di dati di buona qualità. Il problema per molte aziende è che questi dati non esistono in abbondanza, o sono proprietari e difficili da raccogliere.
NVIDIA ha costruito Nemotron-4 con un obiettivo specifico: non essere il miglior modello per rispondere alle domande degli utenti, ma essere il miglior modello per generare dati di training per altri modelli. È come costruire una fabbrica di mattoni invece di un palazzo.
Un'azienda che vuole un modello specializzato per, diciamo, analizzare contratti legali o fare diagnosi mediche può usare Nemotron-4 per generare migliaia di esempi sintetici nel suo dominio, e poi addestrare un modello più piccolo ed efficiente su quei dati. Tutto questo senza dover raccogliere e annotare manualmente dati reali, il che è costoso e lento.
Aziende
NVIDIA
Tool
—
Tag
Fonti