Addestramento Base Anche noto come: Pre-training · Pre-addestramento

Pretraining

Fase iniziale di addestramento in cui un modello impara la struttura del linguaggio prevedendo il prossimo token su enormi quantità di testo generico.

CondividiLinkedIn X

In pratica

È la parte più costosa (mesi di GPU e milioni di dollari) e produce un modello "base" che sa scrivere ma non sa ancora seguire istruzioni. Solo i grandi laboratori la fanno da zero; le aziende ripartono da modelli pre-addestrati e li adattano con SFT, LoRA o RLHF.

Termini collegati

Foundation model SFT Loss Function Gradient Descent Checkpoint

Visto in azione

6 voci che lo citano

5 maggio 2024

GR-2: ByteDance preaddestra robot su 38.000 ore di video umani da internet

Alto
27 giugno 2022

UL2: Google unifica i paradigmi di addestramento con Mixture-of-Denoisers

Medio
1 giugno 2021

The Pile: il dataset open source da 825 GB che alimenta l'open LLM

Alto
31 dicembre 2020

The Pile: il dataset open source da 825 GB per addestrare LLM

Alto
17 giugno 2020

Image GPT: pre-training generativo per le immagini

Medio
23 marzo 2020

ELECTRA: pre-training NLP più efficiente di BERT

Medio

← Tutti i termini