Salta al contenuto
AImpact
IT EN
Addestramento Intermedio Anche noto come: Discesa del gradiente

Gradient Descent

Algoritmo di ottimizzazione che aggiorna i pesi del modello nella direzione che riduce di più l'errore, un piccolo passo alla volta.

CondividiLinkedInX

In pratica

È il motore di base dietro l'addestramento di ogni rete neurale moderna. In pratica si usa una variante chiamata Adam o AdamW, più stabile e veloce. Per chi non addestra modelli da zero è un concetto da conoscere, ma non un parametro da toccare.

Termini collegati

Visto in azione

0 voci che lo citano

Nessuna voce dell'archivio lo cita esplicitamente. Compare in contesti più ampi.

← Tutti i termini