RoboCat: il primo robot che si auto-migliora senza etichettatura umana
In una frase DeepMind presenta RoboCat, un agente robotico che impara da poche dimostrazioni, si auto-addestra raccogliendo nuovi dati, e migliora iterativamente senza intervento umano. Con soli 10 demo raggiunge il 36% di successo su task nuovi.
Di solito per addestrare un robot ci vogliono migliaia di esempi e molto tempo umano. RoboCat di DeepMind cambia le regole del gioco con un'idea elegante: il robot impara da poche dimostrazioni, poi raccoglie autonomamente nuovi dati migliorando progressivamente da solo.
Il ciclo funziona così: si mostrano al robot circa 100 esempi di un task, il robot si affina su quei dati, poi esegue il task raccogliendo ulteriore esperienza, e infine si riaddestra con tutto il nuovo materiale. Questo processo si ripete più volte, come uno studente che studia, fa pratica, rilegge i propri errori, e ricomincia.
Il risultato? Con appena 10 dimostrazioni, RoboCat raggiunge il 36% di successo su task che non ha mai visto. Non è ancora perfetto, ma è straordinario per una quantità così piccola di esempi di partenza.
La cosa più rilevante non è la performance assoluta, ma il principio: per la prima volta abbiamo un sistema robotico che si migliora da solo, senza che un umano debba continuamente etichettare nuovi dati. Questo è un passo enorme verso robot che imparano in modo autonomo durante l'uso.
Aziende
DeepMind
Tool
—
Tag
Fonti