Sim-to-Real Transfer
Il processo di addestramento di una policy robotica in simulazione (veloce, economica, sicura) e successivo deployment su hardware reale senza riaddestramento. Il 'reality gap' — differenze in fisica, attrito, rumore dei sensori — causa il fallimento delle policy. La domain randomization (randomizzare i parametri della simulazione) insegna robustezza. LLMs automatizzano questo processo (DrEureka): generano range di randomizzazione così che le policy si trasferiscano zero-shot all'hardware reale.
In pratica
Un team di robotica che costruisce un arm per picking industriale addestra migliaia di policy in parallelo su Isaac Sim o MuJoCo, variando casualmente massa degli oggetti, attrito, illuminazione e ritardi dei motori. La policy migliore viene poi deplodata sul robot fisico senza ulteriore training. Con DrEureka, un LLM suggerisce automaticamente i range di randomizzazione partendo dalla descrizione del task, riducendo i giorni di tuning manuale a poche ore di ricerca automatizzata.
Termini collegati
Visto in azione
0 voci che lo citanoNessuna voce dell'archivio lo cita esplicitamente. Compare in contesti più ampi.