DrEureka: LLM automatizza il trasferimento simulazione-reale senza tuning manuale

In una frase NVIDIA e UT Austin presentano DrEureka, che usa GPT-4 per generare automaticamente i parametri di domain randomization per il trasferimento sim-to-real. Politiche di locomozione e destrezza trasferiscono zero-shot su hardware reale senza calibrazione manuale.

Da rivedere Fonte autorevole

CondividiLinkedIn X

Addestrare un robot in simulazione è molto più veloce e sicuro che farlo nel mondo reale. Il problema è che i robot addestrati in simulazione spesso non funzionano bene quando vengono trasferiti sull'hardware fisico: la simulazione non è mai perfetta, e le piccole differenze (attrito, elasticità, rumori dei sensori) causano comportamenti inattesi.

Per risolvere questo, si usa la "domain randomization": si aggiunge deliberatamente variabilità casuale alla simulazione (diversi valori di attrito, peso, rumore) così che il robot impari a gestire l'incertezza. Il problema è capire esattamente quanta e quale variabilità aggiungere — questo richiede tipicamente settimane di lavoro manuale da un esperto.

DrEureka usa GPT-4 per automatizzare questo processo. Il modello analizza il codice del simulatore e la descrizione del task, genera automaticamente i parametri di randomizzazione, testa i risultati, e li affina iterativamente. Il robot impara a camminare e a fare manipolazione destrezza in simulazione, poi trasferisce zero-shot su hardware reale.

Il risultato pratico è che il ciclo di sviluppo per nuovi task robotici si accorcia drammaticamente: quello che richiedeva settimane di tuning manuale da un esperto ora si risolve automaticamente in ore.