OpenVLA: il primo Vision-Language-Action model open source per robotica generalista

In una frase Ricercatori di Berkeley e Stanford rilasciano OpenVLA, 7B parametri, primo VLA open source per controllo robotico generalista: un controllore universale scaricabile da Hugging Face.

Verificato Fonte ufficiale

CondividiLinkedIn X

OpenVLA è un modello di intelligenza artificiale che puoi scaricare liberamente e usare per controllare un robot. Prima di OpenVLA, i modelli di questo tipo erano tutti proprietari e accessibili solo alle grandi aziende.

Con 7 miliardi di parametri, OpenVLA prende in input immagini dalla telecamera del robot e istruzioni in linguaggio naturale, e produce i movimenti da eseguire. È addestrato su dati di oltre 970.000 episodi robot provenienti da varie sorgenti.

Il fatto che sia open source significa che qualsiasi laboratorio universitario o ricercatore indipendente può ora costruire sopra questo modello, accelerando enormemente la ricerca nella robotica.