OpenVLA: il primo Vision-Language-Action model open source per robotica generalista
In una frase Ricercatori di Berkeley e Stanford rilasciano OpenVLA, 7B parametri, primo VLA open source per controllo robotico generalista: un controllore universale scaricabile da Hugging Face.
OpenVLA è un modello di intelligenza artificiale che puoi scaricare liberamente e usare per controllare un robot. Prima di OpenVLA, i modelli di questo tipo erano tutti proprietari e accessibili solo alle grandi aziende.
Con 7 miliardi di parametri, OpenVLA prende in input immagini dalla telecamera del robot e istruzioni in linguaggio naturale, e produce i movimenti da eseguire. È addestrato su dati di oltre 970.000 episodi robot provenienti da varie sorgenti.
Il fatto che sia open source significa che qualsiasi laboratorio universitario o ricercatore indipendente può ora costruire sopra questo modello, accelerando enormemente la ricerca nella robotica.
Aziende
UC Berkeley, Stanford, Google DeepMind
Tool
OpenVLA, Prismatic VLM
Tag
Fonti