Salta al contenuto
AImpact
IT EN
Alto AI multimodale · 1 min lettura

Gato: DeepMind prova un singolo agente per 600+ compiti

In una frase DeepMind presenta Gato, una rete Transformer da 1.2 miliardi di parametri che con gli stessi pesi gioca a videogame Atari, controlla un braccio robotico, descrive immagini e dialoga.

Verificato Fonte ufficiale
CondividiLinkedInX
Livello di lettura

Di solito ogni AI fa una cosa sola: una traduce, una gioca a scacchi, un'altra riconosce immagini. DeepMind costruisce Gato per fare l'opposto: una sola rete neurale che fa centinaia di lavori diversi.

Con gli stessi parametri Gato gioca a vecchi videogiochi, descrive foto, conversa, fa muovere un braccio robotico per impilare blocchi.

Non è bravo come uno specialista in nessun campo, ma il messaggio è ambizioso: "forse non servono mille modelli, serve un modello generalista". È un'idea che torna fortissima negli anni successivi, quando si parla di "agenti AI".

Aziende

DeepMind

Tool

Gato

Tag

DeepMindGatoGeneralist AgentMultimodalTransformer

Fonti