Magentic-One: il sistema multi-agente generalista di Microsoft supera GAIA
In una frase Microsoft Research pubblica Magentic-One: un sistema con Orchestrator + 4 agenti specializzati (WebSurfer, FileSurfer, Coder, ComputerTerminal). Prima posizione su GAIA benchmark. Insight chiave: agenti stateless specializzati + orchestratore stateful superano un agente monolitico. Open source MIT.
Microsoft Research presenta Magentic-One, un sistema dove cinque agenti lavorano insieme come un team: uno coordina, uno naviga il web, uno gestisce file, uno scrive codice, uno esegue comandi da terminale.
La cosa interessante e' come e' progettato: ogni agente specializzato e' "senza memoria" (stateless), cioe' vede solo il task corrente e non ricorda nulla delle interazioni passate. Tutta la memoria e il piano di lavoro stanno nell'orchestratore, che sa dove si trova nel processo e decide chi chiamare ogni volta.
Questo design si rivela molto piu' robusto rispetto a un singolo agente che deve fare tutto: ogni specialista e' piu' affidabile nel suo dominio, e l'orchestratore puo' riassegnare il lavoro se uno fallisce.
Il risultato: su GAIA, il benchmark che misura capacita' su task reali (rispondere a domande complesse che richiedono ricerca, ragionamento e azioni), Magentic-One ottiene i migliori risultati. Viene rilasciato come open source sotto licenza MIT.
Aziende
Microsoft
Tool
—
Tag
Fonti