Categoria

Agenti

58 voci

19 giugno 2026 Alto

Anthropic lancia in GA la Memory API per Claude: storage persistente per gli agenti AI

Anthropic porta in disponibilità generale la Memory API, che offre storage strutturato e persistente per gli agenti Claude tra una sessione e l'altra, con memoria a livello di progetto, di utente e ricerca semantica sui fatti memorizzati.

Agenti Memory APIPersistent StorageAgentic AI

12 maggio 2026 Alto

MCP a 18 mesi: l'ecosistema dei server raggiunge la massa critica

A 18 mesi dal lancio (novembre 2024), Model Context Protocol consolida: migliaia di server pubblici, adozione cross-vendor confermata, primo registry ufficiale stabile.

Agenti MCPModel Context ProtocolAnthropic

21 aprile 2026 Alto

Deep Research e Deep Research Max: gli agenti di ricerca autonomi di Google con MCP

Google rilascia due agenti di ricerca sul Gemini API: Deep Research (veloce) e Deep Research Max (deep+lento, 93.3% su DeepSearchQA). MCP support per dati privati, visualizzazioni native con Nano Banana 2.

Agenti GoogleGeminiDeep Research

26 marzo 2026 Alto

OpenAI consolida la piattaforma agenti: Operator e ChatGPT Agent fusi in un'unica offerta

OpenAI riorganizza Operator (gennaio 2025) e ChatGPT Agent (luglio 2025) in una piattaforma unificata, con SDK aggiornato e nuove modalità di esecuzione async multi-task.

Agenti OpenAIAgentsChatGPT

23 gennaio 2026 Alto

OpenAI Operator in disponibilità generale: il primo agente web autonomo commerciale

OpenAI lancia Operator in GA su 30+ paesi: un agente che naviga il web, compila moduli, prenota appuntamenti e fa acquisti in modo autonomo per conto dell'utente.

Agenti

12 gennaio 2026 Alto

Claude Cowork: l'agente desktop di Anthropic per knowledge worker non tecnici

Anthropic rilascia Cowork in research preview: un agente desktop con accesso a shell sandbox e file locali, pensato per chi non vive nel terminale come fa Claude Code.

Agenti AnthropicClaudeCowork

4 dicembre 2025 Alto

MCP ecosystem 2025: Inspector, UI, registry, e adozione cross-vendor

Il Model Context Protocol, lanciato da Anthropic a novembre 2024, raggiunge masse critiche: MCP Inspector GA, MCP-UI per server con interfaccia, registry ufficiale, supporto OpenAI/Google. Diventa lo 'USB-C dei tool LLM'.

Agenti MCPModel Context ProtocolMCP Inspector

20 ottobre 2025 Alto

OpenAI lancia la Computer Use API — l'AI prende il controllo del desktop

La Computer Use API di OpenAI permette ai modelli di navigare il desktop via loop screenshot+azione, gestendo browser, app Office e file — un diretto competitor degli strumenti RPA, disponibile nel tier enterprise.

Agenti

16 ottobre 2025 Alto

Claude Skills: capabilities packagizzate caricate su richiesta nel context

Anthropic introduce Skills: bundle di istruzioni + script + risorse che Claude carica automaticamente quando il task lo richiede. Sostituisce di fatto la maggior parte dei prompt sistemi custom enterprise.

Agenti AnthropicClaude SkillsAgent SDK

17 luglio 2025 Alto

ChatGPT Agent: OpenAI unifica Operator e Deep Research in un agente che usa il computer

OpenAI lancia 'ChatGPT Agent': fusione di Operator (browser use), Deep Research (ricerca lunga) e ChatGPT classico, in un agente unico che ha browser virtuale + terminale + API tools.

Agenti OpenAIChatGPTAgent

14 luglio 2025 Alto

Gemini 2.5 Pro Deep Research GA: agenti di ricerca multi-ora

Gemini 2.5 Pro con Deep Research in disponibilità generale: agenti che navigano il web per ore, leggono PDF e sintetizzano report. Contesto 2M token. Pensato per analisi competitive enterprise.

Agenti

15 maggio 2025 Medio

ADAS: un meta-agente che inventa nuove architetture per agenti AI

L'Universita' della British Columbia pubblica ADAS (Automated Design of Agentic Systems): un meta-agente che cerca nuove architetture agente scrivendo e valutando codice Python. Scopre pattern originali (critic dinamico, step-back abstraction) che superano agenti disegnati da umani. Primo sistema che automatizza la ricerca sull'architettura degli agenti.

Agenti ADASmeta-agentautomated design

22 aprile 2025 Alto

Google A2A Protocol: standard aperto per la comunicazione tra agenti AI eterogenei

Google annuncia A2A (Agent-to-Agent) Protocol con 50+ partner, standard aperto per comunicazione tra agenti AI di vendor diversi, complementare a MCP per l'interoperabilità nell'ecosistema agente.

Agenti A2AAgent ProtocolInteroperability

16 aprile 2025 Alto

Google ADK + A2A: framework open source e protocollo per agenti che si parlano

Google lancia ADK (Agent Development Kit) open source per costruire agenti Gemini e il protocollo A2A per la comunicazione standardizzata tra agenti di vendor diversi.

Agenti GoogleADKA2A Protocol

15 marzo 2025 Medio

Multi-Agent Debate: far discutere piu' LLM migliora il ragionamento del +20%

Ricercatori MIT e Google dimostrano che far dibattere e criticare piu' istanze LLM le stesse risposte per N round porta a risposte piu' accurate: +20% su benchmark aritmetici e di ragionamento vs singolo agente. Fonda il pattern di verifica basata sul dibattito negli agenti moderni.

Agenti multi-agent debatereasoningself-consistency

6 marzo 2025 Alto

Manus: l'agente cinese 'general-purpose' che fa il task end-to-end

Butterfly Effect lancia Manus, agente AI cinese ad accesso invito che esegue task autonomi (analisi azionarie, ricerca, screening CV) producendo report con file. Hype paragonabile a Devin 2024, accesso a invito.

Agenti ManusChinaGeneral Agent

10 febbraio 2025 Alto

OpenAI Deep Research: l'agente che fa ricerche approfondite per decine di minuti

OpenAI lancia Deep Research, agente autonomo basato su o3 che naviga il web per 10-30 minuti, esegue centinaia di ricerche e produce report con citazioni verificate.

Agenti OpenAIDeep Researcho3

7 febbraio 2025 Alto

Google Agent Development Kit: SDK open source per agenti Gemini gerarchici

Google lancia ADK, SDK open source per costruire agenti multi-livello gerarchici su Gemini con tool calling strutturato, state machine native e orchestrazione multi-agent nativa.

Agenti Google ADKMulti-AgentGemini

24 gennaio 2025 Medio

UFO: il primo agente robusto per automatizzare applicazioni Windows desktop

Microsoft Research pubblica UFO (UI-Focused Agent), un agente che osserva lo schermo Windows (app attiva + screenshot + albero controlli), pianifica azioni e le esegue tramite Windows UI Automation e Win32 API. Primo sistema Windows-native con supporto workflow multi-applicazione affidabile.

Agenti UFOWindows agentUI Automation

23 gennaio 2025 Alto

OpenAI Operator: l'agente browser-based va in produzione

OpenAI lancia Operator (research preview): un agente AI che esegue task nel browser per conto dell'utente. Visita siti, compila form, prenota servizi. Disponibile per gli abbonati ChatGPT Pro USA.

Agenti OpenAIOperatorCUA

15 gennaio 2025 Alto

Browser Use: il layer open source che rende gli LLM davvero controllori del browser

Browser Use e' una libreria Python open source che permette a GPT-4, Claude e Gemini di controllare un browser Chromium via Playwright in modo affidabile. 30k stelle GitHub nel primo mese. Primo layer di controllo browser veramente usabile senza estensioni custom. Abilita web agent tasks affidabili su qualsiasi sito.

Agenti Browser Usebrowser automationPlaywright

15 gennaio 2025 Medio

Smolagents di Hugging Face: agenti che scrivono codice invece di JSON

Hugging Face rilascia smolagents, libreria minimale per agenti LLM in ~1000 righe. Promuove il paradigma 'code agents': l'agente scrive snippet Python invece di chiamate tool JSON.

Agenti Hugging FaceSmolagentsCode Agents

11 dicembre 2024 Pietra miliare

Gemini 2.0 Flash: Google apre 'l'era agentica' e mostra Astra/Mariner/Jules

Google rilascia Gemini 2.0 Flash (multimodale nativo, tool use, output immagine/audio) e presenta Project Astra (assistente video real-time), Mariner (browser agent), Jules (coding agent).

Agenti GoogleGemini 2.0Flash

31 ottobre 2024 Alto

Magentic-One: il sistema multi-agente generalista di Microsoft supera GAIA

Microsoft Research pubblica Magentic-One: un sistema con Orchestrator + 4 agenti specializzati (WebSurfer, FileSurfer, Coder, ComputerTerminal). Prima posizione su GAIA benchmark. Insight chiave: agenti stateless specializzati + orchestratore stateful superano un agente monolitico. Open source MIT.

Agenti Magentic-Onemulti-agentMicrosoft Research

22 ottobre 2024 Alto ★ Sul mio lavoro

Computer Use: Claude impara a usare il mouse e la tastiera

Anthropic abilita 'Computer Use' su Claude 3.5 Sonnet: l'agente guarda screenshot del desktop, sposta il cursore, clicca, digita. Per la prima volta un LLM commerciale opera direttamente sull'interfaccia grafica.

Agenti AnthropicClaudeComputer Use

14 ottobre 2024 Alto

n8n AI Agent nodes: automazione no-code mainstream incontra i loop agentici

n8n aggiunge nodi AI Agent nativi al suo workflow builder, permettendo di connettere loop agentici LLM a 400+ app aziendali senza codice, segnando l'arrivo degli agenti nell'automazione mainstream.

Agenti n8nNo-CodeAutomation

11 ottobre 2024 Medio

OpenAI Swarm: framework educational per multi-agent con handoff

OpenAI pubblica Swarm su GitHub, framework Python minimalista per orchestrare più agenti con handoff e routine, esplicitamente positioned come 'educational' precursor di un futuro Agents SDK.

Agenti OpenAISwarmAgents

5 agosto 2024 Medio

Flowise v2: agenti visivi con tool use parallelo e memory types configurabili

Flowise v2 introduce sequential e parallel tool use negli agenti, tipi di memoria multipli (buffer, summary, vector), agent loops configurabili visivamente e supporto a LlamaIndex.

Agenti FlowiseVisual BuilderNo-Code

15 luglio 2024 Medio

Dify 0.7: workflow agentici visivi con RAG integrato e 10+ LLM

Dify 0.7 porta un visual builder no-code/low-code per workflow agentici complessi, RAG integrato con parsing documenti, supporto a 10+ provider LLM e deployment self-hostable su Docker.

Agenti DifyNo-CodeWorkflow

10 luglio 2024 Medio

Agentless: meno complessita' agente, piu' risultati su SWE-bench

UIUC pubblica Agentless: un pipeline a due fasi (localizza il fault, genera la repair) senza loop agentici complessi. Supera AutoCodeRover e SWE-agent su SWE-bench. Primo sistema open in cima alla classifica SWE-bench al momento della pubblicazione. Sfida l'assunzione che piu' complessita' agente significhi piu' performance.

Agenti AgentlessSWE-benchcode repair

25 giugno 2024 Medio

Agno (ex Phidata): framework agente leggero, multimodale e 10x più veloce

Agno, rinominato da Phidata, è un framework agente Python model-agnostic con memory, storage, tool e knowledge base modulari, native multimodal support e performance 10x superiori a LangChain.

Agenti AgnoPhidataLightweight

2 aprile 2024 Alto

SWE-agent: un agente AI che risolve issue GitHub reali al 12.5%

Princeton presenta SWE-agent, agente con interfaccia ACI dedicata che risolve issue reali di GitHub su SWE-bench al 12.5% — da 6x a 12x meglio dei sistemi precedenti.

Agenti PrincetonSWE-agentSWE-bench

12 marzo 2024 Alto

Devin: il primo 'ingegnere AI autonomo' fa il giro del mondo

Cognition Labs presenta Devin, agente AI che pianifica, scrive codice, debugga ed esegue task SWE end-to-end. Demo virale, SWE-bench 13.86%. Definisce la categoria 'AI software engineer'.

Agenti CognitionDevinAutonomous Agent

7 marzo 2024 Medio

Microsoft TaskWeaver: ogni task si trasforma in codice Python eseguibile

TaskWeaver di Microsoft è un agent framework code-first che converte ogni richiesta in codice Python eseguibile in sandbox, con stato persistente tra step e plugin system strutturato.

Agenti TaskWeaverMicrosoftCode-First

21 febbraio 2024 Medio

Devika: la prima alternativa open source a Devin esplode su GitHub

Mufeed VH pubblica Devika, un agente AI software engineer open source: accetta obiettivi di programmazione ad alto livello, li decompone, cerca sul web, scrive codice ed esegue test. Prima vera alternativa open a Devin. 15k stelle GitHub in 72 ore.

Agenti Devikaopen sourcesoftware engineer agent

17 gennaio 2024 Alto

CrewAI: team di agenti AI con ruoli, goal e backstory come un ufficio

CrewAI lancia un framework Python per orchestrare squadre di agenti LLM con ruoli definiti, obiettivi individuali e backstory, supportando processi sia sequenziali sia paralleli.

Agenti CrewAIMulti-AgentRoles

19 ottobre 2023 Alto

LangGraph: agenti stateful come grafi ciclici con loop e branching

LangChain lancia LangGraph, framework per costruire agenti come grafi di nodi con stato persistente, supporto a cicli, branching condizionale ed esecuzione parallela di workflow complessi.

Agenti LangGraphLangChainStateful Agents

16 ottobre 2023 Medio

OpenAgents: agenti reali per non programmatori via interfaccia web

XLab (SUTD Singapore) pubblica OpenAgents: una piattaforma deployabile con tre agenti specializzati (navigazione web, analisi dati, esecuzione codice) accessibili da browser senza API key. Prima dimostrazione di capacita' agentiche reali per utenti comuni, con codice open source completo.

Agenti OpenAgentsweb browsingdata analysis

6 ottobre 2023 Medio

AgentBench: la prima benchmark che misura gli LLM come agenti reali

Tsinghua presenta AgentBench, prima benchmark completa per agenti LLM su 8 ambienti operativi. Rivela un gap enorme tra GPT-4 e i migliori modelli open-source.

Agenti TsinghuaAgentBenchBenchmark

25 agosto 2023 Medio

SuperAGI: la prima piattaforma open source per agenti con interfaccia grafica

SuperAGI offre una piattaforma open source per agenti autonomi con dashboard web, marketplace di tool e la possibilita' di avviare agenti in background senza scrivere codice. Prima soluzione a portare l'esperienza 'monitor agent' a utenti non programmatori. Concorrente di AutoGPT ma orientata alla produzione.

Agenti SuperAGIautonomous agentopen source

15 luglio 2023 Alto

AutoGen: Microsoft formalizza la comunicazione agente-agente

Microsoft Research pubblica AutoGen, un framework dove si definiscono agenti con ruoli diversi e li si lascia conversare tra loro per risolvere un task. Primo framework a formalizzare il pattern 'agent-to-agent communication'. Diventa fondamento di molti workflow enterprise multi-agente.

Agenti AutoGenmulti-agentMicrosoft Research

9 luglio 2023 Alto

Reflexion: agenti che imparano dagli errori senza gradient updates

MIT e Northeastern propongono Reflexion: agenti che fanno self-reflection in linguaggio naturale dopo ogni fallimento, accumulando insight in memoria episodica senza modificare i pesi.

Agenti MITNortheasternReflexion

8 luglio 2023 Alto

MetaGPT: agenti con ruoli aziendali che scrivono software insieme

MetaGPT assegna a ogni agente LLM un ruolo aziendale specifico (PM, Architect, Engineer, QA) e li fa collaborare producendo codice funzionante da un singolo requisito testuale.

Agenti MetaGPTMulti-AgentSoftware Engineering

25 giugno 2023 Medio

GPT-Engineer: genera un intero progetto software da una sola frase

Anton Osika pubblica GPT-Engineer su GitHub: descrivi il software che vuoi in linguaggio naturale, l'agente fa domande di chiarimento, poi scrive tutti i file e li esegue. 50k stelle in una settimana. Prima implementazione virale del concetto 'one-shot project generator'.

Agenti GPT-Engineercode generationproject scaffolding

5 giugno 2023 Medio

Gorilla: LLaMA fine-tuned che chiama le API senza sbagliare

UC Berkeley presenta Gorilla, LLaMA fine-tuned con retrieval per chiamate API accurate: riduce l'hallucination sulle API dall'83% al 3%, superando GPT-4 su questo task.

Agenti UC BerkeleyGorillaLLaMA

30 maggio 2023 Alto

Tree of Thoughts: l'LLM che ragiona esplorando rami alternativi

Princeton e DeepMind propongono Tree of Thoughts: l'LLM genera e valuta molteplici percorsi di ragionamento come un albero di ricerca, superando nettamente il Chain-of-Thought.

Agenti PrincetonDeepMindTree of Thoughts

17 maggio 2023 Alto

Voyager: l'agente AI che impara Minecraft per sempre, senza reset

NVIDIA crea Voyager, agente lifelong-learning in Minecraft che usa GPT-4 per scrivere skill in JavaScript e accumularle in una libreria persistente, senza mai dimenticare.

Agenti NVIDIAVoyagerLifelong Learning

7 aprile 2023 Alto

Generative Agents: 25 agenti AI simulano una società in Smallville

Stanford crea 25 agenti LLM che simulano vita quotidiana in un villaggio virtuale, con memoria episodica, riflessione e planning. Prima società artificiale credibile.

Agenti StanfordGenerative AgentsSmallville

3 aprile 2023 Alto

BabyAGI: 200 righe di Python che scatenano il dibattito sugli agenti autonomi

Yohei Nakajima pubblica BabyAGI, task manager autonomo in ~200 righe Python con GPT-4 e Pinecone che crea ed esegue subtask in loop infinito, virale su Twitter in 24 ore.

Agenti BabyAGIAutonomous AgentTask Management

30 marzo 2023 Alto

AutoGPT: il primo agente AI virale

Un developer pubblica su GitHub AutoGPT: dato un obiettivo testuale, il sistema chiama GPT-4 in loop per pianificare task, eseguirli e auto-criticarsi. In due settimane diventa la repo più stellata della storia.

Agenti AutoGPTAgentsOpen Source

23 marzo 2023 Medio

ChatGPT Plugins: l'LLM diventa interfaccia verso il web

OpenAI lancia i plugin per ChatGPT: il modello può navigare il web, eseguire codice Python in sandbox, prenotare voli (Expedia, Kayak), fare la spesa (Instacart). Primo grande esperimento di tool use mainstream.

Agenti OpenAIChatGPTPlugins

22 marzo 2023 Medio

HuggingGPT: ChatGPT come cervello che orchestra 800 modelli AI

Microsoft Research usa ChatGPT come planner centrale che decompone task complessi e delega l'esecuzione a modelli HuggingFace specializzati per visione, audio e NLP.

Agenti Microsoft ResearchHuggingGPTJARVIS

17 marzo 2023 Medio

Microsoft Semantic Kernel: l'SDK enterprise per orchestrare LLM

Microsoft apre al pubblico Semantic Kernel, un SDK open source in C#, Python e Java per integrare LLM in applicazioni aziendali. Introduce 'skills' (funzioni AI riusabili) e 'planner' (catene automatiche verso un obiettivo). Diventa il layer standard di orchestrazione AI per i Copilot Microsoft.

Agenti Semantic KernelMicrosoftSDK

10 marzo 2023 Medio

CAMEL: due agenti LLM che cooperano per risolvere task complessi

KAUST presenta CAMEL, framework role-playing dove un LLM 'AI user' e un LLM 'AI assistant' collaborano autonomamente su task senza intervento umano a ogni step.

Agenti KAUSTCAMELMulti-Agent

9 febbraio 2023 Alto

Toolformer: l'LLM che impara da solo a usare i tool

Meta AI presenta Toolformer: un LLM che apprende autonomamente quando e come chiamare tool esterni (calcolatrice, Wikipedia, calendario) usando pochi esempi self-supervised.

Agenti Meta AIToolformerTool Use

25 ottobre 2022 Pietra miliare

LangChain: nasce il framework per applicazioni LLM

Harrison Chase rilascia LangChain, libreria Python open source per concatenare LLM con prompt template, memoria, tool e fonti dati esterne. Diventerà la stack di default delle prime app LLM.

Agenti LangChainFrameworkLLM Apps

6 ottobre 2022 Pietra miliare

ReAct: il framework che unisce ragionamento e azioni negli LLM

Il paper di Yao et al. introduce ReAct, schema che alterna pensieri espliciti (Thought) e azioni concrete (Act) nell'LLM, fondamento teorico di tutti gli agenti moderni.

Agenti ReActReasoningTool Use

16 dicembre 2021 Alto

WebGPT: OpenAI insegna a GPT-3 a navigare il web

OpenAI pubblica WebGPT, fine-tuning di GPT-3 che impara a usare un browser testuale per cercare risposte sul web, con citazioni delle fonti, addestrato via imitation learning + RLHF.

Agenti OpenAIWebGPTBrowsing