Agentless: meno complessita' agente, piu' risultati su SWE-bench

In una frase UIUC pubblica Agentless: un pipeline a due fasi (localizza il fault, genera la repair) senza loop agentici complessi. Supera AutoCodeRover e SWE-agent su SWE-bench. Primo sistema open in cima alla classifica SWE-bench al momento della pubblicazione. Sfida l'assunzione che piu' complessita' agente significhi piu' performance.

Da rivedere Fonte autorevole

CondividiLinkedIn X

Nel 2024 tutti stanno costruendo agenti sempre piu' complessi per risolvere bug del software: loop di ragionamento, strumenti multipli, auto-critica, pianificazione ricorsiva. Agentless fa l'opposto e funziona meglio.

L'idea e' semplice: dato un bug report (una GitHub issue), prima localizza dove si trova il problema nel codice (quali file, quali funzioni), poi genera la patch per risolverlo. Due fasi, zero loop autonomi, nessun agente che si auto-modifica.

Il risultato: batte sistemi molto piu' complicati su SWE-bench, il benchmark standard per agenti che risolvono bug su repository Python reali. Al momento della pubblicazione e' in cima alla classifica open source.

La lezione e' importante: la complessita' agentiche puo' essere un problema, non una soluzione. Un pipeline ben progettato con fasi chiare puo' superare un agente che "pensa liberamente". Questo trovato influenzera' come si progettano i sistemi successivi.