Computer Use: Claude impara a usare il mouse e la tastiera
In una frase Anthropic abilita 'Computer Use' su Claude 3.5 Sonnet: l'agente guarda screenshot del desktop, sposta il cursore, clicca, digita. Per la prima volta un LLM commerciale opera direttamente sull'interfaccia grafica.
Anthropic mette in beta una funzione nuova: Claude può "vedere" lo schermo (screenshot) e usarlo come un umano. Si sposta col mouse, clicca su pulsanti, digita testo, fa screenshot, ripete.
L'idea: invece di costruire API custom per ogni servizio, l'AI usa direttamente le interfacce grafiche pensate per umani. Compili un form Excel, fai una ricerca su un sito, riempi una richiesta legacy senza API → tutto come se ci fosse una persona dietro.
È lenta, sbaglia, ha problemi di sicurezza ovvi (può cliccare ovunque). Ma è il primo passo serio verso agenti che operano nel mondo del software esistente, non solo in un sandbox.
Aziende
Anthropic
Tool
Claude 3.5 Sonnet (new)
Tag
Fonti