WebGPT: OpenAI insegna a GPT-3 a navigare il web
In una frase OpenAI pubblica WebGPT, fine-tuning di GPT-3 che impara a usare un browser testuale per cercare risposte sul web, con citazioni delle fonti, addestrato via imitation learning + RLHF.
OpenAI fa qualcosa di nuovo: prende GPT-3 e gli insegna a usare un browser. Non un browser grafico, ma una versione testuale: clicca un link, scorri, cerca su Google, copia un brano nelle citazioni.
Il modello, chiamato WebGPT, viene addestrato guardando umani che fanno la stessa cosa, e poi premiato quando le risposte sono di qualità (RLHF).
È il primo serio prototipo di assistente che cerca online prima di rispondere, con citazioni delle fonti. Il pattern oggi è ovunque: Bing Chat, Perplexity, ChatGPT con browsing, Gemini con grounding, Claude con web search. Tutti discendono da qui.
Aziende
OpenAI
Tool
WebGPT
Tag
Fonti