o1: il primo modello che 'pensa prima di rispondere'

In una frase OpenAI rilascia o1-preview e o1-mini: modelli addestrati con RL su catene di ragionamento. Su matematica, fisica, coding competitivo battono GPT-4o di un margine enorme. Salto di paradigma.

Verificato Fonte ufficiale

CondividiLinkedIn X

OpenAI presenta o1: un modello diverso dagli altri. Invece di rispondere subito, "pensa" in silenzio per secondi o minuti prima di scrivere la risposta. Sul tuo schermo vedi un'indicatore "Thinking..." che dura quanto serve.

Risultati: 83% all'esame di qualificazione olimpiadi di matematica (USAMO; GPT-4o faceva 13%). Su PhD-level science, livello "esperto umano". Sui problemi di coding competitivo (Codeforces) sale al 89° percentile.

Cambia un paradigma: non solo più dati e più parametri in training, ma più calcolo durante l'inferenza. È l'inizio dell'era "reasoning models".