Gemini 3.1 Pro: il primo "0.1" di Google e il salto su ARC-AGI-2

In una frase Google rilascia Gemini 3.1 Pro: 77.1% su ARC-AGI-2 (più del doppio di Gemini 3 Pro), 80.6% SWE-Bench Verified, 94.3% GPQA Diamond. Stesso prezzo di 3 Pro: $2/M input.

Verificato Fonte ufficiale

CondividiLinkedIn X

Gemini 3 Pro era già uscito a gennaio 2026. Solo cinque settimane dopo Google rilascia un incremento "puntato" — il primo "0.1" della storia dei Gemini — e fa un salto notevole su un benchmark specifico: ARC-AGI-2.

ARC-AGI-2 è un test in cui ti danno pattern logici che il modello non ha mai visto durante il training (sono generati apposta). Misura se il modello sta davvero ragionando o se sta solo riconoscendo cose già viste. Gemini 3 Pro era al 31.1%, Gemini 3.1 Pro va al 77.1%: più del doppio.

Tradotto: per task che richiedono di "capire una regola nuova" — debugging strano, problemi di matematica non standard, design system mai visti — 3.1 Pro funziona molto meglio. Su SWE-Bench Verified (coding) fa 80.6%, su GPQA Diamond (scienze livello PhD) 94.3%. Prezzo invariato a $2 per milione di token in input.