Gopher 280B: DeepMind entra ufficialmente nella corsa ai LLM
In una frase DeepMind pubblica Gopher, modello dense da 280B parametri, accompagnato da uno studio sistematico su 152 task e da un paper sulle considerazioni etiche dei foundation models.
DeepMind, che fino a quel momento si era concentrata su AlphaGo, AlphaFold e reinforcement learning, entra nel campo dei grandi modelli linguistici con Gopher, da 280 miliardi di parametri.
Non è solo l'annuncio del modello: è anche uno studio scientifico sui 152 task dove Gopher viene confrontato con GPT-3 e altri. Mostra dove la scala aiuta (lettura, conoscenza) e dove non aiuta (logica, matematica) — un'osservazione che sarà centrale per gli anni successivi.
DeepMind pubblica anche un paper parallelo dedicato a rischi etici, segnale di una postura più cauta rispetto a OpenAI.
Aziende
DeepMind
Tool
Gopher
Tag
Fonti