Aidan Gomez — Co-Autore di Attention is All You Need che ha Fondato Cohere

Chi è: Aidan Gomez è CEO e co-fondatore di Cohere, un laboratorio AI canadese focalizzato sui modelli linguistici per uso enterprise. A 20 anni è stato il più giovane co-autore di "Attention is All You Need", il paper del 2017 che ha introdotto l'architettura Transformer da cui derivano GPT, Claude, Gemini e praticamente tutti i grandi modelli linguistici moderni. Nel 2019 ha lasciato Google Brain e co-fondato Cohere insieme a Ivan Zhang e Nick Frosst, scegliendo un posizionamento deliberatamente diverso da OpenAI: niente prodotto consumer, niente narrazione di AGI, focus su API e applicazioni B2B.

Attention is All You Need a vent'anni

Nel 2017 Aidan Gomez era stagista a Google Brain quando si è unito al team che lavorava su un nuovo tipo di architettura per la traduzione automatica. Il team era guidato da Ashish Vaswani e includeva Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Łukasz Kaiser e Illia Polosukhin. Il risultato è stato "Attention is All You Need", pubblicato a NeurIPS 2017, che ha introdotto il Transformer.

L'architettura Transformer ha sostituito le ricorrenze (RNN, LSTM) con un meccanismo di self-attention che permette di parallelizzare il training e di catturare dipendenze a lungo raggio in modo molto più efficace. È il singolo paper che ha reso possibili i large language model: senza Transformer non ci sarebbe GPT, non ci sarebbe ChatGPT, non ci sarebbe il boom AI 2022-2024. Tutti gli otto co-autori sono diventati figure importanti dell'industria AI. Gomez, il più giovane, aveva 20 anni.

Il salto da Google a Cohere

Dopo "Attention is All You Need", Gomez è rimasto a Google e ha proseguito gli studi a Oxford come dottorando con il supervisore Yarin Gal. Nel 2019, mentre l'industria cominciava a intuire il potenziale commerciale dei language model, ha lasciato Google e co-fondato Cohere insieme a due collaboratori: Ivan Zhang (anche lui canadese, ex University of Toronto) e Nick Frosst, ricercatore del laboratorio di Geoffrey Hinton — il "padrino" del deep learning, anch'egli a Toronto.

La scelta di Toronto come sede non è secondaria. L'università di Toronto è stata uno degli epicentri della rivoluzione deep learning grazie a Hinton, e ha mantenuto una scuola tecnica forte indipendente dalla Bay Area. Cohere ha ereditato questa cultura: più ingegneristica, meno ideologica, meno legata alle narrazioni di AGI imminente.

Boring tech for enterprise

La strategia di Cohere è stata fin dall'inizio diversa da OpenAI. Niente chatbot consumer, niente app virali. L'azienda offre API per developer e soluzioni enterprise per grandi aziende: ricerca documentale interna, sistemi di customer support, classificazione automatica, retrieval-augmented generation per knowledge management aziendale.

Gomez ha articolato pubblicamente questa filosofia in numerose interviste: "Non vogliamo costruire AGI. Vogliamo costruire strumenti utili per le aziende, che funzionino in modo affidabile, che siano economicamente sostenibili." Il framing è esplicito: la sua è "boring tech" — tecnologia poco appariscente ma che fa il lavoro. Non parla mai di superintelligenza, non promette trasformazioni civilizzazionali, non firma open letter sull'AI doom.

Questo posizionamento ha trovato un mercato. Cohere lavora con istituzioni finanziarie (RBC, Fujitsu), telecomunicazioni, settore pubblico canadese, oltre a startup che integrano i suoi modelli via API. Nel 2024 ha chiuso una Series D da 500 milioni di dollari a una valutazione di 5,5 miliardi, con investitori tra cui Nvidia, Cisco, Salesforce e governo del Canada.

Multilingual come strategia centrale

Uno degli aspetti distintivi di Cohere è il focus sul multilinguismo. Mentre OpenAI e Anthropic sono nati con un focus dominante sull'inglese, Cohere ha investito presto in modelli che funzionano bene su decine di lingue, incluse quelle "low-resource" sotto-rappresentate nei dataset standard.

Il Cohere for AI — il laboratorio di ricerca interno guidato da Sara Hooker — ha lanciato il progetto Aya, un'iniziativa open-source per costruire dataset di istruzioni in 101 lingue. Aya 23 e Aya Expanse, rilasciati nel 2024, sono modelli che coprono lingue spesso trascurate dagli altri laboratori: lingue africane, dell'Asia sud-orientale, dell'Asia centrale. È una mossa che combina strategia tecnica (avere copertura linguistica più ampia dei concorrenti) e posizionamento etico (l'AI non deve essere solo per anglofoni).

Per i clienti enterprise, soprattutto in mercati come Europa, India e Sud-est asiatico, questo conta. Una banca in Indonesia o una multinazionale che opera in più paesi ha bisogno di un modello che funzioni decentemente sulla lingua dei suoi clienti, non solo in inglese.

Il rapporto con Geoffrey Hinton

Nick Frosst, co-fondatore di Cohere, viene direttamente dal laboratorio di Geoffrey Hinton. Questo collega Cohere alla tradizione di Toronto del deep learning. Quando Hinton ha lasciato Google nel 2023 per parlare pubblicamente dei rischi dell'AI, ha mantenuto un rapporto stretto con i suoi ex studenti.

Gomez ha posizioni distinte da Hinton sui rischi esistenziali — è meno preoccupato dall'AGI a breve termine — ma ha sempre espresso rispetto per il rigore tecnico del mentore. Cohere ha mantenuto un equilibrio interessante: né scetticismo totale verso i rischi né l'allarmismo apocalittico. Sviluppano AI utile, prendono sul serio le questioni di safety in deployment (jailbreak, hallucination, sicurezza dei dati enterprise), ma non parlano di estinzione umana.

Cohere for AI e la ricerca aperta

A differenza di OpenAI e Anthropic, Cohere mantiene un laboratorio di ricerca pubblico — Cohere for AI (C4AI) — che pubblica regolarmente paper, organizza eventi accademici e supporta ricercatori esterni con grant. Sara Hooker, la direttrice del lab, è una voce rispettata sulla ricerca multilingue e sull'efficienza computazionale dei modelli.

C4AI ha rilasciato modelli open-weight come Command R e Command R+, accompagnati da pubblicazioni dettagliate. Non è "open source" nel senso pieno (i dati di training non sono pubblici), ma è significativamente più aperto di OpenAI, Anthropic, Google. Per la comunità di ricerca rappresenta uno degli ultimi grandi laboratori commerciali che pubblica ancora seriamente.

Perché Cohere conta nell'ecosistema

Aidan Gomez e Cohere rappresentano una terza via nell'industria AI 2024-2026. Da una parte le big tech consumer (OpenAI, Google, Anthropic) che competono sui modelli più capaci possibili. Dall'altra l'open source di Meta, Mistral, DeepSeek. In mezzo, Cohere occupa una nicchia: focused on enterprise, multilingual, transparent enough about research, but business-oriented enough to make money.

Per gli osservatori dell'industria, il successo di Cohere è una prova che esiste un mercato per AI "noiosa ma utile" che non richiede la narrativa AGI per essere commercialmente sostenibile. Per gli sviluppatori e le aziende che vogliono integrare LLM senza diventare dipendenti dell'ecosistema OpenAI, Cohere è una delle alternative più mature. E per chi vuole capire cosa significa fare AI in modo serio fuori dalla Silicon Valley, Aidan Gomez è uno degli interlocutori più articolati.

Link alla fonte originale

cohere.com →

Sito ufficiale Cohere con API docs, blog, e Cohere for AI lab. Pubblicazioni accademiche su cohere.com/research. EN.