Salta al contenuto
AImpact
IT EN

Articolo · Economia & Società

AI21 Labs — Da Wordtune a Jamba, il Pivot di una Pioniera Israeliana

Fonte originale: AI21 Labs — Sito ufficiale e blog tecnico — sintesi e rielaborazione in parole proprie.

CondividiLinkedInX

Cos'è: AI21 Labs è uno dei pochi laboratori non statunitensi che ha provato a competere come foundation model company contro OpenAI, Anthropic e Google. Fondata a Tel Aviv nel 2017 dal professore di Stanford Yoav Shoham, dal serial entrepreneur Ori Goshen e dall'imprenditore Amnon Shashua, ha attraversato due ere distinte: quella dei modelli Jurassic e del prodotto consumer Wordtune, e quella attuale incentrata sulla famiglia Jamba — il primo modello ibrido SSM-Transformer in produzione su scala. Il caso AI21 è un osservatorio interessante su come una startup foundation model possa sopravvivere fuori dalla Silicon Valley.

Le origini: Stanford, Tel Aviv e il bet pre-GPT

AI21 Labs nasce nel 2017 — un anno prima del rilascio del primo GPT di OpenAI — dall'incontro di tre figure rilevanti dell'ecosistema israeliano. Yoav Shoham è professore emerito di computer science a Stanford, autore di testi fondativi nell'AI simbolica e nella teoria dei giochi computazionale, ex senior researcher Google. Ori Goshen è un serial entrepreneur con tre exit precedenti nel settore telco e cloud. Amnon Shashua è il fondatore di Mobileye (venduta a Intel per quindici miliardi nel 2017) e ha investito personalmente come terzo co-founder finanziatore. La tesi iniziale era che la prossima generazione di sistemi NLP avrebbe richiesto un mix di apprendimento neurale e ragionamento simbolico — una posizione minoritaria che il team ha poi raffinato man mano che i modelli Transformer puramente neurali si dimostravano dominanti.

I primi prodotti di AI21 sono stati i modelli Jurassic-1 (agosto 2021) e Jurassic-2 (marzo 2023). Jurassic-1 Jumbo, con 178 miliardi di parametri, era al momento del rilascio il più grande LLM pubblicamente accessibile via API al mondo, leggermente più grande del GPT-3 di OpenAI. I modelli erano pensati per use case enterprise: text generation, classification, paraphrasing, summarization. Il go-to-market era duplice: API a pagamento per developer e una linea consumer chiamata Wordtune.

Wordtune è stato per anni il prodotto più visibile di AI21. Lanciato nel 2020 come Chrome extension e applicazione web, permette di riscrivere frasi con tono diverso (formal, casual, shorter, longer) e di parafrasare interi paragrafi. Negli anni 2021-2022 ha raggiunto diversi milioni di utenti attivi e si è imposto come uno dei principali tool di writing AI consumer-facing, competendo con Grammarly. È stato il motore di crescita del brand AI21 — molti ricercatori e professionisti hanno conosciuto l'azienda attraverso Wordtune prima che attraverso i modelli Jurassic.

Serie C di $208M, valutazione $1,4B e il pivot enterprise

Nel novembre 2023 AI21 Labs ha chiuso una Serie C da 208 milioni di dollari a valutazione 1,4 miliardi, lead investor un consorzio che include Walden Catalyst, Pitango, SCB10X, b2venture, Samsung Next, oltre alla partecipazione strategica di NVIDIA, Google e Intel. Il round porta il funding totale a oltre 336 milioni cumulativi dalla fondazione. Per un'azienda foundation model che opera fuori dalla Silicon Valley, è una raccolta di capitali significativa — paragonabile per dimensioni a quella di Mistral AI in Francia.

La narrativa attorno al round è stata il pivot esplicito da consumer (Wordtune) a enterprise platform. L'analisi interna di AI21 nel 2023 ha riconosciuto che Wordtune, pur essendo redditizio in termini unitari, si trovava in un mercato consumer dove ChatGPT, Claude e i tool di writing nativi di Microsoft e Google stavano comprimendo il valore percepito. Il management ha deciso di mantenere Wordtune come prodotto in maintenance e di spostare il grosso degli investimenti su una nuova generazione di modelli pensati per use case enterprise: contratti, documenti legali, customer support, knowledge management interno.

Il prodotto enterprise principale è l'AI21 Studio, una piattaforma che permette di costruire workflow document-grounded con i modelli proprietari, integrando RAG (retrieval augmented generation), function calling e guardrail di compliance. Il pricing è da contratto enterprise, con tariffazione mista tra licensing fee fissi e pay-per-token. I clienti annunciati pubblicamente includono Clarivate, Wiley e diverse banche europee — il segmento finance e legal è il principale focus go-to-market.

Jamba: il primo modello SSM-Transformer ibrido in produzione

Il marzo 2024 AI21 ha annunciato Jamba, il primo modello al mondo che combina architettura Transformer con strati Mamba (State Space Model) in una configurazione ibrida pensata per produzione su scala. Mamba è un'architettura proposta in un paper di Albert Gu e Tri Dao alla fine del 2023, che promette di superare i Transformer su sequenze lunghe grazie a un meccanismo di state space che evita il costo quadratico dell'attention. La proposta era stata salutata come potenzialmente rivoluzionaria ma rimaneva confinata a esperimenti accademici.

Jamba è stato il primo modello in cui un'azienda ha messo Mamba in produzione su scala commerciale. La versione pubblica iniziale aveva 52 miliardi di parametri totali (di cui 12 miliardi attivi grazie a una componente Mixture of Experts), una context window di 256.000 token e una performance per token significativamente più efficiente di un Transformer puro di pari dimensione — circa tre volte il throughput su sequenze lunghe. Il modello è stato rilasciato sotto licenza Apache 2.0, una mossa di marketing developer-friendly che ha generato molta attenzione nella community open-source.

Le versioni successive — Jamba 1.5 Mini (agosto 2024, 12 miliardi attivi) e Jamba 1.5 Large (94 miliardi attivi) — hanno consolidato la traiettoria. Le performance sui benchmark non sono al livello dei modelli frontier di OpenAI, Anthropic o Google, ma su use case dove il contesto lungo conta (analisi di interi codici sorgente, documenti legali multi-centinaio di pagine, knowledge base interne molto grandi) Jamba offre un rapporto qualità/costo notevolmente migliore. Per AI21 è la differenziazione tecnica più solida da quando esiste: non competere sul modello generale più grande, ma sul modello più efficiente per long-context enterprise.

Sopravvivere tra i giganti: lezioni per le foundation model non-USA

Il caso AI21 Labs offre alcune lezioni interessanti sulla sopravvivenza di una startup foundation model non statunitense. La prima è la scelta del segmento di mercato: AI21 non prova più a competere sul modello generale più potente per il consumer mass-market, una battaglia che ha riconosciuto persa contro OpenAI e Anthropic. Si è concentrata su enterprise long-context, dove la richiesta è tecnicamente specifica e le aziende sono disposte a pagare premium per garanzie di compliance e residenza dei dati.

La seconda lezione è la differenziazione architetturale. Quando si compete con laboratori che hanno budget di addestramento dieci volte superiori, l'unica via per restare rilevanti è scommettere su architetture diverse. La scelta di Mamba/SSM è stata audace e ha pagato in termini di visibilità tecnica e di acquisizione clienti che hanno needs di long context impossibili da soddisfare con i Transformer standard. È una strategia di nicchia tecnica che molti altri laboratori potrebbero imitare.

La terza lezione è la capacità di pivotare ripetutamente. AI21 è passata da modelli proprietari closed (Jurassic) a un prodotto consumer di successo (Wordtune) e poi a un focus enterprise long-context (Jamba) nel giro di sette anni, mantenendo intatta la coesione del team fondatore e l'investimento dei capital provider. Per le foundation model europee e israeliane che oggi cercano di sopravvivere in un mercato dominato dagli Stati Uniti — Mistral, Aleph Alpha, Cohere, Reka — la traiettoria di AI21 è un caso di studio rilevante. Non garantisce vittoria, ma dimostra che esistono percorsi praticabili tra l'irrilevanza e la corsa frontale ai giganti.


Link alla fonte originale

ai21.com →

Sito ufficiale di AI21 Labs con accesso a AI21 Studio e documentazione tecnica sui modelli Jamba. Per il dettaglio della Serie C di novembre 2023 si vedano i comunicati ufficiali e la copertura di Reuters e Calcalist. Il paper accademico su Jamba è disponibile su arXiv (marzo 2024).