The Worlds I See — Fei-Fei Li

Chi è: Fei-Fei Li, professoressa Stanford, co-direttrice dello Stanford Human-Centered AI Institute. Immigrata dalla Cina a 16 anni senza sapere l'inglese. Ha creato ImageNet (2009) — il dataset che ha permesso la rivoluzione del deep learning visivo. Ex Chief Scientist AI/ML di Google Cloud (2017-2018). Una delle voci più ascoltate sulla governance AI e sulla necessità di centrare l'AI sull'umanità.

Chi è Fei-Fei Li

Il memoir racconta una storia poco nota in Italia. Fei-Fei Li arriva negli USA dalla Cina a 16 anni, non parla inglese, i genitori aprono una lavanderia. Studia fisica a Princeton, poi informatica a Caltech. Il libro è metà autobiografia di un'immigrata che vuole capire la mente attraverso le macchine, metà storia della rivoluzione deep learning raccontata dall'interno.

Il titolo — "The Worlds I See" — ha un doppio significato. Il primo è letterale: come una scienziata della visione artificiale ha costruito macchine che vedono il mondo. Il secondo è personale: i mondi attraversati da una donna che è passata da Chengdu a Princeton, dalla lavanderia di famiglia al laboratorio più influente dell'AI mondiale.

ImageNet: il dataset che ha cambiato tutto

Nel 2006, Fei-Fei Li ha un'intuizione radicale: i modelli di computer vision falliscono perché non hanno abbastanza dati. L'intelligenza biologica si sviluppa guardando milioni di oggetti nel mondo reale — un bambino di tre anni riconosce migliaia di oggetti, animali, volti. Perché non replicarlo per le macchine?

Lancia ImageNet: 14 milioni di immagini annotate manualmente in 20.000 categorie. Il progetto viene deriso all'inizio — "è solo raccogliere dati, non è ricerca vera." Li racconta nel libro la fatica di convincere i peer reviewer che l'impresa aveva senso scientifico. Usa Amazon Mechanical Turk per raccogliere annotazioni da lavoratori online in tutto il mondo — allora era un approccio non ortodosso.

Nel 2010 lancia l'ImageNet Large Scale Visual Recognition Challenge (ILSVRC), una competizione annuale. Nel 2012, AlexNet — il modello di Geoffrey Hinton e studenti — vince con un margine devastante rispetto ai secondi classificati: errore del 15,3% contro il 26,2% dei metodi tradizionali. La differenza? GPU e deep learning. ImageNet aveva reso possibile quella vittoria fornendo i dati necessari per addestrare reti profonde. La computer vision moderna nasce da quelle 14 milioni di immagini.

La visione Human-Centered AI

Li non è anti-AI. Ma critica con forza la direzione del campo: troppo focalizzata su capability, troppo poco sull'impatto sociale. Il suo framework Human-Centered AI (HAI) a Stanford — co-fondato con John Etchemendy nel 2019 — nasce da questa critica: l'AI non deve solo essere potente, deve essere progettata con gli umani al centro, non come afterthought ma come principio di design fondamentale.

Esempi concreti che Li porta nel libro: sistemi di AI per diagnosi mediche che aumentano i medici invece di sostituirli — riducendo i casi persi, non eliminando il medico. Sistemi di traduzione che preservano le lingue minoritarie invece di uniformare tutto all'inglese. Tool per persone con disabilità che guadagnano autonomia. La domanda che Li pone ai ricercatori: "per chi stai costruendo questo sistema?"

Il capitolo su Google Cloud

Li descrive i suoi 18 mesi come Chief Scientist AI/ML di Google Cloud (2017-2018) con onestà insolita per un memoir di questo tipo. La cultura aziendale in conflitto con la ricerca accademica: la pressione a monetizzare invece di capire, la difficoltà di fare ricerca fondamentale in un contesto dove ogni progetto deve avere una roadmap commerciale a 12 mesi.

La sua campagna interna per rendere l'AI "più umana" nell'uso enterprise — includere team di eticisti nei progetti, considerare l'impatto sulle comunità, rifiutare alcuni contratti governativi controversi. Non sempre vince questi scontri. Li si è dimessa per tornare a Stanford, non in rottura drammatica, ma con la convinzione che il suo contributo fosse più importante fuori da Big Tech che dentro. La sua conclusione: le università sono l'ultimo spazio in cui si può fare ricerca AI con orizzonte decennale invece che trimestrale.

Cosa distingue questo libro

"The Worlds I See" non è un saggio tecnico né un manifesto politico. È un memoir. Il valore principale: Fei-Fei Li è uno dei pochissimi protagonisti della rivoluzione deep learning che racconta la storia dall'interno con voce personale, senza dover promuovere un prodotto o giustificare una valutazione aziendale.

Il punto di vista è quello di una ricercatrice, donna, immigrata — prospettiva rara nel dibattito AI dominato da uomini americani di 40-50 anni con background imprenditoriale. Li porta nel libro la consapevolezza di chi ha vissuto sulla propria pelle cosa significa essere "outsider" in un sistema: come immigrata negli USA, come donna in un campo quasi interamente maschile, come accademica circondata da investitori miliardari.

Il rischio di un libro così è la celebrazione narcisistica. Li lo evita: le parti più oneste del libro sono quelle in cui descrive i propri fallimenti — i grant rifiutati, i paper rigettati, i momenti in cui stava per abbandonare. ImageNet non era un progetto glorioso fin dall'inizio: era un progetto ridicolizzato per anni.

Link alla fonte originale

hai.stanford.edu →

Libro ~368 pagine, EN. Ottobre 2023. Stanford HAI: hai.stanford.edu.