LangChain — Il Framework AI più Adottato e le Critiche dei Senior Engineer

Cos'è: LangChain è il framework open source per applicazioni LLM più scaricato al mondo — e contemporaneamente il più criticato dai senior engineer. Nato come side project di Harrison Chase a ottobre 2022, è diventato in meno di un anno il default per chi prototipa applicazioni AI, e nello stesso tempo il bersaglio di una controversia tecnica continua sulla qualità del suo design. La sua traiettoria è il caso di studio definitivo su come l'ecosistema LLM trasforma framework in standalone tool man mano che il mercato matura.

Le Origini: Harrison Chase e il Tempismo Perfetto

Harrison Chase pubblica la prima release di LangChain su GitHub il 22 ottobre 2022, un mese esatto prima del lancio di ChatGPT. Il framework nasce dalla sua esperienza in Robust Intelligence e dall'intuizione che le applicazioni LLM richiedono primitive di composizione che le API raw non offrono: chain di prompt, memoria conversazionale, integrazione con vector store, parsing strutturato dell'output. Il timing è straordinariamente fortunato — quando l'esplosione di interesse post-ChatGPT crea improvvisamente una domanda massiva di tool di sviluppo, LangChain è praticamente l'unico framework maturo disponibile in Python.

Nei mesi successivi la traiettoria è verticale. A febbraio 2023 Sequoia Capital guida un seed/Serie A da $10M, seguito da una Serie A da $25M ad aprile 2023 a una valutazione di $200M, e una Serie B da circa $25M+ nel 2024 che porta la valutazione complessiva sopra $1.1B. LangChain Inc. diventa una delle prime "AI infrastructure unicorn" pure-play.

L'Architettura Originale: Chain, Agent, Tool

Il design iniziale ruota attorno a tre primitive. La Chain è una sequenza componibile di passaggi: prompt template, chiamata al modello, parsing output. Le chain possono essere composte (output di una è input dell'altra) per costruire pipeline complesse. L'Agent è un ciclo autonomo dove il modello sceglie quale tool usare ad ogni step — implementazione originale del paper ReAct (Reasoning + Acting). Il Tool è qualsiasi funzione esterna che l'agente può invocare: ricerca web, calcolatrice, query database, esecuzione codice.

A queste si aggiungono primitive di supporto: Memory per stato conversazionale (buffer, summary, vector-backed), Document Loader per ingest di file (PDF, HTML, Notion, decine di altri formati), Text Splitter per chunking, Vector Store wrapper per oltre 50 database (Pinecone, Weaviate, Chroma, Qdrant, FAISS), Retriever per orchestrare retrieval-augmented generation. L'ambizione è coprire l'intero stack di un'applicazione LLM con un'unica libreria coerente.

Le Critiche Tecniche: Over-Abstraction

Nel corso del 2023 la community senior inizia a manifestare insoddisfazione crescente. Il post Hacker News virale "Why I don't use LangChain" di luglio 2023 e una serie di articoli da parte di Octomind, Replit engineers e altri practitioner formalizzano le critiche ricorrenti. Il pattern di lamentela è consistente.

Astrazione eccessiva su API che cambiano velocemente. LangChain wrappa le API di OpenAI, Anthropic, Google e decine di altri provider sotto interfacce uniformi — ma quando un provider introduce una feature nuova (es. parallel tool use di OpenAI, prompt caching di Anthropic), passano settimane prima che LangChain la esponga, costringendo gli sviluppatori a scendere al livello inferiore o aspettare. L'astrazione fallisce esattamente quando serve di più: sulle novità.

Codice difficile da debuggare. Una "semplice" chain LangChain attraversa potenzialmente decine di livelli di chiamate interne — class hierarchy con multiple inheritance, callback handlers, manager objects. Quando qualcosa va storto, lo stack trace è di 40+ frame e il problema reale è sepolto in metodi di terze parti. La comparison ricorrente è con OpenAI SDK diretto: 20 righe di codice esplicito invece di 5 righe di magia opaca.

Breaking changes frequenti e dolorosi. A ottobre 2023 esce LangChain v0.1 con un rewrite massiccio che spezza compatibilità con buona parte del codice esistente. Il framework viene split in tre pacchetti: langchain-core (primitive), langchain (high-level), langchain-community (integrations). Decine di import cambiano nome, decine di pattern d'uso vengono deprecati. Aziende con codebase grosse spendono sprint interi solo per migrare. Una versione 0.2 nel 2024 introduce ulteriori rotture.

La Strategia di Sopravvivenza: LangGraph e LangSmith

La risposta di LangChain Inc. alle critiche è duplice. Da un lato un refactoring per ridurre le astrazioni eccessive nel core. Dall'altro lo spostamento del valore commerciale su due prodotti che non sono il framework originale.

LangSmith, annunciato a luglio 2023, è una piattaforma di observability per applicazioni LLM: tracing distribuito delle chain, valutazione automatica dell'output, dataset management per test regression, monitoring di produzione. Si integra nativamente con LangChain ma funziona anche standalone con qualsiasi SDK. È il vero moat commerciale: una volta che un'azienda ha 6 mesi di trace storici in LangSmith, switchare è doloroso. Le revenue di LangChain Inc. nel 2024 provengono prevalentemente da LangSmith, non dal framework open source.

LangGraph, lanciato a inizio 2024, è una libreria separata per definire agenti come state machine esplicite: nodi che sono funzioni Python pure, edge che sono transizioni condizionali, stato condiviso che è un oggetto tipato. È una risposta diretta alla critica che gli agenti LangChain originali erano opachi e impossibili da debuggare. LangGraph ribalta il design: invece di nascondere il loop di un agente dietro astrazioni, lo rende un grafo esplicito che il developer disegna. È diventato rapidamente il primitivo preferito anche da chi aveva abbandonato LangChain.

Il Pattern di Industria: Framework Prima, Standalone Tool Dopo

Nel frattempo l'ecosistema si è frammentato. LlamaIndex di Jerry Liu si è specializzato sul RAG (retrieval-augmented generation) — più focalizzato, meno ambizioso di LangChain, ma considerato superiore per chi fa solo RAG. Haystack di deepset.ai mantiene una community fedele soprattutto in Europa per applicazioni search-centric. DSPy di Omar Khattab a Stanford propone un approccio radicalmente diverso: definire la pipeline come "moduli" e lasciare che un compilatore ottimizzi automaticamente i prompt — un livello sopra rispetto al prompt engineering manuale.

Il pattern emerso è chiaro e rispecchia altre transizioni dell'industria software: in fase early di una tecnologia, i framework all-in-one vincono perché abbassano la barriera d'ingresso. Man mano che la tecnologia matura e gli sviluppatori acquisiscono expertise, il valore si sposta verso tool specializzati e standalone — ognuno fa una cosa sola e la fa bene. LangChain ha avuto il primo movimento e mantiene un'enorme base installata, ma la maggior parte delle aziende che costruiscono nuovi sistemi in produzione nel 2024-2025 stanno scegliendo combinazioni di SDK provider diretti + LangGraph per l'orchestrazione + LangSmith (o alternative come Helicone, Langfuse) per l'observability — bypassando di fatto il framework LangChain originale.

La traiettoria di Harrison Chase è interessante anche come case study di leadership: ha accettato pubblicamente molte delle critiche, ha guidato il pivot verso prodotti più focalizzati, e ha trasformato un framework controverso in una piattaforma commerciale solida. La lezione per chi costruisce infrastruttura AI è dura ma importante: nei mercati che evolvono velocemente, l'astrazione prematura è il vero rischio — non l'opposto.

Link alla fonte originale

LangChain — Sito Ufficiale →

Sito ufficiale di LangChain Inc. con documentazione del framework Python e JavaScript, descrizione di LangGraph e LangSmith, e blog post di Harrison Chase sulla roadmap e l'evoluzione architetturale.