Salta al contenuto
AImpact
IT EN

Articolo · Lancio prodotto

Pika Labs — Il Rivale di Runway nato dal Garage di Stanford

Fonte originale: Pika — pika.art — sintesi e rielaborazione in parole proprie.

CondividiLinkedInX

Cos'è: Pika Labs è una startup di generazione AI di video fondata nel 2023 da Demi Guo, dottoranda di Stanford in NLP, insieme a Chenlin Meng, ricercatrice nei modelli di diffusione. Pika 1.0 viene lanciato a dicembre 2023 e raccoglie immediatamente $80 milioni in un Series A guidato da Lightspeed e Andreessen Horowitz, raggiungendo a metà 2024 una valutazione di $470 milioni. Pika 2.0, rilasciato a ottobre 2024, introduce Scene Ingredients e consolida il posizionamento dell'azienda come alternativa consumer-first a Runway.

La storia fondativa: dal garage di Palo Alto al Series A

La narrazione di Pika è diventata virale negli ambienti VC della Silicon Valley nel 2023 per un motivo preciso: Demi Guo ha lasciato il dottorato a Stanford insieme a Chenlin Meng per costruire l'azienda partendo letteralmente da un garage, con un team iniziale di quattro persone. La traiettoria — dalla demo iniziale su Discord ai primi milioni di video generati dagli utenti in pochi mesi — ha replicato il pattern Midjourney, ovvero crescita organica via community prima ancora di un'interfaccia web matura.

Il Series A da $80 milioni di Lightspeed Venture Partners e Andreessen Horowitz, annunciato nei primi mesi del 2024, ha portato la valutazione a $470 milioni. Tra gli investitori figurano anche Adam D'Angelo (CEO di Quora e ex board OpenAI) e Andrej Karpathy. La struttura del round è interessante perché avviene prima che l'azienda abbia un fatturato significativo: la scommessa degli investitori è sul posizionamento di brand verso la generazione di video AI consumer, non sui ricavi attuali.

Demi Guo, nata in Cina e cresciuta tra Pechino e gli Stati Uniti, aveva pubblicato durante il dottorato lavori sui modelli generativi multimodali. Chenlin Meng, anche lei di formazione Stanford, è autrice di paper fondamentali sui denoising diffusion implicit models (DDIM). La coppia tecnica/visione è considerata uno degli asset dell'azienda.

Pika 2.0 e Scene Ingredients: il differenziatore tecnico

Pika 2.0, lanciato a ottobre 2024, introduce la funzione che l'azienda chiama Scene Ingredients: la possibilità di caricare immagini di riferimento separate per personaggio, oggetto, location e stile, e di combinarle in un singolo video generato. È una forma di compositional control che va oltre il classico prompt testuale o image-to-video di prima generazione.

Il caso d'uso paradigmatico è: carica una foto della tua faccia come "personaggio", una foto del tuo cane come "oggetto", una foto di una spiaggia tropicale come "location", aggiungi un prompt testuale che descriva l'azione, e Pika genera un video coerente in cui i tre ingredienti vengono integrati. La promessa di Scene Ingredients è la riduzione del problema della "lotteria del prompt": non devi descrivere a parole quello che hai in testa, lo mostri direttamente con immagini.

Dal punto di vista architetturale, la funzione richiede un modello capace di disentangling — separare e ricombinare identità, oggetti e contesto preservando la coerenza visiva. È un problema noto nei modelli di diffusione e Pika non è la sola a lavorarci, ma il pacchetto integrato in un'interfaccia consumer ha rappresentato un salto di usabilità nel mercato della generazione video.

Pika contro Runway: consumer-first vs prosumer

Il posizionamento di Pika diventa chiaro quando lo si mette accanto al rivale principale, Runway. Runway nasce nel 2018 con un target esplicito di filmmaker, video editor professionisti e content creator avanzati: integrazione con strumenti pro, mascheratura, motion brush, color grading. L'interfaccia richiede dimestichezza con il vocabolario del post-produzione video.

Pika ha scelto la direzione opposta: interfaccia minimale, generazione veloce, prompt brevi, output ottimizzato per la condivisione immediata sui social. Il target dichiarato sono i creator di TikTok, Instagram Reels e YouTube Shorts — la "TikTok generation" che produce video brevi e non ha tempo per workflow complessi. Il prezzo è coerente: piani da $10/mese per uso individuale contro le tariffe più articolate di Runway.

Questa biforcazione del mercato è una delle dinamiche più interessanti dell'AI video nel 2024. Non vince il prodotto più potente in assoluto, ma quello meglio calibrato sul comportamento del proprio segmento. Pika non si scontra direttamente con Runway sui filmmaker indipendenti, ma cattura un mercato consumer molto più ampio in valore aggregato.

Il problema irrisolto: coerenza oltre i 5 secondi

Il limite tecnico più discusso di tutti i modelli di generazione video del 2024 — Pika incluso — è la coerenza qualitativa nei video più lunghi di 4-5 secondi. Le clip brevi mostrano qualità impressionante: movimento fluido, illuminazione plausibile, identità del soggetto preservata. Ma estendere la durata introduce drift visivo: il personaggio cambia leggermente i tratti del viso, gli oggetti si deformano, lo stile slitta.

Il problema è strutturale nei modelli di diffusione attuali. Generare frame coerenti su lunghe sequenze richiede una rappresentazione interna stabile dell'identità del soggetto attraverso il tempo, e i modelli faticano a mantenerla. Sora di OpenAI, annunciata a febbraio 2024 e rilasciata a dicembre 2024, ha mostrato risultati migliori su clip da 20 secondi, ma il problema non è risolto neanche lì.

Pika ha scelto un approccio pragmatico: invece di puntare alla lunga durata, ha ottimizzato sull'esperienza di concatenazione di più clip brevi via editing semplificato. È una scelta strategica che assume implicitamente che il mercato consumer accetterà la frammentazione finché la qualità della singola clip resta alta. Resta da vedere se questa scommessa terrà nel medio periodo, quando concorrenti come Sora e Google Veo continueranno a spingere sulla durata coerente.


Link alla fonte originale

Pika — pika.art →

Pika è disponibile via web app con piano gratuito limitato e piani a pagamento da $10/mese (Standard) fino a $95/mese (Pro). I video generati nei piani gratuiti includono watermark. Comunità Discord attiva con oltre un milione di utenti.