Percorso
Creator, marketing e contenuti
Il percorso dalla prima immagine generata al video AI in tempo reale.
Sei designer, content creator, copywriter o marketer e devi capire come l'AI generativa sta riscrivendo il tuo flusso. Questo percorso tocca i salti chiave dall'immagine (DALL·E 2, Stable Diffusion, Midjourney) alla voce (ElevenLabs) fino al video (Sora, Veo 3) e al multimodale conversazionale (GPT-4o).
- 01
Perché conta per te
Prima volta in cui un'immagine generata da testo diventa indistinguibile da uno scatto reale: nasce qui il dibattito su stock photo e mestiere.
Alto Generazione immagini & videoDALL·E 2: il salto in qualità della generazione di immagini
OpenAI annuncia DALL·E 2, un modello text-to-image basato su diffusion che produce immagini fotorealistiche a 1024×1024. Accesso inizialmente via waitlist, poi pubblico a luglio.
- 02
Perché conta per te
I pesi aperti rendono la generazione immagini gratuita e personalizzabile: i creator iniziano a fine-tunare il proprio stile.
Pietra miliare Generazione immagini & videoStable Diffusion: la generazione di immagini diventa open
Stability AI rilascia pubblicamente pesi e codice di un modello latent diffusion text-to-image che gira anche su una GPU consumer. La generazione di immagini AI lascia il cloud.
- 03
Perché conta per te
Definisce un'estetica riconoscibile e mainstream: cambia per sempre moodboard, concept art e illustrazione editoriale.
Alto Generazione immagini & videoMidjourney apre la beta pubblica su Discord
Midjourney apre la sua beta pubblica con un modello text-to-image accessibile via bot Discord. Lo stile estetico marcato e la community trasformano la generazione di immagini in fenomeno di massa.
- 04
Perché conta per te
Il primo video AI lungo, coerente e cinematografico: gli storyboard e i pitch visivi non saranno più gli stessi.
Pietra miliare Generazione immagini & videoSora: OpenAI mostra video AI di qualità cinematografica
OpenAI annuncia Sora, modello text-to-video che produce clip 1080p fino a 60 secondi con coerenza temporale, fisica plausibile e camera movement realistici. Rilascio limitato a red-teamer e selezionati artisti.
- 05
Perché conta per te
Multimodalità nativa in chat: passi da brief a immagini, audio e variazioni in una sola sessione, senza cambiare strumento.
Alto AI multimodaleGPT-4o: testo, voce e immagini in un solo modello
OpenAI presenta GPT-4o (omni), un modello unico che processa nativamente testo, audio e immagini con latenza voce di ~320 ms e qualità GPT-4 sul testo, gratuito anche per utenti free.
- 06
Perché conta per te
Video generativo finalmente disponibile al pubblico in modo usabile per progetti reali, non più solo demo.
Alto Generazione immagini & videoSora Turbo: dieci mesi dopo la demo, OpenAI rilascia video gen al pubblico
OpenAI rilascia Sora Turbo per utenti ChatGPT Plus/Pro: video fino a 20s, 1080p, image-to-video, remix, storyboard. Versione più veloce e meno fedele del Sora demo di febbraio.
- 07
Perché conta per te
Veo 3 alza la barra del fotorealismo video: diventa difficile distinguere lo spot AI da quello tradizionale, con tutto ciò che implica per il tuo mestiere.
Alto Generazione immagini & videoVeo 3 al Google I/O: generazione video con audio sincronizzato nativo
Al Google I/O 2025, DeepMind presenta Veo 3 (video generation con audio nativo, dialoghi, effetti), Imagen 4 (immagini più dettagliate) e Flow (tool video AI per creativi).