✦

Percorso

Creator, marketing e contenuti

Il percorso dalla prima immagine generata al video AI in tempo reale.

Sei designer, content creator, copywriter o marketer e devi capire come l'AI generativa sta riscrivendo il tuo flusso. Questo percorso tocca i salti chiave dall'immagine (DALL·E 2, Stable Diffusion, Midjourney) alla voce (ElevenLabs) fino al video (Sora, Veo 3) e al multimodale conversazionale (GPT-4o).

01

Perché conta per te

Prima volta in cui un'immagine generata da testo diventa indistinguibile da uno scatto reale: nasce qui il dibattito su stock photo e mestiere.

6 aprile 2022 Alto Generazione immagini & video

DALL·E 2: il salto in qualità della generazione di immagini

OpenAI annuncia DALL·E 2, un modello text-to-image basato su diffusion che produce immagini fotorealistiche a 1024×1024. Accesso inizialmente via waitlist, poi pubblico a luglio.
02

Perché conta per te

I pesi aperti rendono la generazione immagini gratuita e personalizzabile: i creator iniziano a fine-tunare il proprio stile.

22 agosto 2022 Pietra miliare Generazione immagini & video

Stable Diffusion: la generazione di immagini diventa open

Stability AI rilascia pubblicamente pesi e codice di un modello latent diffusion text-to-image che gira anche su una GPU consumer. La generazione di immagini AI lascia il cloud.
03

Perché conta per te

Definisce un'estetica riconoscibile e mainstream: cambia per sempre moodboard, concept art e illustrazione editoriale.

12 luglio 2022 Alto Generazione immagini & video

Midjourney apre la beta pubblica su Discord

Midjourney apre la sua beta pubblica con un modello text-to-image accessibile via bot Discord. Lo stile estetico marcato e la community trasformano la generazione di immagini in fenomeno di massa.
04

Perché conta per te

Il primo video AI lungo, coerente e cinematografico: gli storyboard e i pitch visivi non saranno più gli stessi.

15 febbraio 2024 Pietra miliare Generazione immagini & video

Sora: OpenAI mostra video AI di qualità cinematografica

OpenAI annuncia Sora, modello text-to-video che produce clip 1080p fino a 60 secondi con coerenza temporale, fisica plausibile e camera movement realistici. Rilascio limitato a red-teamer e selezionati artisti.
05

Perché conta per te

Multimodalità nativa in chat: passi da brief a immagini, audio e variazioni in una sola sessione, senza cambiare strumento.

13 maggio 2024 Alto AI multimodale

GPT-4o: testo, voce e immagini in un solo modello

OpenAI presenta GPT-4o (omni), un modello unico che processa nativamente testo, audio e immagini con latenza voce di ~320 ms e qualità GPT-4 sul testo, gratuito anche per utenti free.
06

Perché conta per te

Video generativo finalmente disponibile al pubblico in modo usabile per progetti reali, non più solo demo.

9 dicembre 2024 Alto Generazione immagini & video

Sora Turbo: dieci mesi dopo la demo, OpenAI rilascia video gen al pubblico

OpenAI rilascia Sora Turbo per utenti ChatGPT Plus/Pro: video fino a 20s, 1080p, image-to-video, remix, storyboard. Versione più veloce e meno fedele del Sora demo di febbraio.
07

Perché conta per te

Veo 3 alza la barra del fotorealismo video: diventa difficile distinguere lo spot AI da quello tradizionale, con tutto ciò che implica per il tuo mestiere.

20 maggio 2025 Alto Generazione immagini & video

Veo 3 al Google I/O: generazione video con audio sincronizzato nativo

Al Google I/O 2025, DeepMind presenta Veo 3 (video generation con audio nativo, dialoghi, effetti), Imagen 4 (immagini più dettagliate) e Flow (tool video AI per creativi).