Midjourney — Da v1 a v6: Come l'AI ha Ridisegnato l'Arte Digitale

Cos'è: Midjourney è un sistema di generazione di immagini da testo (text-to-image) sviluppato dall'omonima azienda indipendente fondata da David Holz, ex co-fondatore di Leap Motion. Lanciato in open beta pubblica nel luglio 2022, opera interamente tramite Discord e utilizza un modello diffusion proprietario la cui architettura non è stata pubblicata. È diventato il punto di riferimento dell'arte generativa AI per qualità estetica e comunità.

La scelta insolita di Discord come piattaforma

Quando Midjourney aprì la beta pubblica il 12 luglio 2022, la scelta di operare esclusivamente tramite un server Discord sembrava strana — persino limitante. In retrospettiva, fu una delle mosse più intelligenti del settore AI. Discord garantì contemporaneamente tre cose difficilissime da ottenere separatamente: una community immediata di utenti appassionati, un loop di feedback visivo dove ogni immagine generata era pubblica e commentabile, e un canale di marketing organico dove l'entusiasmo si propagava viralmente. Gli utenti vedevano le creazioni altrui, imparavano per osmosi, condividevano tecniche di prompting — tutto dentro la stessa interfaccia dove creavano.

Il server raggiunse un milione di utenti in pochi mesi, poi cinque, poi dieci. Midjourney non aveva bisogno di investire in acquisizione utenti: la piattaforma era il prodotto di marketing.

L'evoluzione delle versioni: un salto qualitativo ogni sei mesi

v1 (luglio 2022): Pittoresco, onirico, con artefatti evidenti e anatomia spesso distorta. Utile per concept artistici astratti, inutilizzabile per qualsiasi cosa richiedesse precisione. Ma abbastanza affascinante da generare viralità immediata.

v3 (ottobre 2022): Prima svolta qualitativa significativa. Coerenza compositiva migliorata, palette cromatiche più sofisticate, capacità di seguire prompt complessi con più elementi. La community iniziò a sviluppare un vero e proprio linguaggio di prompting — parametri come --stylize, --chaos, --ar per l'aspect ratio.

v4 (novembre 2022): Fotorealismo. Per la prima volta Midjourney produceva immagini che, a prima vista, potevano essere scambiate per fotografie. Ritratti, paesaggi, architetture — la qualità raggiunse un livello che sorprese anche i professionisti del settore. Le mani restavano un problema irrisolto: sei dita, proporzioni errate, giunture anatomicamente impossibili.

v5 (marzo 2023): Le mani migliorano sensibilmente. Fotorealismo ulteriormente affinato, dettaglio dei tessuti, consistenza della luce. Midjourney v5 divenne il punto di riferimento industriale per concept art e visualizzazioni architetturali.

v6 (dicembre 2023): Capacità di seguire prompt molto lunghi e specifici (prompt adherence), rendering del testo nelle immagini (storicamente impossibile per i modelli diffusion), qualità complessiva che sfida l'output professionale umano su molte tipologie di soggetto.

Il caso Jason Allen e lo scandalo del concorso d'arte

Agosto 2022: Jason Allen presenta al Colorado State Fair un'opera intitolata Théâtre D'Opéra Spatial nella categoria "Arte digitale e arte manipolata digitalmente". Vince il primo premio. Solo dopo la premiazione rivela che l'opera è stata generata con Midjourney (con raffinamenti in Photoshop). Lo scandalo esplode: artisti digitali accusano Allen di frode, il pubblico si divide tra chi considera l'AI uno strumento come Photoshop e chi la vede come una sostituzione del talento umano. Allen risponde: "Ho vinto usando l'AI, e non me ne vergogno." Il caso catalizza il dibattito su cosa significhi "creare" arte nell'era dei modelli generativi.

Le controversie legali: Getty e deviantART

Getty Images ha citato in giudizio Stability AI (non Midjourney direttamente) per l'utilizzo non autorizzato di milioni di immagini protette da copyright nel training dei modelli. DeviantART ha implementato un tag NoAI permettendo agli artisti di escludere le proprie opere da futuri dataset — una misura simbolica ma significativa. La questione legale di fondo — se il training su immagini protette costituisca fair use o violazione di copyright — non è ancora risolta nei tribunali americani al 2024. L'esito di queste cause ridisegnerà le regole dell'intera industria dell'AI generativa.

David Holz e il modello senza venture capital

David Holz ha fatto una scelta radicale nel panorama delle startup AI: nessun round di venture capital. Midjourney è profittevole fin dalle prime settimane grazie agli abbonamenti mensili — Basic ($10), Standard ($30), Pro ($60), Mega ($120). I ricavi annui stimati si aggirano intorno ai $200 milioni, con un team di appena una quarantina di persone. Holz ha dichiarato che accettare VC avrebbe significato cedere il controllo sulla direzione del prodotto e accelerare la crescita a scapito della qualità. La scelta ha creato un'azienda anomala nell'ecosistema AI: piccola, profittevole, indipendente, con un'estetica coerente e riconoscibile.

Differenze rispetto alla concorrenza

DALL-E (OpenAI) punta sulla sicurezza e sull'integrazione con ChatGPT — più controllato, meno "artistico". Stable Diffusion (Stability AI) è open source, eseguibile localmente, infinitamente personalizzabile ma richiede competenze tecniche. Midjourney occupa una posizione intermedia: non è open source, non è personalizzabile a livello di architettura, ma produce risultati con un'estetica curata e raffinata difficile da replicare. La curva di apprendimento del prompting è reale — ci vogliono ore per capire come dialogare efficacemente con Midjourney — ma la community e le risorse disponibili rendono il percorso agevole.

Link alla fonte originale

Midjourney — midjourney.com →

Midjourney è accessibile tramite Discord (midjourney.com reindirizza al server Discord) e, dal 2024, tramite interfaccia web. Piani a partire da $10/mese. Non esiste versione gratuita stabile dal 2023.