Stable Diffusion: la generazione di immagini diventa open
In una frase Stability AI rilascia pubblicamente pesi e codice di un modello latent diffusion text-to-image che gira anche su una GPU consumer. La generazione di immagini AI lascia il cloud.
Stability AI pubblica Stable Diffusion: un modello che, dato un testo ("un astronauta a cavallo, stile rinascimentale"), produce un'immagine in pochi secondi.
La differenza con DALL·E 2, uscito qualche mese prima, è che qui i pesi del modello sono pubblici. Chiunque abbia una scheda grafica da gaming può scaricarlo e farlo girare in locale, senza mandare nulla a un server esterno.
Da quel momento esplode tutto: interfacce desktop, plugin per Photoshop, fork, fine-tuning su stili personali. La "AI generativa" smette di essere un servizio cloud chiuso.
Aziende
Stability AI, CompVis, Runway
Tool
Stable Diffusion
Tag
Fonti