Nuove opportunità con la generative AI

La generative AI è la next big thing che cambierà molto il modo in cui ognuno di noi interagirà con la tecnologia. Il nostro compito è comprendere questa innovazione e cogliere le opportunità che ci offre.


Qualche mese fa ho iniziato ad analizzare e sperimentare varie piattaforme come DALL-E, MidJourney e Stable Diffusion. Tutti servizi che, grazie all'intelligenza artificiale, producono immagini a partire da un nostro input.

Stiamo assistendo alla next big thing che cambierà molto il modo in cui ognuno di noi interagirà con la tecnologia e il nostro compito è comprendere queste innovazioni e cogliere le opportunità che ci offrono.

Un esempio

Ho inserito una descrizione di ciò che volevo: "asian forest landscape, highly detailed, cinematic lighting, digital art painting" e l'intelligenza artificiale ha fatto il resto, proponendomi quattro risultati.

Immagine generata da MidJourney

Ho poi provato a testarla su me stesso. Ho allenato il modello fornendo alcune foto di me in occasioni e inquadrature differenti, in modo che potesse conoscermi.

A questo punto gli ho fornito un’ipotetica descrizione: "Portrait of marco as a WWI captain on the deck of a ship, male, detailed face, 20th century, highly detailed, cinematic lighting, digital art painting" e questi sono stati i risultati:

Immagini generate attraverso Astria.ai

Pazzesco! Ma come funzionano questi modelli di generazione di immagini? Dovremmo considerarli intelligenti?

Come funziona un modello di Generative AI?

I modelli che generano queste immagini utilizzano una tecnica chiamata diffusion modeling ed eseguono due processi sequenziali: distruggono le immagini e poi cercano di ricostruirle.