Le tecnologie che fanno capo all’ambito di studi dell’intelligenza artificiale oggi sono in grado di elaborare qualsiasi tipo di immagine a partire dall’associazioni dei dati testuali contenuti nel database. Vediamone alcuni esempi.
TAKEAWAY
- Tra le attuali potenzialità dell’intelligenza artificiale c’è quella di riuscire a rappresentare oggetti inesistenti o concetti astratti, quasi ad imitare il pensiero creativo umano.
- I ricercatori della Rutgers University hanno sviluppato un algoritmo AI che permette di generare immagini di pizze che non hanno un corrispettivo nella realtà.
- DALL-E è l’algoritmo di intelligenza artificiale che crea immagini ricavandole dalle parole.
Creare immagini a partire dalle associazioni di dati contenuti nel database: oggi le tecnologie che fanno capo all’ambito di studi dell’intelligenza artificiale sono in grado di farlo.
Eravamo rimasti al rapporto tra intelligenza artificiale e linguaggio umano, due sfere in contatto, ad esempio, attraverso il Natural Language Processing, campo di ricerca focalizzata sull’utilizzo e l’elaborazione, da parte della macchina, di testi prodotti dall’essere umano.
Nel percorso di avvicinamento dell’AI al pensiero creativo, centrale è il ruolo del deep learning – o apprendimento profondo – segmento di ricerca dell’apprendimento automatico e dell’intelligenza artificiale.
E proprio il concetto di deep learning risulta necessario per comprendere l’innovativa tecnologia del GPT 3, ovvero la terza versione del Generative Pre-trained Transformer, sistema con cui l’intelligenza artificiale è in grado di produrre testi creativi.
Negli ultimi mesi, numerosi studi e ricerche hanno portato allo sviluppo di nuovi sistemi di artificial intelligence che non si limitano alle parole, ma che allargano il proprio raggio di azione giungendo a creare immagini. Ecco alcuni esempi da cui stanno nascendo suggestioni interessanti in ambito accademico.
Dalla Rutgers University, il sistema AI capace di creare immagini di pizze usando gli ingredienti presenti nel database
Un team di ricercatori della Rutgers University, nel New Jersey (USA), ha messo a punto un sistema di intelligenza artificiale in grado di creare immagini di pizze composte a partire da una serie di ingredienti presenti nel database, a ciascuno dei quali corrisponde un’etichetta.
Al termine del processo, l’algoritmo AI “assembla” il prodotto finale, in questo caso la pizza, quasi fosse uno chef che completa la ricetta. Il risultato di questa ricerca trasforma il settore della ristorazione, perché introduce la possibilità di mostrare piatti ancora non realizzati, ma allo stesso tempo diventa impattante in molti professionali creativi e dediti al design.
La capacità dell’AI di creare immagini può essere utile nella ricostruzione di fatti storici, per figurare concetti astratti o per produrre immagini di qualcosa che non si ha la possibilità di vedere dal vivo.
A rendere possibile tale tecnologia è un sistema di machine learning che permette all’intelligenza artificiale di apprendere in maniera autonoma. Il processo avviene comunicando al sistema descrizioni testuali e materiale audiovisivo. Dietro il funzionamento di un algoritmo, ha un peso determinante la quantità di informazioni presenti nel database.
Nel caso della Rutgers University, l’algoritmo è stato allenato trasferendogli più di 9mila fotografie fornite da un team di ricercatori del MIT – Massachusetts Institute of Technology, che le ha scelte tra più di mezzo milione di immagini. Il criterio seguito è stato quello di raccogliere fino a tredici opzioni diverse per il condimento della pizza.
DALL-E, come creare immagini da frasi senza senso
L’intelligenza artificiale sta dimostrando in più occasioni come sia possibile dare una forma definita a icone non esistenti in natura.
DALL-E è un algoritmo sviluppato da OpenAI, organizzazione di ricerca sull’intelligenza artificiale con sede a San Francisco. Presentato poche settimane fa, questo algoritmo attinge a coppie di dati-immagini e, partendo da un breve testo, riesce a restituire un’istantanea verosimile. Il sistema riceve frasi spesso senza senso e può arrivare a creare immagini, ad esempio, di un’arpa che si fonde con una lumaca o viceversa.
L’espressione DALL-E deriva dall’unione di Dalì, cognome del noto pittore spagnolo, e WALL-E, il robot protagonista dell’omonimo film di animazione. L’idea di chi ha sviluppato l’algoritmo è quella di avvicinare, sin dal nome, l’estro degli uomini a quello delle macchine, arrivando a creare immagini, illustrazioni e foto in modo creativo.
Alla fine del processo gli utenti hanno a disposizione una gamma di immagini tra cui gli utenti possono selezionare la migliore. In base alle scelte effettuate dall’uomo, il sistema ha gli elementi giusti per riuscire ad affinare ancora di più il risultato la volta successiva.
Difficile, per gli addetti ai lavori, tracciare al momento scenari precisi sulle applicazioni future della tecnologia. Al momento i ricercatori stanno cercando di affinare il funzionamento dell’associazione di variabili, ovvero ciò che permette all’AI di creare immagini con elevata precisione.
Se le informazioni diventano troppe, l’intelligenza artificiale non riesce a esprimersi in tutta la sua creatività. La sfida è quella di aumentare il numero di varianti da inserire nelle descrizioni senza senso fornite alla macchina, ad esempio diversi tipi di animali fusi insieme, andando ben oltre la “semplice” associazione, vista in precedenza, tra l’arpa e la lumaca.