Scroll Top
Via Antonio Amato, 20/22 84131 Salerno (SA)

DALL·E 3 e ChatGPT: un’accoppiata vincente

dall.3

(articolo redatto da Luigi Pierri)

DALL·E 3 è l’ultima versione del generatore di immagini basato sull’intelligenza artificiale di OpenAI, che permette di creare immagini realistiche a partire da una descrizione testuale.

Dopo le impressionanti potenzialità dimostrate dalla precedente versione DALL·E 2, il team di OpenAI è pronto a stupirci con nuove funzionalità. In questo breve articolo analizzeremo alcune di queste nuove funzionalità e faremo un paragone con la precedente versione.

Cos’è DALL·E 3?

DALL·E 3 è una tecnologia che permette di trasformare qualsiasi testo in un’immagine realistica e dettagliata. Si basa sul modello DALL·E, introdotto da OpenAI nel 2021, ed estende le sue capacità per gestire attività più complesse e diversificate. DALL·E 3 può generare immagini realistiche e coerenti da descrizioni in linguaggio naturale, come “un gatto che indossa un cappello” o “un grattacielo fatto di formaggio“, ognuno con uno stile e caratteristiche differenti. Può anche generare didascalie in linguaggio naturale da immagini, come “un cane seduto su un divano” o “un dipinto di un paesaggio“. Essendo uno strumento potente e versatile, può essere utilizzato per applicazioni creative e artistiche, nonché per scopi di ricerca e formazione.

DALL·E 3 vs DALL·E 2

Come successore del precedente DALL·E 2, questa nuova versione apporta numerose migliorie e nuove funzionalità. Analizziamo in breve le più rilevanti:

  • Maggiore qualità delle immagini generate: DALL·E 3 usa un modello più grande e più potente di DALL·E 2, che gli consente di produrre immagini più dettagliate e fedeli alla descrizione. Le immagini generate da DALL·E 3 hanno una risoluzione di 1024×1024 pixel, contro i 512×512 pixel di DALL·E 2.
  • Maggiore varietà delle immagini generate: DALL·E 3 è in grado di generare fino a 64 immagini diverse per ogni descrizione, mentre DALL·E 2 ne generava solo 16. Questo significa che DALL·E 3 offre più scelta e creatività agli utenti, che possono selezionare l’immagine che preferiscono o che meglio si adatta al loro scopo.
  • Maggiore flessibilità delle descrizioni: DALL·E 3 è più tollerante e capace di interpretare le descrizioni degli utenti, anche se sono vaghe, ambigue o contengono errori ortografici o grammaticali. DALL·E 3 riesce anche a gestire descrizioni più complesse e specifiche, che includono attributi, relazioni o combinazioni insolite di oggetti.
  • Maggiore interattività: DALL·E 3 offre una modalità interattiva, in cui gli utenti possono modificare la descrizione in tempo reale e vedere come cambiano le immagini generate. Questo permette di esplorare le potenzialità di DALL·E 3 e di affinare la descrizione fino a ottenere l’immagine desiderata.
  • Maggiore sicurezza: DALL·E 3 pone maggiore attenzione alla sicurezza rispetto a DALL·E 2 per prevenire la generazione di contenuti dannosi. In particolare può ignorare richieste di contenuti violenti, pornografici, razzisti o politici, oltre a richieste di immagini raffiguranti personaggi pubblici. DALL·E 2, invece, è più suscettibile alle richieste di generazione di immagini offensive o inappropriate.

Per avere un’idea dei miglioramenti generativi tra DALL·E 3 e DALL·E 2, potete osservare le seguenti immagini, generate con la stessa descrizione: “Un espressivo dipinto ad olio di un giocatore di basket che schiaccia, raffigurato come l’esplosione di una nebulosa“:

DALL·E 3 vs DALL·E 2

Come si può vedere, le immagini generate da DALL·E 3 sono più realistiche, varie e coerenti con la descrizione rispetto a quelle generate da DALL·E 2.

Il segreto del superamento di alcuni limiti precedenti e l’aumento delle prestazioni generali, è dato dalla combinazione di DALL·E 3 con un altro dei prodotti più popolari di OpenAI: ChatGPT.

DALL·E 3 e ChatGPT: la coppia perfetta

Uno dei limiti del precedente DALL·E 2 è la scrittura del testo da cui generare le immagini, che deve essere chiaro e preciso, altrimenti DALL·E potrebbe non capire bene cosa vogliamo ottenere o produrre risultati inaspettati. Ecco dove entra in gioco ChatGPT.

ChatGPT è in grado di generare automaticamente il testo con cui fare una richiesta a DALL·E 3, iniziando da poche parole chiave che indichino il tema o il soggetto dell’immagine che vogliamo creare. Per esempio, se scriviamo “fantasia medievale“, ChatGPT potrebbe generare frasi come “un drago che sputa fuoco su un castello“, “una principessa che cavalca un unicorno” o “un mago che lancia un incantesimo“. Queste frasi possono poi essere usate come input per DALL·E 3, che creerà le immagini corrispondenti.

In questo modo, ChatGPT rende l’esperienza d’uso di DALL·E 3 più facile, divertente e stimolante. Non dobbiamo più preoccuparci di scrivere il testo giusto, ma possiamo lasciarci guidare dalla creatività e dalla curiosità di ChatGPT, eliminando la necessità di affinare il testo per la generazione delle immagini. Possiamo anche combinare le parole chiave in modi diversi, per ottenere frasi e immagini sempre nuove e sorprendenti.

Quali sono i risultati di questa combinazione? Dai un’occhiata al seguente video introduttivo, pubblicato su YouTube dal canale ufficiale di OpenAI.

Conclusioni

DALL·E 3 è un generatore di immagini basato sull’intelligenza artificiale molto avanzato e divertente da usare, che supera in molti aspetti la precedente versione DALL·E 2. Con la combinazione di ChatGPT, DALL·E 3 offre un potenziale enorme per la generazione di contenuti visivi e testuali. Se volete provare anche voi a creare le vostre immagini con DALL·E 3, potete accedere al sito web ufficiale di OpenAI.

Nota: al momento della stesura di questo articolo, DALL·E 3 è in versione “research preview”, il che significa che è disponibile solo per i clienti ChatGPT Plus ed Enterprise, mentre l’utilizzo tramite API e in Labs sarà reso disponibile nel corso di questo autunno.


Se anche tu vuoi occuparti di progetti di sviluppo software
dai un’occhiata alle nostre opportunità di lavoro e conosciamoci subito!