Scroll Top
Via Antonio Amato, 20/22 84131 Salerno (SA)

DALL·E 3 e ChatGPT: un’accoppiata vincente

dall.3

(articolo redatto da Luigi Pierri)

DALL·E 3 è l’ultima versione del generatore di immagini basato sull’intelligenza artificiale di OpenAI, che permette di creare immagini realistiche a partire da una descrizione testuale.

Dopo le impressionanti potenzialità dimostrate dalla precedente versione DALL·E 2, il team di OpenAI è pronto a stupirci con nuove funzionalità. In questo breve articolo analizzeremo alcune di queste nuove funzionalità e faremo un paragone con la precedente versione.

Cos’è DALL·E 3?

DALL·E 3 è una tecnologia che permette di trasformare qualsiasi testo in un’immagine realistica e dettagliata. Si basa sul modello DALL·E, introdotto da OpenAI nel 2021, ed estende le sue capacità per gestire attività più complesse e diversificate. DALL·E 3 può generare immagini realistiche e coerenti da descrizioni in linguaggio naturale, come “un gatto che indossa un cappello” o “un grattacielo fatto di formaggio“, ognuno con uno stile e caratteristiche differenti. Può anche generare didascalie in linguaggio naturale da immagini, come “un cane seduto su un divano” o “un dipinto di un paesaggio“. Essendo uno strumento potente e versatile, può essere utilizzato per applicazioni creative e artistiche, nonché per scopi di ricerca e formazione.

DALL·E 3 vs DALL·E 2

Come successore del precedente DALL·E 2, questa nuova versione apporta numerose migliorie e nuove funzionalità. Analizziamo in breve le più rilevanti:

  • Maggiore qualità delle immagini generate: DALL·E 3 usa un modello più grande e più potente di DALL·E 2, che gli consente di produrre immagini più dettagliate e fedeli alla descrizione. Le immagini generate da DALL·E 3 hanno una risoluzione di 1024×1024 pixel, contro i 512×512 pixel di DALL·E 2.
  • Maggiore varietà delle immagini generate: DALL·E 3 è in grado di generare fino a 64 immagini diverse per ogni descrizione, mentre DALL·E 2 ne generava solo 16. Questo significa che DALL·E 3 offre più scelta e creatività agli utenti, che possono selezionare l’immagine che preferiscono o che meglio si adatta al loro scopo.
  • Maggiore flessibilità delle descrizioni: DALL·E 3 è più tollerante e capace di interpretare le descrizioni degli utenti, anche se sono vaghe, ambigue o contengono errori ortografici o grammaticali. DALL·E 3 riesce anche a gestire descrizioni più complesse e specifiche, che includono attributi, relazioni o combinazioni insolite di oggetti.
  • Maggiore interattività: DALL·E 3 offre una modalità interattiva, in cui gli utenti possono modificare la descrizione in tempo reale e vedere come cambiano le immagini generate. Questo permette di esplorare le potenzialità di DALL·E 3 e di affinare la descrizione fino a ottenere l’immagine desiderata.
  • Maggiore sicurezza: DALL·E 3 pone maggiore attenzione alla sicurezza rispetto a DALL·E 2 per prevenire la generazione di contenuti dannosi. In particolare può ignorare richieste di contenuti violenti, pornografici, razzisti o politici, oltre a richieste di immagini raffiguranti personaggi pubblici. DALL·E 2, invece, è più suscettibile alle richieste di generazione di immagini offensive o inappropriate.

Per avere un’idea dei miglioramenti generativi tra DALL·E 3 e DALL·E 2, potete osservare le seguenti immagini, generate con la stessa descrizione: “Un espressivo dipinto ad olio di un giocatore di basket che schiaccia, raffigurato come l’esplosione di una nebulosa“:

DALL·E 3 vs DALL·E 2

Come si può vedere, le immagini generate da DALL·E 3 sono più realistiche, varie e coerenti con la descrizione rispetto a quelle generate da DALL·E 2.

Il segreto del superamento di alcuni limiti precedenti e l’aumento delle prestazioni generali, è dato dalla combinazione di DALL·E 3 con un altro dei prodotti più popolari di OpenAI: ChatGPT.

DALL·E 3 e ChatGPT: la coppia perfetta

Uno dei limiti del precedente DALL·E 2 è la scrittura del testo da cui generare le immagini, che deve essere chiaro e preciso, altrimenti DALL·E potrebbe non capire bene cosa vogliamo ottenere o produrre risultati inaspettati. Ecco dove entra in gioco ChatGPT.

ChatGPT è in grado di generare automaticamente il testo con cui fare una richiesta a DALL·E 3, iniziando da poche parole chiave che indichino il tema o il soggetto dell’immagine che vogliamo creare. Per esempio, se scriviamo “fantasia medievale“, ChatGPT potrebbe generare frasi come “un drago che sputa fuoco su un castello“, “una principessa che cavalca un unicorno” o “un mago che lancia un incantesimo“. Queste frasi possono poi essere usate come input per DALL·E 3, che creerà le immagini corrispondenti.

In questo modo, ChatGPT rende l’esperienza d’uso di DALL·E 3 più facile, divertente e stimolante. Non dobbiamo più preoccuparci di scrivere il testo giusto, ma possiamo lasciarci guidare dalla creatività e dalla curiosità di ChatGPT, eliminando la necessità di affinare il testo per la generazione delle immagini. Possiamo anche combinare le parole chiave in modi diversi, per ottenere frasi e immagini sempre nuove e sorprendenti.

Quali sono i risultati di questa combinazione? Dai un’occhiata al seguente video introduttivo, pubblicato su YouTube dal canale ufficiale di OpenAI.

Conclusioni

DALL·E 3 è un generatore di immagini basato sull’intelligenza artificiale molto avanzato e divertente da usare, che supera in molti aspetti la precedente versione DALL·E 2. Con la combinazione di ChatGPT, DALL·E 3 offre un potenziale enorme per la generazione di contenuti visivi e testuali. Se volete provare anche voi a creare le vostre immagini con DALL·E 3, potete accedere al sito web ufficiale di OpenAI.

Nota: al momento della stesura di questo articolo, DALL·E 3 è in versione “research preview”, il che significa che è disponibile solo per i clienti ChatGPT Plus ed Enterprise, mentre l’utilizzo tramite API e in Labs sarà reso disponibile nel corso di questo autunno.


Se anche tu vuoi occuparti di progetti di sviluppo software
dai un’occhiata alle nostre opportunità di lavoro e conosciamoci subito!

Questo sito utilizza cookies propri e si riserva di utilizzare anche cookie di terze parti per garantire la funzionalità del sito e per tenere conto delle scelte di navigazione.
Per maggiori dettagli e sapere come negare il consenso a tutti o ad alcuni cookie è possibile consultare la Cookie Policy.

USO DEI COOKIE

Se abiliti i cookie nella tabella sottostante, ci autorizzi a memorizzare i tuoi comportamenti di utilizzo sul nostro sito web. Questo ci consente di migliorare il nostro sito web e di personalizzare le pubblicità. Se non abiliti i cookie, noi utilizzeremo solo cookies di sessione per migliorare la facilità di utilizzo.

Cookie tecnicinon richiedono il consenso, perciò vengono installati automaticamente a seguito dell’accesso al Sito.

Cookie di statisticaVengono utilizzati da terze parti, anche in forma disaggregata, per la gestione di statistiche

Cookie di social networkVengono utilizzati per la condivisione di contenuti sui social network.

Cookie di profilazione pubblicitariaVengono utilizzati per erogare pubblicità basata sugli interessi manifestati attraverso la navigazione in internet.

AltriCookie di terze parti da altri servizi di terze parti che non sono cookie di statistica, social media o pubblicitari.