Rapporto di ricerca
Applicazione dell'intelligenza artificiale nella presentazione visiva delle opere di Mór Jókai. Rapporto di ricerca sul sondaggio tramite questionario.
Petőfi Media, Laboratorio Jók.ai, aprile 2024
Realizzato da: Gréta Kocsis, Róbert Lányi, János Nagyillés, Tamás Németh, András Nyírő, István Szakadát
Sintesi esecutiva
Il presente documento fornisce un'analisi di come l'intelligenza artificiale (AI) sia in grado di reinterpretare e presentare visivamente le opere di Mór Jókai. Al centro della ricerca c'è un sondaggio a cui hanno partecipato 250 persone. I partecipanti sono stati incaricati di valutare le immagini generate dall'AI, ispirate ai testi delle opere di Jókai. Durante l'analisi, i dati sono stati suddivisi in cinque principali categorie, che esaminano lo stile visivo, la fedeltà storica, la rappresentazione dei personaggi, la realizzazione tecnologica e gli effetti emotivi ed estetici. I risultati della ricerca hanno evidenziato che l'AI offre opportunità per una reinterpretazione artistica e che il modo in cui viene implementata la tecnologia e la fedeltà artistica sono elementi chiave per un'applicazione di successo. L'obiettivo del rapporto di ricerca è quello di fornire una guida per futuri sviluppi, in cui l'AI venga utilizzata per promuovere le opere di Jókai e di altri autori classici ungheresi.
Introduzione
Il nostro obiettivo è reinterpretare e promuovere le opere di Mór Jókai attraverso l'uso dell'intelligenza artificiale. Perché consideriamo l'intelligenza artificiale importante nell'analisi del patrimonio culturale digitale ungherese? ChatGPT non è un'intelligenza umana, conosce moltissimo, ma non comprende nulla. Molti giustamente diffidano dell'intelligenza artificiale, e anche noi ne riconosciamo i pericoli. Tuttavia, vediamo in essa una nuova avventura e un'opportunità per osservare la nostra vita e il nostro patrimonio intellettuale comune da una prospettiva diversa, di un'intelligenza simile alla nostra, ma allo stesso tempo molto diversa sotto molti aspetti.
In preparazione al bicentenario di Jókai, nell'ambito del progetto, abbiamo raccolto le opere dell'autore disponibili in formato digitale, ripulito e normalizzato i testi affinché un modello di intelligenza artificiale, specificamente un sistema GPT sviluppato internamente, possa elaborarli in modo efficace. L'intelligenza artificiale ha rivelato sorprendentemente molti parallelismi tra i testi del XIX secolo e le questioni attuali. Dalle risposte di ChatGPT emerge una nuova, entusiasmante e talvolta provocatoria interpretazione di Jókai. Le analisi e i contenuti creativi forniti dall'AI sono stati arricchiti con illustrazioni visive. A tal fine, abbiamo realizzato un questionario online, e questa scrittura ne contiene l'analisi.
L'obiettivo della ricerca tramite questionario era comprendere come i lettori percepiscono le immagini generate dall'intelligenza artificiale. Eravamo particolarmente interessati a capire se questi elementi visivi possono contribuire alla trasmissione e alla promozione delle opere letterarie di Mór Jókai. Abbiamo inoltre esaminato quali stili e impostazioni i partecipanti preferiscono, e come le opinioni sulle immagini variano in base all'interesse individuale per Jókai, all'età e al livello di istruzione. I risultati della ricerca saranno utilizzati in futuro per migliorare i comandi e i prompt impiegati nella generazione delle immagini.
Tra le nostre ipotesi di ricerca vi era l'idea che ci sarebbero state differenze significative nelle preferenze dei partecipanti in base a quanto apprezzano Mór Jókai e a quanti dei suoi lavori hanno letto. Presupponevamo inoltre che i rispondenti al questionario avrebbero accolto con favore gli esperimenti visivi e l'idea di collocare i personaggi dei romanzi del XIX secolo nel contesto visivo del mondo moderno.
Al sondaggio, realizzato tramite un modulo Google, hanno partecipato complessivamente 250 persone. L'invito a compilare il questionario è stato diffuso in vari gruppi eterogenei, garantendo così la diversità dei rispondenti. Tra questi gruppi c'erano gli studenti del Collegio Benedettino di Pannonhalma e del Liceo Economico Alternativo di Budapest; gli studenti dell'Università di Pécs, raggiunti tramite il sistema Neptun; i membri di vari gruppi Facebook di studenti e docenti dell'Università di Szeged; così come i collaboratori della redazione di MPÉ, del A38 Hajó e della Appsters Mobile Content Development Ltd., i quali sono stati anch'essi invitati a partecipare al questionario.
Come parte del questionario, abbiamo presentato ai partecipanti un totale di sessanta immagini create con l'aiuto di ChatGPT. Queste immagini sono state generate in modi diversi: in alcuni casi abbiamo utilizzato direttamente le descrizioni dettagliate di personaggi e paesaggi di Mór Jókai come fonte d'ispirazione. In altri casi, i romanzi scritti da Jókai sono stati caricati nel sistema ChatGPT, dopodiché abbiamo fornito istruzioni generali per la creazione delle immagini. In certi casi, con prompt specifici, abbiamo chiesto all'intelligenza artificiale di collocare i personaggi di Jókai in un contesto moderno, reinterpretando così le opere originali. Infine, per mostrare la creatività e la varietà degli stili, abbiamo fatto creare alcune immagini in stile cubista o nello stile di Mihály Munkácsy, ampliando ulteriormente la diversità di questo esperimento visivo.
Metodologia
Durante la compilazione del questionario, abbiamo cercato di fornire ai partecipanti un numero sufficiente di immagini per una valutazione completa, pur prestando attenzione a garantire che la compilazione del questionario non richiedesse più di 20 minuti. Per trovare l'equilibrio ideale, abbiamo eseguito diversi test preliminari, chiedendo ai partecipanti di annotare quanto tempo impiegavano per completare il questionario. I risultati hanno mostrato una variazione significativa, ma alla fine siamo giunti alla conclusione che, con la presentazione di sessanta immagini, il tempo di compilazione variava mediamente tra i 20 e i 25 minuti. Sulla base di ciò, abbiamo deciso di mantenere questo numero di immagini, garantendo che i partecipanti potessero esaminare attentamente le immagini senza che il questionario risultasse eccessivamente lungo.
Il questionario, dopo aver raccolto i consueti dati demografici, ha offerto ai partecipanti la possibilità di valutare le immagini presentate su una scala da uno a cinque, dove cinque rappresentava il punteggio più alto. Inoltre, il questionario includeva un'opzione di risposta aperta, tramite la quale i partecipanti potevano esprimere dettagliatamente le loro opinioni sulle immagini. Circa cinquanta persone hanno sfruttato questa opportunità, fornendo così un feedback prezioso e articolato sull'accoglienza delle immagini.
La raccolta dei dati è stata effettuata nell'ultima settimana di marzo 2024. Per l'analisi dei dati raccolti, abbiamo utilizzato Microsoft Excel e gli strumenti statistici di ChatGPT, il che ci ha permesso di condurre un'analisi completa e accurata sia dei dati quantitativi che qualitativi. I feedback testuali sono stati valutati anche manualmente, assicurando che ogni risposta fosse esaminata, al fine di ottenere un quadro preciso delle opinioni e delle osservazioni dei partecipanti.
Risultati
La maggior parte dei partecipanti al questionario appartiene alla fascia d'età tra i 19 e i 25 anni, il che si spiega con il fatto che molti hanno risposto all'invito pubblicato nelle università di Szeged e Pécs. La fascia d'età degli studenti delle scuole superiori è rappresentata dagli studenti del Collegio Benedettino di Pannonhalma e del Liceo Economico Alternativo, entrambe scuole di alto livello educativo e non considerate nella media. La fascia d'età tra i 25 e i 40 anni è quella meno rappresentata, mentre il gruppo tra i 40 e i 50 anni ha una partecipazione sorprendentemente alta, quasi pari a quella del gruppo più giovane. La partecipazione della fascia di età superiore ai 50 anni è anch'essa bassa, il che è prevedibile per un sondaggio online. La partecipazione delle diverse fasce d'età può essere rilevante per l'interpretazione dei risultati del questionario, poiché l'età può influenzare l'affinità con la tecnologia, le abitudini di lettura e il rapporto con la letteratura.

A kitöltők túlnyomó többsége, több mint háromnegyede rendelkezik egyetemi végzettséggel, ez a korosztályos megoszlásból és a meghirdetési körből következik. A középiskolai végzettségűek jelentős kisebbségben vannak. A kérdőívet megmutattuk általános iskolai magyar tanároknak is, de azt mondták, hogy ebben a korcsoportban csak közös foglalkozás keretében lehetne kitöltetni egy ilyen kérdőívet, így ettől eltekintettünk. Mivel a tervezett Jók.ai weboldalt is az elkötelezett érdeklődőknek, és nem a legszélesebb közönségnek szánjuk, ezért ez a torzítás nem jelent problémát az eredmények értékelésében, de tudnunk kell, hogy a magasabb iskolai végzettségűek válaszai befolyásolhatják a felmérés általános eredményeit, például a komplexebb szövegek vagy képek értékelésében.

La maggior parte dei rispondenti, il 69,3%, si colloca nella fascia centrale della scala (3-4 punti), il che indica un generale apprezzamento delle opere di Jókai. Gli estremi della scala (1 e 5 punti) sono meno rappresentati, con una minoranza di partecipanti che ha dato la valutazione più alta o più bassa. Il numero più basso di risposte è stato registrato nella categoria "non mi piace", il che potrebbe suggerire che le opere di Jókai siano tra i lavori letterari più apprezzati dai partecipanti al sondaggio.

La maggior parte dei rispondenti ha letto i due romanzi più famosi di Jókai, ma è interessante notare che l'11,5% ha risposto di non aver letto nessuno dei due. Tra i due romanzi, I figli dell'uomo dal cuore di pietra è stato letto da un numero leggermente maggiore di persone, anche se la differenza non è significativa.
L'analisi di correlazione delle risposte ha mostrato che non esiste una correlazione significativa tra i dati demografici e le preferenze per i romanzi, e, ancor più sorprendente, non esiste una correlazione rilevante tra queste caratteristiche e la valutazione delle immagini. Ciò significa che il gusto personale e la cultura visiva sono più determinanti nella valutazione delle immagini rispetto agli altri fattori esaminati nel questionario.

Le immagini che hanno ricevuto il maggior numero di voti sono quelle realizzate in uno stile fedele all'epoca, con il numero dei voti indicato nell'angolo in basso a destra delle immagini. Queste opere sono caratterizzate dai tratti del realismo romantico, che si manifesta in una rappresentazione idealizzata ma ricca di dettagli della bellezza della natura. Le composizioni seguono un layout classico, enfatizzando la prospettiva e la profondità nello stile dei paesaggisti ungheresi del XIX secolo. La tavolozza dei colori è ricca di tonalità calde, con sfumature dorate e autunnali, che creano un effetto drammatico. Il gioco di luci e ombre del crepuscolo conferisce alle immagini un carattere profondo e atmosferico, accentuando l'effetto tridimensionale. La tecnica è raffinata, precisa e realistica, con dettagli accuratamente elaborati.
A képek elkészítéséhez használt ChatGPT utasítások részletesek voltak, és szorosan kapcsolódtak a regény szövegéhez. Például a jobb alsó képet a következő promptra készítette el a ChatGPT: “Jókai Mór ‘Az arany ember’ című regényében Brazovics Athanáz házát így írja le: egy ódon úri butorzatú szobáról van szó, amely jobb oldalról állótükörrel és toilette-asztallal, balról himző-asztallal és kanapéval rendelkezik. A falakon 1816-os divat szerinti olajfestmény arcképek díszlenek. A szobában található egy szárnyajtó hátul, valamint jobbról és balról oldalajtók. Egy üvegcsillár csüng le a padmalyról, amely további eleganciát kölcsönöz a térnek. Alkoss képet erről a házról, egy jellegzetes Osztrák-Magyar Monarchia-beli város főutcáján ábrázolva a házat a 19. századi első felében.”

Anche i ritratti che riflettono l'atmosfera dell'epoca hanno ricevuto valutazioni elevate. I quattro ritratti mostrati come esempio sono ricchi di dettagli e creano un effetto fotorealistico. La tavolozza dei colori si basa su toni caldi e naturali, dal beige al marrone, dal blu al grigio, suggerendo un senso di atemporalità. Il loro stile è classico e richiama la ritrattistica del XIX secolo. Nelle composizioni, la figura umana è l'elemento centrale, con una forte enfasi sul linguaggio del corpo. I temi delle quattro immagini esprimono rispetto per il passato e le tradizioni, rafforzato dall'abbigliamento classico e dall'ambiente storico, trasmettendo un senso di atemporalità e dignità.
Le istruzioni per la creazione delle immagini hanno seguito le descrizioni dei personaggi del romanzo anche in questi casi. Ad esempio, per la terza immagine abbiamo utilizzato questo prompt: "Descrivi il personaggio di Euthym Trikalisz nel romanzo e il suo aspetto fisico. Poi crea un ritratto di lui nello stile tipico del XIX secolo, tenendo presente che Euthym ha tra i 60 e i 70 anni ed è di origine turca."

A kérdőív kitöltői alacsonyabb pontszámokat adtak azoknak a képeknek, ahol eltértünk a 19. századi vizuális világtól. Ezeken a képeken keverednek a fikciós, szürreális és a realisztikus, történelmi elemek. A színpaletta élénk, kontrasztos és gazdag, a kékek, vörösek és zöldek dominanciájával, ami dinamikussá teszi a képeket. Mindegyik kép erőteljes vizuális narratívával rendelkezik. A történelmi és modern elemek egyaránt jelen vannak és kölcsönhatásban vannak egymással. Az ábrázolások a valóság és a képzelet határait feszegetik. A promptokban elszakadtunk Jókai regényeinek világától, például a 4. képhez ezt az utasítást adtuk: “Készítsd el kubista stílusban a Senki szigetének képét.”

Le immagini che hanno ricevuto i punteggi più bassi sono quelle in cui abbiamo lasciato la maggiore libertà a ChatGPT. La tavolozza dei colori in ogni immagine è vivace e satura, mettendo in risalto ogni dettaglio e creando un'atmosfera fiabesca, quasi magica. Lo stile di rappresentazione è simile: espressioni facciali e linguaggio del corpo realistici che servono a trasmettere la personalità dei personaggi, mentre li collocano in un mondo idealizzato, spesso fantasioso. La realtà viene presentata in una forma esagerata e idealizzata. Queste immagini conducono in un mondo fantastico e idealizzato, dove il colore, la luce e la ricchezza dei dettagli sono prominenti, e dove la bellezza naturale è mostrata in una forma idealizzata. I personaggi e i paesaggi al centro dell'attenzione rafforzano ulteriormente questa visione magica e perfezionata del mondo. Ad esempio, per la prima immagine abbiamo fornito a ChatGPT la seguente descrizione: "Mostra un'immagine naturale bellissima, colorata e realistica, che evochi l'atmosfera di questa citazione: 'Ci sono molti problemi nel mondo che una persona vorrebbe risolvere, se solo potesse. Un povero uomo come me sospira profondamente e dice: cosa posso farci?'"
Nel questionario, i partecipanti avevano la possibilità di fornire feedback testuali sulle immagini. Abbiamo suddiviso le valutazioni in cinque categorie, che ci hanno permesso di analizzare più approfonditamente le reazioni e le opinioni dei partecipanti riguardo alle immagini generate dall'intelligenza artificiale. La prima categoria è lo stile visivo e la realizzazione artistica, dove i commenti positivi lodavano la ricchezza di dettagli e l'uso dei colori, mentre le critiche negative sottolineavano l'incoerenza stilistica e l'errata applicazione delle correnti artistiche. La seconda categoria riguarda la fedeltà storica e culturale, che valutava la precisione storica delle immagini e la loro conformità all'epoca rappresentata; anche in questo caso, le opinioni si sono divise tra rappresentazioni fedeli e anacronistiche.
La terza categoria riguarda la rappresentazione dei personaggi e la fedeltà al tema, particolarmente importante nel contesto delle opere di Mór Jókai. In questa categoria, i partecipanti hanno apprezzato le immagini che rappresentavano fedelmente i personaggi di Jókai e che riflettevano l'atmosfera dei romanzi. Tuttavia, sono emerse anche osservazioni negative riguardanti le discrepanze rispetto alle aspettative legate ai personaggi. Le quarta e quinta categorie, che esaminavano la realizzazione tecnologica e gli effetti emotivi ed estetici, hanno mostrato differenze significative. In queste categorie, i partecipanti hanno valutato positivamente la capacità dell'AI di adottare approcci creativi, mentre le critiche si sono spesso concentrate sulle immagini create dall'AI che risultavano stereotipate e prive di emozioni. A titolo di esempio, ecco un'immagine che ha ricevuto un numero relativamente alto di commenti.
Questa immagine ha ricevuto un punteggio elevato, con 926 punti, risultando una delle più apprezzate nel questionario. Per realizzarla, abbiamo utilizzato il seguente prompt: “Crea un'illustrazione per questa scena del romanzo – l'ambientazione deve essere del XIX secolo e la scena si svolge su una nave fluviale che trasporta grano. Il testo: 'La mattina, quando Timéa si svegliò, non sentiva più nulla della malattia passata. La giovane natura aveva trionfato...'”

Non corrisponde alla nostra immagine di Jókai.
- Troppo bello, non realistico.
- Il disegno è un po' troppo moderno, secondo me le condizioni in Ungheria nel XIX secolo erano più modeste.
- Questo dovrebbe essere una nave mercantile.
- Sicuramente ricordo male il romanzo, ma secondo me non c'è una scena del genere, e questo disegno non riesce affatto a catturare l'atmosfera del romanzo.
- Non riflette il mondo del romanzo. Timéa è una ragazza turca, non indosserebbe un abito del genere.
- Se è destinato a un pubblico più anziano, va bene, ma per i giovani credo che ci sia troppo grigio e marrone nei toni.
Le riserve sull'intelligenza artificiale
- Lo stile da cartone animato nasconde l'AI, rendendola meno evidente.
- Troppo fiabesco.
- Molto americanizzato, mi fa pensare più a un'opera di Mark Twain che a una di Jókai.
- Kitsch di pessima qualità!
- Privo di creatività, disumano, senz'anima. Solo persone che non hanno alcun rispetto per la cultura visiva possono creare o apprezzare qualcosa del genere.
Valutazioni positive
- Mi piace lo stile.
- Il pittore ha prestato attenzione a ogni minimo dettaglio.
- Ci sono un po' troppi toni di grigio... comunque, l'illustrazione è bella.
- È volutamente interessante che si discosti completamente dal film classico.
- I colori e la prospettiva sono buoni.
- Si adatta molto bene allo stile.
Abbiamo allegato il testo completo dei commenti alle immagini al rapporto di ricerca.
Conclusioni
L'obiettivo della ricerca era esaminare come i partecipanti reagissero alle immagini generate dall'intelligenza artificiale basate sui romanzi di Mór Jókai. I risultati indicano che la maggior parte dei partecipanti ha valutato positivamente le immagini che rimanevano fedeli allo stile visivo e ai temi dell'epoca di Jókai. I paesaggi caratterizzati dai tratti del realismo romantico e i ritratti d'epoca hanno ottenuto punteggi elevati, poiché riflettevano in modo autentico l'atmosfera dei romanzi di Jókai e le caratteristiche distintive dei suoi personaggi.
I partecipanti hanno generalmente dato valutazioni più basse alle immagini che si discostavano in modo significativo dallo stile del XIX secolo. Le immagini contenenti elementi moderni o astratti, come le illustrazioni in stile cubista, hanno ricevuto punteggi inferiori, poiché spesso non rispecchiavano fedelmente lo spirito delle opere di Jókai. Queste immagini sperimentali sono state considerate più controverse e si è ritenuto che non si adattassero bene al contesto storico e culturale creato da Jókai.
La ricerca ha anche evidenziato che le preferenze dei partecipanti non mostravano differenze significative in base all'età, al livello di istruzione o alla familiarità con le opere di Jókai. Questo suggerisce che la sensibilità verso gli stili visivi e gli approcci artistici è più generale e non legata all'età o al livello di istruzione. Tra i rispondenti, è emerso un rispetto diffuso per le opere di Jókai, il che ha influenzato positivamente la ricezione delle immagini.
Le immagini dettagliate e strettamente legate alla storia, che si basavano su scene specifiche dei romanzi o su descrizioni dei personaggi, sono state generalmente meglio accolte. Nell'uso delle immagini generate dall'intelligenza artificiale, è fondamentale tenere conto delle preferenze visive del pubblico di riferimento e della fedeltà storica. Nel caso delle opere di Jókai, è particolarmente importante che lo stile e il tono delle immagini siano coerenti con l'universo dei romanzi, poiché questo può contribuire a una comprensione più profonda e alla promozione delle opere.