Kutatási jelentés
Mesterséges intelligencia alkalmazása Jókai Mór műveinek vizuális bemutatásában. Kutatási jelentés a kérdőíves felmérésről.
Petőfi Media, Jók.ai Labor, 2024. április
Készítette: Kocsis Gréta, Lányi Róbert, Nagyillés János, Németh Tamás, Nyírő András, Szakadát István
Vezetői összefoglaló
A jelen dokumentum elemzést ad arról, hogy Jókai Mór műveit miként képes újraértelmezni és vizuálisan bemutatni a mesterséges intelligencia (AI). A kutatás középpontjában egy kérdőíves felmérés áll, amelyben 250-en vettek részt. A kitöltők feladata az volt, hogy értékeljék az AI által generált képeket, amelyek Jókai műveinek szövegeiből merítettek inspirációt. Az elemzés során az adatokból öt fő kategóriát különítettünk el, amelyek a vizuális stílust, történelmi hűséget, karakterábrázolást, technológiai megvalósítást, valamint az érzelmi és esztétikai hatásokat vizsgálták. A kutatás eredményei rámutattak arra, hogy az AI lehetőségeket nyújt a művészeti újraértelmezésre, és a technológiai implementáció módja és a művészeti hűség kulcsfontosságúak a sikeres alkalmazáshoz. A kutatási jelentés célja, hogy irányt mutasson a további fejlesztésekhez, amelyek során az AI-t Jókai és más klasszikus magyar szerzők műveinek népszerűsítésére használjuk.
Bevezetés
Célunk, hogy a mesterséges intelligencia segítségével újraértelmezzük és népszerűsítsük Jókai Mór műveit. Miért tartjuk fontosnak a mesterséges intelligenciát a magyar digitális kulturális adatvagyon elemzésében? A ChatGPT nem emberi intelligencia, nagyon sokat tud, de semmit nem ért. Sokan joggal idegenkednek a mesterséges intelligenciától, mi is látjuk a veszélyeit. De új kalandot látunk benne, és új lehetőséget arra, hogy egy, a miénkhez hasonló, de mégis sok mindenben különböző intelligencia szemszögéből nézzünk rá az életünkre, a közös szellemi örökségünkre.
Jókai bicentenáriumára készülve a projekt keretében összegyűjtöttük a szerző digitális formában elérhető műveit, a szövegeket megtisztítottuk és normalizáltuk: így egy mesterséges intelligencia-modell, konkrétan egy saját fejlesztésű GPT-alapú rendszer hatékonyan tudja feldolgozni. Az AI meglepően sok párhuzamot tárt fel a 19. századi szöveg és napjaink aktuális kérdései között. Új, izgalmas, helyenként provokatív Jókai-olvasat tárul elénk a ChatGPT válaszaiból. Az AI által nyújtott elemzéseket és kreatív tartalmakat képi illusztrációkkal is kiegészítettük. Ehhez készítettünk online kérdőívet: ennek az elemzését tartalmazza ez az írás.
A kérdőíves kutatás célkitűzése az volt, hogy megértsük, miként fogadják az olvasók a mesterséges intelligencia által generált képeket. Főleg arra voltunk kíváncsiak, hogy ezek a vizuális elemek hozzájárulhatnak-e Jókai Mór irodalmi műveinek közvetítéséhez és népszerűsítéséhez. Azt is vizsgáltuk, hogy a résztvevők milyen stílusokat, beállításokat részesítenek előnyben, valamint hogy a képekkel kapcsolatos vélemények hogyan változnak a Jókai iránti érdeklődés egyéni mintázata, az életkor és a végzettség függvényében. A kutatás eredményeit a továbbiakban a képalkotáshoz adott parancsok, promptok alakításában tervezzük felhasználni.
A kutatási hipotéziseink között szerepelt az a feltevés, hogy jelentős eltérések lesznek a résztvevők preferenciáiban attól függően, hogy mennyire kedvelik Jókai Mórt és hány művét olvasták. Azt is feltételeztük, hogy a kérdőív kitöltői örömmel fogadják a vizuális kísérleteket, és azt, ha a modern kor vizuális világába helyezzük a 19. századi regényalakokat.
A felmérésben, amelyet egy Google-kérdőív segítségével hajtottunk végre, összesen 250 fő vett részt. A kérdőív kitöltésére való felhívást számos, egymástól eltérő csoportban tettük közzé, így biztosítva a válaszadók sokszínűségét. E csoportok közé tartoztak a Pannonhalmi Bencés Gimnázium és a budapesti Alternatív Közgazdasági Gimnázium diákjai; a Pécsi Tudományegyetem hallgatói, akiket a Neptun-rendszeren keresztül értünk el; a Szegedi Tudományegyetem különböző hallgatói és oktatói Facebook-csoportjainak tagjai; valamint az MPÉ szerkesztőségének munkatársai, az A38 hajó és az Appsters Mobil Tartalomfejlesztő Kft. munkatársai, akiket szintén megkértünk a kérdőív kitöltésére.
A kérdőív részeként összesen hatvan képet mutattunk be a résztvevőknek, amelyeket a ChatGPT segítségével hoztunk létre. Ezek a képek különböző módon születtek: egyeseknél közvetlenül Jókai Mór részletes személy- és tájleírásait használtuk fel mint az inspiráció forrását. Más képek esetében a Jókai által írt regények szolgáltak alapul, amelyeket feltöltöttünk a ChatGPT rendszerébe, majd általános utasításokat adtunk meg a képek létrehozásához. Bizonyos esetekben specifikus promptokkal arra kértük a mesterséges intelligenciát, hogy helyezze Jókai karaktereit modern környezetbe, így újraértelmezve az eredeti műveket. Végül, a kreativitás és a stílusok sokféleségének bemutatására, néhány képet kubista stílusban vagy Munkácsy Mihály stílusában is készíttettünk, tovább bővítve ezzel a vizuális kísérlet sokszínűségét.
Módszertan
A kérdőív összeállításakor arra törekedtünk, hogy a résztvevők számára elegendő számú képet biztosítsunk az átfogó értékelés érdekében, ugyanakkor figyelemmel kellett lennünk arra is, hogy a kérdőív kitöltése ne vegyen igénybe többet, mint maximálisan 20 percet. Az ideális egyensúly megtalálása érdekében több próbakitöltést végeztünk, ahol a résztvevőket arra kértük, hogy jegyezzék fel, mennyi időt töltöttek a kérdőív kitöltésével. Az eredmények jelentős szórást mutattak, de végül arra a következtetésre jutottunk, hogy hatvan kép bemutatása esetén a kitöltési idő átlagosan 20-25 perc között mozgott. Ennek alapján döntöttünk úgy, hogy ezt a képszámot tartjuk meg, biztosítva ezzel, hogy a résztvevők alaposan megvizsgálhassák a képeket, anélkül, hogy a kérdőív túlzottan hosszúra nyúlna.
A kérdőív a szokásos demográfiai adatok felvételét követően lehetőséget adott a résztvevőknek, hogy a bemutatott képeket egytől ötig terjedő skálán értékeljék, ahol az ötös érték jelentette a legmagasabb pontszámot. Emellett a kérdőívben helyet kapott egy nyitott válaszlehetőség is: ennek révén a kitöltők részletesen kifejthették véleményüket a képekről. Ezt a lehetőséget közel ötvenen használták ki, így értékes és sokrétű visszajelzést szolgáltatva a képek fogadtatásáról.
Az adatgyűjtést 2024 márciusának utolsó hetében hajtottuk végre. Az összegyűjtött adatok elemzésére Microsoft Excelt és a ChatGPT statisztikai eszközrendszerét alkalmaztuk, így átfogó és pontos elemzést végezhettünk a kvantitatív és kvalitatív adatokon. A szöveges visszajelzéseket manuálisan is kiértékeltük, így biztosítva, hogy minden választ elemezzünk, és ennek révén pontos képet kaphassunk a résztvevők véleményéről és észrevételeiről.
Eredmények
A kérdőív kitöltőinek legnagyobb részét a 19-25 éves korosztály adja, ami azzal magyarázható, hogy a szegedi és a pécsi egyetemen közzétett felhívásra sokan válaszoltak. A gimnazista korosztályt a Pannonhalmi Bencés Gimnázium és az Alternatív Közgazdasági Gimnázium tanulói képviselik. Mindkét iskola erős oktatási színvonalat képvisel, nem tekinthető átlagosnak. A 25-40 éves korosztály képviselteti magát a legkisebb létszámban, míg a 40-50 éves csoport aránya meglepően magas, majdnem akkora, mint a legfiatalabb korosztályé. A 50 feletti korcsoport szintén alacsony részvételt mutat, ami szintén várható egy online felmérés esetében. A különböző korcsoportok részvétele fontos lehet a kérdőív eredményeinek értelmezésekor, mivel a kor befolyásolhatja a technológiai affinitást, az olvasási szokásokat és az irodalomhoz való viszonyt.

A kitöltők túlnyomó többsége, több mint háromnegyede rendelkezik egyetemi végzettséggel, ez a korosztályos megoszlásból és a meghirdetési körből következik. A középiskolai végzettségűek jelentős kisebbségben vannak. A kérdőívet megmutattuk általános iskolai magyar tanároknak is, de azt mondták, hogy ebben a korcsoportban csak közös foglalkozás keretében lehetne kitöltetni egy ilyen kérdőívet, így ettől eltekintettünk. Mivel a tervezett Jók.ai weboldalt is az elkötelezett érdeklődőknek, és nem a legszélesebb közönségnek szánjuk, ezért ez a torzítás nem jelent problémát az eredmények értékelésében, de tudnunk kell, hogy a magasabb iskolai végzettségűek válaszai befolyásolhatják a felmérés általános eredményeit, például a komplexebb szövegek vagy képek értékelésében.

A válaszadók többsége, 69.3%-a, a skála közepén helyezkedik el (3-4 pont), ami azt jelzi, hogy általánosságban kedvelik Jókai műveit. A két szélső véglet (1 és 5 pont) kevésbé jellemző, a válaszadók kisebb része adta a legmagasabb és a legalacsonyabb értékelést. A legkevesebben a „nem szeretem” kategóriát választották, ami arra utalhat, hogy Jókai művei a legkedveltebb irodalmi munkák közé tartoznak a megkérdezettek körében.

A válaszadók többsége olvasta Jókai két leghíresebb regényét, de az is érdekes, hogy 11,5% azt válaszolta, hogy egyiket sem olvasta. A két regény közül A kőszívű ember fiait olvasták többen, de a különbség nem jelentős.
A válaszok korrelációanalízise azt mutatta, hogy nincs érdemi összefüggés a demográfiai adatok és a regénypreferenciák között, és ami még meglepőbb, nincs jelentős korrelációs kapcsolat a fenti jellemzők és a képek értékelése között sem. Ez azt jelenti, hogy az egyéni ízlés, és a vizuális kultúra meghatározóbb a képek értékelésében, mint az egyéb, a kérdőívben vizsgált tényezők.

A legtöbb szavazatot a korhű stílusban készült tájképek kapták, a szavazatok számát a képek jobb alsó sarkában tüntettük fel. Ezeket a képeket a romantikus realizmus jegyei jellemzik, ami a természet szépségének idealizált, mégis részletgazdag megjelenítésében nyilvánul meg. A kompozíciók klasszikus elrendezést követnek, hangsúlyozva a perspektívát és mélységet a 19. századi magyar tájképfestők stílusában. A színvilág meleg árnyalatokban gazdag, aranyos és őszi tónusokkal, ez drámai hatást kelt. Az alkonyi fények és az árnyékok játéka mély, atmoszférikus jelleget és térhatást ad a képeknek. A technika finom, pontos és realisztikus, részletek kidolgozottak.
A képek elkészítéséhez használt ChatGPT utasítások részletesek voltak, és szorosan kapcsolódtak a regény szövegéhez. Például a jobb alsó képet a következő promptra készítette el a ChatGPT: “Jókai Mór ‘Az arany ember’ című regényében Brazovics Athanáz házát így írja le: egy ódon úri butorzatú szobáról van szó, amely jobb oldalról állótükörrel és toilette-asztallal, balról himző-asztallal és kanapéval rendelkezik. A falakon 1816-os divat szerinti olajfestmény arcképek díszlenek. A szobában található egy szárnyajtó hátul, valamint jobbról és balról oldalajtók. Egy üvegcsillár csüng le a padmalyról, amely további eleganciát kölcsönöz a térnek. Alkoss képet erről a házról, egy jellegzetes Osztrák-Magyar Monarchia-beli város főutcáján ábrázolva a házat a 19. századi első felében.”

Ugyancsak magas értékelést kaptak azok a portrék, amik a kor hangulatát tükrözik. A példaként bemutatott négy portré részletgazdag és fotorealisztikus hatást kelt. A színpaletta meleg és természetes tónusokra épül, a bézstől a barnán át a kékig és a szürkéig, ami egyfajta időtlenséget sugall. A stílusuk klasszikus, a XIX. századi portréfestészetet idézi. A kompozíciókban az emberi alak a központi elem, a testbeszéd hangsúlyos. A négy kép témájában a múlt és a hagyományok iránti tisztelet jelenik meg, amit a klasszikus öltözék és a korabeli környezet tovább erősít, időtlenséget és méltóságot közvetít.
A képalkotásra készült promptok ezeknél a képeknél is követték a regény személyleírásait. Például a harmadik képhez ezt használtuk: “Jellemezd a regénybeli Euthym Trikalisz karakterét és írd le külsejét is. Ezután készíts róla portrét a 19. századra jellemző modorban, légy tekintettel arra, hogy Euthym 60-70 éves és török származású.”

A kérdőív kitöltői alacsonyabb pontszámokat adtak azoknak a képeknek, ahol eltértünk a 19. századi vizuális világtól. Ezeken a képeken keverednek a fikciós, szürreális és a realisztikus, történelmi elemek. A színpaletta élénk, kontrasztos és gazdag, a kékek, vörösek és zöldek dominanciájával, ami dinamikussá teszi a képeket. Mindegyik kép erőteljes vizuális narratívával rendelkezik. A történelmi és modern elemek egyaránt jelen vannak és kölcsönhatásban vannak egymással. Az ábrázolások a valóság és a képzelet határait feszegetik. A promptokban elszakadtunk Jókai regényeinek világától, például a 4. képhez ezt az utasítást adtuk: “Készítsd el kubista stílusban a Senki szigetének képét.”

A legalacsonyabb pontszámokat azok a képek kapták, ahol a legnagyobb szabadságot hagytuk a ChatGPT-nek. A színpaletta minden képnél élénk és telített, ami a képek minden részletét kiemeli, és mesés, szinte varázslatos hangulatot teremt. Az ábrázolás stílusa is hasonló: realisztikus arckifejezések és testbeszédek, amelyek a karakterek személyiségének érzékeltetésére szolgálnak, miközben egy idealizált, gyakran fantáziadús világba helyezik őket. A valóságot túlzásba vitt, idealizált formában mutatják be. Ezek a képek egy fantasztikus, idealizált világba vezetnek, ahol a szín, a fény és a részletesség kiemelkedő, és ahol a természetes szépséget idealizált formában mutatják be. A figyelem középpontjában álló karakterek és tájképek tovább erősítik ezt a varázslatos és tökéletesített világképet. Például az első képhez ezt a leírást adtuk meg a ChatGPT-nek: “Mutass egy gyönyörű, színes, realisztikus természeti képet, ami megidézi ennek az idézetnek a hangulatát: ‘Sok baj van a világon, amin az ember ugy szeretne segiteni, ha tudna. Magamforma szegény ember nagyot sóhajt rá, s azt mondja: mit tehetek róla?’”
A kérdőívben lehetőség volt arra, hogy szöveges visszajelzést is adjanak a kitöltők a képkhez. Az értékeléseket öt kategóriába soroltuk, amelyek segítségével mélyrehatóbban elemezhettük a résztvevők reakcióit és véleményét a mesterséges intelligencia által generált képekkel kapcsolatban. Az első kategória a vizuális stílus és művészeti kivitelezés, ahol a pozitív hozzászólások dicsérték a részletgazdag ábrázolást és színhasználatot, míg a negatív kritikák a képek stílusidegenségét és a művészeti irányzatok helytelen alkalmazását emelték ki. A második kategória a történelmi és kulturális hűség, amely a képek történelmi pontosságát és a korszakhoz való illeszkedést értékelte, itt is megoszlottak a vélemények a hűséges és anachronisztikus megjelenítések mentén.
A harmadik kategória a karakterábrázolás és témahűség, amely különösen fontos volt a Jókai Mór művek kontextusában. Itt a résztvevők elismerését váltották ki azok a képek, amelyek hitelesen ábrázolták Jókai karaktereit és tükrözték a regények atmoszféráját. Ugyanakkor, negatív észrevételek is érkeztek, amelyek a karakterekkel kapcsolatos elvárásoktól való eltéréseket kifogásolták. A negyedik és ötödik kategóriák, amelyek a technológiai megvalósítást és az érzelmi, esztétikai hatásokat vizsgálták, szintén jelentős eltéréseket mutattak. Ezekben a kategóriákban a résztvevők pozitívan értékelték az AI képességét a kreatív megközelítésekre, míg kritikáik gyakran az AI által létrehozott sablonos és érzelemmentes képekkel kapcsolatosak voltak. Példaként álljon itt egy olyan kép, amihez viszonylag sok észrevételt fűztek.
Ez a kép magas pontszámot kapott, 926 ponttal az egyik legjobbra értékelt kép volt a kérdőívben. Az elkészítéséhez ezt a promptot használtuk: “Készíts illusztrációt ehhez a regényjelenethez – a környezet legyen 19. századi, a jelenet egy gabonaszállító folyami hajón zajlik. A szöveg: ‘Reggel, mikor Timéa felébredt, nem érzett az elmúlt betegségből semmit. Az ifjú természet győzelmes maradt…’”

Nem felel meg a Jókai-képünknek
- Túl szép, nem reális
- Kicsit túl modern a rajz, szerintem a xix. sz Mo-on ennél szegényesebb körülmények voltak.
- Ez elvileg egy kereskedelmi hajó
- Biztosan én nem emlékszem jól a regényre, de sztem nincs ilyen jelenet benne, és számomra a regény hangulatát egyáltalán nem kapta el ez a rajz.
- Nem tükrözi a regény világát. Tímea török lány, nem ilyen ruhát visel.
- Ha idősebb célcsoportnak szánják, akkor jó, de fiataloknak szerintem nagyon sok a szürke és a barna tónus.
Az AI-val kapcsolatos fenttartások
- A rajzfilmes stílus elrejti az ai-t nem annyira feltűnő.
- Túlságosan mese szerű
- Nagyon amerikaias, előbb gondolnék Mark Twain művére, mint Jókaiéra.
- Giccses szar!
- Kreatívtalan, emberségtelen, lélektelen. Kizárólag olyan emberek művelnek ilyet/tetszik nekik, akik magasról tesznek a vizuális kultúrára.
Pozitív értékelések
- Tetszik a stílus
- Minden apró részletre figyelt a festő.
- Kicsit sok a szürke árnyalata… egyébként szép az illusztráció.
- Direkt érdekes, hogy teljesen eltèr a klasszikus filmtôl
- Jók a színek, s a perspektíva.
- Stílusban nagyon illik
A képekhez fűzött megjegyzések teljes szövegét mellékeltük a kutatási jelentéshez.
Következtetések
A kutatás célja az volt, hogy megvizsgáljuk, hogyan fogadják a résztvevők azokat a képeket, amiket Jókai Mór regényei alapján a mesterséges intelligencia generált. Az eredmények szerint a résztvevők többsége pozitívan értékelte azokat képeket, amik hűek maradtak Jókai korának vizuális stílusához és témáihoz. A klasszikus, romantikus realizmus jegyeit viselő tájképek és a korabeli portrék magas pontszámokat kaptak, melyek Jókai regényeinek atmoszféráját és szereplőinek jellegzetességeit tükrözték hitelesen.
A résztvevők általában kevésbé értékelték azokat a képeket, amelyek jelentősen eltértek a 19. századi stílustól. A modern vagy absztrakt elemeket tartalmazó képek, mint például a kubista stílusban készült illusztrációk, alacsonyabb pontszámokat kaptak, mivel ezek a képek gyakran nem tükrözték hűen Jókai műveinek szellemiségét. Az ilyen kísérletező jellegű képeket inkább ellentmondásosnak tartották, és úgy találták, hogy nem illeszkedtek jól a Jókai által megteremtett történelmi és kulturális kontextushoz.
A kutatás azt is kimutatta, hogy a résztvevők preferenciái nem mutattak jelentős különbségeket az életkor, az iskolai végzettség vagy a Jókai-művek ismeretének függvényében. Ez arra utal, hogy a vizuális stílusok és a művészeti megközelítések iránti érzékenység általánosabb, és nem korhoz vagy műveltségi szinthez kötött. A válaszadók körében általánosan magas volt a művek iránti tisztelet, ami pozitívan befolyásolta a képek fogadását.
A részletesen kidolgozott, történethez szorosan kapcsolódó képek, amelyek a regények specifikus jeleneteit vagy szereplőleírásait használták fel, általában jobb fogadtatásra találtak. A mesterséges intelligencia által generált képek alkalmazásánál fontos figyelembe venni a célcsoport vizuális preferenciáit és a történelmi hűséget. A Jókai művekhez készült képek esetében különösen fontos, hogy a képek stílusa és hangvétele összhangban legyen a regények világával, ami hozzájárulhat a művek mélyebb megértéséhez és népszerűsítéséhez.