Képes-e olyan festményt készíteni egy gép, amiről azt hisszük, emberi kéz munkája? Egy friss eset új fejezetet nyitott a mesterséges intelligenciák fejlődésében, a jövő pedig már a kapunkon dörömböl. Marcus du Sautoy matematikus A kreativitás kódja - Hogyan tanul a mesterséges intelligencia írni, festeni, gondolkodni című könyvében azt vizsgáltja, hogyan tanítható a gép arra, hogy önállóan kreatívvá váljon. És miközben du Sautoy az algoritmusok természetéről ír olvasmányosan, valójában egy ősi emberi kód kiáradásáról is beszél: arról, hogy mi a művészet az emberi faj számára. (A könyvbe itt beleolvashatsz.)
Szeptember elején nagy port kavart az amerikai művészvilágban, hogy egy mesterséges intelligencia (MI) által készített fotó nyerte meg az egyik díjat Colorado állam éves vásárán. A pályázó Jason M. Allen volt, a Théâtre D’opéra Spatial (Űroperaszínház) című képet viszont a Midjourney nevű program készítette, és ez lett az első MI-generálta alkotás, ami ilyen díjat nyert:
A művészek felháborodására Jason M. Allen azzal reagált, hogy nem kér bocsánatot, hiszen nem szegett meg szabályt, ráadásul a képet „Jason M. Allen via Midjourney” néven küldte be a versenyre. Az eset valójában nem a szabályzatnak való megfelelésről szól, hanem sokkal régebbi kérdésekről - azaz végső soron arról, hogy mi a művészet? Mit tekintünk művészetnek? A MI által generált kép az-e, ha magát a programot is ember kódolta, és a képhez szükséges adatokat is egy ember adta meg a programnak - és ilyenformán az MI csak egy újabb művészeti eszköz, ami a fotóhoz és a filmhez hasonlóan végül megtalálja majd a helyét az alkotási módok panteonjában? Vagy a gép, a mesterséges intelligencia embertelensége elvesz valamit az alkotás aktusából, ami fundamentálisan része lenne a művészi folyamatnak?
A művészet nem az emberi kód kiáradása?
Ez utóbbi kérdést már Marcus du Sautoy matematikus, A prímszámok zenéje szerzője teszi fel A kreativitás kódja - Hogyan tanul a mesterséges intelligencia írni, festeni, gondolkodni című könyvében. Du Sautoy azon matematikusok közé tartozik, akik a laikusok és az inkább humán érdeklődésű olvasók számára is képesek élvezetesen és érthetően mesélni a szakterületüket érintő témákról. A kreativitás kódja pedig, akár egy jó sci-fi regény, miközben lépésről lépésre végigveszi, hogyan tanítható és tanul a MI, valójában rólunk, az emberről (is) beszél.
Képes-e szimfóniát szerezni, díjnyertes regényt írni vagy remekművet festeni a számítógép? És ha igen, vajon felismerjük-e majd, hogy nem ember, hanem egy gép alkotásáról van szó? Olvass bele!
Folyamatos vita van például arról a társadalmainkban, hogy a művészet afféle úri huncutság-e, ami annak a tünete, hogy alapvetően jól mennek a dolgok, hiszen van idő és energia a létfenntartáshoz szükségtelen alkotó tevékenységgel foglalkozni. Mások úgy vélik, hogy a művészeti tevékenységünk a fajunk elemi jellemzője, ami még annál is korábban megmutatkozott, mint azt a kutatók sokáig vélték. Du Sautoy olyan friss regészeti eredményekkel érvel az utóbbi mellett, amik szerint az első művész dicsőségét a Homo sapiensnek át kell adnia a neandervölgyi emberrel közös ősünknek, a Homo erectusnak. A spanyol barlangokban talált festmények közül néhány ugyanis több mint 65 ezer éves. Du Sautoy szerint abban az őspillanatban megtettünk egy fontos evolúciós lépést:
“egy faj a puszta hasznosságon túli szándékkal jeleket alkot.”
És mi a helyzet a számítógépes alkotással? Du Sautoy szerint a művészet végső soron az emberi szabad akarat kinyilvánítása, “és amíg a számítógépeknek nem lesz önálló, szabad akaratuk, addig az általuk létrehozott művészet mindig visszavezethető lesz az emberi teremtésvágyra”. Du Sautoy könyve eredetileg 2019-es, és itt voltaképp azt fogalmazza meg, amire Jason M. Allen is hivatkozott a coloradói versenyen, azaz hogy ő adta meg a szavakat a programnak, amiből az létrehozta a képet (azt nem árulta el, mi volt ez a szókapcsolat). Ahogy a 24.hu cikke is kiemeli, képalkotó mesterséges intelligenciák már régóta léteznek, a coloradói díj azért fordulópont, mert az olyan, idén megjelent programok, mint a DALL-E 2 vagy a Midjourney képeinek minősége már emberi léptékkel mérhető.
Du Sautoy-t az foglalkoztatta, hogy el lehet-e juttatni az MI-t nemhogy erre a minőségi szintre, hanem ezen túl is, és hogy mik azok a fejlesztési-tanítási lépések és eredmények, amiket már most is ismerünk. A Midjourney szimbolikus erejű sikere így nem teszi elavulttá a könyvet, sőt, a könyv segíthet megérteni az algoritmusokat, azt a tanulási folyamatot, ami lehetővé tette ezt a sikert - és visszahathat arra is, hogy megértsük, mi magunk hogyan tanulunk. Hogyan fejezzük ki magunkat, és hogyan kommunikálunk a művészeten keresztül.
A mesterséges intelligencia tanulására hagyományosan a Deep Blue sakkprogram 1997-es sikerét szokták felhozni, amikor megverte az emberi faj legnagyobb sakkmesterét, Garri Kaszparovot. Du Sautoy szerint viszont egy másik játékra fejlesztett program sokkal mérvadóbb az MI kreativitása szempontjából. A távol-keleti, go nevű játékban a sakkal ellentétben nem leveszik a bábukat a tábláról, hanem egyre többet tesznek fel rá, és - leegyszerűsítve - így a táblán mintázatok rajzolódnak ki. Az emberi agy pedig evolúciós túlélési okokból nagyon erősen ráhangolódott a szerkezet- és mintafelismerésre, amennyiben az vizuálisan megjelenik előtte. A go ezt a képességünket használja ki, a gépek pedig pont a látással küzdöttek sokáig, és bevett elképzelés volt, hogy nem is lehet a Deep Blue mintájára olyan goprogramot írni, ami képes lenne megverni egy embert.
A kutatók azt remélik ettől, hogy gördülékenyebbé tehetik az emberek és a mesterségesintelligencia-rendszerek (MI-rendszerek) közti beszélgetéseket, írta a Guardian nyomán az MTI. Könyvek hírek mellé.
Aztán megérkezett Demis Hassabis, korábbi sakkversenyző, aki csapatával kifejlesztette az AlphaGót. Hassabis akkor forradalmi - mások szerint eszement - ötlete az volt, hogy nem ő írja meg a gojátékos programot, hanem ír egy metaprogramot, és majd az írja a goprogramot úgy, hogy folyamatosan tanul az általa megírt, gojátszmákat játszó, elveszítő vagy megnyerő program hibáiból. Tehát lesz egy metaprogram, ami képes tanítani saját magát. Du Sautoy részletesebben is leírja, hogyan sikerült végül eljutnia Hassabisnak addig, hogy programja kiállt a világ legjobb gojátékosa, Szedol ellen - és nyert. Szép momentuma a történetnek, hogy a többfordulós összecsapás során nemcsak a program tanult Szedoltól, hanem Szedol is a programtól.
A művészet egyik alkotóeleme a kreativitás, a matematikus pedig a könyvében visszatérően foglalkozik azzal, hogy mi is tulajdonképpen a kreativitás és vajon tanulható, tanítható-e. Ez egy olyan tartomány, amiről ma is sokan gondolják, hogy a gépek számára meghódíthatatlan, hiszen szerintük a gép csak annyit tud, amennyit beletettek.
Az emberi kreativitás e megközelítés szerint fajunk rendkívüli képessége a képzeletre, ami kitágítja, alakítja és magasabbra emeli az emberi létezést.
Du Sautoy is ezt nevezi az emberi kódnak, ami nemcsak a művészetben, hanem az élet minden területén érvényesül, például a sporttól a pedagógián és gyereknevelésen át a matematikáig vagy a gasztronómiáig. Aztán viszont felteszi a kérdést:
vajon tényleg lefordíthatatlan a kreativitás algoritmusokra?
A kreativitás meghatározásában visszatérő elem, hogy ez egyfajta késztetés valami új, meglepő és hasznos létrehozására. Jellegzetesen emberi vonása pedig az, hogy másokat inspirál.
Van még egy faktor, amiről sok művész úgy gondolja, hogy ösztönzi a kreativitást, ez pedig a véletlenszerűség. Hogy ez pontosan micsoda, és mennyi szerepe van benne a tudatos és öntudatlan döntéseinknek, illetve például a mintázatkereső késztetéseinknek, mind olyan téma, amivel Du Sautoy foglalkozik. Itt azt a Festőbolond (Painting Fool) nevű programot emelném ki, amit Harold Cohen képzőművész törekvése nyomán Simon Colton hozott létre. Colton nem az emberi kreativitás eszközeként akarta használni az algoritmusokat, hanem magát a gépet akarta kreatívvá tenni. A portré klasszikus műfajában gondolkodott, ami annyiban tér el egy digitális kamerával random lőtt fotótól, hogy megragad valamit a művész és az alany belső világából is. Csakhogy a művész ebben az esetben az algoritmus, aminek nincs belső világa, Colton tehát újabb algoritmussal próbált teremteni neki egyet. Az érzelmeink változékonyak, van, hogy tudjuk, miért érezzük éppen úgy magunkat, ahogy, máskor nem igazán. Nem igaz viszont, hogy teljesen véletlenszerűen alakulna a hangulatunk, így Colton sem véletlenszám-generátorokat akart használni.
Végül azt találta ki, hogy minden nap elolvastatott az algoritmussal egy rakás cikket az aznapi Guardianből
és azok tartalma szerint állítódott be az algoritmus aktuális hangulata. Aznap terroristák robbantottak valahol a világban? A festmény sötét tónusú lett. Volt, hogy az algoritmust annyira “lehangolták” az aznapi olvasmányai, hogy a galériában, ahol dolgozott, elküldte az elé leülő látogatókat azzal, hogy most nincs kedve festeni. Colton ezt a működést “elszámoltathatóan kiszámíthatatlannak” nevezte. A fejlesztők persze nem álltak meg itt, és megtanították az algoritmusokat, hogy a régi nagy festőktől is tanuljanak.
William Gibson a közeljövőben képzelte el a technológiai lehetőségeink következményeit az emberi mivoltunkra. A Neuromancer új fordítását olvasva elkap az a nyomasztó érzés, hogy a gibsoni jövő már részben megérkezett. Ez a hét könyve.
Du Sautoy sem áll meg a képzőművészetnél: könyvében elkalandozik a klasszikus és modern zene, a dalszerzés, a nyelvi játékok, sőt a mesterséges intelligencia generálta irodalom, illetve történetmesélés irányába is. Kalandozásainak zárásaként megjegyzi, hogy eddig nem találkozott olyan algoritmussal, ami létében fenyegethetné az emberi kreativitást, Igaz, teszi hozzá, az sem zárható ki, hogy az alkotó művész tudatos vagy ösztönösnek, inspiráltnak hívott döntései valójában a test algoritmikus válaszai a világra, az életére. És ha ez így van, akkor már csak az a kérdés, hogy megtanítható-e a gép olyan összetett és gazdag válaszokat generálni, mint amire az emberi kód képes? Az emberi kód több millió éve fejlődik - de vajon felgyorsítható-e az evolúció egy gépben? Du Sautoy nyitva hagyja a kérdést, zárásul felvillant viszont egy új evolúciós lépcsőfokról származó képet és lehetőséget. Ha a művészet önkifejezés, amivel képesek vagyunk megragadni és kommunikálni a léttapasztalatainkat, akkor a szingularitás elérésekor, azaz
amikor már tudatos gépekkel kell majd együttműködnünk, vajon nem az ő zenéjük, a festményeik és más alkotásaik nyújtanak majd kapaszkodót, hogy megértsük, mit jelent gépnek lenni?