Az MCC Feszten Dr. Yang Zijian Győző, a Nyelvtudományi Kutatóközpont tudományos munkatársa tisztába tette a technológiai fogalmakat, és beszélt a Puli nevű magyar fejlesztésű chatbotról is.
Amióta a ChatGPT nevezetű chatbot berobbant a köztudatba, azóta attól hangos a sajtó, hogy mi lesz később, elveszi-e a munkánkat, és vannak-e negatív vagy pozitív szándékai ezeknek a chatbotoknak. Dr. Yang Zijian Győző szerint sokan mesterséges intelligenciaként hivatkoznak mindenre, ami valamilyen okosabb algoritmust használ, valójában azonban nem minden MI, ami annak tűnik.
A szakértő tehát tisztába tette, hogy a ChatGPT valójában nem mesterséges intelligencia.
Leginkább csak tanul a rengeteg feldolgozott adaton keresztül – tehát csak annyit tud, amennyit megtanítanak neki.
„Valójában a ChatGPT nagyon sok szöveget látott, és ezek alapján próbálja úgy összepakolni a szavakat, hogy értelmes legyen. Tehát nincsenek szándékai, nem akarja elpusztítani a világot” – mondta, majd hozzátette, hogy egy MI robotnak nem árt, ha vannak szándékai, hiszen ettől is nevezhetjük intelligensnek. Tehát amikor valótlant állít, akkor nem hazudik, csupán téved. Igyekszik mindenre válaszolni az alapján a sok szöveg alapján, amelyen keresztül tanították – és ez néha dezinformációt szülhet. Ezért nem kell tartanunk attól, hogy leigázza az emberiséget, hiszen nincsenek szándékai – csupán a felhasználóinak lehetnek, így persze az nem zárható ki, hogy rosszra használják a nyelvi modelleket.
Nem vész el, csak átalakul
Habár a chatbotoknak nincs, a megalkotóiknak kell hogy legyenek szándékaik. A szakértő mosolyogva megjegyezte, nem arról van szó, hogy virtuális társat szeretnének csinálni saját magunknak, a cél inkább az – más technológiai ágazatokkal, például a bionikával együtt –, hogy emberhez hasonló, élethű chatbotokat, robotokat vagy végtagokat fejlesszenek, amely megkönnyíti az életünket.
Dr. Yang Győző azt is hozzátette, hogy nem kell annyira megijednünk a jelenlegi technológiai boomtól, hiszen ehhez hasonló átalakulás már korábban is történt. A korábbi esetekhez hasonlóan a munkahelyek átalakulnak, de nem szűnnek meg, nekünk pedig alkalmazkodnunk kell a technológiához.
„Vegyük példának a Google fordító esetét. Amikor megjelent, pánikba estek a valódi fordítók, hogy az új technológia elveszi a munkájukat, azonban nem ez történt. A gépi fordító lefordítja a szöveget, az emberek pedig átnézik azokat. Tehát a munkahelyek nem szűntek meg, csak átalakultak, a folyamat pedig sokkal gyorsabb lett” – ismertette a szakértő.
Félhetnek a művészek?
A ChatGPT-hez hasonló chatbotok nem csupán szövegek, de zenék és képek generálására is alkalmasak, különböző stílusban, olajfestményként vagy csak egyszerű fényképként. Emiatt a művészek felháborodtak, hiszen minek is fessen vagy rajzoljon digitálisan órákon át egy képet, ha a technológia másodpercek alatt képes megalkotni azt? Dr. Yang Győző szerint nem kell ennyire megijedni, hiszen egyelőre érződik a technológia és az ember által alkotott érték közötti különbség.
„Az ember olyanra képes, amire a gép nem. Lelket önt egy műbe”
– mondta.
Azt is hozzátette, hogy – bár meg lehet neki tanítani – a gép nem érti az iróniát vagy a cinizmust, amely egy-egy műben szintén fontos szerepet játszik. Tehát a megértésében is gondjai akadnak, és alkotás közben sem igazán használ hasonlókat, ezáltal egyhangúan, „gépiesen” ír szöveget.
A szakértő szerint a programozók esetében sincs ez másképp. Bár néhány nyelvi modell igencsak jól kódol, az összetettebb feladatokba beletörik a bicskájuk. Tehát mindenképpen hasznát vehetik a programozók, azonban egyelőre nem úgy tűnik, hogy le is válthatja őket.
A cégek közötti verseny pumpálja a fejlődést
Nem csupán az OpenAI alkotott generatív nyelvi modellt, a sikert látván több cég is megpróbálkozott vele. Azonban a legtöbb nem aratott akkora sikert, mint a ChatGPT. Dr. Yang Zijian Győző szerint azonban ennek van előnyös oldala, hiszen a verseny miatt felkapott lett az ágazat az utóbbi időben.
A nagy nyelvi modellek népszerűsége azonban aggályokat is szül, erre a szakértő is kitért:
„Mint kutató, a korlátozás nehezíti a mi feladatunkat. Azonban mint felhasználó, szerintem szükség van a korlátozásokra, főleg azért, mert amint látjuk, azért ez nagyon veszélyes is lehet. Tehát attól függ, hogy mire tanítják, ki mire használja. Ezek a nyelvi modellek nagyon okosnak tűnnek, és sok feladatot meg tudnak oldani, ezért akár rossz dolgokra is lehet őket használni. A másik az, ami mindig kérdéseket vet fel a témában: ezeket a nagy modelleket több százezer milliárd szavas adaton tanították. Honnan van az adat? Tőlem nem kérdezte meg soha senki, hogy az én adatomat felhasználták-e vagy nem. Ez is egy ilyen örökös jogi kérdés.” Azonban azt is hozzátette, hogy folynak kutatások arról, hogyan lehetne ezt kiküszöbölni.
Egy másik felmerülő probléma az álhírek szaporodása, hiszen sosem volt ilyen egyszerű például valótlan képeket generálni (gondoljunk csak arra az esetre, amikor a Pápára egy pufidzsekit adtak). A szakértő szerint eddig is voltak álhírek és ezután is lesznek, ezt a kultúrát nem feltétlenül a mesterséges intelligencia hozta létre. Ezzel egyet tudunk érteni, hiszen ez az eredmény különböző képszerkesztőkkel is elérhető – bár jóval hosszabb ideig tart megalkotni.
Az iskolákban is megjelentek a ChatGPT-esszék, ahol a diákok másodpercek alatt generálnak hosszabbnál hosszabb szövegeket egy adott témában, azonban – a kutató is megerősítette – léteznek erre olyan ellenőrző programok, amelyek kiszűrik a mesterséges intelligencia vagy nyelvi modell által generált szöveget, ám a pontosságuk még valamelyest megkérdőjelezhető.
PULI, a magyar ChatGPT
A magyarországi kutatók mindig is jól szerepeltek a technológia terén – állítja a kutató. Azonban azt is hozzátette, hogy a ChatGPT-vel nem egyszerű felvenni a versenyt, márpedig most ahhoz mérik a nyelvi modelleket. Elmagyarázta, hogy egy ChatGPT méretű nyelvi modell betanításához hatalmas erőforrás szükséges, tehát enélkül versenybe sem lehet szállni. Azonban pozitív a jövőkép:
„Az a szerencsénk, hogy Magyarországon egyre több kutatóintézet rendelkezik nagy szuperszámítógépekkel. A Nyelvtudományi Kutatóközpontnak – ahol dolgozom – nemrég sikerült beszereznie egy ilyen nagy szuperszámítógépet, aminek segítségével versenybe tudtunk szállni. Ennek köszönhetően létrehoztuk a PULI nevű nyelvi modellt” – mesélte a kutató.
A PULI-t azonban nem úgy kell elképzelni, mint egy ChatGPT hasonmást. Dr. Yang Győző elmondta, hogy a ChatGPT-t ezermilliárd szavas adaton tanították, míg a PULI magyar nyelvű verzióját negyven, a háromnyelvű verzióját pedig százmilliárd szavas adaton.
Ez erősen érezhető különbség, tehát a PULI egyelőre nem párbeszédre, inkább csak mondatok kiegészítésére alkalmas. A PULI méretét tekintve 6,7 milliárd paraméteres, a fejlesztése azonban itt nem áll meg:
„Hamarosan szerződést kötünk a debreceni Komondorral, így reményeink szerint elérhetjük a 13 milliárdot, célunk pedig a hetvenmilliárd. ”
Reméljük, ez segíteni fog abban, hogy hamarosan egy csevegésre alkalmas chatbottá váljon a PULI. A béta verzió már elérhető, ahol csevegni lehet a magyar nyelvi modellel, nyár végére pedig a tervek szerint a stabil verzió is megszülethet. Azonban a cél nem feltétlenül az, hogy a PULI egy ChatGPT konkurenssé váljon, sokkal inkább az, hogy a magyar kutatók megismerjék a ChatGPT-hez hasonló chatbotok működését, fejlesztési folyamatait. Ahogyan a kutató fogalmazott: „Kell nekünk egy saját ahhoz, hogy ízig-vérig megismerjük, hogyan működik.”
Rengeteg energiába kerül – lehet tenni ellene?
Néhány héttel ezelőtt a Makronómon már körbejártuk, hogy mennyi energiára van szükség egy ilyen gép betanításához.
Kérdésünkre válaszolva a szakértő kifejtette, valóban nem túl környezetbarát egy nyelvi modell betanítása. A Google például azzal védekezett – amely létrehozta a LaMDA nevű nyelvi modellt –, hogy sok energiát használnak, de mégsem annyit, mint mások. Ez azonban továbbra is azt jelenti, hogy a gépeik rengeteget „esznek” egy átlagos számítógéphez viszonyítva.
A szakértő azonban megerősítette: vannak törekvések arra, hogy a gépek környezettudatosabban működjenek.