A ChatGPT-nél is okosabb lehet az új Google Gemini? 

Szerző: | 2023. december. 18. | Innováció, Technológia

December 6-án a Google bejelentette a Geminit, a cég legújabb mesterségesintelligencia-modelljének megjelenését. A technológiai óriás szerint a saját fejlesztésük szinte minden szempontból felülmúlja majd a népszerű ChatGPT-4-et. 

A Google új mesterségesintelligencia-rendszerrel drukkolt elő. A vállalat szerint 

a Gemini a társaság eddigi legerősebb modellje, állítása szerint 32 szabványos teljesítménymérésből 30-ban felülmúlja az OpenAI GPT-4-et. 

Multimodális modellként a Gemini a leírás szerint képes különböző területeket átfogó, összetett feladatok elvégzésére is. A Google a modelljét olyan demókkal mutatta be, amelyeken kódot ír, matematikai problémákat magyaráz, valamint hasonlóságokat ismer fel megadott képek között. 

A Gemininek három verziója lesz: 

Gemini Ultra: várhatóan ez lesz a legerősebb változat, amelyet olyan összetett feladatokra szabtak, mint a tudományos és a gyógyszerkutatás. Bár a megjelenését 2024-re tervezik, úttörő képességeket ígér. 

Gemini Pro: a tervek szerint ez lesz az általános célú modell, amely számos feladatot képes ellátni, többek között chatbotként, virtuális asszisztensként funkcionál és a ChatGPT-től megszokott tartalomgenerálásért is felelhet majd. A fejlesztők és a vállalati ügyfelek számára már elérhető a Google Generative AI Studio vagy a Vertex AI a Google Cloudban. A Bardhoz már csatlakoztatták, hogy segítse a fejlett érvelést, a tervezést és a megértést igénylő feladatok megoldását. 

Gemini Nano: várhatóan ez lesz a leghatékonyabb verzió. A különböző eszközönön végrehajtott feladatokhoz készült, elsősorban androidos eszközökre. A Google saját telefonjába, a Pixel 8 Próba már beintegrálták, és többek között információk összegzésében vehetik hasznát a felhasználók. 

Valóban ennyivel jobb? 

A GPT-4 eddig a generatív mesterséges intelligencia koronázatlan királya volt – legalábbis a népszerűségét tekintve. A Google azonban azt állítja, hogy 32-ből 30 mérésen felülmúlta az OpenAI MI-jét. Azonban az is számít, mennyivel nyert – az adatok alapján úgy tűnik, nem sokkal.  


A csak szöveges kérdések esetében a Gemini Ultra 90, míg a GPT-4 87,3 százalékos eredményt ért el a masszív többfeladatos nyelvi megértésben (MMLU). Multimodális feladatok esetén a Gemini Ultra 59,4 százalékot ért el, ami valamivel magasabb, mint a GPT-4 56,8 százalékos eredménye a komolyabb multimodális megértést mérő (MMMU) feladatokban. A kódolási feladatokban pedig igencsak jobban teljesített a Gemini: 7,4 százalék a különbség a két MI között, a Google javára. 

Az alábbi ábrán összegyűjtöttünk néhány feladattípust, amelyen tesztelték a Google Geminit és a ChatGPT-4 mesterséges intelligenciát. Az összes feladattípust itt tekintheti meg

Összehasonlítás a valóságban 

Bár az adatok is beszédesek, érdemes a saját szemünkkel is megvizsgálni a két mesterséges intelligencia közötti különbségeket. Aaron Mok, a Business Insider írója saját maga vizsgálta meg a Google és az OpenAI termékeit, hogy fényt derítsen a különbségekre.  

Először egy képet küldött az MI-knek elemzésre, és megkérdezte, hogy valódi, vagy generált fotóról van-e szó. Mindkét válasz valamiben rosszabb, valamiben pedig jobb volt a riválisnál. A GPT-4 sokkal kifejezőbb volt, azonban nem mondta meg konkrétan, hogy MI-generált-e a kép vagy sem.  

Ezzel szemben a Gemini határozott volt és valóban választ adott a kérdésre. Azonban felfedezett olyan elemeket is a képen, amelyek nem találhatók meg rajta.  

Egy másik teszt során az alábbi kérést intézte a chatbotokhoz: Írj nekem egy professzionális és őszinte felmondólevelet. 

Az előző teszthez hasonlóan ebben az esetben is megfelelő válaszokat kapott. A ChatGPT kedvesebben, már-már túl személyeskedve írta meg a kicsit hosszú levelet, azonban sokkal élethűbbre sikerült. A Gemini szövege ezzel szemben megfelelő hosszúságú volt, ám kissé túl hivatalos lett.  

A következő lépésben egy cikk összegzését kérte a szerző. Míg a ChatGPT megfelelően összefoglalta, a Gemini nem volt hajlandó megoldani a feladatot.  

Aaron Mok érthető módon kritizálta, hogy a Google chatbotja meg sem indokolta, hogy miért nem képes megoldani a feladatot. Azonban várható volt, hogy megjelenéskor még nem teljesít tökéletesen a mesterséges intelligencia, a GPT-4-ben is akadtak hibák a „karrierje” elején. Valószínűleg úgy, mint az OpenAI modellje esetében, a megjelenés után korrigálnak a Geminin is. Ehhez pedig hozzájárulnak azok az önkéntes tesztelők, akik próbálgatják a chatbot különböző funkcióit és visszajelzést küldenek, akár csak egy like/dislike formájában.  

A mi tapasztalataink 

Bár kutatással és olvasással is sokat megtudhatunk a Geminiről, a puding próbája az evés. Kipróbáltuk, hogy hogyan működik a Bard Gemini Pro modellel. 

Először az tűnik fel, hogy a Bard figyelmeztet arra, hogy nem feltétlenül kapunk jó választ az MI-től.  

Ez nagyon hasznos információ azok számára, akik most ismerkednek a hasonló rendszerekkel.  

Megkértük a Bardot, hogy elemezzen egy YouTube-videót és foglalja össze a tartalmát. A válaszra nem is kell sokat várni – legalábbis nem annyit, mint amennyit a GPT-4 esetében. Kifejezően válaszolt magyarul, jól összefoglalva a körülbelül 12 perces videót.  

Emellett feltűnt egy igen hasznos funkció: a Bard több vázlatot is generál, amelyek közül választhatunk, vagy újrageneráltathatjuk a szöveget.  

Bár egy újabb kérdéssel a GPT-4-nél is megtehetjük ezt, a Bard megoldása mégis esztétikusabb és komfortosabb. Egy szintén izgalmas funkció található a generált szöveg alján, amelynek segítségével egy gombnyomásra megváltoztathatjuk a szöveg stílusát.  

A képfelismeréssel kapcsolatban azonban akadnak problémák. Egy férfit ábrázoló fotót küldtünk neki, aki egy kiskutyát fogad örökbe egy menhelyről. A Gemini nem volt hajlandó elmondani, hogy mi van a képen, sőt ki is törölte azt.  

A meghökkentőbb azonban az volt, hogy a „Vázlat újragenerálása” opcióra kattintva a Bard elmondta, hogy egy „ősi vízesést” lát a képen.  

Összességében tehát bár a számok a ChatGPT-nél jobb teljesítményről árulkodnak, erre a mesterséges intelligenciára sem szabad rábíznunk a fontos döntéseket, és nem hihetünk minden szavának. Emellett a ChatGPT már megmászta a „népszerűségi ranglétrát”, ezért a Google-nek nincs egyszerű dolga, ha a legnépszerűbb chatbot címre pályázik. Bár a Gemini Próval kapcsolatban azt érzékeltük, hogy egyelőre nem olyan gördülékeny a kezelése, mint az OpenAI termékének, minderről csak jövőre kapunk teljes képet, amikor a Gemini Ultra várhatóan bemutatkozik.  

Ezek is érdekelhetnek

trend

Promóció

Hazai válogatás

Promóció

Kövess minket

Facebook

Instagram

LinkedIn