Az MI-ágensek még évtizedekig nem lesznek működőképesek – makronom.eu
2025. november 9., vasárnap

Az MI-ágensek még évtizedekig nem lesznek működőképesek

MI-ágensek - Freepik

A magyar származású MI-guru, Andrej Karpathy a ChatGPT-t kifejlesztő OpenAI egyik kucsfigurája szerint túlzottan nagyok a várakozások a mesterséges intelligencia (MI)-cégekkel szemben. Például a jól használható MI-ügynökökre még 5-10 évet várni kell, hiába lelkesek a cégek.

A Pozsonyban született, de Kanadába költözött, majd Amerikában karriert építő, magyar származású MI-kutató, az OpenAI társalapítója és a Tesla korábbi MI-vezetője egy nagy nemzetközi sajtóvisszhangot kiváltó interjút adott. A techguru ezt követően egy X-posztban részletezte a nagy port kavart megállapításait. Ugyanis az október közepén adott, Dwarkesh Podcast-interjúban váratlanul éles kritikával illette az MI-ágenseket, más néven, ügynököket. „Az MI-ágensek egyszerűen nem működnek” – jelentette ki határozottan, éppen akkor, amikor az MI-lázban égő iparág gyakorlatilag 2025-öt az „ágensek évének” titulálta. 

A kijelentés azért keltett különösen nagy visszhangot, mert Karpathy nem külső megfigyelő, hanem az MI-forradalom egyik központi szakértő figurája. Az OpenAI-nál rendkívül fontos munkát koordinált, az egyik megkerülhetetlen szakértő a mesterséges intelligencia fejlesztésében. Sőt, korábban a Teslánál az autonóm járművezetési rendszerek architektúráját alakította. Amikor tehát szkepticizmusának ad hangot, az szakértői realizmust tükröz. 

Négy alapvető probléma 

Karpathy részletesen kifejtette, miért maradnak el a jelenlegi MI-ágensek a várakozásoktól. Az első probléma az intelligencia szintje. Bár a nagy nyelvi modellek lenyűgöző képességeket mutatnak szövegértésben,  

komplex, többlépcsős problémák megoldásakor gyakran összezavarodnak.  

Egy ágens képes lehet egyszerű kódolási feladatokat elvégezni, de összetett architekturális döntéseknél vagy váratlan hibáknál látványosan zsákutcába fut. 

A második probléma a multimodalitás hiánya. A valódi intelligens ágensnek zökkenőmentesen kellene váltania különböző információforrások között: dokumentációt olvasni, képernyőfotókat értelmezni, hangfelvételeket meghallgatni.  

A jelenlegi rendszerek többsége elsősorban szövegalapú, a képek vagy más adattípusok feldolgozása döcögős. 

A harmadik kihívás az eszközhasználat. Az MI-ágensek küzdenek a számítógépes eszközök hatékony használatával. Nem csupán parancsokat kell végrehajtaniuk, hanem megérteni az eszközök közötti összefüggéseket, valamint adaptívan reagálni váratlan helyzetekre. 

Egy példa: ha egy MI-ágensnek azt mondjuk, hogy „javítsd ki ezt a programhibát”, egy emberi programozó automatikusan tudja, hogy először meg kell nyitnia a megfelelő fájlt, aztán módosítania kell a kódot, majd, ha kész, akkor el kell mentenie, végül újra kell indítania a programot, hogy lássa, működik-e a javítás. Ez négy különböző lépés, négy különböző eszközzel. 
Az MI-ágens viszont gyakran csak az egyik lépést teszi meg – például kijavítja a kódot, de ha nem „rágjuk a szájába”, akkor nem fogja például a változásokat elmenteni. 

A negyedik és legkritikusabb probléma a folyamatos tanulás hiánya.  

A jelenlegi MI-ágensek nem képesek valódi értelemben tanulni a tapasztalataikból.  

Minden interakció tiszta lappal kezdődik, minimális memóriával. Egy emberi programozó megjegyzi a korábbi hibákat és fejleszti stratégiáit, míg az MI-ágensek nulláról kezdik minden alkalommal, mert ez a működésük alapja. Bár vannak már megoldások, amelyben a felhasználók preferenciáit képesek megjegyezni, ez közel sem teljes értékű funkció. 

Együttműködés, nem kiszorítás 

Karpathy élesen bírálta azt a narratívát, hogy az MI-ágensek hamarosan teljesen helyettesítik az emberi fejlesztőket. Ez szerinte nemcsak irreális, hanem káros nézet is. Az Eureka Labs vezetőjeként egy olyan jövőt képzel el, ahol  

az MI együttműködő partnerként jelenik meg az IT-szakemberek mellett.  

Például dokumentációt keres, kérdéseket tesz fel bizonytalanság esetén, és javítja a kód minőségét apró javaslatokkal. 

Ez a kollaboratív megközelítés több előnnyel jár. A fejlesztő megtartja a kontrollt, továbbra is tanul és fejleszti a készségeit, illetve reálisabb a jelenlegi MI-képességek fényében. Karpathy különösen kritikus azzal szemben, hogy a fejlesztők „kódok hegyeit” kapnák, nem igazán értve azok működését. 

Az időzítés kritikus  

Karpathy a podcast után egy X-bejegyzést is közzétett. Ebben hangsúlyozta, hogy ne értsük félre a szavait, ő nem MI-szkeptikus, de más időhorizontban gondolkodik.  

Az időzítési becsléseim 5-10-szer pesszimistábbak, mint amit a San Francisco környéki techbulikban zajló beszélgetések kapcsán gondolhatnánk 

– írta. Azaz, ahol a lelkes technológiarajongók 2-3 évet jósolnak, ott ő inkább 10-30 évre számít. Ez azonban alapvetően más befektetési döntéseket és fejlesztési stratégiákat igényel. 

Figyelmeztetése pedig igen időszerű, hiszen az MI-vel foglakozó nagyvállalatok folyamatosan történelmi árfolyamcsúcsokat döntenek az elmúlt hetekben. Az OpenAI o1 modellje pedig végsősoron önálló feladatvégrehajtást ígér, de a megbízhatóság és a konzisztencia még komoly kihívást jelent. Karpathy kritikája egyfajta kijózanító üzenet: a technológia hatalmas potenciállal rendelkezik, de érdemes reális várakozásokkal tekinteni a közeljövőbe. 

A kiemelt kép illusztráció – Freepik

Kapcsolódó: 

Posztok hasonló témában

Heti hírlevél

Iratkozzon fel hírlevelünkre!

Minden héten megkaphatja válogatott tartalmainkat, hogy naprakész információi legyenek a világ történéseivel kapcsolatban.


Kérjük adja meg a teljes nevét.

Email címét nem osztjuk meg.

Videó

Hét ábrája

Social media

Partnereink

Kérdezz bátran!
Chat