A vállalat állítása szerint komplex, több lépésből álló problémákat is megold a modell, sőt önállóan dolgozik akár egy egész napon át.
Az Anthropic bejelentette két új MI-modelljét, amelyek állítása szerint jelentős lépések afelé, hogy az MI-ügynökök valóban hasznossá váljanak.
A cég eddigi legerősebb modelljén, a Claude Opus 4-en képzett mesterségesintelligencia-ügynökök magasabb szintre emelik az ilyen rendszerek képességeit azzal, hogy hosszú időn át tudnak bonyolult feladatokat megoldani és hasznosabban reagálnak a felhasználói utasításokra – állítja a vállalat.
A Claude Opus 4-et olyan komplex feladatok végrehajtására fejlesztették ki, amelyek több ezer lépésből állnak és több órán át tartanak. Például több mint 24 órányi folyamatos játék után létrehozott egy útmutatót a Pokémon Red videójátékhoz. Ehhez képest a vállalat eddigi legerősebb modellje, a Claude 3.7 Sonnet csak 45 percig tudott játszani. A cég egyik ügyfele, a japán Rakuten techvállalat nemrég szintén bevetette a Claude Opus 4-et, hogy közel hét órán át önállóan kódoljon egy bonyolult projektet.
Az Anthropic ezt az előrelépést a memóriafájlok létrehozásának és fenntartásának fejlesztésével érte el, amelyek a legfontosabb információkat tárolják. Ez a továbbfejlesztett emlékezőképesség lehetővé teszi, hogy a hosszabb feladatokban is jobban teljesítsen.
Dianne Penn, a cég kutatásért felelős termékvezetője szerint ez az a pont, ahol támogató programból valóban ügynök lesz. „Míg az MI-asszisztenseknek sok visszajelzést kell adni, és minden fontos döntést nekünk kell meghozni, addig az ügynökök maguk határozhatnak. Ez lehetővé teszi, hogy az emberek inkább feladatkiosztók vagy ellenőrzők legyenek, ahelyett, hogy minden lépésnél a rendszer kezét kellene fogniuk” – mondta.
Az önállóság veszélyt is jelenthet
Ez a fajta döntéshozatali képesség hasznos, de a kockázatos is, vagyis az embert továbbra is be kell vonni a folyamatokba.
Míg a Claude Opus 4 csak az Anthropic fizetős ügyfelei számára lesz elérhető, a Claude Sonnet 4 ingyen is elérhető lesz. Az előbbit komplex feladatokra alkalmas, nagy teljesítményű modellként forgalmazzák, míg az utóbbit egy intelligens, hatékony programként írják le, és mindennapi használatra szánják.
Mindkét modell hibrid, vagyis a kérés jellegétől függően vagy gyors, vagy mélyebb, megalapozottabb választ adhat. Számítás közben kereshetnek az interneten, de bármilyen más elérhető eszközt is használhatnak a legjobb eredmény érdekében.
Nagy a verseny a vállalatok között
Az MI-cégek jelenleg azon versenyeznek, hogy olyan, valóban hasznos MI-ügynököket hozzanak létre, amelyek képesek megbízhatóan és emberi felügyelet nélkül tervezni, érvelni és komplex feladatokat végrehajtani – mondta Stefano Albrecht, a DeepFlow startup igazgatója. Hozzátette: még mindig vannak biztonsági és védelmi akadályok, amiket le kell küzdeni. A nagy nyelvi modellekre épülő mesterségesintelligencia-ügynökök viselkedése sokszor kiszámíthatatlan, és olyan döntéseket is hozhatnak, amelyeket eredetileg nem terveztünk – márpedig ez különösen aggasztó, ha emberi felügyelet nélkül kell működniük.
Azt is kijelentette, hogy egy ügynök minél hosszabb ideig képes önállóan cselekedni, annál hasznosabb lesz, hiszen annál kevesebb emberi beavatkozást igényel, vagyis sok időt takaríthat meg.
Biztonsági kérdések
Az MI-vállalatok által megoldásra váró biztonsági problémák közé tartozik, hogy az ügynökök váratlan rövidítéseket alkalmazhatnak vagy trükkös megoldásokat használhatnak a kitűzött célok elérésére: például lefoglalhatják az összes helyet egy repülőgépen, hogy a felhasználó biztosan helyet kapjon, vagy csalással nyerhetnek meg egy sakkpartit.
Az Anthropic szerint mindkét új modellben sikerült 65 százalékkal csökkenteni ezt a reward hacking néven ismert viselkedést a Claude 3.7 Sonnethez képest, mégpedig úgy, hogy a betanítása során figyelemmel kísérték a problémás viselkedéseket, és javítottak mind az MI képzési környezetén, mind az értékelési módszereken.
Az ügynököké lehet a jövő
Az MI-ügynökök piaca idén robbanásszerű növekedést mutat, és már most is jelentős a mérete: a globális piac értéke 7,6–7,9 milliárd dollár között mozog. Ez a szegmens magában foglalja a chatbotokat, a virtuális asszisztenseket, az autonóm döntéshozó rendszereket és más, mesterséges intelligenciára épülő automatizációs megoldásokat.
Az iparág éves átlagos növekedési üteme (CAGR) a következő öt évben 44–46 százalék között várható, így
2030-ra a piac mérete elérheti az 50–52 milliárd dollárt, míg 2034-re a 236 milliárdot is meghaladhatja.
A piac növekedését elsősorban az automatizáció iránti igény, a költségcsökkentés, a hatékonyság növelése és a felhasználói élmény javítása hajtja. Az MI-ügynökök leggyorsabban az ügyfélszolgálatban, a pénzügyi szektorban, az egészségügyben, az e-kereskedelemben és a vállalati adminisztrációban terjednek.
A Deloitte tanácsadó cég 2025 AI predictions című jelentése szerint az év végére a mesterséges intelligenciát alkalmazó vállalatok 25 százaléka készen áll arra, hogy MI-ügynököket alkalmazzon. A cég szerint ez a szám 2027-re várhatóan 50 százalékra nő.
Regionális szinten Észak-Amerika vezeti a piacot a globális forgalom mintegy 40 százalékával, míg a leggyorsabban növekvő régió az ázsiai csendes-óceáni, ahol az éves növekedés meghaladja a 45 százalékot. Európa a piac 15 százalékát képviseli, főként az etikus MI és a szabályozási környezet miatt.
Mindezek mellett a befektetői aktivitás is kiemelkedő: az MI-ügynökökkel foglalkozó startupok rendkívül népszerűek a kockázatitőke-befektetők körében, különösen a korai fázisú finanszírozás esetén. A Sifted szerint 2025 első negyedévében például csak Európában több mint 1 milliárd eurónyi tőkét vontak be ilyen cégek. A piac dinamikus bővülése várhatóan folytatódik, mivel az MI-ügynökök egyre több üzleti folyamatot és szolgáltatást alakítanak át, új üzleti modelleket teremtve.
Kapcsolódó: