Kínai áttörés: még olcsóbb és még hatékonyabb MI-modellek jöhetnek – makronom.eu
2025. április 21., hétfő

Kínai áttörés: még olcsóbb és még hatékonyabb MI-modellek jöhetnek 

Egy kínai vállalat olyan mesterségesintelligencia-tanítási technológiát fejlesztett ki, amely akár 20 százalékkal csökkentheti az ilyen modellek fejlesztési költségeit. Az újabb innováció rávilágít az ázsiai nagyhatalom technológiai fejlettségére is, hiszen az áttörést kizárólag kínai chipekkel érték el. 

Áttörést ért el a kínai Ant Group, amikor kínai gyártású chipek segítségével fejlesztett ki képzési technológiát mesterségesintelligencia (MI)-modellek számára. Ez pedig akár 20 százalékkal csökkentheti ezek fejlesztési költségeit – jelezték technológiai szakértők a Bloombergnek

A vállalat az Alibaba és a Huawei által létrehozott félvezetőket alkalmazta az úgynevezett mixture of experts (MOE) megoldáson alapuló modelltanításra. Ennek a lényege, hogy a modell a feladatokat kisebb adathalmazokra bontja, mintha különböző szakértői csoportok dolgoznának az adott részfeladat egyes részelemein, hatékonyabbá téve ezzel a munkafolyamatot.  

Az Ant Group hasonló eredményeket ért el, mint az Nvidia H800-as chipjével – amelynek Kínába történő szállítását Washington megtiltotta.

Habár a cég az MI-fejlesztésekben még mindig használja az amerikai rivális termékeit, nagyrészt alternatív eszközökre, így az Advanced Micro Devices vagy egyéb kínai vállalatok chipjeire támaszkodik.  

Az amerikai tiltás ellenére még mindig érkeznek illegálisan az Egyesült Államokban gyártott chipek Kínába – többek kötött Malajzián keresztül. Washington felszólította az ország kereskedelmi miniszterét, hogy szigorúan monitorozzák a csúcstechnológiás Nvidia-chipek útját, amelyek Malajziába érkeznek. Erre még egy szakértői csoportot is felállítottak, amelynek az a feladata, hogy szigorítsa az ország virágzó adatközpont-iparága körüli szabályozásokat, amely az iparágvezető Nvidia chipjeire támaszkodik. 

A régióban az elmúlt hetekben fokozódhatott az illegális chipkereskedelem, és ennek az egyik jele, hogy Szingapúrban vádat emeltek három férfi ellen egy 390 millió dolláros csalási ügyben, amely Nvidia-chipek Malajzián keresztül Kínába történő feltételezett eladásával kapcsolatos. 

Joe Biden elnökségének végén Washington exportkontrollt vezetett be, amelynek keretében háromszintes engedélyezési rendszert használnak azokra az MI-chipekre, amelyeket adatközpontokban használnak fel – így például az Nvidia erős GPU-ira. 

Forrás: Financial Times 

Minél olcsóbban minél hatékonyabbat 

Az Ant Group versenyképessége megerősödött a kínai és amerikai chipháborúban, amióta a DeepSeek igazolta, hogy nem muszáj milliárdokat ölni az egyes modellekbe, mint ahogyan azt az OpenAI vagy a Google is teszi. A cég által közzétett kutatási jelentés szerint a modelljeik egyes szempontok alapján felülmúlták a Meta által fejlesztetteket is. Ha ez valóban igaz, az azt jelenti, hogy az Ant Group révén Kína egy újabb nagy lépést tett a mesterséges intelligencia fejlesztése terén. 

A jelentés szerint az angol nyelvi megértést illetően a kínai cég Ling-Lite modellje jobban teljesített egy összehasonlításban, mint a Meta Llamája. Sőt, egy helyi vizsgálat során mind a Ling-Lite, mind a Ling-Plus felülmúlta a DeepSeeket.  

A MOE-modellek jellemzően nagy teljesítményű chipeken alapulnak – olyanokon, amilyeneket az Nvidia forgalmaz. Ezek ára azonban számos kisvállalat számára elérhetetlenné tette ezt a technológiát, és megakadályozta annak szélesebb körű elterjedését. Az Ant Group azon dolgozott, hogy feloldja ezeket a korlátokat, és hatékonyabbá tegye a nagy nyelvi modellek (LLM) kiképzését. A jelentésben is leszögezik, a vállalat célja, hogy „prémium-GPU-k nélkül” alkossanak ilyen modelleket. 

A cég nyilvánossá tette a Ling modellek paramétereit, amelyek módosíthatók, ezáltal javíthatják a teljesítményét. A Ling-Lite 16,8 milliárd paramétert tartalmaz, a Ling-Plus pedig 290 milliárdot – utóbbi nagynak számít a nyelvi modellek között. Összehasonlításképpen, a ChatGPT 4.5 1,8 ezermilliárddal működik, míg a DeepSeek R1 modellje 671 milliárddal.  

Ez azonban ellenkezik az Nvidia elképzeléseivel. A cég vezérigazgatója, Jensen Huang azzal érvelt, hogy a számítási igény a DeepSeek R1-hez hasonló hatékonyabb modellek megjelenésével is növekedni fog, így a vállalatoknak jobb chipekre lesz szükségük, hogy több bevételt termeljenek, nem pedig a költségcsökkentésen lesz a hangsúly. Az Nvidia ragaszkodik a nagy GPU-k építéséhez, amelyek több feldolgozómaggal, tranzisztorral és megnövelt memóriakapacitással működnek. 

Az Ant Group azt állítja, hogy

1 ezermilliárd token kiképzése magas teljesítményű hardverekkel körülbelül 880 ezer dollárba került, de ez optimális esetben, alacsonyabb specifikációjú megoldásokkal 703 ezerre szorítható.

Ezek a tokenek olyan információegységek, amelyeket a modell a világ megismerése és a felhasználói lekérdezésekre adott válaszok megadása érdekében vesz fel. 

Innovatív hullámokon az Ant Group 

A vállalat azt tervezi, hogy a mostani újítást a saját LLM-modelljeikben is alkalmazni fogják ipari MI-megoldásokra, például egészségügyi és pénzügyi területeken. Az Ant Group megvásárolta a kínai Haodf.com online portált, amelyen egy MI-orvosasszisztenst hoztak létre, hogy az olyan feladatokban segítsen a Haodf 290 ezer orvosának, mint az orvosi nyilvántartás kezelése. Emellett működik egy „életasszisztensmodelljük” a Csehsziaopao alkalmazásban és egy pénzügyi tanácsadó MI-szolgáltatást is kifejlesztettek, Mahsziaocaj néven. 

A cég azt is közölte, hogy az egészségügy területén olyan nagy méretű gépeket fejlesztenek, amelyeket hét kórház mellett egészségügyi szolgáltatók is használni fognak, többek között Pekingben és Sanghajban. Ez a nagy modell a DeepSeek R1, az Alibaba Qwen és az Ant Group saját nagy nyelvi modelljeit használja, és orvosi tanácsadásra lehet igénybe venni. 

Emellett bejelentették az Angel nevű MI orvosi ügynöküket, amely több mint ezer egészségügyi létesítményt lát el, és a Jipaoert, amely az egészségügyi biztosítók szolgáltatásait támogatja. Tavaly szeptemberben a cég egy fizetős MI healthcare manager alkalmazást is üzembe helyezett az Alipayen.  

Az egyetlen, amit ki kell javítaniuk, hogy a modellek kiképzésének egyes szakaszaiban gondok adódtak a stabilitással, ugyanis a hardver vagy a modell szerkezetének kisebb változtatása is problémákhoz vezetett – derül ki a kutatási jelentésből. 

„Az Ant Group tanulmánya rávilágít a kínai MI-ágazat növekvő innovációs képességeire és a technológiai fejlődés gyorsuló ütemére – mutat rá Robert Lea, a Bloomberg szenior elemzője. –

Amennyiben a cég állítása beigazolódik, Kína jó úton halad afelé, hogy önellátóvá váljon a mesterséges intelligencia területén, mivel az ország az alacsonyabb költségű, számítási szempontból hatékony modellek felé fordul, hogy megkerülje az Nvidia chipek használatát.” 

(Forrás: Bloomberg) 

Kapcsolódó:

Címlapfotó: Dreamstime

Posztok hasonló témában

Heti hírlevél

Iratkozzon fel hírlevelünkre!

Minden héten megkaphatja válogatott tartalmainkat, hogy naprakész információi legyenek a világ történéseivel kapcsolatban.


Kérjük adja meg a teljes nevét.

Email címét nem osztjuk meg.

Kérdezz bátran!
Chat