Az indiai kormány 1,25 milliárd dolláros programot indított annak érdekében, hogy ne maradjon le a mesterségesintelligencia-forradalomról.
India technológiai központjában, Bengaluruban Adithya Kolavi, a 20 éves CognitiveLab alapítója izgatottan figyelte, ahogy a kínai DeepSeek az év elején jelentős áttörést ért el a nyelvi modelljével. A program úgy volt képes felvenni a versenyt a nyugati megoldásokkal, hogy jóval kevesebb tőkéből és idő alatt készült el. „Ha a DeepSeek meg tudta csinálni, nekünk miért ne sikerülne?” – tette fel a kérdést.
Abhishek Upperwal, a Soket AI Labs vezetője ezzel szemben csalódottságát fejezte ki, mivel a Pragna–1B nevű, 1,25 milliárd paraméterből álló többnyelvű modellje „filléres” támogatásokból próbált fennmaradni, miközben a nemzetközi versenytársak milliós befektetéseket kaptak. Az ő modelljének a célja a „nyelvi adó” csökkentése, vagyis annak a többletköltségnek a mérséklése, amit India nyelvi sokszínűsége okoz a technológiai fejlesztések során. Upperwal szerint, ha két évvel korábban megfelelő finanszírozáshoz jutottak volna, ők is elérik azt a szintet, amit a DeepSeek.
A strukturális problémák gyökerei
A lemaradás fő oka, hogy India tartósan kevés pénzt fordított kutatás-fejlesztésre, intézményekre és innovációra. Mivel az országban nincs egyetlen olyan nyelv, amit a lakosság többsége beszélne, a nyelvi modellek képzése sokkal összetettebb feladat, mint más országokban. Bár Indiát hagyományosan a globális szoftveripar hátországaként tartják számon, az ország technológiai ökoszisztémája alapvetően a szolgáltatás-központú szemlélet mentén alakult ki.
Az olyan óriásvállalatok, mint az Infosys és a TCS a hatékony szoftverfejlesztésre alapozták a sikerüket, de az innovációt nem helyezték előtérbe, és nem is ösztönözték azt. India K+F-kiadásai tavaly mindössze a GDP 0,65 százalékát (25,4 milliárd dollár) tették ki, ami messze elmarad Kína 2,68 százalékától (476,2 milliárd dollár) és az Egyesült Államok 3,5 százalékától (962,3 milliárd dollár). Azok a képességek – az algoritmusok fejlesztésétől a chipgyártásig –, amelyek a mélyebb technológiák feltalálásához, fejlesztéséhez és piacra viteléhez szükségesek, egyszerűen soha nem alakultak ki.
Bár elszigetelt, világszínvonalú kutatóközpontok léteznek bizonyos állami szervezetekben, mint a DRDO (Védelmi Kutatási és Fejlesztési Szervezet) vagy az ISRO (Indiai Űrkutatási Szervezet), az áttöréseik csak ritkán jutnak el a civil vagy a kereskedelmi szférába.
Indiában ugyanis hiányoznak azok a kapcsolódási pontok, amelyek a kockázatos kutatásokat a piacképes megoldásokhoz kötnék,
mint ahogyan az Egyesült Államokban a Védelmi Minisztérium kutatásokért felelős részlege, a DARPA teszi.
Kína indukálta, hogy India lépjen
Idén januárban, mindössze tíz nappal a DeepSeek–R1 bemutatása után, az Elektronikai és Információtechnológiai Minisztérium (MeitY) pályázatot hirdetett India saját alapmodelljeinek fejlesztésére. A kiírásban a magánszektor felhő- és adatközpont-szolgáltatóit kérték fel, hogy biztosítsanak GPU-számítási kapacitást a kormány által irányított MI-kutatások számára.
A szolgáltatók – köztük a Jio, a Yotta, az E2E Networks, a Tata, az AWS partnerei és a CDAC – gyorsan reagáltak, és az így létrejött megállapodás révén a MeitY közel 19 ezer GPU-hoz jutott támogatott áron, amelyeket a magánszektorból csoportosítottak át, és kifejezetten alapvető MI-projektekre különítettek el. Ez azonnal megindította azon vállalatok rohamát, amelyek saját modellek fejlesztésére tettek javaslatokat.
Két héten belül már 67 javaslat volt a minisztérium asztalán, ami március közepére megháromszorozódott. Áprilisban a kormány bejelentette a terveit hat nagy méretű modell év végéig történő fejlesztésére, valamint további 18 MI-alkalmazásra, amelyek olyan szektorokat céloznak meg, mint a mezőgazdaság, az oktatás és a klímavédelem.
A nyelvi kihívás komplexitása
India egyik alapvető kihívása a rendkívüli nyelvi sokszínűség: a 22 hivatalos nyelv és több száz dialektus olyan nehézséget jelent, amire a legtöbb meglévő nagy nyelvi modell nincs felkészülve. Bár angolul hatalmas mennyiségű és jó minőségű webes adat áll rendelkezésre, az indiai nyelvek együttesen az online tartalom kevesebb mint 1 százalékát teszik ki.
A digitalizált, címkézett és megtisztított adatok hiánya olyan nyelveken, mint a bhodzspuri vagy a kannada, megnehezíti az olyan nagy nyelvi modellek fejlesztését, amelyek valóban képesek megérteni, hogyan beszélnek vagy keresnek az indiai felhasználók. A globális tokenizálók, amelyek a szöveget a modellek számára feldolgozható egységekre bontják, sok indiai írásrendszer esetében szintén gyengén teljesítenek: gyakran félreértelmezik a karaktereket, vagy kihagynak belőlük néhányat.
Ezért még ha az indiai nyelvek meg is jelennek a többnyelvű modellekben, gyakran félreértik azokat, és hibás válaszokat generálnak. Az OpenAI-jal vagy a DeepSeekkel szemben, amelyek strukturált, színvonalas angol adatokkal tudtak nagyra nőni, az indiai fejlesztői csapatok többnyire töredezett, gyenge minőségű adathalmazokra támaszkodnak, amelyek ráadásul több tucat különböző indiai nyelvet fednek le.
Innovatív megoldások születnek
Hiszen míg az angol nyelv szóközökkel választja el a szavakat, és viszonylag egyszerű szerkezetet követ, egyes indiai nyelveknél gyakran nincsenek egyértelmű szóhatárok, és rengeteg információt sűrítenek egyetlen szóba. Nem véletlen, hogy a hagyományos tokenizálók nehezen tudnak megbirkózni ezekkel a bonyolult nyelvi sajátosságokkal.
Egy kisebb, de elszánt indiai fejlesztői közösség azonban elkezdte a „kezébe venni az ország MI-jövőjét”. A Sarvam AI például létrehozta az OpenHathi–Hi–v0.1-et, egy nyílt forráskódú hindi nagy nyelvi modellt, amely jól mutatja, hogy egyre több megoldásuk van a saját nyelvi sokszínűségük kezeléséhez. A Meta Llama 2 architektúrájára épülő modellt például 40 milliárd hindi és rokon indiai nyelvi tokenen képezték, így ez az egyik legnagyobb nyílt forrású hindi modell.
Upperwal Pragna–1B-je szintén azt bizonyítja, hogy India képes megoldani a saját nyelvi összetettségét: ezt 300 milliárd tokenen képezték ki, mindössze 250 ezer dollárból.
Ambiciózus célok és pénzügyi támogatás
Az IndiaAI Misszió – amely egy tavaly márciusban elindított 1,25 milliárd dolláros nemzeti kezdeményezés – célja az ország alapvető MI-infrastruktúrájának kiépítése és a fejlett eszközök szélesebb körben történő elérhetővé tétele. A MeitY által vezetett misszió az MI-startupok támogatására összpontosít, különösen azokéra, amelyek alapmodelleket fejlesztenek indiai nyelveken.
A program keretében a kormány több mint 18 ezer GPU-t telepít, köztük közel 13 ezer csúcskategóriás H100 chipet indiai startupok kiválasztott csoportjának. Abhishek Singh, az IndiaAI vezérigazgatója és a MeitY tisztviselője szerint országának a fejlettebb technológiák felé való fordulása várhatóan mintegy 12 milliárd dollárnyi kutatás-fejlesztési beruházást vonz a következő öt évben.
Ennek keretében körülbelül 162 millió dollárt mozgatnak meg az IndiaAI Misszión keresztül, és ebből mintegy 32 milliót közvetlenül startup-finanszírozásra különítettek el. A Nemzeti Kvantum Misszió további 730 millióval járul hozzá az ország kvantumkutatási ambícióihoz. Ezenkívül a 2025–26-os költségvetés része az az 1,2 milliárd dolláros Mély Technológiai Alapok Alapja, amelynek célja a korai szakaszú innovációk katalizálása a magánszektorban.

