Az MI-modellek már egymást nézik hülyének – makronom.eu
2026. május 19., kedd

Az MI-modellek már egymást nézik hülyének

A red-suited robot stands out among a crowd of white-helmeted figures, centered in the image.

Az MI-verseny új szakaszába lépett: az idei rangsorban két modell is elérte a 145-ös IQ-s ponthatárt. A Grok és a GPT egymás nyakán liheg.

Az idei MI-rangsorban az a legérdekesebb, hogy nincs egyértelmű győztes. A Grok-4.20 Expert Mode és az OpenAI GPT 5.4 Pro (Vision) holtversenyben, 145-ös pontszámmal vezeti azt a listát, amit 35 vizuális mintafelismerési feladat alapján állítanak össze. Ez a szám új rekord, egy évvel korábban még 135 volt a legjobb eredmény, vagyis a csúcsmodellek egyetlen esztendő alatt tíz pontot javítottak.

A dobogó harmadik fokán a Gemini 3.1 Pro Preview áll 141-gyel, így a vezető modelleket csupán néhány pont választja el egymástól. A mezőny további része is sűrű: az OpenAI GPT 5.4 Thinking (Vision) 139 pontot ért el, az OpenAI GPT 5.3 136-ot, míg több rendszer – köztük a Meta Muse Spark, az OpenAI GPT 5.4 Thinking és a Grok vizuális változata – 133 pont körül csoportosul. A 130-as sávban található az Qwen 3.5 és a Claude-4.6 Opus is, ami azt mutatja, hogy az élmezőny már nem egy-két szereplő privilégiuma.


Az élmezőnytől leszakadó modellek között vannak a DeepSeek rendszerei 111-112 ponttal, illetve az európai csodafegyverként tálalt francia Mistral csúcsmodellje 96-tal.

Árnyalja a képet, hogy maga a mérés korlátozott, hiszen a hagyományos Mensa Norway-teszt alapvetően vizuális mintafelismerési képességeket mér. A vision modellek közvetlenül képekkel dolgoznak, míg a többiek szövegesen megfogalmazott feladatokat kapnak, ami torzíthatja az eredményeket. Mindez azt jelenti, hogy az IQ-szerű pontszám inkább egy jól kommunikálható összehasonlító mutató, mint átfogó intelligenciamérés. Nem mond sokat a kódolási képességekről, a faktuális pontosságról vagy a valós alkalmazási teljesítményről. Valójában „csupán” a trendet jelzi: az MI fejlődése nem lassul, a különbségek pedig egyre kisebbek.

***

Kapcsolódó:


Fotó: Dreamstime

Posztok hasonló témában

Hét ábrája

Partnereink

Kérdezz bátran!
Chat