Sok jelölt megjegyezte, hogy a matematikai teszt hosszú és nehéz 90 perc alatt kitölteni. Ez azonban nem akadály a mesterséges intelligencia számára. Fotó: Duy Hieu . |
Június 26-án délután a jelöltek teljesítették a 2025-ös középiskolai érettségi vizsga matematika tesztjét, 90 perces időkorláttal. Ez volt az első teszt, miután az Oktatási és Képzési Minisztérium új formátumot alkalmazott, amely állítólag nehezebb, mint a korábbi években.
Bár az idei matematikai feladatok nehézkesek lehetnek a jelöltek számára, mivel hosszúak és időigényesek, a mesterséges intelligencia alapú chatbotok feldolgozása nem igényel sok időt. A mesterséges intelligencia hatékonyságának teszteléséhez a Tri Thuc - Znews 4 chatbotot használt, köztük a ChatGPT-t, a Google Gemini-t, a Claude AI-t és a Grok AI-t, hogy megoldják az idei középiskolai érettségi vizsga néhány esszékérdését.
Gyors feldolgozás, „találat vagy nem találat” eredmények
A 0109-es tesztkód rövid kérdéseinek megválaszolásához chatbotokat használtak. Közülük a ChatGPT és a Gemini adta a legtöbb helyes eredményt a legkisebb késéssel. Mindkét chatbot 6 kérdésre válaszolt, kérdésenként 7-15 másodperces idővel. A Gemini azonban a fenti problémákat a 2.5-ös Flash modellel (indoklás nélkül) tudta megoldani, ami gyors és átfogó feldolgozást tesz lehetővé.
Eközben Claude teljesen elbukott a számításaiban, és folyamatosan helytelen eredményeket adott. Hiába kérték fel az újraszámításra, az Anthropic chatbotja továbbra is ugyanazt a választ adta. Grok a kérdések körülbelül felére helyesen válaszolt, de hosszú válaszidővel (kérdésenként több mint 2 perc).
A ChatGPT és a Grok esetében ezeknek a kérdéseknek a megoldása a következtetéses verziót igényli, ami sokkal tovább tart. A Gemini nagyon gyors, a leggyorsabb kérdéshez talán 5 másodperc kell, és csak a 2.5-ös Flash modellt használja.
A ChatGPT nagyon élénken mutatja be a gondolkodási folyamatot. |
Sebesség tekintetében a Gemini érte el a leggyorsabb feldolgozási időt, átlagosan kevesebb mint 10 másodpercet feladatonként, de összetettebb, hosszabb és nehezebben követhető megoldásokat kínált. Ezután következett a ChatGPT következtetési modellje, amely átlagosan 25 másodpercet vett igénybe. Eközben, bár továbbra is helyes eredményeket kapott, Grok sokáig tartott az érvelés, 148 másodpercet egy közepesen nehéz kérdéshez.
Bár vietnami nyelven tették fel a kérdést, mindhárom modell angolul mutatta be az érvelési folyamatát. A ChatGPT tartalmazta a legrövidebb leírást, számos illusztrációval, grafikonnal és könnyen érthető elemzéssel. A Gemini a modell gondolkodását is tisztázta és sorrendben mutatta be.
Különösen a Groknak van a leginkább emberi gondolkodásmódja. A modell folyamatosan azt kérdezi magától, hogy „de várjunk csak, ellenkezőleg”, hasonlóan ahhoz, ahogy egy diák tenné egy matematikai feladat megoldása során. Ez ahhoz vezethet, hogy a chatbot túlgondolja a problémát, és lelassítja a válaszidőt.
Groknak 148 másodpercbe telt, hogy részletesen kifejtse az eredményeit. |
A mesterséges intelligencia másképp oldja meg a matematikai feladatokat, mint az emberek
Egy Apple-tanulmány kimutatta, hogy a következtetési modellek valójában nem használják az agyukat, hanem csak mechanikusan tanulnak a meglévő adatokból. A tanulmány azt is sugallja, hogy a mesterséges intelligencia teljesen más gondolkodási folyamattal rendelkezik, mint az emberek, ezért megpróbálják utánozni a problémamegoldás módját. Azonban lehetséges, hogy az érvelési folyamatot csak a modell alkotja meg.
Mivel a középiskolai érettségi vizsga egyre nehezebbé és magas szintű analitikus gondolkodást igényel, a mesterséges intelligencia használata a tanulásban és a referenciaként már nem ismeretlen a diákok számára. A fent használt chatbotok közül a ChatGPT és a Gemini két megfelelő lehetőség az önálló tanulásra, hogy nehéz problémákra megoldásokat találjanak.
![]() |
Hanoi diákjai a 2025-ös középiskolai érettségi vizsgán. Fotó: Viet Ha . |
Bár a mesterséges intelligencia gyorsan és egyszerűen állít elő eredményeket, a fejlesztők még nem értik teljesen az érvelési folyamatát. Egy akadémiai környezetben az emberi gondolkodási képesség továbbra is a legfontosabb tényező. Tuan Nguyen úr, egy Ho Si Minh-városi nemzetközi egyetem előadója szerint a mesterséges intelligencia használata normális, de a diákoknak meg kell érteniük a tanulságot, gyakorolniuk kell a kritikai gondolkodást és elsajátítaniuk az okoseszközök használatát a hatékonyabb tanulás érdekében.
Tran Manh Tung úr, a Newton Középiskola Matematika Tanszékének vezetője megjegyezte, hogy a vizsga formátuma hasonló volt az Oktatási és Képzési Minisztérium által korábban közzétett mintavizsgához. „Ha azonban skálára helyezzük, az igazi vizsga nehezebb volt és differenciáltabb, mint a próbavizsga” – jegyezte meg.
Az idei vizsga három részből áll, amelyek három római számnak felelnek meg. Az első két rész feleletválasztós, így a jelöltek nem túl nehezek ahhoz, hogy könnyen pontokat szerezzenek – mondta Tung úr. A fennmaradó részek azonban rövid kérdések, hasonlóan a sok évvel ezelőtti esszé formátumhoz, azzal a különbséggel, hogy a jelölteknek csak az eredményeket kell kitölteniük, és nem kell bemutatniuk azokat.
Forrás: https://znews.vn/ai-chi-mat-10-giay-de-giai-bai-toan-thi-tot-nghiep-thpt-post1563990.html











Hozzászólás (0)