A Google bemutatja a Gemini 2.5-öt - a mesterséges intelligencia gondolkodási modelljeinek új generációját

Az új generációt a Gemini 2.5 Pro Experimental vezeti, egy multimodális mesterséges intelligencia modell, amely a vállalat állítása szerint a valaha volt legintelligensebb gondolkodási képességével rendelkezik. A modell március 26-tól, azaz ma lesz elérhető a Google AI Studio fejlesztői platformon, valamint a Gemini alkalmazásban a Gemini Advanced előfizetők számára (havi 20 dollárért).

A Gemini 2.5 képes „gondolkodni” egy pillanatra, mielőtt válaszolna. (Fotó: Google)

A mesterséges intelligencia gondolkodása – a Google új iránya

A Google bejelentette, hogy mostantól minden új mesterséges intelligencia alapú modellje beépített gondolkodási képességekkel fog rendelkezni.

Amióta az OpenAI 2024 szeptemberében bemutatta az o1-et, az első gondolkodó MI-modellt, a technológiai iparág azóta is versenyben van, hogy elérje vagy meghaladja a képességeit. Az Anthropic, a DeepSeek, a Google és az xAI is rendelkezik gondolkodó MI-modellekkel, amelyek további számítási teljesítményt használnak az információk vizsgálatára és a problémák elemzésére, mielőtt megoldást találnának.

A kognitív mesterséges intelligencia fejlődése lehetővé tette a modellek számára, hogy felülmúlják a matematikát és a programozást. Sok technológus úgy véli, hogy ez fontos alapot jelent majd a mesterséges intelligencia ágensek – olyan automatizált rendszerek, amelyek emberi beavatkozás nélkül képesek feladatokat elvégezni – számára. A kognitív mesterséges intelligencia azonban több erőforrást is fogyaszt, ami magasabb üzemeltetési költségekhez vezet.

A Google korábban, 2024 decemberében kísérletezett a Gemini egy speciális verziójával a mesterséges intelligenciával való gondolkodással. A Gemini 2.5 azonban a vállalat eddigi legkomolyabb lépése, amely az OpenAI „o” sorozatával versenyez.

Kiemelkedő teljesítmény több kritérium alapján

A Gemini 2.5 Pro számos teszten legyőzte a legnagyobb versenytársait. (Fotó: Google)

A Google azt állítja, hogy a Gemini 2.5 Pro nemcsak felülmúlja korábbi AI-modelljeit, hanem számos teszten számos top versenytársát is legyőzi.

Az Aider Polyglot benchmarkban, amely a programozási kód szerkesztésének képességét méri, a Gemini 2.5 Pro 68,6%-ot ért el, megelőzve az OpenAI, az Anthropic és a DeepSeek topmodelljeit.

Az SWE-bench Verified szoftverfejlesztési képességeket vizsgáló teszten azonban a Gemini 2.5 Pro 63,8%-ot ért el, ami magasabb, mint az OpenAI o3-mini és a DeepSeek R1, de még mindig alacsonyabb, mint az Anthropic Claude 3.7 Sonnetje (70,3%).

A Humanity's Last Exam multidiszciplináris teszten, amely több ezer kérdést tartalmaz matematika, társadalomtudományok és természettudományok terén, a Gemini 2.5 Pro 18,8%-ot ért el, ami magasabb eredmény, mint a legtöbb más vezető AI-modellé.

Figyelemre méltó, hogy a Gemini 2.5 Pro egyszerre 1 millió tokent képes feldolgozni, ami körülbelül 750 000 szónak felel meg – ez több, mint a teljes Gyűrűk Ura regénysorozat. A Google azt is elárulta, hogy a közeljövőben ez a modell akár 2 millió tokent is támogatni fog, ami jelentősen megnöveli a hosszú kontextusok elemzésének és megjegyzésének képességét.

A Google még nem hozta nyilvánosságra a Gemini 2.5 Pro API-árazását. A vállalat azt mondta, hogy a következő hetekben további információkat fog közölni.

Khanh Huyen (Forrás: Tech Crunch)

Forrás: https://vtcnews.vn/google-ra-mat-gemini-2-5-the-he-mo-hinh-ai-tu-duy-moi-ar933854.html