
A Google nemrégiben piacra dobta a Gemini 3-at, egy olyan modellt, amely a kódolás, az e-mail-feldolgozás és a dokumentumelemzés fejlesztésére összpontosít. Ez a modell jobb érvelési képességgel is rendelkezik, megérti a kontextust, és grafikákat (diagramokat, illusztrációkat...) is beépít egyes kérdések megválaszolásakor.
A Google bejelentése hangsúlyozza, hogy a Gemini 3 megjelenik a Gemini alkalmazásban, a Google Keresés mesterséges intelligencia módjában, valamint egy új programozási platformon, a Google Antigravity-n.
„A legokosabb a Google-től”
A közel két évvel ezelőtti indulása óta a Google folyamatosan bővítette a Gemini szolgáltatást a szélesebb közönség számára. A vállalat megjegyzi, hogy az AI Overviews funkciónak mára havi 2 milliárd felhasználója van, a Gemini alkalmazásnak havi 650 millió felhasználója van, a felhőalapú ügyfelek több mint 70%-a használ mesterséges intelligenciát, és 13 millió fejlesztő fejleszt termékeket a Google generatív AI modelljéből.
A Google most először teszi elérhetővé a Gemini 3 Pro-t a Gemini alkalmazásban, a kezdetektől fogva, azt állítva, hogy ez a vállalat „eddigi legokosabb modellje”. A Gemini 3 Pro-t mesterséges intelligencia módban is elérhetővé teszik a fizetős felhasználók számára.
Tulsee Doshi, a Google DeepMind vezető igazgatója és termékvezetője elmondta, hogy a Gemini 3 közelebb viszi a vállalatot ahhoz a céljához, hogy az információkat „széles körben elérhetővé és hasznossá” tegyék, folytatva a Google keresőmotorjának fejlesztését.
A Google kiemeli a Gemini 3 Pro multimodális feldolgozási képességeit, amelyek a szöveg, a képek és a hanganyagok egyidejű feldolgozására összpontosítanak. A modell például képes receptek fotóit beolvasni és könyvekké alakítani, vagy interaktív kártyákat létrehozni videó előadások alapján.
![]() |
A Google által az LMArena platformon végzett Gemini 3 Pro teljesítménymérés. Fotó: Google . |
A Google bejelentése kiemelte a Gemini 3 Pro teljesítményét a benchmark teszteken is. Például a modell 1501 pontot szerzett, amivel az LMArena rangsorának élén végzett. A Gemini 3 Pro logikai képessége elérte a doktori szintet, 37,5%-ot ért el a Humanity's Last Exam és 91,9%-ot a GPQA Diamond teszten.
A probléma alapú skálán (MathArena Apex) a Gemini 3 Pro 23,4%-ot ért el, ami jelenleg a legmagasabb eredmény a nagy nyelvi modellek (LLM) között.
A multimodális gondolkodás tekintetében a Google szerint a Gemini 3 Pro 81%-ot ért el az MMMU-Pro skálán és 87,6%-ot a Video-MMMU skálán. A modell a SimpleQA Verified pontosságtesztelési platformon is 72,1%-ot ért el.
„Ez azt mutatja, hogy a Gemini 3 Pro képes nagy megbízhatósággal megoldani a komplex problémákat a természettudományoktól a matematikáig számos területen” – hangsúlyozta a Google.
A Gemini 3 Deep Think mélyreható gondolkodást fejlesztő verziójával a Humanity's Last Exam és a GPQA Diamond teszteken elért pontszámok még a Gemini 3 Pro-nál is magasabbak voltak, 41%, illetve 93,8%. A modell az ARC-AGI-n is 45,1%-ot ért el, ami az általános mesterséges intelligencia mérőszáma.
Mit tehet a Gemini 3?
A Gemini 3 fejlesztései számos Google-termékben megjelennek. A Gemini kísérleti Dynamic View funkciója interaktív élményt nyújt bizonyos lekérdezéseknél, például illusztrációkkal ellátott magazinoknál, rövid információknál vagy igény szerinti testreszabott felületeknél.
„A Gemini 3 képes elemezni a pickleball meccsed videóját is, azonosítani a fejlesztendő területeket, és edzéseket tervezni az általános technikád fejlesztése érdekében” – jegyzi meg a Google.
![]() |
A Gemini 3 Pro fejlett kódolási képességei jobb képek készítését teszik lehetővé. Fotó: Google . |
A Google Keresés mesterséges intelligencia módja vizuális elemeket, például képeket, táblázatokat és szimulált videókat is képes generálni a generatív felhasználói felület módján keresztül lekérdezések alapján. A felhasználók interakcióba léphetnek az adatokkal, vagy további kérdéseket tehetnek fel róluk.
A Google szerint az AI mód több keresést tud végrehajtani a „lekérdezés-elosztás” fejlesztésének köszönhetően. Ez a technika kisebb részekre bontja a kérdéseket, hogy jobban megértse a kérdés szándékát, és „olyan új tartalmakat találjon, amelyek korábban esetleg kimaradtak”.
A Google nem riad vissza attól, hogy megemlítse versenytársait, amikor a Gemini 3 Prót úgy jellemzi, mint amely „az üres hízelgést értékes és hiteles nézőpontokkal váltja fel”.
„Nem csak azt válaszolja meg, amit hallani szeretnél, hanem azt is megadja, amit igazán hallanod kell” – tette hozzá a Google egyik képviselője.
![]() |
A Gemini dinamikus nézet funkciója vizuális interaktív élményt nyújt bizonyos lekérdezések esetén. Fotó: Google . |
A Gemini 3 Pro jobb támogatást nyújt a fejlesztőknek az ágenskódolásban és a „vibe kódolásban” végzett feladatokban is. A Gemini 3-on olyan eszközök érhetők el, mint a Google AI Studio, a Vertex AI és a Gemini CLI, valamint a vadonatúj Antigravity platform, amely az ágenskódolásra és automatizálásra összpontosít.
Az ügynökökről szólva, a Google szerint a Gemini 3 jobban tud segíteni. A modell összetett folyamatokat tud végrehajtani a felhasználók nevében, mint például az e-mailek rendezése és rendszerezése, információk keresése és utazási jegyek foglalása.
A Google AI Ultra felhasználói mostantól a Gemini Agent móddal élvezhetik az ügynökfunkciókat a Gemini alkalmazásban.
Lélegezd forró levegőt az ellenfeledre
A Google új modelljét nehéz problémának tekintik a versenytársak számára. A New York Times forrása hangsúlyozta, hogy mind az OpenAI, mind az Anthropic belső aggodalmát fejezte ki amiatt, hogy lehagyják őket, ha a Gemini 3 kiemelkedően teljesít olyan feladatokban, mint a kódolás vagy a képalkotás.
„Tekintettel a Google méretére, piacvezető szerepére és a keresési piac elsőként való előnyére, a Gemini piaci részesedést szerezhet, maga mögött hagyva az OpenAI-t és másokat” – mondta Mike O'Rourke, a JonesTrading elemzője.
A Geminire való áttérés hullámszerűen befolyásolhatja az egész piacot – tette hozzá –, kérdéseket vetve fel az Oracle és a Microsoft számára, amelyek dollármilliárdokat kaptak az OpenAI-tól felhőalapú számítástechnikai infrastruktúra biztosítására.
![]() |
A Google Keresés mesterséges intelligenciája szimulált képeket képes generálni a lekérdezések alapján. Fotó: Google . |
A mesterséges intelligencia robbanásszerű térnyerése a technológiai világot is kérdések elé állította a költségek és az üzleti lehetőségek egyensúlyozásával kapcsolatban. A mesterséges intelligencia rendszereket ma főként az internet lekérdezésére és a programozás automatizálására használják.
A technológia drága szuperszámítógépekkel teli adatközpontokban működik, és a McKinsey & Company szerint az iparág várhatóan 7 billió dollárt költ majd ezekre a létesítményekre 2030-ig. A Wall Street-i befektetők aggódnak amiatt, hogy az Anthropic, az OpenAI, a Microsoft és a Google bevételei elegendőek lesznek-e a költségek fedezésére.
„Kiváló minőségű, potenciális felhasználási esetekre van szükségünk a bevételszerzéshez. Még nem tartunk ott” – mondta Ben Bajarin, a Creative Strategies elemzője.
![]() |
A Gemini 3 Pro pontszámokat ért el a Google WebDev Arena benchmarkján. Fotó: Google . |
Koray Kavukcuoglu, a Google mesterséges intelligenciaért felelős műszaki igazgatója elmondta, hogy a Gemini pontossága javulni fog, ahogy a vállalat bevezeti a Google Keresésben. A keresőmotorral kombinálva a modell azonnal képes információkat lekérni és hitelesíteni. Természetesen ez csak bizonyos mértékig működik.
„Ha az emberek azért mennek a Google-ra, hogy elkerüljék a kék linkekre kattintást, az nem elég jó” – mondta Manos Koukoumidis, az Oumi, egy mesterséges intelligencia megoldásokat automatizáló és telepítő startup társalapítója.
A felhasználói bázis növelése érdekében a Google bejelentette, hogy egy év ingyenes AI Pro próbaverziót kínál az amerikai egyetemistáknak. A vállalat több mint 20 olyan partnert sorol fel, akik a Gemini 3-at használják adatok elemzésére és többnyelvű megbeszélések rögzítésére.
Bajarin szerint az új funkciók segíthetnek a Google-nek versenyezni a Microsofttal és az Amazonnal a felhőalapú számítástechnikai piacon. Októberben a Google bejelentette, hogy felhőalapú bevétele a legutóbbi negyedévben elérte a 15 milliárd USD-t , amely főként a mesterséges intelligencia iránti keresletből származik.
Forrás: https://znews.vn/google-ra-mat-gemini-3-manh-me-hon-post1603987.html











Hozzászólás (0)