
A Google nemrégiben indította el a Gemini 3 modellt, amely a kódolás, az e-mail-feldolgozás és a dokumentumelemzés fejlesztésére összpontosít. Ez a modell jobb érvelési képességekkel, kontextus-érzékeléssel és grafikák (diagramok, illusztrációk stb.) beépítésének képességével is büszkélkedhet bizonyos kérdések megválaszolásakor.
A Google bejelentése kiemelte, hogy a Gemini 3 megjelenik a Gemini alkalmazásban, a Google Keresés mesterséges intelligencia módjában, valamint egy új programozási platformon, a Google Antigravity-n.
„A legokosabb a Google-től”
A közel két évvel ezelőtti indulása óta a Google folyamatosan bővítette a Gemini szolgáltatást, hogy szélesebb közönséget érjen el. A vállalat kiemeli, hogy az AI Overviews funkciójának jelenleg havi 2 milliárd felhasználója van, a Gemini alkalmazásnak havi 650 millió felhasználója van, a felhőalapú ügyfelek több mint 70%-a használ mesterséges intelligenciát, és 13 millió fejlesztő készít termékeket a Google AI-generációs modellje alapján.
A Google most először tette lehetővé a felhasználók számára, hogy a Gemini 3 Pro készüléket a Gemini alkalmazáson belül, az első naptól kezdve, azt állítva, hogy ez "a vállalat eddigi legokosabb modellje". A vállalat a Gemini 3 Pro készüléket mesterséges intelligencia módban is elérhetővé tette a fizetős felhasználók számára.
Tulsee Doshi, a Google DeepMind vezető igazgatója és termékvezetője elmondta, hogy a Gemini 3 közelebb viszi a vállalatot ahhoz a céljához, hogy az információkat „széles körben elérhetővé és hasznossá” tegye, tovább javítva a Google keresőmotorját.
A Google hangsúlyozza a Gemini 3 Pro multimodális feldolgozási képességeit, amelyek a szöveg, a képek és a hanganyagok egyidejű feldolgozására összpontosítanak. Például a modell képes receptek fotóit beolvasni és könyvekké alakítani, vagy interaktív kártyákat létrehozni videó előadások alapján.
![]() |
A Gemini 3 Pro benchmark eredményeit a Google gyűjtötte össze az LMArena oldalon. Kép: Google . |
A Google bejelentése kiemelte a Gemini 3 Pro teljesítményét a benchmark teszteken is. Például a modell 1501 pontot szerzett, amivel az LMArena rangsorának élén végzett. A Gemini 3 Pro logikai képessége elérte a doktori szintet a Humanity's Last Exam 37,5%-os, a GPQA Diamond vizsgán pedig 91,9%-os eredményével.
A MathArena Apex skálán a Gemini 3 Pro 23,4%-ot ért el, ami jelenleg a legmagasabb pontszám a nagy modellnyelvek (LLM-ek) között.
A multimodális érvelési képességekkel kapcsolatban a Google kijelenti, hogy a Gemini 3 Pro 81%-ot ért el az MMMU-Pro skálán és 87,6%-ot a Video-MMMU skálán. A modell 72,1%-ot ért el a SimpleQA Verified pontosságtesztelési platformon is.
„Ez azt bizonyítja, hogy a Gemini 3 Pro képes komplex problémák megoldására számos területen, a természettudományoktól a matematikáig, nagy megbízhatósággal” – hangsúlyozta a Google.
A Gemini 3 Deep Think verziójával a Humanity's Last Exam és a GPQA Diamond teszteken elért eredmények még a Gemini 3 Pro-nál is magasabbak voltak, 41%, illetve 93,8%. A modell az ARC-AGI-n, egy általános mesterséges intelligencia mérőszámon is 45,1%-ot ért el.
Mit tehet a Gemini 3?
A Gemini 3 fejlesztései számos Google-termékben megjelennek. A jelenleg a Geminiben tesztelés alatt álló Dinamikus nézet funkció interaktív élményt nyújt bizonyos lekérdezéseknél, például illusztrációkkal ellátott magazinoknál, rövid információknál vagy igény szerinti testreszabott felületeknél.
„A Gemini 3 akár a pickleball meccsvideódat is képes elemezni, azonosítani a fejlesztendő területeket, és edzéstervet készíteni az általános technikád fejlesztésére” – hangsúlyozta a Google.
![]() |
A Gemini 3 Pro fejlett kódolási képességei jobb képek készítését segítik. Fotó: Google . |
A Google Keresés mesterséges intelligencia módja vizuális elemeket is képes létrehozni, például képeket, diagramokat és szimulált videókat a Generatív felhasználói felület módban lekérdezések alapján. A felhasználók interakcióba léphetnek az adatokkal, vagy további kérdéseket tehetnek fel róluk.
A Google szerint az AI Mode több keresést tud végrehajtani egy továbbfejlesztett „lekérdezés-elosztási” technikának köszönhetően, amely a kérdéseket kisebb részekre bontja, hogy jobban megértse a kérdés szándékát, és „olyan új tartalmakat találjon, amelyeket korábban esetleg kihagytak”.
A Google nem habozott megemlíteni versenytársát, amikor a Gemini 3 Prót úgy jellemezte, mint amely „az üres közhelyeket értékes és hiteles nézőpontokkal helyettesíti”.
„Nemcsak azt válaszolja meg, amit hallani szeretnél, hanem azt is megadja, amit igazán hallanod kell” – tette hozzá a Google egyik képviselője.
![]() |
A Gemini dinamikus nézet funkciója vizuálisan interaktív élményt nyújt bizonyos lekérdezések esetén. Kép: Google . |
A Gemini 3 Pro jobb támogatást nyújt a fejlesztőknek az ügynökkódolásban és a „vibe kódolásban”. Az olyan eszközök, mint a Google AI Studio, a Vertex AI és a Gemini CLI támogatják a Gemini 3-at, a vadonatúj Antigravity platform mellett, amely az ügynökkódolásra és automatizálásra összpontosít.
Az ügynökökkel kapcsolatban a Google szerint a Gemini 3 továbbfejlesztett támogatást kínál. A modell összetett folyamatokat képes végrehajtani a felhasználók nevében, például e-mailek kategorizálását és rendszerezését, információk keresését és utazási jegyek foglalását.
Jelenleg a Google AI Ultra felhasználói a Gemini alkalmazás ügynöki funkcióit a Gemini Agent módban élvezhetik.
Fújj forró levegőt az ellenfeledre.
A Google új modelljét kemény kihívásnak tekintik a versenytársak számára. A New York Times forrásai hangsúlyozzák, hogy mind az OpenAI, mind az Anthropic attól tart, hogy megelőzik őket, ha a Gemini 3 kiemelkedően teljesít olyan feladatokban, mint a kódolás vagy a képalkotás.
„A Google méretét, piaci részesedését és a keresési területen betöltött úttörő előnyét tekintve a Gemini piaci részesedést szerezhet, és lemaradhat az OpenAI-ról és más vállalatokról” – mondta Mike O'Rourke, a JonesTrading elemzője.
Hozzátette, hogy a Geminire való áttérés átterjedhet az egész piacra, kérdéseket vetve fel az Oracle és a Microsoft számára, amelyek dollármilliárdokat kapnak az OpenAI-tól felhőalapú számítástechnikai infrastruktúra biztosítására.
![]() |
A Google Keresés mesterséges intelligencia alapú módja szimulált képeket tud létrehozni a lekérdezések alapján. Kép: Google . |
A mesterséges intelligencia robbanásszerű térnyerése a technológiai ipart is arra késztette, hogy szembesüljön a költségek és az üzleti lehetőségek egyensúlyozásának kérdésével. A mai mesterséges intelligencia rendszereket elsősorban internetes keresésekhez használják, automatizálva a programozást.
A McKinsey & Company szerint ez a technológia drága szuperszámítógépekkel teli adatközpontokban működik, és az iparág várhatóan 7 billió dollárt fog költeni ezekre a létesítményekre 2030-ra. A Wall Street-i befektetők aggódnak, hogy az Anthropic, az OpenAI, a Microsoft és a Google bevételei elegendőek lesznek-e a költségek ellensúlyozására.
„Kiváló minőségű, potenciális felhasználási esetekre van szükségünk a bevételszerzéshez. Még nem értük el ezt a pontot” – hangsúlyozta Ben Bajarin, a Creative Strategies elemzője.
![]() |
A Gemini 3 Pro pontszáma a Google által végzett WebDev Arena benchmark teszten. Kép: Google . |
Koray Kavukcuoglu, a Google mesterséges intelligencia részlegének technológiai igazgatója szerint a Gemini pontossága javulni fog, ahogy a vállalat bevezeti a Google Keresésben. A keresőmotorral kombinálva a modell azonnal képes információkat lekérni és validálni. Természetesen ez csak bizonyos mértékig hatékony.
„Ha az emberek csak azért keresnek rá a Google-re, hogy elkerüljék a kék linkekre kattintást, az jelenleg nem elég jó” – mondta Manos Koukoumidis, az Oumi, egy mesterséges intelligencia megoldásokat automatizáló és telepítő startup társalapítója.
A felhasználók számának növelése érdekében a Google bejelentette, hogy egyéves ingyenes AI Pro csomagot kínál az amerikai főiskolai hallgatóknak. A vállalat több mint 20 olyan partnert sorolt fel, akik a Gemini 3-at használják adatok elemzésére és többnyelvű megbeszélések rögzítésére.
Bajarin szerint ezek az új funkciók segíthetnek a Google-nek versenyezni a Microsofttal és az Amazonnal a felhőalapú számítástechnikai piacon. Októberben a Google bejelentette, hogy a felhőalapú bevétele a legutóbbi negyedévben elérte a 15 milliárd dollárt , amelyet elsősorban a mesterséges intelligencia iránti kereslet generált.
Forrás: https://znews.vn/google-ra-mat-gemini-3-manh-me-hon-post1603987.html











Hozzászólás (0)