![]() |
Google Gemini logó. Fotó: Bloomberg . |
A Google november végén mutatta be a Gemini 3 modellt. A vállalat számos figyelemre méltó fejlesztést hozott, például továbbfejlesztett kódolási képességeket, vizualizációt és ügynököket, amelyek bizonyos feladatokat végeznek el a felhasználók nevében.
A Gemini 3 bemutatásakor a Google hangsúlyozta, hogy ez a vállalat „eddigi legokosabb modellje”. A gyakorlati tapasztalatok azt mutatják, hogy a modell gyorsabban dolgozza fel a feladatokat, jobb az érvelési képessége, bár vannak olyan tényezők, amelyeken javítani kell.
Interaktív felületek gyors létrehozása
A Gemini 3 egyik legnagyobb fejlesztése a Canvas, egy interaktív munkaterület a Geminiben, amely lehetővé teszi, hogy chatbotokat kérjünk meg kód írására, eredmények vizualizálására és tartalom szerkesztésére.
Amikor a Gemini 3-at arra kérik, hogy készítsen egy 3D-s modellt a futball-labda, a Föld, a Nap és a Tejútrendszer méretkülönbségeiről, az eszköz egy interaktív kódoló, feldolgozó és létrehozó felületet indít el, amely lehetővé teszi az objektumok kiválasztását és méretbeli összehasonlítását.
![]() |
Interaktív terek létrehozásának lehetősége a Gemini 3 Canvas funkciójával. |
A Google demójához képest az eredmények képminőség tekintetében valamivel rosszabbak. Cserébe az objektumokról szóló információk világosan és könnyen érthetően jelennek meg. A feldolgozási idő körülbelül 2 perc. A Canvas felületén a felhasználók közvetlenül szerkeszthetik a kódot, másolhatják vagy megoszthatják a tartalmat.
Egy másik paranccsal a Gemini 3-nak egy voxel stílusú, faágon ülő sasot kellett létrehoznia. Az eszköz körülbelül 45 másodperc után eredményt adott, a felhasználók pedig az egérrel nagyíthattak és forgathatták a nézetet. A kép egyes részletei azonban grafikai hibákat tartalmaztak, és nem jelentek meg megfelelően.
Szintén egy faágon ülő sassal, de egy nehezebb kéréssel (3D modell). Az első alkalommal a Gemini 3 által generált kód összeomlott és nem tudott futni. A javítás kérése után a kép megjelent és interaktív volt.
![]() |
A Gemini 3 interaktív környezetteremtő képességei. |
Bár vannak problémák, a kérdés-felelet modellről a közös szerkesztésre való áttérés érdekes irány, amely hasznossá teszi a Gemini 3-at összetett, hosszú távú feladatokhoz.
Természetesen a Gemini 3 nem csak grafikák vagy vizuális modellek készítésére szolgál. A Google egy „Generatív felhasználói felület” funkciót tesztel az AI Pro felhasználók számára. Néhány paranccsal a modell interaktív, magazin stílusú felületeket vagy vizuális weboldalakat hozhat létre.
A Google szerint a funkció fokozatosan kerül bevezetésre. Ahogy a The Verge is tapasztalta, a felhasználóknak ki kell választaniuk a Vizuális elrendezés funkciót, majd be kell írniuk egy parancsot, például: „Tervezzetek meg egy 3 napos utat Rómába”.
A feldolgozás után a Gemini 3 egy utazási weboldalhoz hasonló eredményeket generál részletes menetrendekkel és képekkel, valamint számos kérdéssel az utazási preferenciákról és az étkezési stílusokról. Innen a modell ennek megfelelően módosítja a válaszokat. Ez a funkció olyan témákban is hasznos, mint például a számítógép összeszerelése, az akvárium építése stb.
Hatékonyabban érvelj és elemezz
A Google szerint a Gemini 3 jobb érvelési képességekkel rendelkezik, mint elődje. A cég azt állítja, hogy a Gemini 3 Pro érvelési képessége doktori szintű, 37,5%-os eredményt ért el a Humanity's Last Exam vizsgán és 91,9%-ot a GPQA Diamond vizsgán.
Természetesen a felhasználók csak akkor érzik a különbséget, ha közvetlenül interakcióba lépnek a modellel. Amikor a GPQA Diamond referenciakészletből vett (doktori szintre fókuszáló) probléma megoldására kérték őket, a Gemini 3 Pro körülbelül 30 másodperc alatt részletes megoldást adott, beleértve a probléma minden egyes lépését és szemléltető képeket.
![]() |
Az Ikrek 3 képes összetett kérdésekre válaszolni, gondolkodási képessége PhD-szintnek megfelelő. |
Az értékelés szerint a megoldás meglehetősen részletes és követi az eljárást. Összehasonlításképpen, a GPT-5.1 szintén körülbelül 30 másodpercet vett igénybe, helyesen válaszolt, de a megoldás kevésbé volt részletes. Hasonlóképpen, a Claude 4.5 Sonnet is helyesen válaszolt, gyorsabban, mint a Gemini 3, de kevesebb részletességgel.
A Google szerint a Gemini 3 egyszerre több forrásból is képes dokumentumokat kinyerni, például szöveget, képeket és videókat . A Gemini 3 azokat a feladatokat is jobban kezeli, amelyekre korábban nem tanították be.
![]() |
Gemini 3 videóanalitikai képességek. |
Például, amikor egy 57 perces videó fő témájának elemzésére kérték a Gemini 3-at, mindössze egy percre volt szüksége ahhoz, hogy olyan eredményt adjon vissza, amely tartalmazta a kért argumentumokat, valamint a videó megfelelő részére mutató időbélyeget. Hasonlóképpen, a modell helyesen azonosított egy teniszről szóló videót, elemezve a mérkőzéseket és az egyes játékosok játékát.
A felhasználók megkérhetik a Gemini 3-at, hogy nézzen videókat külső forrásokra való hivatkozás közben, sőt, kérdéseket is feltehetnek mélyebb elemzés céljából. Összességében a Gemini 3 meglehetősen gyorsan elemzi és hivatkozik a dokumentumokra, részben a Google Search adatbázisához való csatlakozásának köszönhetően.
Az ügynök segítőkész, de problémái vannak
Az Agent egy figyelemre méltó fejlesztés a Gemini 3-on. Az AI Ultra csomag felhasználói számára (jelenleg csak az amerikai piacot támogatja) ez a mód összetett folyamatokat tud végrehajtani a felhasználók nevében, például e-mailek rendezését és rendszerezését, információk keresését, utazási jegyek foglalását...
Amikor a Google elindította a Gemini 3-at, bemutatta a Gmailben a beérkező levelek rendszerezésének lehetőségét, és a The Verge tapasztalatai szerint pontosan úgy működött, ahogy kellett: egy hét olvasatlan e-mailjeinek teljes listáját generálta.
A Canvas funkcióhoz hasonlóan az e-mail lista és a javasolt műveletek külön területen jelennek meg. A Gemini néhány lehetőséget kínál, például emlékeztetők beállítását a fontos e-mailekhez, promóciós e-mailek archiválását...
![]() |
A Gemini 3 ügynöki funkciója támogatja a Gmail beérkező levelek kezelését. Fotó: The Verge . |
Amikor a rendszert számlafizetési emlékeztető létrehozására kérik, a Gemini gyorsan beolvassa a releváns információkat a Google Tasksbe. A fizetési feladatnál az ügynök automatikusan navigál, és megáll, amikor a felhasználónak meg kell adnia a fizetési információkat.
Összességében a Gemini 3 ügynökprogram meglehetősen hasznos az olyan e-mailek észlelésében, amelyeket a felhasználók valószínűleg elfelejtenek. Az eszköz képes megtalálni és leiratkozni a hirdetési címekről érkező, már nem hasznos e-mailekről is.
Valójában néhány chatbot ügynök, mint például a Perplexity és a ChatGPT, már támogatja a Gmail integrációját. A Gemini integrációs képességei azonban a legváltozatosabbak. Például a Perplexity felhasználóknak konkrétan meg kell adniuk azokat az e-maileket, amelyeket meg szeretnének tartani vagy törölni, míg a Gemini műveletei gombokkal végezhetők el.
![]() |
A Gemini 3 interaktív felület-készítő funkciója. Fotó: The Verge . |
A ChatGPT e-mail ütemezési funkciója szintén nem konzisztens. A Gemini e-mail kézbesítési sebessége azonban lassabb, mint a Perplexity-é. Egyes feladatok, például az éttermi asztalfoglalás, néha problémákba ütköznek.
Bár a felhasználóknak mindig meg kell erősíteniük a bizalmas műveleteket, például a fizetéseket vagy az e-mailek küldését, bizonyos feladatok mesterséges intelligenciára bízása továbbra is bizonytalanságot okoz a felhasználóknak. A Gemini 3 ügynöki módja meglehetősen hasznos, de a felhasználóknak továbbra is figyelniük kell a kimenetet.
Forrás: https://znews.vn/gemini-3-tot-den-dau-post1607493.html

















Hozzászólás (0)