A Gemini túllépi a chatbotok határait.

A Geminivel kapcsolatos fejlesztések a Google új irányvonalát mutatják, amely a chatbot interfészekről a folyamatosan aktív ügynökökre helyezi át a hangsúlyt.

ZNews•22/05/2026

Sundar Pichai vezérigazgató a Google I/O 2026 konferencián beszél. Fotó: Android Central .

A május 20-án (vietnami idő szerint) kora reggel tartott I/O 2026 konferencián a Google bejelentette a Gemini legújabb verzióját, valamint egy Omni nevű, a fizikai világot szimuláló mesterséges intelligencia modellt.

A CNET szerint az eseményre akkor került sor, amikor a Google igyekezett lépést tartani a mesterséges intelligencia modelljeinek fejlesztésével, miközben több szolgáltatást nyújtott hatalmas felhasználói bázisának.

Az I/O 2026 szintén kiemelkedő esemény, mivel a piac az OpenAI és az Anthropic szárnyaló értékeléseire összpontosít, amelyek várhatóan idén indítanak első nyilvános ajánlattételt (IPO-t).

Gemini 3.5 Flash: Gyors és költséghatékony

A Google továbbra is a Gemini ökoszisztémára összpontosít. Az eseményen a vállalat bemutatta a Gemini 3.5 Flash-t, egy leegyszerűsített verziót, amely továbbra is hatékony, miközben a hasonló, fejlettebb modellek árának felébe, vagy akár egyharmadába kerül.

Az esemény előtt újságíróknak nyilatkozva Sundar Pichai vezérigazgató elmondta, hogy a Gemini 3.5 Flash „elképesztően gyors”. A Google kijelentette, hogy ez lesz az alapértelmezett modell a Geminiben és a Google Search mesterséges intelligencia módjában világszerte.

„A Google bejelentése szerint többé nem kell a minőséget feláldozni a sebességért.” A vállalat kijelentette, hogy a Gemini 3.5 Flash kibertámadások elleni védelme javult, csökkentve a rosszindulatú tartalmak létrehozásának és a normál parancsok téves elutasításának arányát.

Google Gemini 3.5 Flash, Google Gemini Spark, Google Gemini Omni, su kien I/O 2026, Gemini Omni la gi anh 1

A Gemini 3.5 Flash nagy hatékonyságáról és gyors kimeneti sebességéről ismert. Kép: Google .

A Gemini 3.5 Flash összetett, ügynökalapú munkafolyamatokra van optimalizálva. A Google szerint számos benchmarkban felülmúlja a Gemini 3.1 Pro-t, például a Terminal-Bench 2.1-ben (76,2% vs. 70,3%) és az MCP Atlasban (83,6% vs. 78,2%).

A másodpercenként kibocsátott tokenek számát tekintve a Gemini 3.5 Flash négyszer gyorsabb, mint néhány más újabb modell. A Google szerint a modell lerövidítheti egyes feladatok elvégzésének idejét, amelyek korábban napokig vagy hetekig tartottak, alacsonyabb költséggel, így ideális programozók, vállalkozások, tudósok és általános felhasználók számára egyaránt.

„Hogy perspektívába helyezzük a dolgot, a nagyvállalatok naponta körülbelül 1 billió tokent dolgoznak fel. Ha ennek a munkaterhelésnek a 80%-át 3,5 Flash-re migrálnák, akkor évente több mint 1 milliárd dollárt takarítanának meg, ami jelentős mennyiségű tőkét közvetlenül újra be lehetne fektetni az üzletbe” – hangsúlyozta Pichai.

A Gemini 3.5 Flash megjelenését követően a Google bejelentette, hogy a Gemini 3.5 Pro fejlesztés alatt áll és belső használatra készül, széles körű megjelenése pedig júniusra várható.

Ikrek terjeszkedése

A Gemini alkalmazást egy Neural Expressive nyelvvel is áttervezték. Új funkció a Gemini Spark, egy folyamatosan aktív személyes mesterséges intelligencia alapú ügynök. Ez a funkció a Gemini 3.5 platformon fut, és közvetlenül képes csatlakozni a Gmailhez, a Google Dokumentumokhoz vagy a Diákhoz.

A Gemini Sparkot az különbözteti meg a többitől, hogy képes a háttérben futni, így akkor is működik, ha a felhasználó zárolja a telefonját vagy a számítógépét.

A Spark néhány felhasználási módja közé tartozik a havi hitelkártya-kimutatások elemzése az előfizetési díjak vagy rejtett költségek figyelmeztetése érdekében, az e-mailek ellenőrzése a fontos információk kinyerése és összefoglalása érdekében, a megbeszélések összefoglalása és Google Dokumentumokban való írása, és egyebek.

Google Gemini 3.5 Flash, Google Gemini Spark, Google Gemini Omni, su kien I/O 2026, Gemini Omni la gi anh 2

Új funkciók érkeznek hamarosan a Gemini alkalmazásba. Fotó: Google .

Androidon a felhasználók élőben követhetik nyomon a frissítéseket és a feladatok előrehaladását olyan szereplőktől, mint a Spark, egy új, Android Halo nevű felületen keresztül, amely várhatóan még idén megjelenik.

A nyár végére a Spark közvetlenül a Chrome-on belül is futni fog, így a böngésző egy olyan ügynökké válik, amely segíti a felhasználókat az interneten.

Az adatvédelem biztosítása érdekében a felhasználók kikapcsolhatják a Gemini Spark aktiválását, és kiválaszthatják, hogy mely alkalmazások legyenek csatlakoztatva. Ez a funkció várhatóan május végétől lesz elérhető a Google AI Ultra előfizetői számára az Egyesült Államokban.

A Napi összefoglaló szintén egy új funkció a Gemini rendszeren, amely minden reggel személyre szabott összefoglalót tud nyújtani. Az információkat az e-mailekből és naptárakból gyűjti össze egy tömör jelentés létrehozásához.

Google Gemini 3.5 Flash, Google Gemini Spark, Google Gemini Omni, su kien I/O 2026, Gemini Omni la gi anh 3

A Gemini alkalmazás napi rövid összefoglaló funkciója. Fotó: Google .

A felhasználók prioritást élvező információtípusokat kérhetnek, sőt, útmutatást is nyújthatnak a mesterséges intelligenciának a következő feldolgozási lépésekben. Jelenleg a Daily Brief csak az AI Plus, Pro és Ultra előfizetéseket támogatja az amerikai piacon.

A Google számos frissítést is bejelentett a macOS Gemini alkalmazáshoz, beleértve a Gemini Spark integrációt a munkafolyamatok feldolgozásához és automatizálásához.

A Rambler beszédfelismerő rendszere a macOS rendszeren is támogatott, képes eltávolítani a felesleges szavakat, hogy a beszédet zökkenőmentesebben szöveggé alakítsa.

Készíts videókat a Gemini Omni segítségével

A Gemini Omni egy olyan modell, amely a fizikai világot szimulálja. A DeepMind korábban már számos hasonló modellt fejlesztett ki, de csak robotikában és játékokban való felhasználásra.

Az Omni segítségével a felhasználók képeket, hanganyagokat és szöveget kombinálva kiváló minőségű videókat hozhatnak létre, a Gemini valós tudásbázisára alapozva.

A Google szerint az Omni pontosan képes alkalmazni a fizika törvényeit a kontextusra, például a gravitációt, a mozgási energiát és a folyadékdinamikát. A Geminiből származó meglévő ismereteinek köszönhetően a modell képes megjósolni a későbbi eseményeket.

Google Gemini 3.5 Flash, Google Gemini Spark, Google Gemini Omni, su kien I/O 2026, Gemini Omni la gi anh 4

A Gemini Omni által készített videó. Fotó: Google .

A modell támogatja a természetes nyelvi szerkesztést, és a kontextus minden szerkesztés során konzisztens marad. Parancsok segítségével a felhasználók könnyen hozzáadhatnak karaktereket, beszúrhatnak objektumokat, vagy módosíthatják a jelenetet.

Az Omni támogatja a valósághű megjelenésű és hangú virtuális avatárok létrehozását is. Minden videó SynthID vízjellel rendelkezik a mesterséges intelligencia által létrehozott tartalom azonosítására.

A Google szerint az első verzió, a Gemini Omni Flash, a Gemini, a Flow és a YouTube Shorts alkalmazásokban lesz elérhető. A jövőben ez a modell mind a videó, mind az audio kimenetet támogatni fogja.

Google Gemini 3.5 Flash, Google Gemini Spark, Google Gemini Omni, su kien I/O 2026, Gemini Omni la gi anh 5

A Google hangsúlyozza a Gemini Omni azon képességét, hogy pontosan szimulálja a fizikai világot. Fotó: Google .

A Google-lel kapcsolatban a növekvő befektetési költségek miatt a Wall Street magas elvárásokat támasztott. A CNET szerint a befektetők azt szeretnék látni, hogy a vállalat mélyen integrálja a mesterséges intelligenciát a fő termékeibe a fenntartható profit elérése érdekében. Az ágenseszközök kulcsszerepet játszhatnak.

Az olyan intelligens ügynökök, mint a Spark és a Daily Brief, a Google válasza. A költséghatékony Gemini 3.5 Flash és Omni kombinációjával a vállalat igyekszik megőrizni versenytársaival szembeni pozícióját.

Nem csak a Google-ről van szó; az AI-cégekkel szembeni elvárások is folyamatosan nőnek, különösen azután, hogy az Anthropic bejelentette a Mythos-t. Ezt a modellt olyan erősnek tartják, hogy képes több ezer példátlan biztonsági rést észlelni a globális szoftverinfrastruktúrában.

Forrás: https://znews.vn/gemini-vuot-khoi-ranh-gioi-chatbot-post1652959.html