![]() |
Sundar Pichai vezérigazgató a Google I/O 2026 konferencián beszél. Fotó: Android Central . |
A május 20-án (vietnami idő szerint) kora reggel tartott I/O 2026 konferencián a Google bejelentette a Gemini legújabb verzióját, valamint egy Omni nevű, a fizikai világot szimuláló mesterséges intelligencia modellt.
A CNET szerint az eseményre akkor került sor, amikor a Google igyekezett lépést tartani a mesterséges intelligencia modelljeinek fejlesztésével, miközben több szolgáltatást nyújtott hatalmas felhasználói bázisának.
Az I/O 2026 szintén kiemelkedő esemény, mivel a piac az OpenAI és az Anthropic szárnyaló értékeléseire összpontosít, amelyek várhatóan idén indítanak első nyilvános ajánlattételt (IPO-t).
Gemini 3.5 Flash: Gyors és költséghatékony
A Google továbbra is a Gemini ökoszisztémára összpontosít. Az eseményen a vállalat bemutatta a Gemini 3.5 Flash-t, egy leegyszerűsített verziót, amely továbbra is hatékony, miközben a hasonló, fejlettebb modellek árának felébe, vagy akár egyharmadába kerül.
Az esemény előtt újságíróknak nyilatkozva Sundar Pichai vezérigazgató elmondta, hogy a Gemini 3.5 Flash „elképesztően gyors”. A Google kijelentette, hogy ez lesz az alapértelmezett modell a Geminiben és a Google Search mesterséges intelligencia módjában világszerte.
„A Google bejelentése szerint többé nem kell a minőséget feláldozni a sebességért.” A vállalat kijelentette, hogy a Gemini 3.5 Flash kibertámadások elleni védelme javult, csökkentve a rosszindulatú tartalmak létrehozásának és a normál parancsok téves elutasításának arányát.
![]() |
A Gemini 3.5 Flash nagy hatékonyságáról és gyors kimeneti sebességéről ismert. Kép: Google . |
A Gemini 3.5 Flash összetett, ügynökalapú munkafolyamatokra van optimalizálva. A Google szerint számos benchmarkban felülmúlja a Gemini 3.1 Pro-t, például a Terminal-Bench 2.1-ben (76,2% vs. 70,3%) és az MCP Atlasban (83,6% vs. 78,2%).
A másodpercenként kibocsátott tokenek számát tekintve a Gemini 3.5 Flash négyszer gyorsabb, mint néhány más újabb modell. A Google szerint a modell lerövidítheti egyes feladatok elvégzésének idejét, amelyek korábban napokig vagy hetekig tartottak, alacsonyabb költséggel, így ideális programozók, vállalkozások, tudósok és általános felhasználók számára egyaránt.
„Hogy perspektívába helyezzük a dolgot, a nagyvállalatok naponta körülbelül 1 billió tokent dolgoznak fel. Ha ennek a munkaterhelésnek a 80%-át 3,5 Flash-re migrálnák, akkor évente több mint 1 milliárd dollárt takarítanának meg, ami jelentős mennyiségű tőkét közvetlenül újra be lehetne fektetni az üzletbe” – hangsúlyozta Pichai.
A Gemini 3.5 Flash megjelenését követően a Google bejelentette, hogy a Gemini 3.5 Pro fejlesztés alatt áll és belső használatra készül, széles körű megjelenése pedig júniusra várható.
Ikrek terjeszkedése
A Gemini alkalmazást egy Neural Expressive nyelvvel is áttervezték. Új funkció a Gemini Spark, egy folyamatosan aktív személyes mesterséges intelligencia alapú ügynök. Ez a funkció a Gemini 3.5 platformon fut, és közvetlenül képes csatlakozni a Gmailhez, a Google Dokumentumokhoz vagy a Diákhoz.
A Gemini Sparkot az különbözteti meg a többitől, hogy képes a háttérben futni, így akkor is működik, ha a felhasználó zárolja a telefonját vagy a számítógépét.
A Spark néhány felhasználási módja közé tartozik a havi hitelkártya-kimutatások elemzése az előfizetési díjak vagy rejtett költségek figyelmeztetése érdekében, az e-mailek ellenőrzése a fontos információk kinyerése és összefoglalása érdekében, a megbeszélések összefoglalása és Google Dokumentumokban való írása, és egyebek.
![]() |
Új funkciók érkeznek hamarosan a Gemini alkalmazásba. Fotó: Google . |
Androidon a felhasználók élőben követhetik nyomon a frissítéseket és a feladatok előrehaladását olyan szereplőktől, mint a Spark, egy új, Android Halo nevű felületen keresztül, amely várhatóan még idén megjelenik.
A nyár végére a Spark közvetlenül a Chrome-on belül is futni fog, így a böngésző egy olyan ügynökké válik, amely segíti a felhasználókat az interneten.
Az adatvédelem biztosítása érdekében a felhasználók kikapcsolhatják a Gemini Spark aktiválását, és kiválaszthatják, hogy mely alkalmazások legyenek csatlakoztatva. Ez a funkció várhatóan május végétől lesz elérhető a Google AI Ultra előfizetői számára az Egyesült Államokban.
A Napi összefoglaló szintén egy új funkció a Gemini rendszeren, amely minden reggel személyre szabott összefoglalót tud nyújtani. Az információkat az e-mailekből és naptárakból gyűjti össze egy tömör jelentés létrehozásához.
![]() |
A Gemini alkalmazás napi rövid összefoglaló funkciója. Fotó: Google . |
A felhasználók prioritást élvező információtípusokat kérhetnek, sőt, útmutatást is nyújthatnak a mesterséges intelligenciának a következő feldolgozási lépésekben. Jelenleg a Daily Brief csak az AI Plus, Pro és Ultra előfizetéseket támogatja az amerikai piacon.
A Google számos frissítést is bejelentett a macOS Gemini alkalmazáshoz, beleértve a Gemini Spark integrációt a munkafolyamatok feldolgozásához és automatizálásához.
A Rambler beszédfelismerő rendszere a macOS rendszeren is támogatott, képes eltávolítani a felesleges szavakat, hogy a beszédet zökkenőmentesebben szöveggé alakítsa.
Készíts videókat a Gemini Omni segítségével
A Gemini Omni egy olyan modell, amely a fizikai világot szimulálja. A DeepMind korábban már számos hasonló modellt fejlesztett ki, de csak robotikában és játékokban való felhasználásra.
Az Omni segítségével a felhasználók képeket, hanganyagokat és szöveget kombinálva kiváló minőségű videókat hozhatnak létre, a Gemini valós tudásbázisára alapozva.
A Google szerint az Omni pontosan képes alkalmazni a fizika törvényeit a kontextusra, például a gravitációt, a mozgási energiát és a folyadékdinamikát. A Geminiből származó meglévő ismereteinek köszönhetően a modell képes megjósolni a későbbi eseményeket.
![]() |
A Gemini Omni által készített videó. Fotó: Google . |
A modell támogatja a természetes nyelvi szerkesztést, és a kontextus minden szerkesztés során konzisztens marad. Parancsok segítségével a felhasználók könnyen hozzáadhatnak karaktereket, beszúrhatnak objektumokat, vagy módosíthatják a jelenetet.
Az Omni támogatja a valósághű megjelenésű és hangú virtuális avatárok létrehozását is. Minden videó SynthID vízjellel rendelkezik a mesterséges intelligencia által létrehozott tartalom azonosítására.
A Google szerint az első verzió, a Gemini Omni Flash, a Gemini, a Flow és a YouTube Shorts alkalmazásokban lesz elérhető. A jövőben ez a modell mind a videó, mind az audio kimenetet támogatni fogja.
![]() |
A Google hangsúlyozza a Gemini Omni azon képességét, hogy pontosan szimulálja a fizikai világot. Fotó: Google . |
A Google-lel kapcsolatban a növekvő befektetési költségek miatt a Wall Street magas elvárásokat támasztott. A CNET szerint a befektetők azt szeretnék látni, hogy a vállalat mélyen integrálja a mesterséges intelligenciát a fő termékeibe a fenntartható profit elérése érdekében. Az ágenseszközök kulcsszerepet játszhatnak.
Az olyan intelligens ügynökök, mint a Spark és a Daily Brief, a Google válasza. A költséghatékony Gemini 3.5 Flash és Omni kombinációjával a vállalat igyekszik megőrizni versenytársaival szembeni pozícióját.
Nem csak a Google-ről van szó; az AI-cégekkel szembeni elvárások is folyamatosan nőnek, különösen azután, hogy az Anthropic bejelentette a Mythos-t. Ezt a modellt olyan erősnek tartják, hogy képes több ezer példátlan biztonsági rést észlelni a globális szoftverinfrastruktúrában.
Forrás: https://znews.vn/gemini-vuot-khoi-ranh-gioi-chatbot-post1652959.html













Hozzászólás (0)