Vietnam.vn - Nền tảng quảng bá Việt Nam

Největší konkurent ChatGPT

Nejnovější model umělé inteligence od Googlu vylepšuje uvažování, myšlení a generování kódu, ale to stále nestačí k tomu, aby se z Gemini 3 stal perfektní chatbot.

ZNewsZNews06/12/2025

Logo Google Gemini. Foto: Bloomberg .

Společnost Google uvedla na trh model Gemini 3 koncem listopadu. Společnost představila řadu významných vylepšení, jako jsou vylepšené možnosti kódování, vytváření vizuálních obrázků a agenti, kteří vykonávají určité úkoly jménem uživatele.

Při představení Gemini 3 společnost Google zdůraznila, že se jedná o „zatím nejchytřejší model společnosti“. Zkušenosti z praxe ukazují, že model pracuje rychleji a má lepší schopnosti uvažování, i když stále existují oblasti pro zlepšení.

Rychle vytvářejte interaktivní rozhraní.

Jedno z hlavních vylepšení v Gemini 3 se točí kolem Canvasu. Jedná se o interaktivní pracovní prostor v Gemini, který umožňuje požádat chatboty o psaní kódu, vizualizaci výsledků a úpravu obsahu.

Když je Gemini 3 požádán o vytvoření 3D modelu rozdílů ve velikostech mezi fotbalovým míčem, Zemí, Sluncem a Mléčnou dráhou, nástroj aktivuje kódovací rozhraní, zpracuje a vytvoří interaktivní prostředí, které uživatelům umožňuje vybírat a porovnávat velikosti objektů.

Gemini 3 la gi,  danh gia Gemini 3,  mo hinh Gemini 3,  Google Gemini 3 Pro anh 1

Možnost vytvářet interaktivní prostory pomocí funkce Canvas v Gemini 3.

Ve srovnání s demoverzí od Googlu jsou výsledky v kvalitě obrazu mírně horší. Informace o objektech jsou však jasné a snadno srozumitelné. Doba zpracování je přibližně 2 minuty. V rozhraní Canvas mohou uživatelé přímo upravovat kód, kopírovat nebo sdílet obsah.

Dalším příkazem byl Gemini 3 požádán o vytvoření 3D modelu orla sedícího na větvi stromu ve stylu krychle (voxel). Nástroj vytvořil výsledek přibližně za 45 sekund a uživatelé mohli zobrazení přibližovat a otáčet pomocí myši. Některé detaily v obrázku však obsahovaly grafické chyby a nebyly zobrazeny stabilně.

Orel sedící na větvi stromu byl také přítomen, ale požadavek byl složitější (3D model). Kód vygenerovaný programem Gemini 3 zpočátku selhal a nešel spustit. Po vyžádání úprav se obrázek objevil a stal se interaktivním.

Gemini 3 la gi,  danh gia Gemini 3,  mo hinh Gemini 3,  Google Gemini 3 Pro anh 2

Schopnost Gemini 3 vytvářet interaktivní prostředí.

Navzdory některým přetrvávajícím problémům je přechod od modelu otázek a odpovědí k kolaborativnímu editačnímu přístupu zajímavým směrem, díky kterému je Gemini 3 užitečný pro složité a dlouhodobé úkoly.

Gemini 3 samozřejmě není určen jen pro vytváření grafiky nebo vizuálních modelů. Google testuje funkci „Generativní uživatelské rozhraní“ pro uživatele AI Pro. S určitými příkazy může model vytvářet interaktivní rozhraní ve stylu časopisů nebo vizuální webové stránky.

Google uvádí, že tato funkce je zaváděna postupně. Podle zkušeností serveru The Verge musí uživatelé vybrat funkci Vizuální rozvržení a poté zadat příkaz, například „Naplánuj si třídenní výlet do Říma“.

Po zpracování Gemini 3 generuje výsledky podobné cestovním webovým stránkám, včetně itinerářů, podrobných obrázků a některých otázek týkajících se cestovních preferencí a stravovacích návyků. Model poté odpovídajícím způsobem upraví odpovědi. Tato funkce je také docela užitečná pro témata, jako je sestavení počítače nebo stavba akvária.

Efektivnější uvažování a analýza.

Podle Googlu má Gemini 3 lepší schopnosti uvažování než jeho předchůdce. Společnost tvrdí, že schopnost uvažování Gemini 3 Pro dosahuje doktorské úrovně, když v testu Humanity's Last Exam dosáhl 37,5 % a v testu GPQA Diamond 91,9 %.

Uživatelé samozřejmě mohou rozdíl skutečně ocenit pouze při přímé interakci s modelem. Když byl Gemini 3 Pro požádán o vyřešení problému ze sady referenčních otázek GPQA Diamond (zaměřených na doktorskou úroveň), trvalo přibližně 30 sekund, než poskytl podrobné řešení, včetně podrobných pokynů a ilustrativních obrázků.

Gemini 3 la gi,  danh gia Gemini 3,  mo hinh Gemini 3,  Google Gemini 3 Pro anh 3

Blíženci 3 dokáží odpovědět na složité otázky a prokázat myšlenkové schopnosti ekvivalentní úrovni PhD.

Podle hodnocení je řešení poměrně podrobné a dodržuje správný postup. Pro srovnání, GPT-5.1 trvalo správné zodpovězení také asi 30 sekund, ale řešení bylo méně podrobné. Podobně Claude 4.5 Sonnet odpověděl správně a rychleji než Gemini 3, ale byl méně podrobný.

Google uvádí, že Gemini 3 dokáže extrahovat dokumenty současně z více zdrojů, jako je text, obrázky a videa . Úkoly, které nebyly nikdy předtím trénovány, jsou v Gemini 3 také lépe zvládnuty.

Gemini 3 la gi,  danh gia Gemini 3,  mo hinh Gemini 3,  Google Gemini 3 Pro anh 4

Schopnosti analýzy videa družice Gemini 3.

Například když byl Gemini 3 požádán o analýzu hlavního tématu 57minutového videa, trvalo mu pouze asi minutu, než poskytl výsledky včetně požadovaných argumentů a časových razítek pro odpovídající segment videa. Podobně model správně identifikoval tenisové video, analyzoval zápasy a herní styl každého sportovce.

Uživatelé mohou požádat Gemini 3, aby současně sledoval videa a odkazoval se na externí zdroje, a dokonce klást otázky pro hlubší analýzu. Celkově je Gemini 3 poměrně pohotový v analytických úkolech a úkolech odkazování na dokumenty, částečně díky propojení s databází Vyhledávání Google.

Agent je ochotný, ale stále přetrvávají problémy.

Funkce Agent je také pozoruhodným vylepšením v Gemini 3. Pro uživatele tarifu AI Ultra (v současné době dostupného pouze na americkém trhu) může tento režim provádět složité úkoly jménem uživatele, jako je kategorizace a organizace e-mailů, vyhledávání informací a rezervace cestovních lístků.

Při spuštění Gemini 3 Google použil příklad možnosti organizace doručené pošty v Gmailu. Podle zkušeností The Verge tato funkce funguje přesně tak, jak bylo požadováno: vytvoří kompletní seznam nepřečtených e-mailů za týden.

Podobně jako u funkce Canvas se seznamy e-mailů a navrhované akce zobrazují v samostatné oblasti. Gemini nabízí několik možností, jako je nastavení připomenutí důležitých e-mailů, archivace propagačních e-mailů atd.

Gemini 3 la gi,  danh gia Gemini 3,  mo hinh Gemini 3,  Google Gemini 3 Pro anh 5

Funkce agenta v Gemini 3 pomáhá spravovat doručenou poštu v Gmailu. Obrázek: The Verge .

Když je vyzván k vytvoření připomenutí platby faktury, Gemini rychle zadá příslušné informace do Úkolů Google. V případě platby agent automaticky přejde k úkolu a zastaví se, když je potřeba, aby uživatel zadal platební informace.

Celkově je agent Gemini 3 docela užitečný při detekci e-mailů, na které uživatelé mají tendenci zapomínat. Nástroj dokáže také najít a odhlásit se z odběru e-mailů z reklamních adres, které již nejsou užitečné.

Ve skutečnosti agenti některých chatbotů, jako jsou Perplexity a ChatGPT, již podporují integraci s Gmailem. Gemini však nabízí nejrozmanitější integrační možnosti. Uživatelé Perplexity například musí konkrétně zadat e-maily, které chtějí ponechat nebo smazat, zatímco tyto akce lze provádět pomocí tlačítek na Gemini.

Gemini 3 la gi,  danh gia Gemini 3,  mo hinh Gemini 3,  Google Gemini 3 Pro anh 6

Funkce pro tvorbu interaktivního rozhraní v Gemini 3. Foto: The Verge .

Funkce třídění e-mailů v ChatGPT je také nestabilní. Rychlost odesílání e-mailů v Gemini je však pomalejší než v Perplexity. Některé úkoly, jako například rezervace restaurací, někdy narážejí na problémy.

Přestože před provedením citlivých akcí, jako jsou platby nebo odesílání e-mailů, je vždy vyžadováno potvrzení uživatele, delegování určitých úkolů na umělou inteligenci stále uživatele zdráhá. Režim agenta na Gemini 3 je docela užitečný, ale uživatelé stále musí sledovat výstup.

Zdroj: https://znews.vn/gemini-3-tot-den-dau-post1607493.html


Komentář (0)

Zanechte komentář a podělte se o své pocity!

Dědictví

Postava

Firmy

Aktuální události

Politický systém

Místní

Produkt

Happy Vietnam
Koníčky ve stáří

Koníčky ve stáří

PAK SI ZATANČUJTE NA FESTIVALU LONG TONG

PAK SI ZATANČUJTE NA FESTIVALU LONG TONG

Živé lakované obrazy

Živé lakované obrazy