![]() |
Logo Google Gemini. Zdjęcie: Bloomberg . |
Pod koniec listopada Google wprowadził na rynek model Gemini 3. Firma wprowadziła szereg znaczących ulepszeń, takich jak ulepszone możliwości kodowania, wizualizacja i agenci wykonujący określone zadania w imieniu użytkowników.
Podczas prezentacji Gemini 3 firma Google podkreśliła, że jest to „najinteligentniejszy jak dotąd model firmy”. Praktyczne doświadczenia pokazują, że model ten przetwarza dane szybciej i lepiej rozumuje, choć istnieją pewne czynniki, które wymagają poprawy.
Szybkie tworzenie interaktywnych interfejsów
Jedną z największych ulepszeń w Gemini 3 jest Canvas, interaktywna przestrzeń robocza w Gemini, która umożliwia zlecanie chatbotom pisania kodu, wizualizacji wyników i edytowania treści.
Gdy Gemini 3 zostaje poproszony o stworzenie modelu 3D różnic między wielkością piłki nożnej, Ziemi, Słońca i Drogi Mlecznej, narzędzie uruchamia interaktywny interfejs kodowania, przetwarzania i tworzenia, który umożliwia wybieranie obiektów i porównywanie ich wielkości.
![]() |
Możliwość tworzenia interaktywnych przestrzeni za pomocą funkcji Canvas w Gemini 3. |
W porównaniu z wersją demonstracyjną Google, wyniki są nieco gorsze pod względem jakości obrazu. W zamian informacje o obiektach są przejrzyste i łatwe do zrozumienia. Czas przetwarzania wynosi około 2 minut. W interfejsie Canvas użytkownicy mogą bezpośrednio edytować kod, kopiować lub udostępniać treść.
Za pomocą innego polecenia, Gemini 3 otrzymał polecenie stworzenia orła w stylu woksela siedzącego na gałęzi drzewa. Narzędzie dało wyniki po około 45 sekundach, a użytkownicy mogli powiększać i obracać widok za pomocą myszy. Jednak niektóre szczegóły na obrazie zawierały błędy graficzne i nie były wyświetlane poprawnie.
Również z orłem siedzącym na gałęzi drzewa, ale z trudniejszym zadaniem (model 3D). Za pierwszym razem kod wygenerowany przez Gemini 3 uległ awarii i nie uruchomił się. Po wysłaniu prośby o poprawkę, obraz pojawił się i był interaktywny.
![]() |
Możliwości tworzenia interaktywnego środowiska Gemini 3. |
Mimo pewnych problemów, przejście od modelu pytań i odpowiedzi do edycji zespołowej to interesujący kierunek, który sprawi, że Gemini 3 stanie się przydatny w przypadku złożonych, długoterminowych zadań.
Oczywiście Gemini 3 nie służy wyłącznie do tworzenia grafiki i modeli wizualnych. Google testuje funkcję „Generative UI” dla użytkowników AI Pro. Za pomocą kilku poleceń model może tworzyć interaktywne interfejsy w stylu magazynu lub wizualne strony internetowe.
Google twierdzi, że funkcja jest wdrażana etapami. Jak przekonał się The Verge , użytkownicy muszą wybrać opcję układu wizualnego , a następnie wpisać polecenie, na przykład „Zaplanuj mi 3-dniową wycieczkę do Rzymu”.
Po przetworzeniu, Gemini 3 generuje wyniki podobne do tych z serwisu turystycznego , ze szczegółowymi harmonogramami i zdjęciami, a także szeregiem pytań dotyczących preferencji podróżniczych i stylu odżywiania. Na tej podstawie model odpowiednio dopasowuje odpowiedzi. Ta funkcja jest również bardzo przydatna w przypadku takich tematów, jak montaż komputera, budowa akwarium itp.
Skuteczniej rozumuj i analizuj
Według Google, Gemini 3 ma lepsze zdolności logicznego myślenia niż jego poprzednik. Firma twierdzi, że zdolności logiczne Gemini 3 Pro są na poziomie doktorskim, z wynikiem 37,5% w teście Humanity's Last Exam i 91,9% w egzaminie GPQA Diamond.
Oczywiście, użytkownicy odczują różnicę tylko podczas bezpośredniej interakcji z modelem. Poproszony o rozwiązanie problemu z zestawu referencyjnego GPQA Diamond (skoncentrowanego na poziomie doktorskim), Gemini 3 Pro potrzebował około 30 sekund na przedstawienie szczegółowego rozwiązania, obejmującego każdy krok problemu i ilustracje.
![]() |
Bliźnięta 3 potrafią odpowiadać na złożone pytania, mają zdolność myślenia równą poziomowi doktoratu. |
Według oceny, rozwiązanie jest dość szczegółowe i zgodne z procedurą. Dla porównania, rozwiązanie w GPT-5.1 zajęło około 30 sekund, ale było mniej szczegółowe. Podobnie, rozwiązanie w Claude 4.5 Sonnet było poprawne, szybsze niż w Gemini 3, ale mniej szczegółowe.
Google twierdzi, że Gemini 3 potrafi wyodrębniać dokumenty z wielu źródeł jednocześnie, takich jak tekst, obrazy i filmy . Zadania, w których Gemini 3 nie był wcześniej szkolony, są również lepiej obsługiwane.
![]() |
Możliwości analizy wideo Gemini 3. |
Na przykład, poproszony o analizę głównego tematu 57-minutowego filmu, Gemini 3 potrzebował zaledwie około minuty, aby zwrócić wynik zawierający żądane argumenty wraz ze znacznikiem czasu odpowiadającym fragmentowi filmu. Podobnie, model poprawnie zidentyfikował film o tenisie, analizując mecze i sposób gry każdego z zawodników.
Użytkownicy mogą poprosić Gemini 3 o oglądanie filmów, jednocześnie odwołując się do źródeł zewnętrznych, a nawet zadawać pytania w celu pogłębionej analizy. Ogólnie rzecz biorąc, Gemini 3 jest dość responsywny w analizowaniu i odwoływaniu się do dokumentów, częściowo dzięki połączeniu z bazą danych wyszukiwarki Google.
Agent jest pomocny, ale ma problemy
Agent to również godna uwagi aktualizacja w systemie Gemini 3. W przypadku użytkowników pakietu AI Ultra (obecnie obsługującego tylko rynek amerykański) tryb ten może wykonywać złożone procesy w imieniu użytkowników, takie jak sortowanie i porządkowanie wiadomości e-mail, wyszukiwanie informacji, rezerwowanie biletów podróżnych...
Gdy Google wypuściło Gemini 3, zaprezentowano możliwość uporządkowania skrzynki odbiorczej w Gmailu. Jak wynika z doświadczeń serwisu The Verge , narzędzie to działało dokładnie tak, jak powinno: generowało pełną listę nieprzeczytanych wiadomości e-mail z całego tygodnia.
Podobnie jak w przypadku funkcji Canvas, lista e-maili i sugerowane działania są wyświetlane w osobnym obszarze. Gemini oferuje kilka opcji, takich jak ustawianie przypomnień o ważnych e-mailach, archiwizowanie e-maili promocyjnych...
![]() |
Funkcja agenta w Gemini 3 obsługuje zarządzanie skrzynką odbiorczą Gmaila. Zdjęcie: The Verge . |
Poproszony o utworzenie przypomnienia o płatności rachunku, Gemini szybko pobiera odpowiednie informacje do Google Tasks. W przypadku zadania płatności agent automatycznie przechodzi do niego i zatrzymuje się, gdy użytkownik musi wprowadzić dane dotyczące płatności.
Ogólnie rzecz biorąc, agent Gemini 3 jest bardzo przydatny w wykrywaniu wiadomości e-mail, o których użytkownicy mogą zapomnieć. Narzędzie potrafi również wyszukiwać i anulować subskrypcję wiadomości e-mail z adresów reklamowych, które nie są już przydatne.
W rzeczywistości niektórzy agenci chatbotów, tacy jak Perplexity i ChatGPT, już obsługują integrację z Gmailem. Jednak możliwości integracji Gemini są najbardziej zróżnicowane. Na przykład użytkownicy Perplexity muszą wprowadzić konkretne adresy e-mail, które chcą zachować lub usunąć, podczas gdy w Gemini operacje można wykonywać za pomocą przycisków.
![]() |
Funkcja tworzenia interaktywnego interfejsu Gemini 3. Zdjęcie: The Verge . |
Funkcja planowania wysyłki e-maili w ChatGPT również jest niespójna. Jednak prędkość dostarczania e-maili w Gemini jest wolniejsza niż w Perplexity. Niektóre zadania, takie jak rezerwacja w restauracji, mogą sprawiać problemy.
Chociaż zawsze wymaga potwierdzenia użytkownika przed wykonaniem wrażliwych czynności, takich jak dokonywanie płatności czy wysyłanie e-maili, pozostawienie niektórych zadań sztucznej inteligencji nadal budzi u użytkowników wątpliwości. Tryb agenta w Gemini 3 jest dość przydatny, ale użytkownicy nadal muszą monitorować wyniki.
Źródło: https://znews.vn/gemini-3-tot-den-dau-post1607493.html

















Komentarz (0)