![]() |
Logo Google Gemini. Zdjęcie: Bloomberg . |
Google wprowadził na rynek model Gemini 3 pod koniec listopada. Firma wprowadziła szereg istotnych ulepszeń, takich jak ulepszone możliwości kodowania, tworzenie obrazów wizualnych oraz agenci wykonujący określone zadania w imieniu użytkownika.
Podczas prezentacji Gemini 3 firma Google podkreśliła, że jest to „najinteligentniejszy model firmy jak dotąd”. Doświadczenie pokazuje, że model ten przetwarza dane szybciej i ma lepsze możliwości wnioskowania, choć wciąż istnieją pewne obszary wymagające poprawy.
Szybkie tworzenie interaktywnych interfejsów.
Jedną z głównych ulepszeń w Gemini 3 jest Canvas. To interaktywna przestrzeń robocza w Gemini, która pozwala zlecać chatbotom pisanie kodu, wizualizację wyników i edycję treści.
Gdy Gemini 3 zostaje poproszony o stworzenie trójwymiarowego modelu różnic w rozmiarach piłki nożnej, Ziemi, Słońca i Drogi Mlecznej, narzędzie uruchamia interfejs kodujący, przetwarza dane i tworzy interaktywne środowisko, umożliwiając użytkownikom wybieranie i porównywanie rozmiarów obiektów.
![]() |
Możliwość tworzenia interaktywnych przestrzeni przy użyciu funkcji Canvas w Gemini 3. |
W porównaniu z wersją demonstracyjną Google, jakość obrazu jest nieco gorsza. Informacje o obiektach są jednak przejrzyste i łatwe do zrozumienia. Czas przetwarzania wynosi około 2 minut. W interfejsie Canvas użytkownicy mogą bezpośrednio edytować kod, kopiować lub udostępniać treść.
Za pomocą innego polecenia, Gemini 3 otrzymało zadanie stworzenia trójwymiarowego modelu sześcianu (woksela) orła siedzącego na gałęzi drzewa. Narzędzie wygenerowało wynik w około 45 sekund, a użytkownicy mogli powiększać i obracać widok za pomocą myszy. Jednak niektóre szczegóły obrazu zawierały błędy graficzne i nie były wyświetlane stabilnie.
Orzeł siedzący na gałęzi drzewa również był obecny, ale wymaganie było trudniejsze (model 3D). Początkowo kod wygenerowany przez Gemini 3 nie działał. Po zażądaniu modyfikacji obraz pojawił się i stał się interaktywny.
![]() |
Możliwość tworzenia interaktywnych środowisk w Gemini 3. |
Mimo kilku pozostałych problemów, przejście od modelu pytań i odpowiedzi do podejścia opartego na współpracy i edycji to ciekawy kierunek, który sprawia, że Gemini 3 jest przydatny w przypadku złożonych, długoterminowych zadań.
Oczywiście Gemini 3 nie służy wyłącznie do tworzenia grafiki i modeli wizualnych. Google testuje funkcję „Generative UI” dla użytkowników AI Pro. Za pomocą określonych poleceń model może tworzyć interaktywne interfejsy w stylu magazynu lub wizualne strony internetowe.
Google twierdzi, że ta funkcja jest wdrażana etapami. Według doświadczenia The Verge , użytkownicy muszą wybrać funkcję „ Układ wizualny” , a następnie wpisać polecenie, na przykład „Zaplanuj moją 3-dniową wycieczkę do Rzymu”.
Po przetworzeniu, Gemini 3 generuje wyniki podobne do tych z serwisu turystycznego , zawierające plany podróży, szczegółowe zdjęcia oraz pytania dotyczące preferencji podróżniczych i nawyków żywieniowych. Następnie model odpowiednio dostosowuje odpowiedzi. Funkcja ta jest również bardzo przydatna w przypadku takich tematów, jak montaż komputera czy budowa akwarium.
Skuteczniejsze rozumowanie i analiza.
Według Google, Gemini 3 oferuje lepsze możliwości rozumowania niż jego poprzednik. Firma twierdzi, że zdolność rozumowania Gemini 3 Pro osiąga poziom doktorski, uzyskując 37,5% w teście Humanity's Last Exam i 91,9% w egzaminie GPQA Diamond.
Oczywiście użytkownicy mogą w pełni docenić różnicę dopiero podczas bezpośredniej interakcji z modelem. Poproszony o rozwiązanie problemu z zestawu pytań referencyjnych GPQA Diamond (skupionego na poziomie doktoranckim), Gemini 3 Pro potrzebował około 30 sekund, aby podać szczegółowe rozwiązanie, wraz z instrukcjami krok po kroku i ilustracjami.
![]() |
Gemini 3 potrafi odpowiadać na złożone pytania, wykazując się zdolnością myślenia równą poziomowi doktoratu. |
Według oceny, rozwiązanie jest dość szczegółowe i zgodne z prawidłową procedurą. Dla porównania, rozwiązanie w GPT-5.1 również zajęło około 30 sekund, ale było mniej szczegółowe. Podobnie, rozwiązanie w Claude 4.5 Sonnet dało poprawne i szybsze odpowiedzi niż w Gemini 3, ale było mniej szczegółowe.
Google twierdzi, że Gemini 3 może jednocześnie wyodrębniać dokumenty z wielu źródeł, takich jak tekst, obrazy i filmy . Zadania, których wcześniej nie szkolono, są również lepiej obsługiwane w Gemini 3.
![]() |
Możliwości analizy wideo Gemini 3. |
Na przykład, poproszony o analizę głównego tematu 57-minutowego filmu, Gemini 3 potrzebował zaledwie około minuty na wygenerowanie wyników, w tym żądanych argumentów i znaczników czasu, dla odpowiedniego fragmentu filmu. Podobnie, model poprawnie zidentyfikował film o tenisie, analizując mecze i styl gry każdego zawodnika.
Użytkownicy mogą poprosić Gemini 3 o jednoczesne oglądanie filmów i odwoływanie się do źródeł zewnętrznych, a nawet zadawanie pytań w celu głębszej analizy. Ogólnie rzecz biorąc, Gemini 3 jest dość responsywny w zadaniach analitycznych i odwoływaniu się do dokumentów, częściowo dzięki połączeniu z bazą danych wyszukiwarki Google.
Agent jest pomocny, ale nadal są problemy.
Funkcja Agent to również godna uwagi aktualizacja w systemie Gemini 3. W przypadku użytkowników planu AI Ultra (dostępnego obecnie tylko na rynku amerykańskim) tryb ten może wykonywać złożone zadania w imieniu użytkownika, takie jak kategoryzowanie i porządkowanie wiadomości e-mail, wyszukiwanie informacji i rezerwowanie biletów podróżnych.
Podczas premiery Gemini 3, Google posłużyło się przykładem możliwości uporządkowania skrzynki odbiorczej w Gmailu. Według doświadczenia The Verge , funkcja ta działa dokładnie tak, jak oczekiwano: tworzy kompletną listę nieprzeczytanych wiadomości e-mail na tydzień.
Podobnie jak w przypadku funkcji Canvas, listy e-mail i sugerowane działania są wyświetlane w osobnym obszarze. Gemini oferuje kilka opcji, takich jak ustawianie przypomnień o ważnych e-mailach, archiwizowanie e-maili promocyjnych itp.
![]() |
Funkcja agenta w Gemini 3 ułatwia zarządzanie skrzynkami odbiorczymi Gmaila. Zdjęcie: The Verge . |
Po wyświetleniu monitu o utworzenie przypomnienia o płatności rachunku, Gemini szybko wprowadza odpowiednie informacje do Google Tasks. W przypadku zadania płatności agent automatycznie przechodzi do niego i zatrzymuje się, gdy użytkownik musi wprowadzić dane dotyczące płatności.
Ogólnie rzecz biorąc, agent Gemini 3 jest bardzo przydatny w wykrywaniu wiadomości e-mail, o których użytkownicy często zapominają. Narzędzie potrafi również wyszukiwać i anulować subskrypcję wiadomości e-mail z adresów reklamowych, które nie są już przydatne.
W rzeczywistości agenci niektórych chatbotów, takich jak Perplexity i ChatGPT, już obsługują integrację z Gmailem. Jednak Gemini oferuje najbardziej zróżnicowane możliwości integracji. Na przykład użytkownicy Perplexity muszą podać konkretne adresy e-mail, które chcą zachować lub usunąć, podczas gdy w Gemini czynności te można wykonać za pomocą przycisków.
![]() |
Funkcja tworzenia interaktywnego interfejsu Gemini 3. Zdjęcie: The Verge . |
Funkcja sortowania wiadomości e-mail w ChatGPT również jest niestabilna. Jednak prędkość wysyłania wiadomości e-mail w Gemini jest niższa niż w Perplexity. Niektóre zadania, takie jak rezerwacja w restauracji, czasami napotykają problemy.
Chociaż zawsze wymaga potwierdzenia użytkownika przed wykonaniem wrażliwych czynności, takich jak płatności czy wysyłanie e-maili, delegowanie niektórych zadań sztucznej inteligencji nadal budzi u użytkowników wątpliwości. Tryb agenta w Gemini 3 jest dość przydatny, ale użytkownicy nadal muszą monitorować wyniki.
Źródło: https://znews.vn/gemini-3-tot-den-dau-post1607493.html













Komentarz (0)