Vietnam.vn - Nền tảng quảng bá Việt Nam

Największy konkurent ChatGPT

Najnowszy model sztucznej inteligencji firmy Google usprawnia rozumowanie, myślenie i możliwości generowania kodu, ale to wciąż za mało, aby Gemini 3 stał się idealnym chatbotem.

ZNewsZNews06/12/2025

Logo Google Gemini. Zdjęcie: Bloomberg .

Google wprowadził na rynek model Gemini 3 pod koniec listopada. Firma wprowadziła szereg istotnych ulepszeń, takich jak ulepszone możliwości kodowania, tworzenie obrazów wizualnych oraz agenci wykonujący określone zadania w imieniu użytkownika.

Podczas prezentacji Gemini 3 firma Google podkreśliła, że ​​jest to „najinteligentniejszy model firmy jak dotąd”. Doświadczenie pokazuje, że model ten przetwarza dane szybciej i ma lepsze możliwości wnioskowania, choć wciąż istnieją pewne obszary wymagające poprawy.

Szybkie tworzenie interaktywnych interfejsów.

Jedną z głównych ulepszeń w Gemini 3 jest Canvas. To interaktywna przestrzeń robocza w Gemini, która pozwala zlecać chatbotom pisanie kodu, wizualizację wyników i edycję treści.

Gdy Gemini 3 zostaje poproszony o stworzenie trójwymiarowego modelu różnic w rozmiarach piłki nożnej, Ziemi, Słońca i Drogi Mlecznej, narzędzie uruchamia interfejs kodujący, przetwarza dane i tworzy interaktywne środowisko, umożliwiając użytkownikom wybieranie i porównywanie rozmiarów obiektów.

Gemini 3 la gi,  danh gia Gemini 3,  mo hinh Gemini 3,  Google Gemini 3 Pro anh 1

Możliwość tworzenia interaktywnych przestrzeni przy użyciu funkcji Canvas w Gemini 3.

W porównaniu z wersją demonstracyjną Google, jakość obrazu jest nieco gorsza. Informacje o obiektach są jednak przejrzyste i łatwe do zrozumienia. Czas przetwarzania wynosi około 2 minut. W interfejsie Canvas użytkownicy mogą bezpośrednio edytować kod, kopiować lub udostępniać treść.

Za pomocą innego polecenia, Gemini 3 otrzymało zadanie stworzenia trójwymiarowego modelu sześcianu (woksela) orła siedzącego na gałęzi drzewa. Narzędzie wygenerowało wynik w około 45 sekund, a użytkownicy mogli powiększać i obracać widok za pomocą myszy. Jednak niektóre szczegóły obrazu zawierały błędy graficzne i nie były wyświetlane stabilnie.

Orzeł siedzący na gałęzi drzewa również był obecny, ale wymaganie było trudniejsze (model 3D). Początkowo kod wygenerowany przez Gemini 3 nie działał. Po zażądaniu modyfikacji obraz pojawił się i stał się interaktywny.

Gemini 3 la gi,  danh gia Gemini 3,  mo hinh Gemini 3,  Google Gemini 3 Pro anh 2

Możliwość tworzenia interaktywnych środowisk w Gemini 3.

Mimo kilku pozostałych problemów, przejście od modelu pytań i odpowiedzi do podejścia opartego na współpracy i edycji to ciekawy kierunek, który sprawia, że ​​Gemini 3 jest przydatny w przypadku złożonych, długoterminowych zadań.

Oczywiście Gemini 3 nie służy wyłącznie do tworzenia grafiki i modeli wizualnych. Google testuje funkcję „Generative UI” dla użytkowników AI Pro. Za pomocą określonych poleceń model może tworzyć interaktywne interfejsy w stylu magazynu lub wizualne strony internetowe.

Google twierdzi, że ta funkcja jest wdrażana etapami. Według doświadczenia The Verge , użytkownicy muszą wybrać funkcję „ Układ wizualny” , a następnie wpisać polecenie, na przykład „Zaplanuj moją 3-dniową wycieczkę do Rzymu”.

Po przetworzeniu, Gemini 3 generuje wyniki podobne do tych z serwisu turystycznego , zawierające plany podróży, szczegółowe zdjęcia oraz pytania dotyczące preferencji podróżniczych i nawyków żywieniowych. Następnie model odpowiednio dostosowuje odpowiedzi. Funkcja ta jest również bardzo przydatna w przypadku takich tematów, jak montaż komputera czy budowa akwarium.

Skuteczniejsze rozumowanie i analiza.

Według Google, Gemini 3 oferuje lepsze możliwości rozumowania niż jego poprzednik. Firma twierdzi, że zdolność rozumowania Gemini 3 Pro osiąga poziom doktorski, uzyskując 37,5% w teście Humanity's Last Exam i 91,9% w egzaminie GPQA Diamond.

Oczywiście użytkownicy mogą w pełni docenić różnicę dopiero podczas bezpośredniej interakcji z modelem. Poproszony o rozwiązanie problemu z zestawu pytań referencyjnych GPQA Diamond (skupionego na poziomie doktoranckim), Gemini 3 Pro potrzebował około 30 sekund, aby podać szczegółowe rozwiązanie, wraz z instrukcjami krok po kroku i ilustracjami.

Gemini 3 la gi,  danh gia Gemini 3,  mo hinh Gemini 3,  Google Gemini 3 Pro anh 3

Gemini 3 potrafi odpowiadać na złożone pytania, wykazując się zdolnością myślenia równą poziomowi doktoratu.

Według oceny, rozwiązanie jest dość szczegółowe i zgodne z prawidłową procedurą. Dla porównania, rozwiązanie w GPT-5.1 również zajęło około 30 sekund, ale było mniej szczegółowe. Podobnie, rozwiązanie w Claude 4.5 Sonnet dało poprawne i szybsze odpowiedzi niż w Gemini 3, ale było mniej szczegółowe.

Google twierdzi, że Gemini 3 może jednocześnie wyodrębniać dokumenty z wielu źródeł, takich jak tekst, obrazy i filmy . Zadania, których wcześniej nie szkolono, są również lepiej obsługiwane w Gemini 3.

Gemini 3 la gi,  danh gia Gemini 3,  mo hinh Gemini 3,  Google Gemini 3 Pro anh 4

Możliwości analizy wideo Gemini 3.

Na przykład, poproszony o analizę głównego tematu 57-minutowego filmu, Gemini 3 potrzebował zaledwie około minuty na wygenerowanie wyników, w tym żądanych argumentów i znaczników czasu, dla odpowiedniego fragmentu filmu. Podobnie, model poprawnie zidentyfikował film o tenisie, analizując mecze i styl gry każdego zawodnika.

Użytkownicy mogą poprosić Gemini 3 o jednoczesne oglądanie filmów i odwoływanie się do źródeł zewnętrznych, a nawet zadawanie pytań w celu głębszej analizy. Ogólnie rzecz biorąc, Gemini 3 jest dość responsywny w zadaniach analitycznych i odwoływaniu się do dokumentów, częściowo dzięki połączeniu z bazą danych wyszukiwarki Google.

Agent jest pomocny, ale nadal są problemy.

Funkcja Agent to również godna uwagi aktualizacja w systemie Gemini 3. W przypadku użytkowników planu AI Ultra (dostępnego obecnie tylko na rynku amerykańskim) tryb ten może wykonywać złożone zadania w imieniu użytkownika, takie jak kategoryzowanie i porządkowanie wiadomości e-mail, wyszukiwanie informacji i rezerwowanie biletów podróżnych.

Podczas premiery Gemini 3, Google posłużyło się przykładem możliwości uporządkowania skrzynki odbiorczej w Gmailu. Według doświadczenia The Verge , funkcja ta działa dokładnie tak, jak oczekiwano: tworzy kompletną listę nieprzeczytanych wiadomości e-mail na tydzień.

Podobnie jak w przypadku funkcji Canvas, listy e-mail i sugerowane działania są wyświetlane w osobnym obszarze. Gemini oferuje kilka opcji, takich jak ustawianie przypomnień o ważnych e-mailach, archiwizowanie e-maili promocyjnych itp.

Gemini 3 la gi,  danh gia Gemini 3,  mo hinh Gemini 3,  Google Gemini 3 Pro anh 5

Funkcja agenta w Gemini 3 ułatwia zarządzanie skrzynkami odbiorczymi Gmaila. Zdjęcie: The Verge .

Po wyświetleniu monitu o utworzenie przypomnienia o płatności rachunku, Gemini szybko wprowadza odpowiednie informacje do Google Tasks. W przypadku zadania płatności agent automatycznie przechodzi do niego i zatrzymuje się, gdy użytkownik musi wprowadzić dane dotyczące płatności.

Ogólnie rzecz biorąc, agent Gemini 3 jest bardzo przydatny w wykrywaniu wiadomości e-mail, o których użytkownicy często zapominają. Narzędzie potrafi również wyszukiwać i anulować subskrypcję wiadomości e-mail z adresów reklamowych, które nie są już przydatne.

W rzeczywistości agenci niektórych chatbotów, takich jak Perplexity i ChatGPT, już obsługują integrację z Gmailem. Jednak Gemini oferuje najbardziej zróżnicowane możliwości integracji. Na przykład użytkownicy Perplexity muszą podać konkretne adresy e-mail, które chcą zachować lub usunąć, podczas gdy w Gemini czynności te można wykonać za pomocą przycisków.

Gemini 3 la gi,  danh gia Gemini 3,  mo hinh Gemini 3,  Google Gemini 3 Pro anh 6

Funkcja tworzenia interaktywnego interfejsu Gemini 3. Zdjęcie: The Verge .

Funkcja sortowania wiadomości e-mail w ChatGPT również jest niestabilna. Jednak prędkość wysyłania wiadomości e-mail w Gemini jest niższa niż w Perplexity. Niektóre zadania, takie jak rezerwacja w restauracji, czasami napotykają problemy.

Chociaż zawsze wymaga potwierdzenia użytkownika przed wykonaniem wrażliwych czynności, takich jak płatności czy wysyłanie e-maili, delegowanie niektórych zadań sztucznej inteligencji nadal budzi u użytkowników wątpliwości. Tryb agenta w Gemini 3 jest dość przydatny, ale użytkownicy nadal muszą monitorować wyniki.

Źródło: https://znews.vn/gemini-3-tot-den-dau-post1607493.html


Komentarz (0)

Zostaw komentarz, aby podzielić się swoimi odczuciami!

Dziedzictwo

Postać

Firmy

Sprawy bieżące

System polityczny

Lokalny

Produkt

Happy Vietnam
Świętujmy razem 80 lat.

Świętujmy razem 80 lat.

Wdzięczny za pokój

Wdzięczny za pokój

Flaga Wietnamu

Flaga Wietnamu