
Google właśnie wprowadził Gemini 3, model, który koncentruje się na usprawnianiu kodowania, przetwarzania wiadomości e-mail i analizy dokumentów. Model ten charakteryzuje się również lepszą zdolnością rozumowania, rozumie kontekst i uwzględnia elementy graficzne (diagramy, ilustracje...) podczas udzielania odpowiedzi na niektóre pytania.
W ogłoszeniu Google podkreślono, że Gemini 3 pojawi się w aplikacji Gemini, trybie AI w wyszukiwarce Google, a także na nowej platformie programistycznej o nazwie Google Antigravity.
„Najmądrzejsze od Google”
Od premiery, która miała miejsce prawie dwa lata temu, Google stale poszerza zasięg Gemini. Firma zauważa, że funkcja AI Overviews ma obecnie 2 miliardy użytkowników miesięcznie, aplikacja Gemini ma 650 milionów użytkowników miesięcznie, ponad 70% klientów korzystających z chmury korzysta ze sztucznej inteligencji, a 13 milionów programistów tworzy produkty oparte na generatywnym modelu sztucznej inteligencji Google.
Google po raz pierwszy udostępnia Gemini 3 Pro w aplikacji Gemini już od samego początku, twierdząc, że jest to „najinteligentniejszy model firmy jak dotąd”. Gemini 3 Pro jest również udostępniany użytkownikom za pośrednictwem trybu AI.
Tulsee Doshi, starszy dyrektor i szef produktu w Google DeepMind, powiedział, że Gemini 3 przybliży firmę do celu, jakim jest uczynienie informacji „szeroko dostępnymi i użytecznymi”, kontynuując przy tym udoskonalanie wyszukiwarki Google.
Google podkreśla możliwości przetwarzania multimodalnego Gemini 3 Pro, które polegają na jednoczesnym przetwarzaniu tekstu, obrazów i dźwięku. Model ten może na przykład odczytywać zdjęcia przepisów kulinarnych i przekształcać je w książki lub tworzyć interaktywne fiszki na podstawie wykładów wideo .
![]() |
Testy porównawcze Google dla Gemini 3 Pro na platformie LMArena. Zdjęcie: Google . |
W ogłoszeniu Google podkreślono również wydajność Gemini 3 Pro w testach porównawczych. Na przykład, model uzyskał 1501 punktów, zajmując pierwsze miejsce w rankingu LMArena. Zdolność Gemini 3 Pro do logicznego myślenia osiągnęła poziom doktorski, uzyskując 37,5% w teście Humanity's Last Exam i 91,9% w teście GPQA Diamond.
W skali opartej na problemie (MathArena Apex) Gemini 3 Pro uzyskał wynik 23,4%, co jest obecnie najwyższą wartością wśród dużych modeli językowych (LLM).
W zakresie rozumowania multimodalnego, Google twierdzi, że Gemini 3 Pro uzyskał 81% w skali MMMU-Pro i 87,6% w skali Video-MMMU. Model uzyskał również 72,1% w platformie testowej SimpleQA Verified.
„To pokazuje, że Gemini 3 Pro jest w stanie rozwiązywać złożone problemy z szerokiego zakresu dziedzin, od nauk ścisłych po matematykę, z dużą niezawodnością” – podkreślił Google.
W wersji Gemini 3 Deep Think, przeznaczonej do głębokiego rozumowania, wyniki w testach Humanity's Last Exam i GPQA Diamond były jeszcze wyższe niż w przypadku Gemini 3 Pro i wyniosły odpowiednio 41% i 93,8%. Model uzyskał również 45,1% w teście ARC-AGI, będącym miarą ogólnej SI.
Co potrafi Gemini 3?
Ulepszenia w Gemini 3 pojawią się w wielu produktach Google. Eksperymentalna funkcja Dynamic View w Gemini tworzy interaktywne doświadczenia dla niektórych zapytań, na przykład czasopisma z ilustracjami, krótkimi informacjami lub dostosowane interfejsy na żądanie.
„Gemini 3 potrafi nawet analizować nagrania wideo z Twojej gry w pickleball, identyfikować obszary wymagające poprawy i planować sesje treningowe w celu poprawienia Twojej ogólnej techniki” – zauważa Google.
![]() |
Zaawansowane możliwości kodowania Gemini 3 Pro pomagają tworzyć lepsze obrazy. Zdjęcie: Google . |
Tryb AI w wyszukiwarce Google może również generować elementy wizualne, takie jak obrazy, tabele i symulowane filmy, na podstawie zapytań za pośrednictwem generatywnego trybu interfejsu użytkownika. Użytkownicy mogą wchodzić w interakcję z danymi lub zadawać dodatkowe pytania na ich temat.
Według Google tryb AI może wykonywać więcej wyszukiwań dzięki ulepszeniu funkcji „query fan-out”, czyli techniki rozbijającej pytania na mniejsze części, co pozwala lepiej zrozumieć intencję pytania i „znaleźć nowe treści, które wcześniej mogły zostać pominięte”.
Google nie unika wspominania o konkurencji, opisując Gemini 3 Pro jako urządzenie, które „zastępuje puste pochlebstwa wartościowymi i autentycznymi perspektywami”.
„Nie tylko odpowiada na to, co chcesz usłyszeć, ale także daje ci to, co naprawdę musisz usłyszeć” – dodał przedstawiciel Google.
![]() |
Funkcja Dynamic View w Gemini tworzy wizualne i interaktywne środowisko dla niektórych zapytań. Zdjęcie: Google . |
Gemini 3 Pro zapewnia również lepsze wsparcie dla programistów w zakresie kodowania agentów i zadań „vibe coding”. Narzędzia takie jak Google AI Studio, Vertex AI i Gemini CLI są dostępne w Gemini 3, a także zupełnie nowa platforma Antigravity, która koncentruje się na kodowaniu agentów i automatyzacji.
Skoro mowa o agentach, Google twierdzi, że Gemini 3 może im pomóc. Model ten może wykonywać złożone procesy w imieniu użytkowników, takie jak sortowanie i porządkowanie wiadomości e-mail, wyszukiwanie informacji i rezerwowanie biletów .
Użytkownicy Google AI Ultra mogą teraz korzystać z funkcji agenta w aplikacji Gemini dzięki trybowi Gemini Agent.
Zdmuchnij gorące powietrze na przeciwnika
Nowy model Google’a jest postrzegany jako poważny problem dla konkurencji. Źródło „New York Timesa ” podkreśliło, że zarówno OpenAI, jak i Anthropic martwią się o to, że zostaną wyprzedzone, jeśli Gemini 3 sprawdzi się w takich zadaniach jak kodowanie czy generowanie obrazów.
„Biorąc pod uwagę wielkość, przestrzeń i przewagę Google jako pierwszego gracza na rynku wyszukiwań, Gemini może przejąć udziały w rynku i wyprzedzić OpenAI i inne firmy” – powiedział Mike O'Rourke, analityk z JonesTrading.
Przejście na Gemini może mieć wpływ na cały rynek – dodał – i rodzi pytania dla Oracle i Microsoftu, które otrzymały miliardy dolarów od OpenAI na dostarczenie infrastruktury do przetwarzania w chmurze.
![]() |
Sztuczna inteligencja wyszukiwarki Google potrafi generować symulowane obrazy na podstawie zapytań. Zdjęcie: Google . |
Eksplozja sztucznej inteligencji postawiła świat technologii przed pytaniami o równowagę między kosztami a możliwościami biznesowymi. Systemy sztucznej inteligencji są dziś wykorzystywane głównie do wyszukiwania informacji w internecie i automatyzacji programowania.
Technologia ta działa w centrach danych wypełnionych drogimi superkomputerami, a według McKinsey & Company branża ma wydać 7 bilionów dolarów na te obiekty do 2030 roku. Inwestorzy z Wall Street obawiają się, czy przychody Anthropic, OpenAI, Microsoftu i Google wystarczą na pokrycie kosztów.
„Potrzebujemy wysokiej jakości, potencjalnych zastosowań, aby generować przychody. Jeszcze nie jesteśmy na tym etapie” – powiedział Ben Bajarin, analityk Creative Strategies.
![]() |
Gemini 3 Pro osiąga wyniki w teście Google WebDev Arena. Zdjęcie: Google . |
Koray Kavukcuoglu, dyrektor ds. technologii sztucznej inteligencji w Google, powiedział, że dokładność Gemini wzrośnie wraz z wdrożeniem go w wyszukiwarce Google. W połączeniu z wyszukiwarką model może natychmiast pobierać i uwierzytelniać informacje. Oczywiście, działa to tylko do pewnego stopnia.
„Jeśli ludzie korzystają z wyszukiwarki Google, aby uniknąć klikania niebieskich linków, to nie jest to wystarczająco dobre” – powiedział Manos Koukoumidis, współzałożyciel Oumi, startupu, który pomaga firmom automatyzować i wdrażać rozwiązania oparte na sztucznej inteligencji.
Aby powiększyć bazę użytkowników, Google ogłosiło, że zaoferuje studentom w Stanach Zjednoczonych roczną bezpłatną wersję oprogramowania AI Pro. Firma wymienia ponad 20 partnerów korzystających z Gemini 3 w celu analizowania danych i rejestrowania wielojęzycznych spotkań.
Według Bajarina nowe funkcje mogą pomóc Google konkurować z Microsoftem i Amazonem na rynku przetwarzania w chmurze. W październiku Google ogłosiło, że jego przychody z chmury w ostatnim kwartale osiągnęły 15 miliardów dolarów , głównie dzięki zapotrzebowaniu na sztuczną inteligencję.
Źródło: https://znews.vn/google-ra-mat-gemini-3-manh-me-hon-post1603987.html











Komentarz (0)