ChatGPTs største konkurrent

Google Gemini-logoen. Foto: Bloomberg .

Google lanserte Gemini 3-modellen i slutten av november. Selskapet introduserte en rekke bemerkelsesverdige oppgraderinger, som forbedrede kodefunksjoner, visuell bildeoppretting og agenter som utfører visse oppgaver på vegne av brukeren.

Da Google introduserte Gemini 3, understreket de at det var selskapets «smarteste modell hittil». Erfaring fra den virkelige verden viser at modellen behandler raskere og har bedre resonneringsevner, selv om det fortsatt er noen områder for forbedring.

Lag interaktive grensesnitt raskt.

En av de største oppgraderingene i Gemini 3 dreier seg om Canvas. Dette er et interaktivt arbeidsområde i Gemini som lar deg be chatboter om å skrive kode, visualisere resultater og redigere innhold.

Når Gemini 3 blir bedt om å lage en 3D-modell av størrelsesforskjellene mellom en fotball, jorden, solen og Melkeveien, aktiverer verktøyet et kodegrensesnitt, behandler og oppretter et interaktivt miljø, slik at brukerne kan velge og sammenligne størrelsene på objekter.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 1

Muligheten til å lage interaktive rom ved hjelp av Canvas-funksjonen i Gemini 3.

Sammenlignet med Googles demo er resultatene noe dårligere i bildekvalitet. Informasjonen om objektene er imidlertid tydelig og lett å forstå. Behandlingstiden er omtrent 2 minutter. I Canvas-grensesnittet kan brukere redigere koden direkte, kopiere eller dele innholdet.

Med en annen kommando ble Gemini 3 bedt om å lage en 3D-kubemodell (voksel) av en ørn som satt på en tregren. Verktøyet produserte resultatet på omtrent 45 sekunder, og brukerne kunne zoome inn og rotere visningen med musen. Noen detaljer i bildet hadde imidlertid grafiske feil og ble ikke vist stabilt.

Ørnen som satt på en tregren var også til stede, men kravet var vanskeligere (en 3D-modell). I utgangspunktet feilet koden generert av Gemini 3 og ville ikke kjøre. Etter å ha bedt om endringer, dukket bildet opp og ble interaktivt.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 2

Gemini 3s evne til å skape interaktive miljøer.

Til tross for noen gjenværende problemer, er overgangen fra en spørsmål-og-svar-modell til en samarbeidende, redigerende tilnærming en interessant retning, noe som gjør Gemini 3 nyttig for komplekse, langsiktige oppgaver.

Gemini 3 er selvsagt ikke bare for å lage grafikk eller visuelle modeller. Google tester en «Generativ brukergrensesnitt»-funksjon for AI Pro-brukere. Med visse kommandoer kan modellen lage interaktive grensesnitt i magasinstil eller visuelle nettsteder.

Google sier at denne funksjonen rulles ut i etapper. I følge The Verges erfaring må brukerne velge funksjonen Visuell layout og deretter skrive inn en kommando som «Planlegg min 3-dagers tur til Roma».

Etter behandling genererer Gemini 3 resultater som ligner på en reiseside , komplett med reiseruter, detaljerte bilder og noen spørsmål om reisepreferanser og spisevaner. Modellen justerer deretter svarene deretter. Denne funksjonen er også ganske nyttig for emner som hvordan man monterer en datamaskin eller bygger et akvarium.

Mer effektiv resonnering og analyse.

Ifølge Google har Gemini 3 bedre resonneringsevner enn forgjengeren. Selskapet hevder at Gemini 3 Pros resonneringsevne når et doktorgradsnivå, med en score på 37,5 % på Humanity's Last Exam og 91,9 % på GPQA Diamond-eksamenen.

Brukere kan selvsagt bare virkelig forstå forskjellen når de samhandler direkte med modellen. Da Gemini 3 Pro ble bedt om å løse et problem fra GPQA Diamond-referansespørsmålssettet (fokusert på doktorgradsnivå), brukte det omtrent 30 sekunder på å gi en detaljert løsning, inkludert trinnvise instruksjoner og illustrerende bilder.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 3

Gemini 3 kan svare på komplekse spørsmål og demonstrere tenkeevner tilsvarende et doktorgradsnivå.

Ifølge vurderingen er løsningen ganske detaljert og følger riktig prosedyre. Til sammenligning tok det også omtrent 30 sekunder å svare riktig på GPT-5.1, men løsningen var mindre detaljert. På samme måte svarte Claude 4.5 Sonnet riktig og raskere enn Gemini 3, men var mindre detaljert.

Google sier at Gemini 3 kan hente ut dokumenter samtidig fra flere kilder, som tekst, bilder og videoer . Oppgaver som aldri har blitt trent på før håndteres også bedre på Gemini 3.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 4

Gemini 3s videoanalysefunksjoner.

For eksempel, da Gemini 3 ble bedt om å analysere hovedtemaet i en 57-minutters video, brukte de bare omtrent ett minutt på å gi resultater, inkludert de forespurte argumentene og tidsstemplene til det tilsvarende segmentet av videoen. På samme måte identifiserte modellen riktig en tennisvideo, og analyserte kampene og spillestilen til hver utøver.

Brukere kan be Gemini 3 om å se videoer samtidig som de refererer til eksterne kilder, og til og med stille spørsmål for dypere analyse. Totalt sett er Gemini 3 ganske responsiv i analytiske og dokumentrefererende oppgaver, delvis takket være tilkoblingen til Googles søkedatabase.

Agenten er hjelpsom, men det er fortsatt problemer.

Agent-funksjonen er også en bemerkelsesverdig oppgradering på Gemini 3. For brukere av AI Ultra-abonnementet (for øyeblikket kun tilgjengelig på det amerikanske markedet), kan denne modusen utføre komplekse oppgaver på vegne av brukeren, for eksempel kategorisering og organisering av e-poster, søk etter informasjon og bestilling av reisebilletter.

Da Google lanserte Gemini 3, brukte de eksempelet med muligheten til å organisere innboksen i Gmail. Ifølge The Verges erfaring fungerer denne funksjonen akkurat som forespurt: den oppretter en komplett liste over uleste e-poster for en uke.

I likhet med Canvas-funksjonen vises e-postlister og foreslåtte handlinger i et separat område. Gemini tilbyr flere alternativer, som å angi påminnelser for viktige e-poster, arkivere reklame-e-poster osv.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 5

Agentfunksjonen i Gemini 3 hjelper deg med å administrere Gmail-innbokser. Bilde: The Verge .

Når Gemini blir bedt om å opprette en påminnelse om betaling av regninger, legger de raskt inn relevant informasjon i Google Oppgaver. For betalingsoppgaven navigerer agenten automatisk og stopper når brukeren må oppgi betalingsinformasjon.

Alt i alt er agenten i Gemini 3 ganske nyttig for å oppdage e-poster som brukere har en tendens til å glemme. Verktøyet kan også finne og melde seg av e-poster fra annonseadresser som ikke lenger er nyttige.

Faktisk støtter agentene til noen chatboter som Perplexity og ChatGPT allerede integrasjon med Gmail. Gemini tilbyr imidlertid de mest varierte integrasjonsmulighetene. For eksempel må Perplexity-brukere spesifikt legge inn e-postene de vil beholde eller slette, mens disse handlingene kan utføres via knapper på Gemini.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 6

Funksjonen for å lage interaktive grensesnitt i Gemini 3. Foto: The Verge .

Funksjonen for sortering av e-post på ChatGPT er også ustabil. Imidlertid er Gemini sin e-postsendingshastighet lavere enn Perplexity. Enkelte oppgaver, som å bestille bord på restaurant, støter noen ganger på problemer.

Selv om det alltid krever brukerbekreftelse før man utfører sensitive handlinger som betalinger eller sending av e-post, gjør delegering av visse oppgaver til AI fortsatt brukerne nølende. Agentmodusen på Gemini 3 er ganske nyttig, men brukerne må fortsatt overvåke resultatet.

Kilde: https://znews.vn/gemini-3-tot-den-dau-post1607493.html