![]() |
Google Gemini-logoen. Foto: Bloomberg . |
Google lanserte Gemini 3-modellen i slutten av november. Selskapet introduserte en rekke bemerkelsesverdige oppgraderinger, som forbedrede kodefunksjoner, visualisering og agenter som utfører visse oppgaver på vegne av brukere.
Da Google introduserte Gemini 3, understreket de at dette er selskapets «smarteste modell hittil». Praktisk erfaring viser at modellen behandler raskere og har bedre resonneringsevne, selv om det er noen faktorer som må forbedres.
Lag interaktive grensesnitt raskt
En av de store oppgraderingene i Gemini 3 dreier seg om Canvas, et interaktivt arbeidsområde i Gemini som lar deg be chatboter om å skrive kode, visualisere resultater og redigere innhold.
Når Gemini 3 blir bedt om å lage en 3D-modell av forskjellen mellom størrelsen på en fotball, jorden, solen og Melkeveien, utløser verktøyet et interaktivt grensesnitt for koding, behandling og oppretting som lar objekter velges og sammenlignes i størrelse.
![]() |
Muligheten til å lage interaktive rom med Canvas-funksjonen i Gemini 3. |
Sammenlignet med Googles demo er resultatene noe dårligere når det gjelder bildekvalitet. Til gjengjeld gis informasjonen om objektene tydelig og lettforståelig. Behandlingstiden tar omtrent 2 minutter. I Canvas-grensesnittet kan brukerne redigere koden direkte, kopiere eller dele innholdet.
Med en annen kommando ble Gemini 3 bedt om å lage en voksellignende ørn som satt på en tregren. Verktøyet ga resultater etter omtrent 45 sekunder, og brukerne kunne zoome inn og rotere visningen med musen. Noen detaljer i bildet hadde imidlertid grafiske feil og ble ikke vist riktig.
Også med en ørn som sitter på en tregren, men med en vanskeligere forespørsel (3D-modell). Første gang koden generert av Gemini 3 krasjet og ikke kjørte. Etter å ha bedt om en rettelse dukket bildet opp og var interaktivt.
![]() |
Gemini 3s evner til å skape interaktive omgivelser. |
Selv om det er noen problemer, er overgangen fra en spørsmål-og-svar-modell til samarbeidende redigering en interessant retning som vil gjøre Gemini 3 nyttig for komplekse, langsiktige oppgaver.
Gemini 3 er selvsagt ikke bare for å lage grafikk eller visuelle modeller. Google tester en «Generativ brukergrensesnitt»-funksjon for AI Pro-brukere. Med noen få kommandoer kan modellen lage interaktive grensesnitt i magasinstil eller visuelle nettsteder.
Google sier at funksjonen rulles ut i etapper. Som The Verge opplevde, må brukerne velge funksjonen for visuell layout og deretter skrive inn en kommando som «Planlegg en 3-dagers tur til Roma for meg».
Etter behandling genererer Gemini 3 resultater som ligner på en reiseside med detaljerte tidsplaner og bilder, sammen med en rekke spørsmål om reisepreferanser og spisestiler. Derfra vil modellen justere svarene deretter. Denne funksjonen er også ganske nyttig for emner som hvordan man setter sammen en datamaskin, bygger et akvarium osv.
Resoner og analyser mer effektivt
Ifølge Google har Gemini 3 bedre resonneringsevner enn forgjengeren. Selskapet hevder at Gemini 3 Pros resonneringsevne er på doktorgradsnivå, med en poengsum på 37,5 % på Humanity's Last Exam og 91,9 % på GPQA Diamond-eksamenen.
Brukere kan selvfølgelig bare merke forskjellen når de samhandler direkte med modellen. Da Gemini 3 Pro ble bedt om å løse et problem hentet fra GPQA Diamond-referansesettet (fokusert på doktorgradsnivå), brukte det omtrent 30 sekunder på å gi en detaljert løsning, inkludert hvert trinn i problemet og illustrerende bilder.
![]() |
Gemini 3 kan svare på komplekse spørsmål, og har en tenkeevne tilsvarende doktorgradsnivå. |
Ifølge vurderingen er løsningen ganske detaljert og følger prosedyren. Til sammenligning tok GPT-5.1 også omtrent 30 sekunder, og besvarte riktig, men løsningen var mindre detaljert. På samme måte besvarte Claude 4.5 Sonnet riktig, raskere enn Gemini 3, men med færre detaljer.
Google sier at Gemini 3 kan hente ut dokumenter fra flere kilder samtidig, for eksempel tekst, bilder og videoer . Oppgaver den ikke har blitt trent på før håndteres også bedre på Gemini 3.
![]() |
Gemini 3 videoanalysefunksjoner. |
For eksempel, da Gemini 3 ble bedt om å analysere hovedtemaet i en 57-minutters video, brukte de bare omtrent ett minutt på å returnere et resultat som inkluderte de forespurte argumentene, sammen med et tidsstempel til den tilsvarende delen av videoen. På samme måte identifiserte modellen riktig en video om tennis, analyserte kampene og hvordan hver spiller spilte.
Brukere kan be Gemini 3 om å se videoer mens de refererer til eksterne kilder, og til og med stille spørsmål for dypere analyse. Alt i alt er Gemini 3 ganske responsiv når det gjelder å analysere og referere til dokumenter, delvis takket være tilkoblingen til Googles søkedatabase.
Agenten er hjelpsom, men har problemer
Agent er også en bemerkelsesverdig oppgradering på Gemini 3. For brukere av AI Ultra-pakken (som for øyeblikket kun støtter det amerikanske markedet), kan denne modusen utføre komplekse prosesser på vegne av brukere, som å sortere og organisere e-poster, søke etter informasjon, bestille reisebilletter...
Da Google lanserte Gemini 3, viste de frem muligheten til å organisere innboksen din i Gmail, og etter The Verges erfaring fungerte det akkurat som det skulle: det genererte en fullstendig liste over uleste e-poster fra en uke.
I likhet med Canvas-funksjonen vises e-postlisten og foreslåtte handlinger i et separat område. Gemini tilbyr noen alternativer, som å angi påminnelser for viktige e-poster, arkivere reklame-e-poster ...
![]() |
Agentfunksjonen i Gemini 3 støtter administrasjon av Gmail-innboksen. Foto: The Verge . |
Når Gemini blir bedt om å opprette en påminnelse om betaling av regninger, henter de raskt den relevante informasjonen inn i Google Oppgaver. For betalingsoppgaven navigerer agenten automatisk og stopper når brukeren må oppgi betalingsinformasjon.
Alt i alt er Gemini 3-agenten ganske nyttig for å oppdage e-poster som brukere sannsynligvis vil glemme. Verktøyet kan også finne og melde seg av e-poster fra annonseadresser som ikke lenger er nyttige.
Faktisk støtter noen chatbot-agenter som Perplexity og ChatGPT allerede Gmail-integrasjon. Imidlertid er Gemini sine integrasjonsmuligheter de mest varierte. For eksempel må Perplexity-brukere spesifikt legge inn e-postene de vil beholde eller slette, mens Gemini sine operasjoner kan gjøres via knapper.
![]() |
Gemini 3s interaktive grensesnittopprettingsfunksjon. Foto: The Verge . |
ChatGPTs funksjon for e-postplanlegging er også inkonsekvent. Imidlertid er Gemini sin e-postleveringshastighet lavere enn Perplexitys. Enkelte oppgaver, som å bestille bord på restaurant, kan noen ganger ha problemer.
Selv om det alltid kreves brukerbekreftelse før man utfører sensitive handlinger som å betale eller sende e-post, gjør det fortsatt brukerne nølende å overlate noen oppgaver til AI. Agentmodusen på Gemini 3 er ganske nyttig, men brukerne må fortsatt overvåke resultatet.
Kilde: https://znews.vn/gemini-3-tot-den-dau-post1607493.html

















Kommentar (0)