![]() |
Google Gemini-logotypen. Foto: Bloomberg . |
Google lanserade Gemini 3-modellen i slutet av november. Företaget införde en rad anmärkningsvärda uppgraderingar, såsom förbättrade kodningsfunktioner, visualisering och agenter som utför vissa uppgifter åt användarna.
När Google introducerade Gemini 3 betonade de att detta är företagets "smartaste modell hittills". Praktisk erfarenhet visar att modellen bearbetar snabbare och har bättre resonemangsförmåga, även om det finns vissa faktorer som behöver förbättras.
Skapa interaktiva gränssnitt snabbt
En av de stora uppgraderingarna i Gemini 3 kretsar kring Canvas, en interaktiv arbetsyta i Gemini som låter dig be chatbotar att skriva kod, visualisera resultat och redigera innehåll.
När Gemini 3 ombeds skapa en 3D-modell av skillnaden mellan storleken på en fotboll, jorden, solen och Vintergatan, utlöser verktyget ett interaktivt gränssnitt för kodning, bearbetning och skapande som gör det möjligt att välja och jämföra objekt i storlek.
![]() |
Möjligheten att skapa interaktiva utrymmen med Canvas-funktionen i Gemini 3. |
Jämfört med Googles demo är resultaten något sämre vad gäller bildkvalitet. I gengäld ges informationen om objekten tydligt och lättförståelig. Bearbetningstiden tar cirka 2 minuter. I Canvas-gränssnittet kan användare direkt redigera koden, kopiera eller dela innehållet.
Med ett annat kommando ombads Gemini 3 att skapa en voxelliknande örn som satt på en trädgren. Verktyget gav resultat efter cirka 45 sekunder, och användarna kunde zooma in och rotera vyn med musen. Vissa detaljer i bilden hade dock grafiska fel och visades inte korrekt.
Även med en örn uppe på en trädgren men med en svårare begäran (3D-modell). Första gången koden som genererades av Gemini 3 kraschade och inte kunde köras. Efter att ha begärt en korrigering dök bilden upp och var interaktiv.
![]() |
Gemini 3:s möjligheter att skapa interaktiva miljöer. |
Även om det finns vissa problem är övergången från en fråga-och-svar-modell till samarbetsbaserad redigering en intressant riktning som kommer att göra Gemini 3 användbart för komplexa, långsiktiga uppgifter.
Gemini 3 är förstås inte bara till för att skapa grafik eller visuella modeller. Google testar en funktion för "Generativt användargränssnitt" för AI Pro-användare. Med några få kommandon kan modellen skapa interaktiva gränssnitt i tidskriftsstil eller visuella webbplatser.
Google säger att funktionen lanseras i etapper. Som The Verge upplevde måste användare välja funktionen Visuell layout och sedan skriva in ett kommando som "Planera en 3-dagarsresa till Rom för mig".
Efter bearbetning genererar Gemini 3 resultat som liknar en resewebbplats med detaljerade scheman och bilder, tillsammans med ett antal frågor om resepreferenser och matstilar. Därifrån justerar modellen svaren därefter. Den här funktionen är också ganska användbar för ämnen som hur man monterar en dator, bygger ett akvarium etc.
Resonera och analysera mer effektivt
Enligt Google har Gemini 3 bättre resonemangsförmåga än sin föregångare. Företaget hävdar att Gemini 3 Pros resonemangsförmåga är på doktorandnivå, med en poäng på 37,5 % på Humanity's Last Exam och 91,9 % på GPQA Diamond-examen.
Naturligtvis kan användare bara känna skillnaden när de interagerar direkt med modellen. När Gemini 3 Pro ombads att lösa ett problem hämtat från GPQA Diamond-referensuppsättningen (fokuserad på doktorandnivå) tog det cirka 30 sekunder för dem att ge en detaljerad lösning, inklusive varje steg i problemet och illustrativa bilder.
![]() |
Gemini 3 kan svara på komplexa frågor, tankeförmåga motsvarande doktorsexamen. |
Enligt bedömningen är lösningen ganska detaljerad och följer proceduren. Som jämförelse tog GPT-5.1 också cirka 30 sekunder, besvarades korrekt men lösningen var mindre detaljerad. På liknande sätt besvarades Claude 4.5 Sonnet korrekt, snabbare än Gemini 3 men med mindre detaljer.
Google säger att Gemini 3 kan extrahera dokument från flera källor samtidigt, såsom text, bilder och videor . Uppgifter som den inte har tränats på tidigare hanteras också bättre i Gemini 3.
![]() |
Gemini 3 videoanalysfunktioner. |
Till exempel, när Gemini 3 ombads att analysera huvudämnet i en 57 minuter lång video, tog det bara ungefär en minut för dem att returnera ett resultat som inkluderade de begärda argumenten, tillsammans med en tidsstämpel för motsvarande del av videon. På liknande sätt identifierade modellen korrekt en video om tennis, analyserade matcherna och hur varje spelare spelade.
Användare kan be Gemini 3 att titta på videor samtidigt som de refererar till externa källor, och till och med ställa frågor för djupare analys. Sammantaget är Gemini 3 ganska responsiv när det gäller att analysera och referera till dokument, delvis tack vare dess koppling till Googles sökdatabas.
Agenten är hjälpsam men har problem
Agent är också en anmärkningsvärd uppgradering av Gemini 3. För användare av AI Ultra-paketet (som för närvarande endast stöder den amerikanska marknaden) kan det här läget utföra komplexa processer åt användarna, såsom att sortera och organisera e-postmeddelanden, söka efter information, boka resebiljetter...
När Google lanserade Gemini 3 visade de upp möjligheten att organisera inkorgen i Gmail, och enligt The Verges erfarenhet fungerade det precis som det skulle: det genererade en fullständig lista över olästa e-postmeddelanden från en vecka.
I likhet med Canvas-funktionen visas e-postlistan och föreslagna åtgärder i ett separat område. Gemini erbjuder vissa alternativ som att ställa in påminnelser för viktiga e-postmeddelanden, arkivera reklammejl...
![]() |
Gemini 3:s agentfunktion har stöd för hantering av Gmail-inkorg. Foto: The Verge . |
När Gemini blir ombedd att skapa en påminnelse om fakturabetalning hämtar de snabbt relevant information till Google Tasks. För betalningsuppgiften navigerar agenten automatiskt och stannar när användaren behöver ange betalningsinformation.
Sammantaget är Gemini 3-agenten ganska användbar för att upptäcka e-postmeddelanden som användare sannolikt kommer att glömma. Verktyget kan också hitta och avsluta prenumerationen på e-postmeddelanden från annonsadresser som inte längre är användbara.
Faktum är att vissa chatbot-agenter som Perplexity och ChatGPT redan stöder Gmail-integration. Gemini har dock de mest varierande integrationsmöjligheterna. Perplexity-användare måste till exempel specifikt ange de e-postmeddelanden de vill behålla eller ta bort, medan Gemini kan hanteras via knappar.
![]() |
Gemini 3:s funktion för att skapa interaktiva gränssnitt. Foto: The Verge . |
ChatGPTs funktion för e-postschemaläggning är också inkonsekvent. Gemini har dock en långsammare e-postleverans än Perplexitys. Vissa uppgifter, som att boka bord på restauranger, kan ibland ha problem.
Även om det alltid krävs användarbekräftelse innan känsliga åtgärder som att göra betalningar eller skicka e-postmeddelanden utförs, gör det fortfarande användare tveksamma att lämna vissa uppgifter till AI. Agentläget på Gemini 3 är ganska användbart, men användarna måste fortfarande övervaka resultatet.
Källa: https://znews.vn/gemini-3-tot-den-dau-post1607493.html

















Kommentar (0)