ChatGPTs största konkurrent

Google Gemini-logotypen. Foto: Bloomberg .

Google lanserade Gemini 3-modellen i slutet av november. Företaget introducerade en rad anmärkningsvärda uppgraderingar, såsom förbättrade kodningsfunktioner, skapande av visuella bilder och agenter som utför vissa uppgifter åt användaren.

När Google introducerade Gemini 3 betonade de att det var företagets "smartaste modell hittills". Erfarenheter från verkligheten visar att modellen bearbetar snabbare och har bättre resonemangsförmåga, även om det fortfarande finns vissa områden för förbättring.

Skapa interaktiva gränssnitt snabbt.

En av de största uppgraderingarna i Gemini 3 kretsar kring Canvas. Det är en interaktiv arbetsyta i Gemini som låter dig be chatbotar att skriva kod, visualisera resultat och redigera innehåll.

När Gemini 3 ombeds skapa en 3D-modell av storleksskillnaderna mellan en fotboll, jorden, solen och Vintergatan, aktiverar verktyget ett kodgränssnitt, bearbetar och skapar en interaktiv miljö som gör det möjligt för användare att välja och jämföra storleken på objekt.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 1

Möjligheten att skapa interaktiva utrymmen med hjälp av Canvas-funktionen i Gemini 3.

Jämfört med Googles demo är resultaten något sämre i bildkvalitet. Informationen om objekten är dock tydlig och lätt att förstå. Bearbetningstiden är cirka 2 minuter. I Canvas-gränssnittet kan användare direkt redigera koden, kopiera eller dela innehållet.

Med ett annat kommando ombads Gemini 3 att skapa en 3D-kubliknande (voxelliknande) modell av en örn som satt på en trädgren. Verktyget producerade resultatet på cirka 45 sekunder, och användarna kunde zooma in och rotera vyn med musen. Vissa detaljer i bilden hade dock grafiska fel och visades inte stabilt.

Örnen som satt på en trädgren fanns också med, men kravet var svårare (en 3D-modell). Inledningsvis misslyckades koden som genererades av Gemini 3 och kördes inte. Efter att ha begärt modifieringar dök bilden upp och blev interaktiv.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 2

Gemini 3:s förmåga att skapa interaktiva miljöer.

Trots vissa kvarvarande problem är övergången från en fråge-och-svar-modell till en samarbetsinriktad, redigerande metod en intressant riktning, vilket gör Gemini 3 användbart för komplexa, långsiktiga uppgifter.

Gemini 3 är förstås inte bara till för att skapa grafik eller visuella modeller. Google testar en funktion för "Generativt användargränssnitt" för AI Pro-användare. Med vissa kommandon kan modellen skapa interaktiva gränssnitt i tidskriftsstil eller visuella webbplatser.

Google säger att den här funktionen lanseras i etapper. Enligt The Verges erfarenhet måste användare välja funktionen Visuell layout och sedan ange ett kommando som "Planera min 3-dagarsresa till Rom".

Efter bearbetning genererar Gemini 3 resultat som liknar en resewebbplats , komplett med resplaner, detaljerade bilder och några frågor om resepreferenser och matvanor. Modellen justerar sedan svaren därefter. Den här funktionen är också ganska användbar för ämnen som hur man monterar en dator eller bygger ett akvarium.

Effektivare resonemang och analys.

Enligt Google har Gemini 3 bättre resonemangsförmåga än sin föregångare. Företaget hävdar att Gemini 3 Pros resonemangsförmåga når en doktorsnivå, med 37,5 % på Humanity's Last Exam och 91,9 % på GPQA Diamond-examen.

Naturligtvis kan användare bara verkligen uppskatta skillnaden när de interagerar direkt med modellen. När Gemini 3 Pro ombads att lösa ett problem från GPQA Diamond-referensfrågeserien (fokuserad på doktorandnivå) tog det cirka 30 sekunder för dem att ge en detaljerad lösning, inklusive steg-för-steg-instruktioner och illustrativa bilder.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 3

Gemini 3 kan svara på komplexa frågor och visa tankeförmåga motsvarande en doktorsexamen.

Enligt bedömningen är lösningen ganska detaljerad och följer korrekt procedur. Som jämförelse tog det också cirka 30 sekunder att svara korrekt på GPT-5.1, men lösningen var mindre detaljerad. På liknande sätt svarade Claude 4.5 Sonnet korrekt och snabbare än Gemini 3, men var mindre detaljerad.

Google säger att Gemini 3 kan extrahera dokument samtidigt från flera källor, såsom text, bilder och videor . Uppgifter som aldrig har tränats på tidigare hanteras också bättre i Gemini 3.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 4

Gemini 3:s videoanalysfunktioner.

Till exempel, när Gemini 3 ombads att analysera huvudämnet i en 57 minuter lång video, tog det bara ungefär en minut för dem att ge resultat, inklusive de begärda argumenten och tidsstämplarna, till motsvarande segment av videon. På liknande sätt identifierade modellen korrekt en tennisvideo genom att analysera matcherna och varje idrottares spelstil.

Användare kan be Gemini 3 att samtidigt titta på videor och hänvisa till externa källor, och till och med ställa frågor för djupare analys. Sammantaget är Gemini 3 ganska responsiv i analytiska och dokumentrefererande uppgifter, delvis tack vare dess koppling till Googles sökdatabas.

Agenten är hjälpsam, men det finns fortfarande problem.

Agentfunktionen är också en anmärkningsvärd uppgradering på Gemini 3. För användare av AI Ultra-planen (för närvarande endast tillgänglig på den amerikanska marknaden) kan det här läget utföra komplexa uppgifter åt användaren, såsom att kategorisera och organisera e-postmeddelanden, söka efter information och boka resebiljetter.

När Google lanserade Gemini 3 använde de exemplet med möjligheten att organisera inkorgen i Gmail. Enligt The Verges erfarenhet fungerar den här funktionen precis som efterfrågat: det skapar en komplett lista över olästa e-postmeddelanden under en vecka.

I likhet med Canvas-funktionen visas e-postlistor och föreslagna åtgärder i ett separat område. Gemini erbjuder flera alternativ, som att ställa in påminnelser för viktiga e-postmeddelanden, arkivera reklammejl etc.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 5

Gemini 3:s agentfunktion hjälper till att hantera Gmail-inkorgar. Bild: The Verge .

När Gemini ombeds att skapa en påminnelse om fakturabetalning matar agenten snabbt in relevant information i Google Tasks. För betalningsuppgiften navigerar agenten automatiskt och stannar när användaren behöver ange betalningsinformation.

Sammantaget är Gemini 3:s agent ganska användbar för att upptäcka e-postmeddelanden som användare tenderar att glömma. Verktyget kan också hitta och avsluta prenumerationen på e-postmeddelanden från annonsadresser som inte längre är användbara.

Agenterna för vissa chatbotar som Perplexity och ChatGPT stöder faktiskt redan integration med Gmail. Gemini erbjuder dock de mest varierade integrationsmöjligheterna. Perplexity-användare måste till exempel specifikt ange de e-postmeddelanden de vill behålla eller radera, medan dessa åtgärder kan utföras via knappar på Gemini.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 6

Funktionen för att skapa interaktiva gränssnitt i Gemini 3. Foto: The Verge .

Funktionen för e-postsortering på ChatGPT är också instabil. Gemini har dock en långsammare e-postsändningshastighet än Perplexity. Vissa uppgifter, som att boka bord på restauranger, stöter ibland på problem.

Även om det alltid krävs användarbekräftelse innan känsliga åtgärder som betalningar eller e-postmeddelanden utförs, gör delegering av vissa uppgifter till AI fortfarande användare tveksamma. Agentläget på Gemini 3 är ganska användbart, men användarna behöver fortfarande övervaka resultatet.

Källa: https://znews.vn/gemini-3-tot-den-dau-post1607493.html