![]() |
Sigla Google Gemini. Fotografie: Bloomberg . |
Google a lansat modelul Gemini 3 la sfârșitul lunii noiembrie. Compania a adus o serie de îmbunătățiri notabile, cum ar fi capacități îmbunătățite de codare, vizualizare și agenți care îndeplinesc anumite sarcini în numele utilizatorilor.
La lansarea Gemini 3, Google a subliniat că acesta este „cel mai inteligent model de până acum” al companiei. Experiența practică arată că modelul procesează mai rapid, are o capacitate de raționament mai bună, deși există anumiți factori care trebuie îmbunătățiți.
Creați rapid interfețe interactive
Una dintre marile îmbunătățiri din Gemini 3 se învârte în jurul Canvas, un spațiu de lucru interactiv în Gemini care vă permite să solicitați chatbot-urilor să scrie cod, să vizualizeze rezultate și să editeze conținut.
Când Gemini 3 este rugat să creeze un model 3D al diferenței dintre dimensiunea unei mingi de fotbal, Pământ, Soare și Calea Lactee, instrumentul declanșează o interfață interactivă de codare, procesare și creare care permite selectarea și compararea dimensiunilor obiectelor.
![]() |
Posibilitatea de a crea spații interactive cu funcția Canvas din Gemini 3. |
Comparativ cu versiunea demo de la Google, rezultatele sunt puțin mai slabe în ceea ce privește calitatea imaginii. În schimb, informațiile despre obiecte sunt furnizate clar și ușor de înțeles. Timpul de procesare durează aproximativ 2 minute. În interfața Canvas, utilizatorii pot edita direct codul, copia sau partaja conținutul.
Cu o altă comandă, Gemini 3 a fost rugat să creeze un vultur în stil voxel așezat pe o creangă de copac. Instrumentul a dat rezultate după aproximativ 45 de secunde, iar utilizatorii puteau mări și roti vizualizarea folosind mouse-ul. Cu toate acestea, unele detalii din imagine aveau erori grafice și nu erau afișate corect.
Tot cu un vultur cocoțat pe o creangă de copac, dar cu o solicitare mai dificilă (model 3D). Prima dată, codul generat de Gemini 3 s-a blocat și nu a putut rula. După solicitarea unei remedieri, imaginea a apărut și era interactivă.
![]() |
Capacitățile interactive de creare a mediului ale Gemini 3. |
Deși există unele probleme, trecerea de la un model de întrebări și răspunsuri la editarea colaborativă este o direcție interesantă care va face Gemini 3 util pentru sarcini complexe, pe termen lung.
Desigur, Gemini 3 nu este doar pentru crearea de grafică sau modele vizuale. Google testează o funcție „Generative UI” pentru utilizatorii AI Pro. Cu câteva comenzi, modelul poate crea interfețe interactive în stil de revistă sau site-uri web vizuale.
Google spune că funcția este implementată în etape. După cum a experimentat The Verge , utilizatorii trebuie să selecteze funcția Aspect vizual , apoi să introducă o comandă precum „Planifică-mi o excursie de 3 zile la Roma”.
După procesare, Gemini 3 generează rezultate similare cu un site web de călătorii , cu programe și imagini detaliate, împreună cu o serie de întrebări despre preferințele de călătorie și stilurile alimentare. De acolo, modelul va ajusta răspunsurile în consecință. Această funcție este, de asemenea, destul de utilă pentru subiecte precum cum să asamblezi un computer, să construiești un acvariu etc.
Raționează și analizează mai eficient
Conform Google, Gemini 3 are capacități de raționament mai bune decât predecesorul său. Compania susține că capacitatea de raționament a lui Gemini 3 Pro este la nivel de doctorat, cu un scor de 37,5% la Humanity's Last Exam și 91,9% la examenul GPQA Diamond.
Desigur, utilizatorii pot simți diferența doar atunci când interacționează direct cu modelul. Când i s-a cerut să rezolve o problemă preluată din setul de referință GPQA Diamond (concentrat pe nivel doctoral), Gemini 3 Pro a avut nevoie de aproximativ 30 de secunde pentru a oferi o soluție detaliată, incluzând fiecare pas al problemei și imagini ilustrative.
![]() |
Gemeni 3 poate răspunde la întrebări complexe, cu o capacitate de gândire echivalentă cu nivelul de doctorat. |
Conform evaluării, soluția este destul de detaliată și respectă procedura. Pentru comparație, GPT-5.1 a durat și el aproximativ 30 de secunde, a răspuns corect, dar soluția a fost mai puțin detaliată. În mod similar, Claude 4.5 Sonnet a răspuns corect, mai rapid decât Gemini 3, dar cu mai puține detalii.
Google spune că Gemini 3 poate extrage documente din mai multe surse simultan, cum ar fi text, imagini și videoclipuri . Sarcinile pentru care nu a fost antrenat anterior sunt, de asemenea, gestionate mai bine pe Gemini 3.
![]() |
Capacități de analiză video Gemini 3. |
De exemplu, când i s-a cerut să analizeze subiectul principal al unui videoclip de 57 de minute, Gemini 3 a returnat în aproximativ un minut un rezultat care includea argumentele solicitate, împreună cu o marcă temporală pentru partea corespunzătoare a videoclipului. În mod similar, modelul a identificat corect un videoclip despre tenis, analizând meciurile și modul în care a jucat fiecare jucător.
Utilizatorii pot solicita Gemini 3 să vizioneze videoclipuri în timp ce fac referire la surse externe și chiar pot pune întrebări pentru o analiză mai aprofundată. Per total, Gemini 3 este destul de receptiv în analizarea și referențierea documentelor, în parte datorită conexiunii sale la baza de date Google Search.
Agentul este de ajutor, dar are probleme.
Agent este, de asemenea, o actualizare notabilă față de Gemini 3. Pentru utilizatorii pachetului AI Ultra (care în prezent acceptă doar piața din SUA), acest mod poate efectua procese complexe în numele utilizatorilor, cum ar fi sortarea și organizarea e-mailurilor, căutarea de informații, rezervarea biletelor de călătorie...
Când Google a lansat Gemini 3, a demonstrat posibilitatea de a-ți organiza inbox-ul în Gmail, iar din experiența The Verge , a funcționat exact așa cum trebuia: a generat o listă completă de e-mailuri necitite dintr-o săptămână.
Similar cu funcția Canvas, lista de e-mailuri și acțiunile sugerate sunt afișate într-o zonă separată. Gemini oferă câteva opțiuni, cum ar fi setarea de mementouri pentru e-mailuri importante, arhivarea e-mailurilor promoționale...
![]() |
Funcția de agent a Gemini 3 acceptă gestionarea inbox-ului Gmail. Fotografie: The Verge . |
Când i se solicită să creeze o reamintire pentru plata unei facturi, Gemini extrage rapid informațiile relevante în Google Tasks. Pentru sarcina de plată, agentul navighează automat și se oprește atunci când are nevoie ca utilizatorul să introducă informațiile de plată.
Per total, agentul Gemini 3 este destul de util în detectarea e-mailurilor pe care utilizatorii sunt susceptibili să le uite. De asemenea, instrumentul poate găsi și dezabona e-mailuri de la adrese publicitare care nu mai sunt utile.
De fapt, unii agenți chatbot precum Perplexity și ChatGPT acceptă deja integrarea cu Gmail. Cu toate acestea, capacitățile de integrare ale Gemini sunt cele mai diverse. De exemplu, utilizatorii Perplexity trebuie să introducă în mod specific e-mailurile pe care doresc să le păstreze sau să le șteargă, în timp ce operațiunile Gemini se pot face prin intermediul butoanelor.
![]() |
Funcția de creare a interfeței interactive a Gemini 3. Fotografie: The Verge . |
Funcția de programare a e-mailurilor din ChatGPT este, de asemenea, inconsistentă. Cu toate acestea, viteza de livrare a e-mailurilor din Gemini este mai lentă decât cea din Perplexity. Unele sarcini, cum ar fi efectuarea rezervărilor la restaurant, întâmpină uneori probleme.
Deși necesită întotdeauna confirmarea utilizatorului înainte de a efectua acțiuni sensibile, cum ar fi efectuarea de plăți sau trimiterea de e-mailuri, lăsarea anumitor sarcini în seama inteligenței artificiale îi face totuși pe utilizatori ezitanți. Modul agent de pe Gemini 3 este destul de util, dar utilizatorii trebuie în continuare să monitorizeze rezultatul.
Sursă: https://znews.vn/gemini-3-tot-den-dau-post1607493.html

















Comentariu (0)