Cel mai mare concurent al ChatGPT

Sigla Google Gemini. Fotografie: Bloomberg .

Google a lansat modelul Gemini 3 la sfârșitul lunii noiembrie. Compania a introdus o serie de îmbunătățiri notabile, cum ar fi capacități îmbunătățite de codare, crearea de imagini vizuale și agenți care îndeplinesc anumite sarcini în numele utilizatorului.

La introducerea Gemini 3, Google a subliniat că acesta era „cel mai inteligent model de până acum” al companiei. Experiența din lumea reală arată că modelul procesează mai rapid și are capacități de raționament mai bune, deși există încă unele domenii care necesită îmbunătățiri.

Creați rapid interfețe interactive.

Una dintre principalele îmbunătățiri din Gemini 3 se învârte în jurul Canvas. Acesta este un spațiu de lucru interactiv în cadrul Gemini care vă permite să solicitați chatbot-urilor să scrie cod, să vizualizeze rezultate și să editeze conținut.

Când Gemini 3 este rugat să creeze un model 3D al diferențelor de dimensiune dintre o minge de fotbal, Pământ, Soare și Calea Lactee, instrumentul activează o interfață de codare, procesează și creează un mediu interactiv, permițând utilizatorilor să selecteze și să compare dimensiunile obiectelor.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 1

Posibilitatea de a crea spații interactive folosind funcția Canvas din Gemini 3.

Comparativ cu demonstrația Google, rezultatele sunt ușor inferioare în ceea ce privește calitatea imaginii. Cu toate acestea, informațiile despre obiecte sunt clare și ușor de înțeles. Timpul de procesare este de aproximativ 2 minute. În interfața Canvas, utilizatorii pot edita direct codul, copia sau partaja conținutul.

Cu o altă comandă, Gemini 3 a fost rugat să creeze un model 3D în stil cub (voxel) al unui vultur cocoțat pe o creangă de copac. Instrumentul a produs rezultatul în aproximativ 45 de secunde, iar utilizatorii puteau mări și roti vizualizarea folosind mouse-ul. Cu toate acestea, unele detalii din imagine aveau erori grafice și nu erau afișate stabil.

Vulturul cocoțat pe o creangă de copac era și el prezent, dar cerința era mai dificilă (un model 3D). Inițial, codul generat de Gemini 3 a eșuat și nu a mai rulat. După ce s-au solicitat modificări, imaginea a apărut și a devenit interactivă.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 2

Capacitatea lui Gemini 3 de a crea medii interactive.

În ciuda unor probleme rămase, trecerea de la un model de întrebări și răspunsuri la o abordare colaborativă, de editare, este o direcție interesantă, ceea ce face ca Gemini 3 să fie util pentru sarcini complexe, pe termen lung.

Desigur, Gemini 3 nu este doar pentru crearea de grafică sau modele vizuale. Google testează o funcție „Generative UI” pentru utilizatorii AI Pro. Cu anumite comenzi, modelul poate crea interfețe interactive în stil de revistă sau site-uri web vizuale.

Google spune că această funcție este implementată în etape. Conform experienței The Verge , utilizatorii trebuie să selecteze funcția Visual Layout , apoi să introducă o comandă precum „Planifică-mi excursia de 3 zile la Roma”.

După procesare, Gemini 3 generează rezultate similare cu un site web de călătorii , complete cu itinerarii, imagini detaliate și câteva întrebări despre preferințele de călătorie și obiceiurile alimentare. Modelul ajustează apoi răspunsurile în consecință. Această funcție este, de asemenea, destul de utilă pentru subiecte precum cum să asamblezi un computer sau să construiești un acvariu.

Raționament și analiză mai eficiente.

Conform Google, Gemini 3 are capacități de raționament mai bune decât predecesorul său. Compania susține că abilitatea de raționament a lui Gemini 3 Pro atinge un nivel doctoral, obținând un scor de 37,5% la Humanity's Last Exam și 91,9% la examenul GPQA Diamond.

Desigur, utilizatorii pot aprecia cu adevărat diferența doar atunci când interacționează direct cu modelul. Când li s-a cerut să rezolve o problemă din setul de întrebări de referință GPQA Diamond (concentrat pe nivel doctoral), Gemini 3 Pro a oferit o soluție detaliată în aproximativ 30 de secunde, inclusiv instrucțiuni pas cu pas și imagini ilustrative.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 3

Gemini 3 poate răspunde la întrebări complexe, demonstrând abilități de gândire echivalente cu un nivel de doctorat.

Conform evaluării, soluția este destul de detaliată și urmează procedura corectă. Pentru comparație, și GPT-5.1 a avut nevoie de aproximativ 30 de secunde pentru a răspunde corect, dar soluția a fost mai puțin detaliată. În mod similar, Claude 4.5 Sonnet a răspuns corect și mai rapid decât Gemini 3, dar a fost mai puțin detaliat.

Google spune că Gemini 3 poate extrage documente simultan din mai multe surse, cum ar fi text, imagini și videoclipuri . Sarcinile care nu au fost niciodată instruite anterior sunt, de asemenea, gestionate mai bine pe Gemini 3.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 4

Capacitățile de analiză video ale Gemini 3.

De exemplu, când i s-a cerut să analizeze subiectul principal al unui videoclip de 57 de minute, Gemini 3 a avut nevoie de doar aproximativ un minut pentru a oferi rezultate, inclusiv argumentele și timestamp-urile solicitate pentru segmentul corespunzător al videoclipului. În mod similar, modelul a identificat corect un videoclip de tenis, analizând meciurile și stilul de joc al fiecărui sportiv.

Utilizatorii pot solicita Gemini 3 să vizioneze simultan videoclipuri și să consulte surse externe, putând chiar să pună întrebări pentru o analiză mai aprofundată. Per total, Gemini 3 este destul de receptiv în sarcinile analitice și de referire la documente, parțial datorită conexiunii sale cu baza de date Google Search.

Agentul este de ajutor, dar există încă probleme.

Funcția Agent este, de asemenea, o îmbunătățire notabilă la Gemini 3. Pentru utilizatorii planului AI Ultra (disponibil în prezent doar pe piața americană), acest mod poate efectua sarcini complexe în numele utilizatorului, cum ar fi clasificarea și organizarea e-mailurilor, căutarea de informații și rezervarea biletelor de călătorie.

La lansarea Gemini 3, Google a folosit exemplul posibilității de a organiza inbox-ul din Gmail. Conform experienței The Verge , această funcție funcționează exact așa cum a fost solicitat: crearea unei liste complete de e-mailuri necitite timp de o săptămână.

Similar funcției Canvas, listele de e-mailuri și acțiunile sugerate sunt afișate într-o zonă separată. Gemini oferă mai multe opțiuni, cum ar fi setarea de mementouri pentru e-mailurile importante, arhivarea e-mailurilor promoționale etc.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 5

Funcția de agent a Gemini 3 ajută la gestionarea inbox-urilor Gmail. Imagine: The Verge .

Când i se solicită să creeze o reamintire pentru plata facturilor, Gemini introduce rapid informațiile relevante în Google Tasks. Pentru sarcina de plată, agentul navighează automat și se oprește atunci când are nevoie ca utilizatorul să introducă informațiile de plată.

Per total, agentul Gemini 3 este destul de util în detectarea e-mailurilor pe care utilizatorii tind să le uite. De asemenea, instrumentul poate găsi și dezabona de la e-mailuri de la adrese publicitare, care nu mai sunt utile.

De fapt, agenții unor chatbot-uri precum Perplexity și ChatGPT acceptă deja integrarea cu Gmail. Cu toate acestea, Gemini oferă cele mai diverse capacități de integrare. De exemplu, utilizatorii Perplexity trebuie să introducă în mod specific e-mailurile pe care doresc să le păstreze sau să le șteargă, în timp ce aceste acțiuni pot fi efectuate prin intermediul butoanelor de pe Gemini.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 6

Funcția de creare a interfeței interactive din Gemini 3. Fotografie: The Verge .

Funcția de sortare a e-mailurilor de pe ChatGPT este, de asemenea, instabilă. Cu toate acestea, viteza de trimitere a e-mailurilor de pe Gemini este mai mică decât cea a Perplexity. Unele sarcini, cum ar fi efectuarea rezervărilor la restaurant, întâmpină uneori probleme.

Deși necesită întotdeauna confirmarea utilizatorului înainte de a efectua acțiuni sensibile, cum ar fi plățile sau trimiterea de e-mailuri, delegarea anumitor sarcini către inteligența artificială îi face în continuare pe utilizatori să ezite. Modul agent de pe Gemini 3 este destul de util, dar utilizatorii trebuie în continuare să monitorizeze rezultatul.

Sursă: https://znews.vn/gemini-3-tot-den-dau-post1607493.html