El mayor competidor de ChatGPT

El logotipo de Google Gemini. Foto: Bloomberg .

Google lanzó el modelo Gemini 3 a finales de noviembre. La compañía introdujo una serie de mejoras importantes, como capacidades de codificación mejoradas, creación de imágenes visuales y agentes que realizan ciertas tareas en nombre del usuario.

Al presentar Gemini 3, Google enfatizó que era el "modelo más inteligente" de la compañía hasta la fecha. La experiencia práctica demuestra que el modelo procesa más rápido y tiene mejor capacidad de razonamiento, aunque aún existen áreas de mejora.

Cree interfaces interactivas rápidamente.

Una de las principales mejoras de Gemini 3 gira en torno a Canvas. Este es un espacio de trabajo interactivo dentro de Gemini que permite pedir a los chatbots que escriban código, visualicen resultados y editen contenido.

Cuando se le pide a Gemini 3 que cree un modelo 3D de las diferencias de tamaño entre un balón de fútbol, la Tierra, el Sol y la Vía Láctea, la herramienta activa una interfaz de codificación, procesa y crea un entorno interactivo, permitiendo a los usuarios seleccionar y comparar los tamaños de los objetos.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 1

La capacidad de crear espacios interactivos utilizando la función Canvas en Gemini 3.

En comparación con la demo de Google, la calidad de imagen de los resultados es ligeramente inferior. Sin embargo, la información sobre los objetos es clara y fácil de entender. El tiempo de procesamiento es de aproximadamente 2 minutos. En la interfaz de Canvas, los usuarios pueden editar el código directamente, copiar o compartir el contenido.

Con otro comando, se le pidió a Gemini 3 que creara un modelo 3D de cubo (vóxel) de un águila posada en la rama de un árbol. La herramienta generó el resultado en aproximadamente 45 segundos, y los usuarios podían ampliar y rotar la vista con el ratón. Sin embargo, algunos detalles de la imagen presentaban errores gráficos y no se mostraban de forma estable.

El águila posada en la rama de un árbol también estaba presente, pero el requisito era más complejo (un modelo 3D). Inicialmente, el código generado por Gemini 3 falló y no se ejecutó. Tras solicitar modificaciones, la imagen apareció y se volvió interactiva.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 2

La capacidad de Gemini 3 para crear entornos interactivos.

A pesar de algunos problemas restantes, el cambio de un modelo de preguntas y respuestas a un enfoque de edición colaborativa es una dirección interesante, que hace que Gemini 3 sea útil para tareas complejas y a largo plazo.

Por supuesto, Gemini 3 no se limita a crear gráficos o modelos visuales. Google está probando una función de "IU generativa" para usuarios de AI Pro. Con ciertos comandos, el modelo puede crear interfaces interactivas tipo revista o sitios web visuales.

Google afirma que esta función se está implementando por etapas. Según la experiencia de The Verge , los usuarios deben seleccionar la función Diseño visual y luego escribir un comando como "Planificar mi viaje de 3 días a Roma".

Tras el procesamiento, Gemini 3 genera resultados similares a los de un sitio web de viajes , con itinerarios, imágenes detalladas y preguntas sobre preferencias de viaje y hábitos alimenticios. El modelo ajusta las respuestas según corresponda. Esta función también es muy útil para temas como ensamblar una computadora o construir un acuario.

Razonamiento y análisis más efectivos.

Según Google, Gemini 3 tiene una capacidad de razonamiento superior a la de su predecesor. La compañía afirma que la capacidad de razonamiento de Gemini 3 Pro alcanza el nivel de un doctorado, con una puntuación del 37,5 % en el Examen Final de Humanidades y del 91,9 % en el examen Diamante de GPQA.

Por supuesto, los usuarios solo pueden apreciar la diferencia al interactuar directamente con el modelo. Al solicitarle que resolviera un problema del conjunto de preguntas de referencia GPQA Diamond (dirigido a estudiantes de doctorado), Gemini 3 Pro tardó aproximadamente 30 segundos en proporcionar una solución detallada, con instrucciones paso a paso e imágenes ilustrativas.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 3

Géminis 3 puede responder preguntas complejas, demostrando habilidades de pensamiento equivalentes a un nivel de doctorado.

Según la evaluación, la solución es bastante detallada y sigue el procedimiento correcto. A modo de comparación, GPT-5.1 también tardó unos 30 segundos en responder correctamente, pero la solución fue menos detallada. De igual manera, Claude 4.5 Sonnet respondió correctamente y más rápido que Gemini 3, pero fue menos detallado.

Google afirma que Gemini 3 puede extraer documentos simultáneamente de múltiples fuentes, como texto, imágenes y vídeos . Las tareas que nunca se han entrenado antes también se gestionan mejor en Gemini 3.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 4

Capacidades de análisis de vídeo de Gemini 3.

Por ejemplo, al solicitarle que analizara el tema principal de un video de 57 minutos, Gemini 3 tardó solo un minuto en proporcionar resultados, incluyendo los argumentos solicitados y las marcas de tiempo del segmento correspondiente. De igual forma, el modelo identificó correctamente un video de tenis, analizando los partidos y el estilo de juego de cada atleta.

Los usuarios pueden pedirle a Gemini 3 que vea videos y consulte fuentes externas simultáneamente, incluso formulando preguntas para un análisis más profundo. En general, Gemini 3 es bastante ágil en tareas analíticas y de referencia de documentos, en parte gracias a su conexión con la base de datos de Búsqueda de Google.

El agente es útil, pero todavía hay problemas.

La función Agente también es una mejora notable en Gemini 3. Para los usuarios del plan AI Ultra (actualmente solo disponible en el mercado estadounidense), este modo puede realizar tareas complejas en nombre del usuario, como categorizar y organizar correos electrónicos, buscar información y reservar boletos de viaje.

Al lanzar Gemini 3, Google utilizó el ejemplo de la posibilidad de organizar la bandeja de entrada en Gmail. Según la experiencia de The Verge , esta función funciona exactamente como se solicita: crea una lista completa de correos electrónicos no leídos durante una semana.

Al igual que con la función Canvas, las listas de correo electrónico y las acciones sugeridas se muestran en un área separada. Gemini ofrece varias opciones, como configurar recordatorios para correos electrónicos importantes, archivar correos promocionales, etc.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 5

La función de agente de Gemini 3 ayuda a gestionar las bandejas de entrada de Gmail. Imagen: The Verge .

Cuando se le solicita crear un recordatorio de pago de factura, Gemini ingresa rápidamente la información relevante en Google Tasks. Para la tarea de pago, el agente navega automáticamente y se detiene cuando necesita que el usuario ingrese la información de pago.

En general, el agente de Gemini 3 es bastante útil para detectar correos electrónicos que los usuarios suelen olvidar. La herramienta también puede encontrar y cancelar la suscripción a correos electrónicos de direcciones publicitarias que ya no son útiles.

De hecho, los agentes de algunos chatbots como Perplexity y ChatGPT ya admiten la integración con Gmail. Sin embargo, Gemini ofrece las capacidades de integración más diversas. Por ejemplo, los usuarios de Perplexity deben especificar los correos electrónicos que desean conservar o eliminar, mientras que estas acciones se pueden realizar mediante botones en Gemini.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 6

La función de creación de interfaz interactiva de Gemini 3. Foto: The Verge .

La función de clasificación de correo electrónico en ChatGPT también es inestable. Sin embargo, la velocidad de envío de correos de Gemini es menor que la de Perplexity. Algunas tareas, como hacer reservas en restaurantes, a veces presentan problemas.

Aunque siempre se requiere la confirmación del usuario antes de realizar acciones sensibles como pagos o enviar correos electrónicos, delegar ciertas tareas a la IA aún genera dudas en los usuarios. El modo agente de Gemini 3 es bastante útil, pero los usuarios aún necesitan supervisar el resultado.

Fuente: https://znews.vn/gemini-3-tot-den-dau-post1607493.html