![]() |
Logotipo de Google Gemini. Foto: Bloomberg . |
Google lanzó el modelo Gemini 3 a finales de noviembre. La compañía incorporó una serie de mejoras importantes, como mejoras en las capacidades de codificación, visualización y agentes que realizan ciertas tareas en nombre de los usuarios.
Al presentar Gemini 3, Google enfatizó que este es el modelo más inteligente de la compañía hasta la fecha. La experiencia práctica demuestra que el modelo procesa más rápido y tiene mejor capacidad de razonamiento, aunque existen algunos factores que deben mejorarse.
Cree interfaces interactivas rápidamente
Una de las grandes actualizaciones de Gemini 3 gira en torno a Canvas, un espacio de trabajo interactivo en Gemini que permite pedir a los chatbots que escriban código, visualicen resultados y editen contenido.
Cuando se le pide a Gemini 3 que cree un modelo 3D de la diferencia entre el tamaño de un balón de fútbol, la Tierra, el Sol y la Vía Láctea, la herramienta activa una interfaz interactiva de codificación, procesamiento y creación que permite seleccionar objetos y compararlos en tamaño.
![]() |
La capacidad de crear espacios interactivos con la función Canvas en Gemini 3. |
En comparación con la demo de Google, la calidad de imagen de los resultados es ligeramente inferior. Sin embargo, la información sobre los objetos se presenta de forma clara y fácil de entender. El tiempo de procesamiento es de aproximadamente 2 minutos. En la interfaz de Canvas, los usuarios pueden editar el código directamente, copiar o compartir el contenido.
Con otro comando, se le pidió a Gemini 3 que creara un águila de estilo vóxel posada en la rama de un árbol. La herramienta arrojó resultados después de unos 45 segundos, y los usuarios podían ampliar y rotar la vista con el ratón. Sin embargo, algunos detalles de la imagen presentaban errores gráficos y no se mostraban correctamente.
También con un águila posada en la rama de un árbol, pero con una solicitud más compleja (modelo 3D). La primera vez, el código generado por Gemini 3 falló y no se ejecutó. Tras solicitar una corrección, la imagen apareció y era interactiva.
![]() |
Capacidades de creación de entornos interactivos de Gemini 3. |
Si bien existen algunos problemas, el paso de un modelo de preguntas y respuestas a una edición colaborativa es una dirección interesante que hará que Gemini 3 sea útil para tareas complejas y a largo plazo.
Por supuesto, Gemini 3 no se limita a crear gráficos o modelos visuales. Google está probando una función de "IU generativa" para usuarios de IA Pro. Con unos pocos comandos, el modelo puede crear interfaces interactivas tipo revista o sitios web visuales.
Google afirma que la función se está implementando por etapas. Como informó The Verge , los usuarios deben seleccionar la función de diseño visual y escribir un comando como "Planifícame un viaje de 3 días a Roma".
Tras el procesamiento, Gemini 3 genera resultados similares a los de un sitio web de viajes , con horarios e imágenes detallados, además de preguntas sobre preferencias de viaje y estilos de alimentación. A partir de ahí, el modelo ajusta las respuestas según corresponda. Esta función también es muy útil para temas como ensamblar una computadora, construir una pecera, etc.
Razonar y analizar con mayor eficacia
Según Google, Gemini 3 tiene una capacidad de razonamiento superior a la de su predecesor. La compañía afirma que la capacidad de razonamiento de Gemini 3 Pro es de nivel doctoral, con una puntuación del 37,5 % en el Examen Final de Humanidades y del 91,9 % en el examen GPQA Diamond.
Por supuesto, los usuarios solo notan la diferencia al interactuar directamente con el modelo. Al solicitarle que resolviera un problema del conjunto de referencia GPQA Diamond (dirigido a estudiantes de doctorado), Gemini 3 Pro tardó unos 30 segundos en proporcionar una solución detallada, incluyendo cada paso del problema e imágenes ilustrativas.
![]() |
Géminis 3 puede responder preguntas complejas, con una capacidad de pensamiento equivalente al nivel de doctorado. |
Según la evaluación, la solución es bastante detallada y sigue el procedimiento. A modo de comparación, GPT-5.1 también tardó unos 30 segundos y se respondió correctamente, pero la solución fue menos detallada. De igual manera, Claude 4.5 Sonnet respondió correctamente, más rápido que Gemini 3, pero con menos detalle.
Google afirma que Gemini 3 puede extraer documentos de múltiples fuentes a la vez, como texto, imágenes y vídeos . Gemini 3 también gestiona mejor las tareas para las que no ha sido entrenado previamente.
![]() |
Capacidades de análisis de vídeo de Gemini 3. |
Por ejemplo, al solicitarle que analizara el tema principal de un video de 57 minutos, Gemini 3 tardó aproximadamente un minuto en devolver un resultado que incluía los argumentos solicitados, junto con la fecha y hora de la parte correspondiente del video. De igual forma, el modelo identificó correctamente un video sobre tenis, analizando los partidos y el desempeño de cada jugador.
Los usuarios pueden pedirle a Gemini 3 que vea videos mientras consulta fuentes externas, e incluso hacer preguntas para un análisis más profundo. En general, Gemini 3 es bastante ágil al analizar y consultar documentos, gracias en parte a su conexión con la base de datos de la Búsqueda de Google.
El agente es útil pero tiene problemas.
Agente también es una mejora notable de Gemini 3. Para los usuarios del paquete AI Ultra (actualmente solo compatible con el mercado estadounidense), este modo puede realizar procesos complejos en nombre de los usuarios, como ordenar y organizar correos electrónicos, buscar información, reservar billetes de viaje...
Cuando Google lanzó Gemini 3, mostró la capacidad de organizar la bandeja de entrada en Gmail y, según la experiencia de The Verge , funcionó exactamente como debía: generó una lista completa de correos electrónicos no leídos de una semana.
Al igual que con la función Canvas, la lista de correo electrónico y las acciones sugeridas se muestran en un área separada. Gemini ofrece opciones como configurar recordatorios para correos electrónicos importantes y archivar correos promocionales.
![]() |
La función de agente de Gemini 3 facilita la gestión de la bandeja de entrada de Gmail. Foto: The Verge . |
Cuando se le solicita crear un recordatorio de pago de facturas, Gemini extrae rápidamente la información relevante en Google Tasks. Para la tarea de pago, el agente navega automáticamente y se detiene cuando necesita que el usuario ingrese la información de pago.
En general, el agente Gemini 3 es muy útil para detectar correos electrónicos que los usuarios probablemente olviden. La herramienta también puede encontrar y cancelar la suscripción a correos electrónicos de direcciones publicitarias que ya no son útiles.
De hecho, algunos agentes de chatbot como Perplexity y ChatGPT ya son compatibles con la integración con Gmail. Sin embargo, las capacidades de integración de Gemini son las más diversas. Por ejemplo, los usuarios de Perplexity deben introducir específicamente los correos electrónicos que desean conservar o eliminar, mientras que las operaciones de Gemini se pueden realizar mediante botones.
![]() |
Función de creación de interfaz interactiva de Gemini 3. Foto: The Verge . |
La función de programación de correos electrónicos de ChatGPT también es inconsistente. Sin embargo, la velocidad de entrega de correos electrónicos de Gemini es más lenta que la de Perplexity. Algunas tareas, como hacer reservas en restaurantes, a veces presentan problemas.
Si bien siempre se requiere la confirmación del usuario antes de realizar acciones sensibles, como realizar pagos o enviar correos electrónicos, dejar algunas tareas en manos de la IA aún genera dudas en los usuarios. El modo agente de Gemini 3 es bastante útil, pero los usuarios aún deben supervisar el resultado.
Fuente: https://znews.vn/gemini-3-tot-den-dau-post1607493.html

















Kommentar (0)