![]() |
Gemma 4 es un lenguaje de modelos extensos (LLM, por sus siglas en inglés) desarrollado por Google DeepMind. Se trata de una familia de modelos de código abierto que permite el procesamiento local sin conexión a internet. Los usuarios pueden descargarlo, personalizarlo e implementarlo en sus ordenadores o dispositivos móviles. |
![]() |
La serie Gemma 4 se distribuye en cuatro versiones: E2B, E4B, 31B y 26B A4B. Las versiones E2B y E4B requieren un mínimo de 4-6 GB (4 bits) o 10-16 GB (16 bits) de RAM, lo que las hace adecuadas para su uso en dispositivos móviles y ordenadores con una configuración moderada. Por su parte, la versión 26B A4B requiere un mínimo de 18 GB de RAM, y la 31B, al menos 20 GB. |
![]() |
Según MindStudio , una de las ventajas de ejecutar modelos de IA localmente es la seguridad y la ausencia de costes adicionales. Sin embargo, el rendimiento de estos modelos depende del hardware del dispositivo. Los usuarios de dispositivos móviles pueden instalar la aplicación Google AI Edge Gallery (en la imagen), mientras que los ordenadores requieren herramientas como LM Studio u Ollama. Foto: Google . |
![]() |
LM Studio para PC permite seleccionar y cargar Gemma 4 en la primera ejecución. La versión E4B tiene un tamaño aproximado de 6,3 GB y admite inferencia y análisis de imágenes. Gemma 4 E4B para dispositivos móviles tiene un tamaño de 3,6 GB al descargarse mediante Google AI Edge Gallery. |
![]() |
Una vez finalizada la descarga, el usuario será redirigido a una interfaz tipo chatbot. En la sección de selección de modelo que aparece a continuación, haga clic en Gemma 4 E4B . En la siguiente ventana, seleccione Cargar modelo y espere aproximadamente un minuto a que se inicie el modelo. |
![]() |
Al igual que otros modelos populares, Gemma 4 E4B admite la interacción en idioma vietnamita. En las pruebas realizadas en un Mac mini M4 (16 GB de RAM) con el comando "Hola", el modelo tardó aproximadamente 8 segundos en deducir y responder. |
![]() |
Cuando se le preguntó "¿Qué puedes hacer?", Gemma 4 E4B tardó aproximadamente 13 segundos en comprender y traducir inmediatamente la orden al inglés, para luego escribir gradualmente la respuesta. |
![]() |
Dado que se ejecuta directamente en el dispositivo, el tiempo de respuesta del modelo puede variar según el hardware. Con la misma pregunta, "¿Qué puedes hacer?", el modelo tardó aproximadamente 45 segundos en proporcionar una respuesta completa en un iPhone 15 Pro. |
![]() |
Otra pregunta de razonamiento que se respondió con rapidez y precisión fue, por ejemplo: «Un tren sale a las 8:15 y llega a las 11:47. ¿Cuánto duró el viaje?». En general, este tipo de enunciados de razonamiento sencillos no resultan demasiado complicados para la nueva generación de estudiantes de Derecho. |
![]() |
Se le practicó una pregunta de lógica como "¿Cuántas 'r' hay en la palabra 'fresa'?". Esta pregunta había desconcertado a muchos estudiantes de LLM anteriores, pero Gemma 4 E4B tardó solo unos 3 segundos en responder correctamente. |
![]() ![]() |
Ante una pregunta más compleja, tras un minucioso razonamiento, Gemma 4 respondió correctamente. El tiempo total de procesamiento fue de 1 minuto y 6 segundos, un tiempo razonable para un modelo sin conexión. En comparación, Gemini 3 tardó unos 15 segundos en procesar la pregunta, y GPT-5.5 tardó un tiempo similar. |
![]() |
La principal ventaja de Gemma 4 E4B reside en sus capacidades multimodales, que admiten la entrada de imágenes. Por ejemplo, LLM puede analizar imágenes y responder preguntas sobre puntos de referencia, detalles destacados y condiciones meteorológicas y climáticas presentes en la imagen. |
![]() |
Al solicitarle a Gemma 4 que extrajera todo el texto de la imagen de una página de revista, el resultado tardó poco más de 30 segundos. Este tiempo no difiere significativamente del de otros motores de búsqueda en línea con los que los usuarios están familiarizados. |
![]() |
En la aplicación para smartphone, los usuarios deben seleccionar una función de la interfaz principal (Chat con IA, Preguntar por imagen, etc.) y luego elegir el modelo que desean utilizar. Dado que funciona con la GPU, el dispositivo puede calentarse durante el proceso de inferencia de IA. |
![]() |
Los usuarios también pueden subir archivos de documentos en formato DOCX o PDF y solicitar análisis o resumen de texto. Según representantes de Google, la nueva generación de modelos controla eficazmente la generación de cadenas de caracteres. El modelo limita los procesos de pensamiento innecesarios, reduciendo la carga computacional en las tarjetas gráficas y la memoria del ordenador. |
![]() |
Gemma 4 también es programable. En un experimento, se le encomendó al modelo la tarea de usar HTML, CSS y JavaScript para construir un sistema operativo que se ejecutara directamente en el navegador. Los usuarios debían aumentar la longitud del contexto antes del inicio para garantizar que el modelo produjera una respuesta completa. Aun así, la IA podría cometer errores si el archivo HTML estaba incompleto, y algunos componentes de la aplicación podrían no funcionar. |
![]() |
En general, los comandos que requieren varios pasos o datos complejos pueden resultar difíciles para Gemma 4. Algunos comandos pueden consumir una gran cantidad de tokens de procesamiento. Establecer límites de tokens excesivamente altos puede consumir mucha RAM o VRAM. |
Fuente: https://znews.vn/ai-khong-can-internet-cua-google-lam-duoc-gi-post1652142.html


























Kommentar (0)