Pocos parámetros, muchos datos

PaLM 2, el último modelo de lenguaje grande (LLM) de Google, anunciado la semana pasada, utiliza casi cinco veces más datos de entrenamiento que su predecesor de 2022, lo que le permite realizar programación, matemáticas y creación de contenido más avanzadas.

En la conferencia de desarrolladores Google I/O, el gigante de las búsquedas presentó PaLM 2, un modelo de lenguaje entrenado con 3,6 billones de tokens. Estos tokens son secuencias de palabras, los componentes básicos utilizados para entrenar el modelo de lenguaje y predecir la siguiente palabra.

La versión anterior de PaLM se lanzó en 2022 y se acuñó con 780 mil millones de tokens.

En el evento Google I/O de la semana pasada, el CEO de Google, Sundar Pichai, presentó el último modelo de lenguaje grande de la compañía, PaLM 2.

Si bien Google ha pregonado su destreza en IA para búsquedas, correo electrónico, procesamiento de textos y hojas de cálculo, la empresa se ha mostrado reacia a revelar el tamaño o los detalles de sus conjuntos de datos de entrenamiento. OpenAI también ha mantenido en secreto los detalles de su última especificación de entrenamiento LLM, GPT-4.

Las empresas tecnológicas atribuyen este fenómeno a la competitividad de sus sectores. Tanto Google como OpenAI compiten por atraer usuarios con chatbots en lugar de con buscadores tradicionales.

Compacto, potente y económico

Google afirma que PaLM 2 es más pequeño que sus predecesores, ya que se entrenó con 340 mil millones de parámetros en comparación con los 540 mil millones de parámetros de la versión anterior. Esto demuestra que la tecnología de la compañía está mejorando su eficiencia en la realización de tareas complejas.

Para lograr esto, PaLM 2 utiliza una nueva técnica llamada “optimización computacional extendida”, que ofrece “un mejor rendimiento general, incluyendo una inferencia más rápida con menos parámetros que reducen la sobrecarga”.

El último modelo de IA de lenguaje de Google, entrenado en más de 100 idiomas, realiza diversas tareas para 25 funciones y productos, incluido el chatbot experimental Bard. PaLM 2 se presenta en cuatro versiones según su tamaño, de menor a mayor: Gecko, Nutria, Bisonte y Unicornio.

Según la documentación pública, PaLM 2 es más potente que cualquier modelo existente. LlaMA de Facebook, lanzado en febrero, se entrenó con 1,4 billones de tokens. Por su parte, OpenAI reveló públicamente el tamaño de los datos de entrenamiento para ChatGPT, una versión de GPT-3, con 300 mil millones de tokens.

La explosión de aplicaciones de IA ha generado controversia en torno a esta tecnología. A principios de este año, El Mahdi El Mhamdi, científico sénior de Google Research, dimitió en protesta por la falta de transparencia del gigante de las búsquedas.

Esta semana, el director ejecutivo de OpenAI, Sam Altman, también testificó ante el subcomité judicial del Senado de Estados Unidos sobre privacidad y tecnología en el contexto de la creciente popularidad de la IA, donde el “padre” de ChatGPT coincidió con los legisladores en que se necesitan nuevas regulaciones para gobernar la IA.

(Según CNBC)

Fuente

Etikett: Google modelo de lenguaje grande modelo de IA

Kommentar (0)

Top -Interessen

Neueste

No data

[Foto] El secretario general To Lam recibe al embajador de Singapur, Jaya Ratnam

Mismo tema

Usar IA para crear facturas falsas, un nuevo truco de fraude que está causando sufrimiento a muchas empresas

Báo Tuổi Trẻ

28/10/2025

Silicon Valley hoy en día: Incluso con dinero, no hay tiempo para gastarlo, se trabaja 100 horas a la semana para encontrar una superinteligencia artificial.

VietNamNet

24/10/2025

OpenAI lanza el navegador ChatGPT Atlas: La guerra por la 'hegemonía' en Internet ha comenzado

VietNamNet

24/10/2025

La IA de Google Search es compatible oficialmente con el idioma vietnamita

Báo Quốc Tế

16/10/2025

Los turistas vietnamitas tardan 4 horas en terminar una comida porque están ocupados sacando fotos.

Báo Thanh niên

15/10/2025

Google invierte 15.000 millones de dólares en la construcción del mayor centro de IA fuera de Estados Unidos.

VietnamPlus

14/10/2025

Misma categoría

Vietnam desarrolla y domina la tecnología digital basándose en estándares abiertos.

VietnamPlus

3 giờ trước

El precio del Bitcoin podría caer un 70%

Báo Dân trí

4 giờ trước

El desafío de IA de Zalo atrae a 740 equipos inscritos tras solo una semana

ZNews

5 giờ trước

El proyecto de ley sobre comercio electrónico refuerza la responsabilidad de los propietarios de plantas.

Tạp chí Doanh Nghiệp

6 giờ trước

$Las agencias de gestión incrementarán la aplicación de la IA y la cadena de bloques para controlar y detectar las infracciones de derechos de autor.$