En el evento anual TechXchange de IBM, la compañía anunció su modelo de IA más avanzado hasta la fecha, Granite 3.0. Los modelos de lenguaje Granite de tercera generación, el buque insignia de IBM, superan o igualan a modelos de tamaño similar de los principales proveedores de modelos en múltiples pruebas de referencia académicas e industriales, demostrando un rendimiento sólido, transparencia y seguridad.

IBM presenta su modelo de IA más avanzado hasta la fecha, Granite 3.0.
En consonancia con el compromiso de la empresa con la IA de código abierto, los modelos de Granite se publican bajo la licencia permisiva Apache 2.0, lo que los hace únicos por la combinación de rendimiento, flexibilidad y autonomía que ofrecen a los clientes empresariales y a la comunidad en general.
Los nuevos modelos de lenguaje Granite 3.0 8B y 2B están diseñados como modelos convencionales para la IA empresarial, ofreciendo un alto rendimiento en tareas como la generación aumentada de recuperación (RAG), la clasificación, la generación de resúmenes, la extracción de entidades y el uso de herramientas. Estos modelos compactos y flexibles están diseñados para optimizarse con los datos empresariales e integrarse sin problemas en diversos entornos o flujos de trabajo empresariales.
Si bien muchos modelos de lenguaje de gran tamaño (LLM) se entrenan con datos disponibles públicamente, la gran mayoría de los datos empresariales permanecen sin explotar. Al combinar un modelo Granite pequeño con datos empresariales, específicamente mediante la revolucionaria técnica de alineación InstructLab —presentada por IBM y Red Hat en mayo—, IBM cree que las empresas pueden lograr un rendimiento específico para cada tarea comparable al de modelos más grandes a un costo mucho menor (según algunas pruebas de concepto iniciales, el costo es entre 3 y 23 veces menor que el de los grandes modelos de vanguardia).
Modelo de IA Granite 3.0.
El lanzamiento de Granite 3.0 reafirma el compromiso de IBM con la transparencia, la seguridad y la confianza en los productos de IA. El informe técnico y la guía de uso responsable de Granite 3.0 describen los conjuntos de datos empleados para entrenar estos modelos, detallan los pasos de filtrado, limpieza y curación aplicados, y ofrecen resultados exhaustivos sobre el rendimiento del modelo en las principales pruebas comparativas académicas y empresariales.
Los modelos «Granite 3.0» son de código abierto, al igual que otras versiones de la familia de IA Granite de IBM. Este enfoque difiere del de competidores como Microsoft, que cobran a sus clientes por el acceso a los modelos. A cambio, IBM ofrece una herramienta de pago llamada Watsonx que ejecuta los modelos en centros de datos tras su personalización.
Varias variantes de los nuevos modelos Granite están disponibles para uso comercial a partir de hoy en la plataforma Watsonx. Algunos de estos modelos también estarán disponibles en el conjunto de herramientas de software de Nvidia, lo que permitirá a las empresas incorporar modelos de IA.
Los nuevos modelos Granite se entrenaron utilizando unidades de procesamiento gráfico (GPU) H100 de Nvidia, líder en chips de IA, dijo Dario Gil, director de investigación de IBM.
(Según IBM, Reuters)
Fuente: https://www.baogiaothong.vn/ibm-phat-hanh-moi-ai-hinh-cho-doanh-nghiep-uu-viet-hon-microsoft-192241021144242992.htm







Kommentar (0)