OpenAI anunció el 5 de agosto dos modelos de lenguaje ponderados abiertos por primera vez desde el lanzamiento de GPT-2 en 2019.
Un modelo de inteligencia artificial se considera de peso abierto si sus parámetros, es decir, los factores que ayudan a mejorar el resultado y las predicciones durante el entrenamiento, están disponibles públicamente.
Los modelos de ponderación abiertos pueden proporcionar transparencia y control, pero se diferencian de los modelos de código abierto, que hacen que todo el código fuente esté disponible para que cualquiera pueda usarlo y modificarlo.
OpenAI dice que estos modelos de solo texto, llamados gpt-oss-120b y gpt-oss-20b, están diseñados para brindar a los desarrolladores, investigadores y empresas opciones de menor costo que sean fáciles de operar y personalizar.
Los dos nuevos modelos de OpenAI pueden gestionar tareas avanzadas de inferencia, uso de herramientas y procesamiento neuronal. Están diseñados para funcionar en cualquier entorno, desde hardware de consumo hasta plataformas en la nube y aplicaciones integradas en dispositivos.
OpenAI dice que los usuarios pueden ejecutar gpt-oss-20b en una computadora portátil y usarlo como un asistente personal que puede buscar archivos y escribir.
La compañía se ha asociado con Nvidia, Advanced Micro Devices (AMD), Cerebras y Groq para garantizar que estos modelos funcionen bien en una variedad de chips.
El lanzamiento de los modelos de ponderación abiertos de OpenAI ha sido muy esperado, en parte porque la compañía ha retrasado repetidamente el lanzamiento ya que necesita más tiempo para realizar pruebas de seguridad adicionales y revisar áreas de alto riesgo.
OpenAI declaró el 5 de agosto que había realizado un exhaustivo entrenamiento y pruebas de seguridad de sus modelos de peso abierto. La empresa filtró datos químicos, biológicos, radiológicos y nucleares dañinos durante la fase de preentrenamiento y simuló cómo actores maliciosos podrían intentar ajustar los modelos con fines maliciosos.
OpenAI también afirmó que trabajó con tres grupos independientes de expertos para obtener comentarios sobre su evaluación de este proceso de modificación maliciosa.
En los últimos años, varias otras empresas tecnológicas, como Meta, Mistral AI respaldada por Microsoft y la startup china DeepSeek, también han lanzado modelos de ponderación abiertos.
Fuente: https://www.vietnamplus.vn/openai-lan-dau-phat-hanh-mo-hinh-ai-trong-so-mo-ke-tu-nam-2019-post1054037.vnp
Kommentar (0)