Vietnam.vn - Nền tảng quảng bá Việt Nam

¿Puede realmente pensar la IA?

Empresas como OpenAI y DeepSeek están impulsando chatbots de razonamiento, que pueden desempeñarse mejor en algunas tareas computacionales.

Zing NewsZing News06/04/2025

El chatbot de OpenAI mejora constantemente a través de nuevas tecnologías. Foto: New York Times .

En septiembre de 2024, OpenAI lanzó una versión de ChatGPT que integra el modelo o1, que puede razonar sobre tareas relacionadas con las matemáticas, la ciencia y la programación informática.

A diferencia de la versión anterior de ChatGPT, la nueva tecnología tomará tiempo para “pensar” en soluciones a problemas complejos antes de dar una respuesta.

Después de OpenAI, muchos competidores como Google, Anthropic y DeepSeek también introdujeron modelos de razonamiento similares. Aunque no es perfecta, sigue siendo una tecnología de actualización de chatbot en la que muchos desarrolladores confían.

Cómo razona la IA

Básicamente, el razonamiento significa que el chatbot puede dedicar más tiempo a resolver el problema presentado por el usuario.

“El razonamiento es la forma en que el sistema realiza más trabajo después de recibir una pregunta”, dijo Dan Klein, profesor de informática en la Universidad de California, Berkeley, al New York Times .

El sistema de razonamiento puede dividir un problema en pasos individuales o resolverlo mediante prueba y error.

Cuando se lanzó por primera vez, ChatGPT podía responder preguntas instantáneamente extrayendo y sintetizando información. Mientras tanto, el sistema de razonamiento necesita unos segundos más (o incluso minutos) para resolver el problema y responder.

AI ly luan,  OpenAI o1 va ChatGPT,  mo hinh ly luan,  tri tue nhan tao anh 1

Ejemplo de proceso de razonamiento del modelo o1 en un chatbot de atención al cliente. Foto: OpenAI .

En algunos casos, el sistema de razonamiento cambiará su enfoque del problema, mejorando continuamente la solución. Además, el modelo puede probar múltiples soluciones antes de tomar una decisión óptima o comprobar la precisión de respuestas anteriores.

En general, el sistema de razonamiento considerará todas las formas posibles de responder a la pregunta. Esto es como cuando los estudiantes de primaria anotan muchas opciones en un papel antes de elegir la forma más adecuada de resolver un problema de matemáticas.

Según el New York Times , la IA ahora es capaz de razonar sobre cualquier tema. Sin embargo, la tarea será más efectiva con preguntas relacionadas con matemáticas, ciencias y programación informática.

¿Cómo se entrena el sistema teórico?

En un chatbot normal, los usuarios aún pueden solicitar una explicación de un proceso o verificar la precisión de una respuesta. De hecho, muchos conjuntos de datos de entrenamiento de ChatGPT ya incluyen un procedimiento de resolución de problemas.

El sistema de razonamiento es aún más avanzado cuando puede realizar una operación sin que el usuario la solicite. Este proceso es más complejo y extenso. Las empresas utilizan la palabra “razonamiento” porque el sistema funciona de manera similar a la forma en que piensan los humanos.

Muchas empresas como OpenAI esperan que los sistemas de razonamiento sean la mejor solución para mejorar los chatbots actuales. Durante años se creyó que los chatbots funcionaban mejor si se entrenaban con la mayor cantidad de información posible disponible en Internet.

Para 2024, los sistemas de IA habrán consumido casi todo el texto disponible en Internet. Esto significa que las empresas necesitan encontrar nuevas soluciones para actualizar los chatbots, incluidos los sistemas de razonamiento.

AI ly luan,  OpenAI o1 va ChatGPT,  mo hinh ly luan,  tri tue nhan tao anh 2

La startup DeepSeek una vez "causó fiebre" con un modelo de razonamiento que costaba menos que OpenAI. Foto: Bloomberg .

Desde el año pasado, empresas como OpenAI se han centrado en técnicas de aprendizaje de refuerzo. Este proceso suele tardar varios meses, durante los cuales la IA aprende el comportamiento mediante ensayo y error.

Por ejemplo, al resolver miles de problemas, el sistema puede aprender el método óptimo para dar la respuesta correcta. A partir de ahí, los investigadores construyeron un complejo mecanismo de retroalimentación que ayuda al sistema a reconocer soluciones correctas e incorrectas.

Es como entrenar a un perro. Si funciona bien, le das un premio. Si no, le dices: "Ese perro es malo" —dijo Jerry Tworek, investigador de OpenAI—.

¿Es la IA el futuro?

Según el New York Times , las técnicas de aprendizaje de refuerzo funcionan bien con los requisitos de matemáticas, ciencias y programación informática. Este es un área donde hay una respuesta clara, correcta o incorrecta.

Por el contrario, el aprendizaje de refuerzo no es eficaz en la escritura creativa, la filosofía o la ética, áreas donde es difícil distinguir entre el bien y el mal. Aun así, los investigadores afirman que la técnica aún puede mejorar el rendimiento de la IA, incluso en preguntas que van más allá de las matemáticas.

“Los sistemas aprenderán los caminos que conducen a resultados positivos y negativos”, afirmó Jared Kaplan, director científico de Anthropic.

AI ly luan,  OpenAI o1 va ChatGPT,  mo hinh ly luan,  tri tue nhan tao anh 3

Sitio web de Anthropic, la startup propietaria del modelo de IA Claude. Foto: Bloomberg .

Es importante señalar que el aprendizaje de refuerzo y los sistemas de razonamiento son dos conceptos diferentes. En concreto, el aprendizaje por refuerzo es un método para construir un sistema teórico. Esta es la etapa final de entrenamiento para que el chatbot pueda razonar.

Como todavía es relativamente nuevo, los científicos aún no pueden estar seguros de si los chatbots de razonamiento o el aprendizaje de refuerzo pueden ayudar a la IA a pensar como los humanos. Vale la pena señalar que muchas de las tendencias actuales de entrenamiento de IA crecen muy rápido al principio y luego se desaceleran.

Además, los chatbots de razonamiento aún pueden cometer errores. En función de la probabilidad, el sistema elegirá el proceso que más se asemeje a los datos aprendidos, ya provengan de Internet o mediante aprendizaje de refuerzo. Por lo tanto, el chatbot aún puede elegir la solución incorrecta o irrazonable.

Fuente: https://znews.vn/ai-ly-luan-nhu-the-nao-post1541477.html


Kommentar (0)

No data
No data

Herencia

Cifra

Negocio

No videos available

Noticias

Sistema político

Local

Producto