Vietnam.vn - Nền tảng quảng bá Việt Nam

¿Puede realmente pensar la IA?

Empresas como OpenAI y DeepSeek están impulsando chatbots de razonamiento, que pueden desempeñarse mejor en algunas tareas computacionales.

ZNewsZNews06/04/2025

El chatbot de OpenAI sigue mejorando gracias a las nuevas tecnologías. Foto: New York Times .

En septiembre de 2024, OpenAI lanzó una versión de ChatGPT que integra el modelo o1, que puede razonar sobre tareas relacionadas con las matemáticas, la ciencia y la programación informática.

A diferencia de la versión anterior de ChatGPT, la nueva tecnología tomará tiempo para “pensar” en soluciones a problemas complejos antes de dar una respuesta.

Tras OpenAI, muchos competidores como Google, Anthropic y DeepSeek también introdujeron modelos de razonamiento similares. Aunque no es perfecta, sigue siendo una tecnología de mejora de chatbots en la que confían muchos desarrolladores.

Cómo razona la IA

Básicamente, el razonamiento significa que el chatbot puede dedicar más tiempo a resolver el problema presentado por el usuario.

“El razonamiento es la forma en que el sistema realiza trabajo adicional después de recibir una pregunta”, dijo Dan Klein, profesor de informática en la Universidad de California, al New York Times .

El sistema de razonamiento puede dividir un problema en pasos individuales o resolverlo mediante prueba y error.

En su lanzamiento, ChatGPT podía responder preguntas al instante extrayendo y sintetizando información. Mientras tanto, el sistema de razonamiento necesitaba unos segundos (o incluso minutos) más para resolver el problema y dar una respuesta.

AI ly luan,  OpenAI o1 va ChatGPT,  mo hinh ly luan,  tri tue nhan tao anh 1

Ejemplo del proceso de razonamiento del modelo o1 en un chatbot de atención al cliente. Foto: OpenAI .

En algunos casos, el sistema de razonamiento cambiará su enfoque del problema, mejorando continuamente la solución. Como alternativa, el modelo puede probar múltiples soluciones antes de decidirse por la opción óptima, o comprobar la precisión de respuestas anteriores.

En general, el sistema de razonamiento considerará todas las posibles respuestas a la pregunta. Esto es como si un estudiante de primaria anotara varias respuestas posibles en una hoja de papel antes de elegir la más adecuada para resolver un problema de matemáticas.

Según el New York Times , la IA ahora es capaz de razonar sobre cualquier tema. Sin embargo, la tarea será más efectiva con preguntas relacionadas con matemáticas, ciencias y programación informática.

¿Cómo se entrena el sistema teórico?

En un chatbot típico, los usuarios aún pueden solicitar una explicación del proceso o comprobar la exactitud de una respuesta. De hecho, muchos conjuntos de datos de entrenamiento de ChatGPT ya incluyen un proceso de resolución de problemas.

Un sistema de razonamiento va aún más allá cuando puede realizar una acción sin que el usuario tenga que pedírsela. El proceso es más complejo y de mayor alcance. Las empresas utilizan el término «razonamiento» porque el sistema funciona de forma similar al pensamiento humano.

Muchas empresas como OpenAI apuestan a que los sistemas de razonamiento son la mejor manera de mejorar los chatbots. Durante años, creyeron que los chatbots funcionarían mejor si se entrenaban con la mayor cantidad de información posible en internet.

Para 2024, los sistemas de IA habrán consumido casi todo el texto disponible en internet. Esto significa que las empresas necesitarán encontrar nuevas soluciones para actualizar los chatbots, incluyendo sistemas de razonamiento.

AI ly luan,  OpenAI o1 va ChatGPT,  mo hinh ly luan,  tri tue nhan tao anh 2

La startup DeepSeek causó sensación con un modelo de razonamiento más económico que OpenAI. Foto: Bloomberg .

Desde el año pasado, empresas como OpenAI se han centrado en una técnica llamada aprendizaje de refuerzo, un proceso que normalmente lleva varios meses, en el que la IA aprende el comportamiento a través de ensayo y error.

Por ejemplo, al resolver miles de problemas, el sistema puede aprender el método óptimo para obtener la respuesta correcta. A partir de ahí, los investigadores desarrollaron complejos mecanismos de retroalimentación que ayudan al sistema a aprender las soluciones correctas e incorrectas.

"Es como entrenar a un perro. Si se porta bien, le das un premio. Si se porta mal, le dices: 'Ese perro es malo'", explicó Jerry Tworek, investigador de OpenAI.

¿Es la IA el futuro?

Según el New York Times , el aprendizaje de refuerzo funciona bien con preguntas de matemáticas, ciencias y programación informática, donde hay respuestas correctas o incorrectas claramente definidas.

En cambio, el aprendizaje por refuerzo no es tan eficaz en la escritura creativa, la filosofía o la ética, áreas donde es difícil distinguir entre lo bueno y lo malo. Sin embargo, los investigadores afirman que la técnica puede mejorar el rendimiento de la IA, incluso en preguntas fuera del ámbito matemático.

“Los sistemas aprenderán los caminos que conducen a resultados positivos y negativos”, afirmó Jared Kaplan, director científico de Anthropic.

AI ly luan,  OpenAI o1 va ChatGPT,  mo hinh ly luan,  tri tue nhan tao anh 3

Sitio web de Anthropic, la startup propietaria del modelo de IA Claude. Foto: Bloomberg .

Es importante destacar que el aprendizaje por refuerzo y los sistemas de razonamiento son dos conceptos diferentes. En concreto, el aprendizaje por refuerzo es un método para construir sistemas de razonamiento. Esta es la etapa final de entrenamiento para que los chatbots adquieran capacidades de razonamiento.

Dado que aún son relativamente nuevos, los científicos no pueden estar seguros de si los chatbots de razonamiento o el aprendizaje por refuerzo pueden ayudar a la IA a pensar como los humanos. Es importante destacar que muchas tendencias actuales en el entrenamiento de IA se desarrollan muy rápidamente al principio y luego se estabilizan gradualmente.

Además, los chatbots de razonamiento aún pueden cometer errores. Basándose en la probabilidad, el sistema elegirá el proceso más similar a los datos que ha aprendido, ya sea de internet o mediante aprendizaje por refuerzo. Por lo tanto, los chatbots aún pueden elegir la solución incorrecta o poco razonable.

Fuente: https://znews.vn/ai-ly-luan-nhu-the-nao-post1541477.html


Kommentar (0)

¡Deja un comentario para compartir tus sentimientos!

Misma categoría

La Catedral de Notre Dame en Ciudad Ho Chi Minh se iluminará para dar la bienvenida a la Navidad de 2025
Las niñas de Hanoi se visten de maravilla para la temporada navideña
Reanimados después de la tormenta y la inundación, el pueblo de crisantemos Tet en Gia Lai espera que no haya cortes de energía para salvar las plantas.
La capital del albaricoque amarillo en la región Central sufrió grandes pérdidas tras doble desastre natural.

Mismo autor

Herencia

Cifra

Negocio

La cafetería de Dalat ve un aumento del 300% en el número de clientes porque el propietario interpreta el papel de una "película de artes marciales"

Actualidad

Sistema político

Local

Producto

Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC