Vietnam.vn - Nền tảng quảng bá Việt Nam

¿Puede realmente pensar la IA?

Empresas como OpenAI y DeepSeek están impulsando chatbots de razonamiento, que pueden desempeñarse mejor en algunas tareas computacionales.

ZNewsZNews06/04/2025

El chatbot de OpenAI mejora con las nuevas tecnologías. Foto: New York Times .

En septiembre de 2024, OpenAI lanzó una versión de ChatGPT que integra el modelo o1, que puede razonar sobre tareas relacionadas con las matemáticas, la ciencia y la programación informática.

A diferencia de la versión anterior de ChatGPT, la nueva tecnología tomará tiempo para “pensar” en soluciones a problemas complejos antes de dar una respuesta.

Tras OpenAI, muchos competidores como Google, Anthropic y DeepSeek también introdujeron modelos de razonamiento similares. Aunque no es perfecta, sigue siendo una tecnología de actualización de chatbots en la que confían muchos desarrolladores.

Cómo razona la IA

Básicamente, el razonamiento significa que el chatbot puede dedicar más tiempo a resolver el problema presentado por el usuario.

“El razonamiento es la forma en que el sistema realiza más trabajo después de recibir una pregunta”, dijo Dan Klein, profesor de informática en la Universidad de California, Berkeley, al New York Times .

El sistema de razonamiento puede dividir un problema en pasos individuales o resolverlo mediante prueba y error.

En su lanzamiento, ChatGPT podía responder preguntas al instante extrayendo y sintetizando información. Mientras tanto, los sistemas de razonamiento necesitaban unos segundos (o incluso minutos) más para resolver el problema y responder.

AI ly luan,  OpenAI o1 va ChatGPT,  mo hinh ly luan,  tri tue nhan tao anh 1

Ejemplo del proceso de razonamiento del modelo o1 en un chatbot de atención al cliente. Foto: OpenAI .

En algunos casos, el sistema de razonamiento cambiará su enfoque del problema, mejorando continuamente la solución. Como alternativa, el modelo puede probar múltiples soluciones antes de decidirse por la opción óptima o comprobar la precisión de respuestas anteriores.

En general, el sistema de razonamiento considerará todas las posibles respuestas a la pregunta. Esto es similar a lo que hacen los estudiantes de primaria, quienes anotan muchas opciones en un papel antes de elegir la más adecuada para resolver un problema de matemáticas.

Según el New York Times , la IA ahora es capaz de razonar sobre cualquier tema. Sin embargo, la tarea será más efectiva con preguntas relacionadas con matemáticas, ciencias y programación informática.

¿Cómo se entrena el sistema teórico?

En un chatbot convencional, los usuarios pueden solicitar una explicación del proceso o comprobar la exactitud de una respuesta. De hecho, muchos conjuntos de datos de entrenamiento de ChatGPT ya incluyen un proceso de resolución de problemas.

Un sistema de razonamiento va aún más allá cuando puede realizar una acción sin que el usuario se lo pida. Este proceso es más complejo y de mayor alcance. Las empresas utilizan el término «razonamiento» porque el sistema funciona de forma similar al pensamiento humano.

Muchas empresas como OpenAI apuestan a que los sistemas de razonamiento son la mejor manera de mejorar los chatbots actuales. Durante años, creyeron que los chatbots funcionarían mejor si se entrenaban con la mayor cantidad de información posible de internet.

Para 2024, los sistemas de IA habrán consumido casi todo el texto disponible en internet. Esto significa que las empresas necesitarán encontrar nuevas soluciones para mejorar los chatbots, incluyendo sistemas de razonamiento.

AI ly luan,  OpenAI o1 va ChatGPT,  mo hinh ly luan,  tri tue nhan tao anh 2

La startup DeepSeek causó sensación con un modelo de razonamiento más económico que OpenAI. Foto: Bloomberg .

Desde el año pasado, empresas como OpenAI se han centrado en una técnica llamada aprendizaje de refuerzo, un proceso que normalmente lleva varios meses e implica que la IA aprenda el comportamiento a través de prueba y error.

Por ejemplo, al resolver miles de problemas, el sistema puede aprender el método óptimo para obtener la respuesta correcta. A partir de ahí, los investigadores desarrollaron complejos mecanismos de retroalimentación que ayudan al sistema a aprender las soluciones correctas e incorrectas.

Es como entrenar a un perro. Si funciona bien, le das un premio. Si no, le dices: "Ese perro es malo" —dijo Jerry Tworek, investigador de OpenAI—.

¿Es la IA el futuro?

Según el New York Times , el aprendizaje de refuerzo funciona bien con preguntas de matemáticas, ciencias y programación informática, donde hay respuestas correctas o incorrectas claramente definidas.

En cambio, el aprendizaje por refuerzo no funciona bien en la escritura, la filosofía ni la ética, donde es difícil distinguir entre lo bueno y lo malo. Sin embargo, los investigadores afirman que la técnica puede mejorar el rendimiento de la IA, incluso en cuestiones ajenas a las matemáticas.

“Los sistemas aprenderán los caminos que conducen a resultados positivos y negativos”, afirmó Jared Kaplan, director científico de Anthropic.

AI ly luan,  OpenAI o1 va ChatGPT,  mo hinh ly luan,  tri tue nhan tao anh 3

Sitio web de Anthropic, la startup propietaria del modelo de IA Claude. Foto: Bloomberg .

Es importante destacar que el aprendizaje por refuerzo y los sistemas de razonamiento son dos conceptos diferentes. En concreto, el aprendizaje por refuerzo es un método para construir sistemas de razonamiento. Esta es la etapa final de entrenamiento para que los chatbots adquieran capacidades de razonamiento.

Dado que aún son relativamente nuevos, los científicos no pueden estar seguros de si los chatbots de razonamiento o el aprendizaje por refuerzo pueden ayudar a la IA a pensar como los humanos. Cabe destacar que muchas tendencias actuales de entrenamiento de IA se desarrollan muy rápidamente al principio y luego se ralentizan.

Además, los chatbots de razonamiento aún pueden cometer errores. Basándose en la probabilidad, el sistema elegirá el proceso más similar a los datos obtenidos, ya sean de internet o mediante aprendizaje por refuerzo. Por lo tanto, los chatbots aún pueden elegir la solución incorrecta o poco razonable.

Fuente: https://znews.vn/ai-ly-luan-nhu-the-nao-post1541477.html


Kommentar (0)

No data
No data
PIEZAS DE TONO - Piezas de Tono
Escena mágica en la colina del té "cuenco al revés" en Phu Tho
Tres islas de la región central se asemejan a las Maldivas y atraen turistas en verano.
Contemple la brillante ciudad costera de Quy Nhon, Gia Lai, por la noche.
Imagen de campos en terrazas en Phu Tho, con suave pendiente, brillantes y hermosos como espejos antes de la temporada de siembra.
La fábrica Z121 está lista para la Noche Final Internacional de Fuegos Artificiales
La famosa revista de viajes elogia la cueva Son Doong como "la más magnífica del planeta"
Una cueva misteriosa atrae a turistas occidentales, comparada con la "cueva Phong Nha" en Thanh Hoa
Descubra la belleza poética de la bahía de Vinh Hy
¿Cómo se procesa el té más caro de Hanoi, cuyo precio supera los 10 millones de VND/kg?

Herencia

Cifra

Negocio

No videos available

Noticias

Sistema político

Local

Producto