GPT-4.5 es el modelo más grande que OpenAI ha desarrollado jamás. Fuente: The Verge . |
Un nuevo estudio del Departamento de Ciencias Cognitivas de la Universidad de California en San Diego marca un hito en el campo de la inteligencia artificial: el modelo GPT-4.5 de OpenAI ha logrado un rendimiento superior en la prueba de Turing utilizando un enfoque de interacción basado en la "personalidad".
Este se considera el sistema de conversación de IA más parecido al humano hasta la fecha y abre muchas aplicaciones potenciales en el campo de la inteligencia social.
OpenAI promociona GPT-4.5 como “un gran paso adelante en la ampliación del preentrenamiento y el postentrenamiento”. Este es el modelo más grande que OpenAI ha desarrollado jamás, con un tamaño y una potencia de cálculo que superan a las versiones anteriores.
Según la publicación oficial del blog de OpenAI del 27 de febrero, GPT-4.5 comenzó a implementarse para los usuarios de ChatGPT Pro el día de su anuncio.
¿Puede la IA engañar a los humanos?
El experimento comparó cuatro sistemas de IA representativos: el chatbot ELIZA de la década de 1960, LLaMa-3.1-405B de Meta AI, GPT-4o y GPT-4.5 de OpenAI. El equipo diseñó dos pruebas independientes con 250 participantes cada una, para un total de 500 personas de plataformas online como Prolific. Los participantes eran de diferentes edades, géneros y niveles educativos para garantizar la diversidad de la muestra.
![]() |
Tabla comparativa de cuatro sistemas de IA típicos. Fuente: AIbase |
La prueba utiliza el formato tradicional de Turing: cada participante chatea a través de una interfaz de texto con dos sujetos (uno humano y uno IA) durante 5 minutos y luego califica cuál de ellos es humano.
Los resultados fueron sorprendentes: GPT-4.5 logró una tasa de aprobación de la prueba de Turing de hasta el 73%, superando el promedio humano (60-70%). Esta es la primera vez que un modelo de IA realmente “pasa” la prueba de Turing estándar. Mientras tanto, GPT-4o obtiene una puntuación ligeramente inferior, LLaMa-3.1-405B se aproxima o alcanza el desempeño humano en algunos contextos y ELIZA se queda muy corto.
Capacidad de interactuar como un ser humano
Lo más destacado de GPT-4.5 no radica solo en su fluidez en el lenguaje, sino también en su capacidad de expresar emociones y ajustar sus respuestas a los matices de la comunicación del interlocutor. Muchos participantes lo describieron como "amigable" y "auténtico".
En particular, cuando los usuarios parecen confundidos o estresados, GPT-4.5 puede dar respuestas humorísticas o reconfortantes, haciendo que muchos crean que están chateando con una persona real.
![]() |
Contenido de la conversación de dos sujetos (una IA y un humano) en la prueba. Foto: UC San Diego . |
Mientras tanto, LLaMa-3.1-405B, aunque técnicamente impresionante, tiene capacidades de expresión emocional y adaptación al contexto más pobres que GPT-4.5. GPT-4o es potente pero se queda corto en términos de personalización y adaptación de la respuesta situacional.
El avance del GPT-4.5 podría abrir una amplia gama de aplicaciones prácticas, desde tutores virtuales hasta apoyo psicológico y atención al cliente. Sin embargo, a medida que la IA se vuelve más parecida a la humana, distinguir entre lo real y lo virtual y controlar cómo se utiliza esta tecnología se convertirá en un desafío social clave.
El estudio se produce en medio de rápidos avances en IA. El éxito de GPT-4.5 no sólo es un triunfo técnico para OpenAI, sino que también plantea preguntas profundas sobre la relación entre humanos y máquinas. Un participante de la prueba comentó que sentía como si estuviera hablando con un amigo, hasta que se dio cuenta de que todo eran solo líneas de código. Es posible que el diálogo entre humanos e IA apenas haya comenzado.
Fuente: https://znews.vn/chatgpt-da-vuot-qua-bai-danh-gia-quan-trong-xac-dinh-may-nguoi-post1542945.html
Kommentar (0)