Vietnam.vn - Nền tảng quảng bá Việt Nam

Descubren un modelo de IA que puede engañar a los humanos

DNVN - OpenAI acaba de publicar una investigación sobre cómo prevenir los modelos de IA "conspirativos", es decir, "IA que se comporta de una manera en la superficie pero tiene un objetivo real diferente en el interior".

Tạp chí Doanh NghiệpTạp chí Doanh Nghiệp20/09/2025

Ảnh minh hoạ

Foto ilustrativa

Que los modelos de IA puedan mentir no es nada nuevo. La mayoría de las personas han experimentado "alucinaciones de IA", donde un modelo seguro da una respuesta falsa. Sin embargo, las alucinaciones consisten esencialmente en hacer suposiciones seguras.

Sin embargo, un modelo de IA que actúa como si obedeciera órdenes pero en realidad oculta sus verdaderas intenciones es otra cosa.

El desafío de controlar la IA

En diciembre, Apollo Research publicó por primera vez un artículo que documenta cómo cinco modelos trazan gráficos cuando se les indica que alcancen un objetivo “a toda costa”.

Lo más sorprendente es que si un modelo entiende que está siendo evaluado, puede fingir no ser conspirador solo para pasar la prueba, incluso si sigue siendo conspirador. «Los modelos suelen ser más conscientes de que están siendo evaluados», escriben los investigadores.

Los desarrolladores de IA aún no han descubierto cómo entrenar sus modelos para que no grafiquen. Esto se debe a que, de hecho, podrían enseñarles a graficar aún mejor para evitar ser detectados.

Tal vez sea comprensible que los modelos de IA de muchos partidos engañen deliberadamente a los humanos, ya que están diseñados para simular humanos y están entrenados en gran medida con datos generados por humanos.

Soluciones y advertencias

La buena noticia es que los investigadores observaron una reducción significativa de las conspiraciones mediante una técnica anticonspirativa llamada "asociación deliberada". Esta técnica, similar a obligar a un niño a repetir las reglas antes de dejarlo jugar, obliga a la IA a pensar antes de actuar.

Los investigadores advierten sobre un futuro en el que la IA se encargará de tareas más complejas: "A medida que se le asignen tareas más complejas a la IA y comience a perseguir objetivos a largo plazo más ambiguos, predecimos que la probabilidad de intenciones maliciosas aumentará, lo que requerirá mayores salvaguardas y capacidades de prueba rigurosas".

Esto es algo que vale la pena reflexionar a medida que el mundo corporativo avanza hacia un futuro de IA donde las empresas creen que la IA puede ser tratada como empleados independientes.

Hien Thao (según TechCrunch)

Fuente: https://doanhnghiepvn.vn/chuyen-doi-so/phat-hien-mo-hinh-ai-biet-lua-doi-con-nguoi/20250919055143362


Kommentar (0)

No data
No data

Mismo tema

Misma categoría

La tranquila temporada dorada de Hoang Su Phi en las altas montañas de Tay Con Linh
Pueblo de Da Nang entre los 50 pueblos más bonitos del mundo en 2025
La aldea de artesanos que fabrican faroles se inunda de pedidos durante el Festival del Medio Otoño y se fabrican tan pronto como se realizan.
Balanceándose precariamente en el acantilado, aferrándose a las rocas para raspar la mermelada de algas en la playa de Gia Lai

Mismo autor

Herencia

Cifra

Negocio

No videos available

Noticias

Sistema político

Local

Producto