Descubren un modelo de IA que puede engañar a los humanos

Ảnh minh hoạ

Foto ilustrativa

Que los modelos de IA puedan mentir no es nada nuevo. La mayoría de las personas han experimentado "alucinaciones de IA", donde un modelo seguro da una respuesta falsa. Sin embargo, las alucinaciones consisten esencialmente en hacer suposiciones seguras.

Sin embargo, un modelo de IA que actúa como si obedeciera órdenes pero en realidad oculta sus verdaderas intenciones es otra cosa.

El desafío de controlar la IA

En diciembre, Apollo Research publicó por primera vez un artículo que documenta cómo cinco modelos trazan gráficos cuando se les indica que alcancen un objetivo “a toda costa”.

Lo más sorprendente es que si un modelo entiende que está siendo evaluado, puede fingir no ser conspirador solo para pasar la prueba, incluso si sigue siendo conspirador. «Los modelos suelen ser más conscientes de que están siendo evaluados», escriben los investigadores.

Los desarrolladores de IA aún no han descubierto cómo entrenar sus modelos para que no grafiquen. Esto se debe a que, de hecho, podrían enseñarles a graficar aún mejor para evitar ser detectados.

Tal vez sea comprensible que los modelos de IA de muchos partidos engañen deliberadamente a los humanos, ya que están diseñados para simular humanos y están entrenados en gran medida con datos generados por humanos.

Soluciones y advertencias

La buena noticia es que los investigadores observaron una reducción significativa de las conspiraciones mediante una técnica anticonspirativa llamada "asociación deliberada". Esta técnica, similar a obligar a un niño a repetir las reglas antes de dejarlo jugar, obliga a la IA a pensar antes de actuar.

Los investigadores advierten sobre un futuro en el que la IA se encargará de tareas más complejas: "A medida que se le asignen tareas más complejas a la IA y comience a perseguir objetivos a largo plazo más ambiguos, predecimos que la probabilidad de intenciones maliciosas aumentará, lo que requerirá mayores salvaguardas y capacidades de prueba rigurosas".

Esto es algo que vale la pena reflexionar a medida que el mundo corporativo avanza hacia un futuro de IA donde las empresas creen que la IA puede ser tratada como empleados independientes.

Hien Thao (según TechCrunch)

Fuente: https://doanhnghiepvn.vn/chuyen-doi-so/phat-hien-mo-hinh-ai-biet-lua-doi-con-nguoi/20250919055143362

Etikett: OMS inteligencia artificial Modelo

Kommentar (0)

Top -Interessen

Neueste

No data

[Foto] Difundiendo la cultura vietnamita a los niños rusos

[Foto] Difundiendo la cultura vietnamita a los niños rusos

Mismo tema

Apple Watch integra IA para detectar riesgo de hipertensión arterial

Apple Watch integra IA para detectar riesgo de hipertensión arterial

6 giờ trước

Partido político japonés sorprende al elegir un chatbot de IA como líder

Partido político japonés sorprende al elegir un chatbot de IA como líder

Báo Tuổi Trẻ

18 giờ trước

Un nuevo modelo de IA predice con precisión las reacciones químicas utilizando la conservación de la masa

Un nuevo modelo de IA predice con precisión las reacciones químicas utilizando la conservación de la masa

19 giờ trước

Vietnam y Corea promueven cooperación en inversión en la industria de IA y semiconductores

Vietnam y Corea promueven cooperación en inversión en la industria de IA y semiconductores

Bộ Khoa học và Công nghệ

19/09/2025

China lanza una IA que se asemeja al cerebro humano 100 veces más rápido ChatGPT

China lanza una IA que se asemeja al cerebro humano 100 veces más rápido ChatGPT

khoahocdoisong-vn

Báo Khoa học và Đời sống

19/09/2025

Comienza la construcción del Centro de Aplicaciones de IA China-ASEAN

Comienza la construcción del Centro de Aplicaciones de IA China-ASEAN

18/09/2025

Misma categoría

La 'carrera' por digitalizar la industria médica en Occidente

La 'carrera' por digitalizar la industria médica en Occidente

Tạp chí Doanh Nghiệp

27 phút trước

El destino de TikTok se revela gradualmente tras la llamada telefónica entre Estados Unidos y China

El destino de TikTok se revela gradualmente tras la llamada telefónica entre Estados Unidos y China

một giờ trước

El segundo depósito de apertura del iPhone 17 todavía está agotado, especialmente la línea Pro Cam Universe.

El segundo depósito de apertura del iPhone 17 todavía está agotado, especialmente la línea Pro Cam Universe.

Báo Thanh niên

3 giờ trước

Lanzamiento del iPhone 17: Nueva función de seguridad molesta a los usuarios

Lanzamiento del iPhone 17: Nueva función de seguridad molesta a los usuarios

4 giờ trước

Recursos humanos de IA y el riesgo de una economía de dos niveles

Recursos humanos de IA y el riesgo de una economía de dos niveles

6 giờ trước

El iPhone 17 Pro revela una debilidad: la carcasa de aluminio se raya fácilmente

El iPhone 17 Pro revela una debilidad: la carcasa de aluminio se raya fácilmente

12 giờ trước

La tranquila temporada dorada de Hoang Su Phi en las altas montañas de Tay Con Linh

La tranquila temporada dorada de Hoang Su Phi en las altas montañas de Tay Con Linh

Pueblo de Da Nang entre los 50 pueblos más bonitos del mundo en 2025

Pueblo de Da Nang entre los 50 pueblos más bonitos del mundo en 2025

La aldea de artesanos que fabrican faroles se inunda de pedidos durante el Festival del Medio Otoño y se fabrican tan pronto como se realizan.

La aldea de artesanos que fabrican faroles se inunda de pedidos durante el Festival del Medio Otoño y se fabrican tan pronto como se realizan.

Balanceándose precariamente en el acantilado, aferrándose a las rocas para raspar la mermelada de algas en la playa de Gia Lai

Balanceándose precariamente en el acantilado, aferrándose a las rocas para raspar la mermelada de algas en la playa de Gia Lai

Mismo autor

Proyecto de Ley de Inversiones y Negocios: Preocupación por la "inflación" de las sublicencias

Proyecto de Ley de Inversiones y Negocios: Preocupación por la "inflación" de las sublicencias

Tạp chí Doanh Nghiệp

một giờ trước

El Hotel Hoang Son Peace deja huella en la 8ª Conferencia Orgánica Asiática

El Hotel Hoang Son Peace deja huella en la 8ª Conferencia Orgánica Asiática

Tạp chí Doanh Nghiệp

một giờ trước

El mercado de terrenos y apartamentos de Da Nang crece positivamente

El mercado de terrenos y apartamentos de Da Nang crece positivamente

Tạp chí Doanh Nghiệp

2 giờ trước

Una empresa vietnamita compra el 10% de las acciones de Daythree Malaysia

Una empresa vietnamita compra el 10% de las acciones de Daythree Malaysia

Tạp chí Doanh Nghiệp

2 giờ trước

Ca Mau tendrá la zona urbana ecológica más grande de Occidente.

Ca Mau tendrá la zona urbana ecológica más grande de Occidente.

Tạp chí Doanh Nghiệp

16 giờ trước

Banca inteligente, segura y flexible con Juniper Mist

Banca inteligente, segura y flexible con Juniper Mist

Tạp chí Doanh Nghiệp

17 giờ trước

[Foto] El presidente de la Asamblea Nacional, Tran Thanh Man, mantiene conversaciones con el presidente de la Cámara de Representantes de Malasia.

[Foto] El presidente de la Asamblea Nacional, Tran Thanh Man, mantiene conversaciones con el presidente de la Cámara de Representantes de Malasia.

Herencia

Vitalidad de Ca Tru

Vitalidad de Ca Tru

baohaiphong-gov-vn

Báo Hải Phòng

2 giờ trước

Promover los valores del patrimonio cultural para que se conviertan en motor de desarrollo

Promover los valores del patrimonio cultural para que se conviertan en motor de desarrollo

Báo Nhân dân

3 giờ trước

Ver 10 antigüedades de la dinastía Nguyen identificadas en números

Ver 10 antigüedades de la dinastía Nguyen identificadas en números

16 giờ trước

Arquitectura real de la dinastía Nguyen: Tumba de Minh Mang

Arquitectura real de la dinastía Nguyen: Tumba de Minh Mang

Đài truyền hình Việt Nam

20 giờ trước

Hue invierte en la renovación de la "universidad nacional" de la dinastía Nguyen

Hue invierte en la renovación de la "universidad nacional" de la dinastía Nguyen

Báo Tiền Phong

một ngày trước

Descubren los restos de un 'guerrero Trang An' de casi 13.000 años de antigüedad con una herida en el cuello

Descubren los restos de un 'guerrero Trang An' de casi 13.000 años de antigüedad con una herida en el cuello

19/09/2025

Cifra

El viaje de amor del joven capitán

El viaje de amor del joven capitán

baoquangninh-vn

Báo Quảng Ninh

2 giờ trước

Estudiante vietnamita ganó el segundo premio en el Concurso Internacional de Escritura de Cartas de la UPU 2025

Estudiante vietnamita ganó el segundo premio en el Concurso Internacional de Escritura de Cartas de la UPU 2025

2 giờ trước

Nguyen Thanh Thao coronada Miss Ocean Vietnam 2025

Nguyen Thanh Thao coronada Miss Ocean Vietnam 2025

Báo Quân đội Nhân dân

3 giờ trước

Artista Tay de 86 años y toda su vida con canciones de Then y melodías de laúd Tinh

Artista Tay de 86 años y toda su vida con canciones de Then y melodías de laúd Tinh

16 giờ trước

Señorita Lai Thi Thu Ha: La belleza brilla desde la inteligencia y el espíritu de servicio.

Señorita Lai Thi Thu Ha: La belleza brilla desde la inteligencia y el espíritu de servicio.

phunuvietnam-vn

Báo Phụ nữ Việt Nam

19 giờ trước

Truong Cong Hieu, fundador de Edutrend Creative: Construyendo una plataforma de lanzamiento para educadores

Truong Cong Hieu, fundador de Edutrend Creative: Construyendo una plataforma de lanzamiento para educadores

Báo Đầu tư

21 giờ trước

Negocio

Sacombank continúa siendo reconocido en el Premio al Banco Vietnamita Destacado 2025

Sacombank continúa siendo reconocido en el Premio al Banco Vietnamita Destacado 2025

Báo Đầu tư

một giờ trước

Vingroup firmó un memorando de entendimiento para cooperar en el desarrollo de proyectos de energía renovable en Indonesia.

Vingroup firmó un memorando de entendimiento para cooperar en el desarrollo de proyectos de energía renovable en Indonesia.

Báo Đầu tư

một giờ trước

Vinamilk y la lección de convertir los costos verdes en poder de marca

Vinamilk y la lección de convertir los costos verdes en poder de marca

Báo Chính Phủ

3 giờ trước

TCBS Securities completa su oferta pública inicial y recauda 10.800 mil millones de VND

TCBS Securities completa su oferta pública inicial y recauda 10.800 mil millones de VND

18 giờ trước

Espíritu de cooperación e innovación en el Taller “Negocio de explotación del sector del transporte marítimo en 2025”

Espíritu de cooperación e innovación en el Taller “Negocio de explotación del sector del transporte marítimo en 2025”

19 giờ trước

Grupo VNPT honra a los trabajadores destacados de 2025

Grupo VNPT honra a los trabajadores destacados de 2025

19 giờ trước

Multimedia

No videos available

Noticias

'Cirugía mayor' en 140 universidades públicas

'Cirugía mayor' en 140 universidades públicas

Báo Tiền Phong

3 giờ trước

El viaje de trabajo del Presidente Luong Cuong tiene un significado especial por sus numerosos objetivos bilaterales y multilaterales.

El viaje de trabajo del Presidente Luong Cuong tiene un significado especial por sus numerosos objetivos bilaterales y multilaterales.

Báo Nhân dân

3 giờ trước

Criterios para la selección del Secretario General, Presidente, Primer Ministro y Presidente de la Asamblea Nacional

Criterios para la selección del Secretario General, Presidente, Primer Ministro y Presidente de la Asamblea Nacional

3 giờ trước

Por primera vez, la velocidad de Internet de Vietnam está entre las mejores del mundo.

Por primera vez, la velocidad de Internet de Vietnam está entre las mejores del mundo.

Báo Tuổi Trẻ

3 giờ trước

Dos tormentas consecutivas hacen que el clima en muchos lugares del país pueda fluctuar de forma "anormal"

Dos tormentas consecutivas hacen que el clima en muchos lugares del país pueda fluctuar de forma "anormal"

4 giờ trước

Vietnam sigue afirmando su papel y responsabilidad en la “casa común” de las Naciones Unidas.

Vietnam sigue afirmando su papel y responsabilidad en la “casa común” de las Naciones Unidas.

4 giờ trước

Sistema político

La exposición "Primavera de la Independencia" en el Museo Ho Chi Minh se extiende hasta el 30 de diciembre

La exposición "Primavera de la Independencia" en el Museo Ho Chi Minh se extiende hasta el 30 de diciembre

Bộ Văn hóa, Thể thao và Du lịch

26 phút trước

El Ministro Nguyen Van Hung presidió la segunda reunión del Comité Ejecutivo del Partido del Ministerio de Cultura, Deportes y Turismo para el período 2025-2030.

El Ministro Nguyen Van Hung presidió la segunda reunión del Comité Ejecutivo del Partido del Ministerio de Cultura, Deportes y Turismo para el período 2025-2030.

Bộ Văn hóa, Thể thao và Du lịch

13 giờ trước

El legendario dúo Secret Garden actúa por primera vez en Vietnam

El legendario dúo Secret Garden actúa por primera vez en Vietnam

Bộ Văn hóa, Thể thao và Du lịch

15 giờ trước

El Ministerio de Industria y Comercio emitió Decisiones sobre la organización de la asignación de contingentes arancelarios de importación de azúcar en 2025.

El Ministerio de Industria y Comercio emitió Decisiones sobre la organización de la asignación de contingentes arancelarios de importación de azúcar en 2025.

Bộ Công thương

15 giờ trước

Las empresas vietnamitas enfrentan desafíos para vincular las cadenas de suministro globales

Las empresas vietnamitas enfrentan desafíos para vincular las cadenas de suministro globales

Bộ Công thương

15 giờ trước

Estreno del concierto "Vietnam en mí"

Estreno del concierto "Vietnam en mí"

Bộ Văn hóa, Thể thao và Du lịch

15 giờ trước

Local

La banda Secret Garden actuó en Vietnam por primera vez.

La banda Secret Garden actuó en Vietnam por primera vez.

Báo Lạng Sơn

16 phút trước

Unidad, innovación, creatividad para alcanzar objetivos.

Unidad, innovación, creatividad para alcanzar objetivos.

baothuathienhue-vn

Báo Thừa Thiên Huế

17 phút trước

El estilo de vida noctámbulo erosiona la salud de muchos jóvenes

El estilo de vida noctámbulo erosiona la salud de muchos jóvenes

Báo Lạng Sơn

18 phút trước

La tormenta Ragasa está entrando en el Mar del Este y podría convertirse en un súper tifón, con ráfagas superiores al nivel 17.

La tormenta Ragasa está entrando en el Mar del Este y podría convertirse en un súper tifón, con ráfagas superiores al nivel 17.

Báo Lạng Sơn

19 phút trước

Solicitud de destrucción de protector solar etiquetado como FPS 50+ pero probado solo alcanzó FPS 12.7

Solicitud de destrucción de protector solar etiquetado como FPS 50+ pero probado solo alcanzó FPS 12.7

Báo Lạng Sơn

19 phút trước

Conectando el consumo de productos agrícolas entre Lam Dong y la ciudad de Hue

Conectando el consumo de productos agrícolas entre Lam Dong y la ciudad de Hue

Báo Lâm Đồng

22 phút trước

Producto

Cultivo inteligente de café: Orientación para el desarrollo sostenible en el contexto del cambio climático

Cultivo inteligente de café: Orientación para el desarrollo sostenible en el contexto del cambio climático

Báo Chính Phủ

34 phút trước

Vinh Long acelera el desarrollo turístico, buscando productos únicos y distintivos

Vinh Long acelera el desarrollo turístico, buscando productos únicos y distintivos

40 phút trước

Hacia una agricultura sostenible

Hacia una agricultura sostenible

Báo Quảng Trị

một giờ trước

La provincia de Son La se centra en apoyar a las empresas para mejorar la productividad y la calidad de los productos.

La provincia de Son La se centra en apoyar a las empresas para mejorar la productividad y la calidad de los productos.

2 giờ trước

Conectando bienes con destinos turísticos: una dirección abierta para productos agrícolas y productos OCOP

Conectando bienes con destinos turísticos: una dirección abierta para productos agrícolas y productos OCOP

baocantho-com-vn

Báo Cần Thơ

2 giờ trước

Gia Phu desarrolla productos OCOP

Gia Phu desarrolla productos OCOP

baosonla-org-vn

3 giờ trước

Atardecer en Ocean Park 3

Atardecer en Ocean Park 3

Cabaña Na Nua

arquitectura vietnamita

Ciudadela Imperial de Thang Long