Descoberto modelo de IA que pode enganar humanos

Ảnh minh hoạ

Foto ilustrativa

O fato de modelos de IA poderem mentir não é novidade. A maioria das pessoas já teve "alucinações de IA", em que um modelo confiante dá uma resposta que não é verdadeira. Alucinações, no entanto, consistem essencialmente em fazer suposições confiantes.

No entanto, um modelo de IA que age como se estivesse obedecendo ordens, mas na verdade esconde suas verdadeiras intenções, é outra questão.

O desafio de controlar a IA

A Apollo Research publicou pela primeira vez um artigo em dezembro documentando como cinco modelos planejam quando são instruídos a atingir uma meta "a todo custo".

O mais surpreendente é que, se um modelo entende que está sendo testado, ele pode fingir que não é conspiratório apenas para passar no teste, mesmo que ainda seja conspiratório. "Os modelos costumam ter mais consciência de que estão sendo avaliados", escrevem os pesquisadores.

Os desenvolvedores de IA ainda precisam descobrir como treinar seus modelos para não plotar. Isso porque, ao fazer isso, o modelo poderia ser ainda melhor treinado para evitar a detecção.

Talvez seja compreensível que modelos de IA de muitas partes enganem deliberadamente os humanos, pois eles são criados para simular humanos e são amplamente treinados com dados gerados por humanos.

Soluções e avisos

A boa notícia é que os pesquisadores observaram uma redução significativa nas conspirações usando uma técnica anticonspiração chamada “associação deliberada”. Essa técnica, semelhante a fazer uma criança repetir as regras antes de deixá-la jogar, força a IA a pensar antes de agir.

Os pesquisadores alertam para um futuro em que a IA será encarregada de tarefas mais complexas: “À medida que a IA for encarregada de tarefas mais complexas e começar a perseguir objetivos de longo prazo mais ambíguos, prevemos que a probabilidade de intenção maliciosa aumentará, exigindo salvaguardas correspondentemente maiores e capacidades de testes rigorosas”.

Isso é algo que vale a pena ponderar à medida que o mundo corporativo caminha em direção a um futuro de IA, onde as empresas acreditam que a IA pode ser tratada como funcionários independentes.

Hien Thao (de acordo com o TechCrunch)

Fonte: https://doanhnghiepvn.vn/chuyen-doi-so/phat-hien-mo-hinh-ai-biet-lua-doi-con-nguoi/20250919055143362

Tópico: QUEM inteligência artificial Modelo

Comentário (0)

Mais populares

Mais recente

No data

Descubra a única vila do Vietnã entre as 50 vilas mais bonitas do mundo

Descubra a única vila do Vietnã entre as 50 vilas mais bonitas do mundo

No mesmo tópico

4 estudantes do sexo masculino ganharam o prêmio em inteligência artificial 3 vezes

4 estudantes do sexo masculino ganharam o prêmio em inteligência artificial 3 vezes

14 giờ trước

Nghe An promove potencial de investimento e turismo no Vietnã - Fórum da China

Nghe An promove potencial de investimento e turismo no Vietnã - Fórum da China

14 giờ trước

Ferramenta de aplicação de IA auxilia gestores e empresas na identificação rápida de espécies de madeira

Ferramenta de aplicação de IA auxilia gestores e empresas na identificação rápida de espécies de madeira

15 giờ trước

IA: Uma importante força motriz para a futura cooperação entre a China e a ASEAN

IA: Uma importante força motriz para a futura cooperação entre a China e a ASEAN

21/09/2025

Universidade Politécnica concede bolsas de estudo aos oradores da turma de matrículas de 2025

Universidade Politécnica concede bolsas de estudo aos oradores da turma de matrículas de 2025

Báo Đà Nẵng

20/09/2025

Apple Watch integra IA para detectar risco de pressão alta

Apple Watch integra IA para detectar risco de pressão alta

19/09/2025

Na mesma categoria

iPhone Air “dissecado”: 4 segredos interessantes revelados

iPhone Air “dissecado”: 4 segredos interessantes revelados

một giờ trước

Phu Tho: Apoiando cooperativas e empresas na transformação digital

Phu Tho: Apoiando cooperativas e empresas na transformação digital

Tạp chí Doanh Nghiệp

3 giờ trước

A ASEAN promove o desenvolvimento de empresas multinacionais de tecnologia na região

A ASEAN promove o desenvolvimento de empresas multinacionais de tecnologia na região

6 giờ trước

A pessoa que trabalhou na Apple por mais tempo

A pessoa que trabalhou na Apple por mais tempo

6 giờ trước

A Pi Network está sendo vendida

A Pi Network está sendo vendida

9 giờ trước

Pílula popular e barata para dor de cabeça pode prevenir a recorrência de câncer perigoso

Pílula popular e barata para dor de cabeça pode prevenir a recorrência de câncer perigoso

Tạp chí Doanh Nghiệp

9 giờ trước

Descubra a única vila do Vietnã entre as 50 vilas mais bonitas do mundo

Descubra a única vila do Vietnã entre as 50 vilas mais bonitas do mundo

Por que as lanternas com bandeiras vermelhas e estrelas amarelas são populares este ano?

Por que as lanternas com bandeiras vermelhas e estrelas amarelas são populares este ano?

Vietname vence concurso musical Intervision 2025

Vietname vence concurso musical Intervision 2025

Engarrafamento em Mu Cang Chai até a noite, turistas se aglomeram para caçar a temporada de arroz maduro

Engarrafamento em Mu Cang Chai até a noite, turistas se aglomeram para caçar a temporada de arroz maduro

Do mesmo autor

O bilionário americano Warren Buffett retirou-se completamente da BYD apesar de um lucro de 3.890%.

O bilionário americano Warren Buffett retirou-se completamente da BYD apesar de um lucro de 3.890%.

Tạp chí Doanh Nghiệp

6 giờ trước

Bac Ninh promove a criação de dados para servir à transformação digital abrangente

Bac Ninh promove a criação de dados para servir à transformação digital abrangente

Tạp chí Doanh Nghiệp

6 giờ trước

Bancos aumentam produtividade interna com assistente de IA interno

Bancos aumentam produtividade interna com assistente de IA interno

Tạp chí Doanh Nghiệp

6 giờ trước

Ruby Coastal City - Um paraíso de turismo de luxo e resorts

Ruby Coastal City - Um paraíso de turismo de luxo e resorts

Tạp chí Doanh Nghiệp

9 giờ trước

Nghe An: Número de empresas aumentou acentuadamente após a emissão da Resolução 68

Nghe An: Número de empresas aumentou acentuadamente após a emissão da Resolução 68

Tạp chí Doanh Nghiệp

9 giờ trước

O número de empresas em Nghe An aumentou acentuadamente após a emissão da Resolução 68-NQ/TW.

O número de empresas em Nghe An aumentou acentuadamente após a emissão da Resolução 68-NQ/TW.

Tạp chí Doanh Nghiệp

9 giờ trước

Admire Ao Ba Om com centenas de árvores antigas com raízes de formatos únicos

Admire Ao Ba Om com centenas de árvores antigas com raízes de formatos únicos

Herança

Thanh Hoa gasta mais de 350 bilhões de VND para restaurar a Cidadela da Dinastia Ho, Patrimônio Mundial

Thanh Hoa gasta mais de 350 bilhões de VND para restaurar a Cidadela da Dinastia Ho, Patrimônio Mundial

6 giờ trước

A mágica e bela herança das casas comunitárias do Norte sob as linhas das pinturas contemporâneas

A mágica e bela herança das casas comunitárias do Norte sob as linhas das pinturas contemporâneas

10 giờ trước

Santuário do Meu Filho visto do céu

Santuário do Meu Filho visto do céu

Báo Tiền Phong

13 giờ trước

Bat Trang: Quando os pratos da aldeia se tornam património

Bat Trang: Quando os pratos da aldeia se tornam património

Báo Nhân dân

15 giờ trước

Continuando a fonte dos blocos de madeira do Patrimônio Mundial da Dinastia Nguyen

Continuando a fonte dos blocos de madeira do Patrimônio Mundial da Dinastia Nguyen

Báo Thanh niên

16 giờ trước

Quang Ninh: Transformando tesouros patrimoniais em motores de crescimento verde

Quang Ninh: Transformando tesouros patrimoniais em motores de crescimento verde

Bộ Văn hóa, Thể thao và Du lịch

21/09/2025

Figura

Com foco no VinFast, o Sr. Pham Nhat Vuong ganha muito

Com foco no VinFast, o Sr. Pham Nhat Vuong ganha muito

6 giờ trước

Deixando de lado seu diploma de engenharia, ele começou um negócio com… folhas de goiaba

Deixando de lado seu diploma de engenharia, ele começou um negócio com… folhas de goiaba

Báo Thanh niên

9 giờ trước

9X da Alemanha retorna ao Vietnã para fazer o projeto "50 bandeiras - 50 anos de paz"

9X da Alemanha retorna ao Vietnã para fazer o projeto "50 bandeiras - 50 anos de paz"

10 giờ trước

A linda garota Gia Rai guarda a alma do bambu e acende o fogo do empreendedorismo

A linda garota Gia Rai guarda a alma do bambu e acende o fogo do empreendedorismo

13 giờ trước

Memórias de amor em meio às balas de um veterano de Quang Tri

Memórias de amor em meio às balas de um veterano de Quang Tri

khoahocdoisong-vn

Báo Khoa học và Đời sống

15 giờ trước

Siga sua paixão e ainda estude bem

Siga sua paixão e ainda estude bem

Người Lao Động

16 giờ trước

Negócios

Aço Hoa Phat: anticorrosivo e resistente à descoloração em climas marinhos

Aço Hoa Phat: anticorrosivo e resistente à descoloração em climas marinhos

11 giờ trước

A União da Juventude VIMC orienta a conclusão do Congresso da União da Juventude de base

A União da Juventude VIMC orienta a conclusão do Congresso da União da Juventude de base

14 giờ trước

Vingroup estabelece terceira empresa de robótica com capital social de 500 bilhões de VND

Vingroup estabelece terceira empresa de robótica com capital social de 500 bilhões de VND

16 giờ trước

PTSC Youth: coragem inabalável, inteligência inovadora, aspiração de chegar longe, unir forças para criar um desenvolvimento sustentável para o PTSC

PTSC Youth: coragem inabalável, inteligência inovadora, aspiração de chegar longe, unir forças para criar um desenvolvimento sustentável para o PTSC

17 giờ trước

União da Juventude PV SECURITY: Coração apaixonado, espírito firme

União da Juventude PV SECURITY: Coração apaixonado, espírito firme

18 giờ trước

O PTSC Quang Ngai foi homenageado com o Prêmio de Inovação da GE Vernova no evento "2025 Apac Supplier Partnership Summit"

O PTSC Quang Ngai foi homenageado com o Prêmio de Inovação da GE Vernova no evento "2025 Apac Supplier Partnership Summit"

18 giờ trước

Multimídia

No videos available

Notícias

Vietname envia tropas para continuar participando de missões de paz das Nações Unidas

Vietname envia tropas para continuar participando de missões de paz das Nações Unidas

Báo Tuổi Trẻ

9 giờ trước

Esportes vietnamitas correm para se preparar para os Jogos do Sudeste Asiático 33

Esportes vietnamitas correm para se preparar para os Jogos do Sudeste Asiático 33

Báo Tuổi Trẻ

10 giờ trước

O supertufão Ragasa ultrapassará o Yagi e se tornará o tufão mais forte dos últimos 30 anos no Mar do Leste?

O supertufão Ragasa ultrapassará o Yagi e se tornará o tufão mais forte dos últimos 30 anos no Mar do Leste?

Báo Tuổi Trẻ

10 giờ trước

O Sr. Bui Van Khang foi eleito presidente do Comitê Popular da província de Quang Ninh.

O Sr. Bui Van Khang foi eleito presidente do Comitê Popular da província de Quang Ninh.

10 giờ trước

Hanói está entre os principais destinos para ver as folhas de outono no continente.

Hanói está entre os principais destinos para ver as folhas de outono no continente.

10 giờ trước

A província de Khanh Hoa deve afirmar sua nova posição no processo de inovação e desenvolvimento do país.

A província de Khanh Hoa deve afirmar sua nova posição no processo de inovação e desenvolvimento do país.

Báo Nhân dân

10 giờ trước

Sistema político

Estudante vietnamita ganha segundo prêmio no 54º Concurso Internacional de Redação de Cartas da UPU

Estudante vietnamita ganha segundo prêmio no 54º Concurso Internacional de Redação de Cartas da UPU

Bộ Khoa học và Công nghệ

3 giờ trước

Abertura do Campeonato Nacional de Tiro - Copa da Federação de Tiro do Vietnã 2025

Abertura do Campeonato Nacional de Tiro - Copa da Federação de Tiro do Vietnã 2025

Bộ Văn hóa, Thể thao và Du lịch

3 giờ trước

Telegrama do Ministério da Indústria e Comércio sobre o fortalecimento da estabilidade do mercado de arroz

Telegrama do Ministério da Indústria e Comércio sobre o fortalecimento da estabilidade do mercado de arroz

Bộ Công thương

3 giờ trước

Organizar cursos de formação para melhorar a qualidade dos recursos humanos em conhecimento profissional e inventário do patrimônio cultural.

Organizar cursos de formação para melhorar a qualidade dos recursos humanos em conhecimento profissional e inventário do patrimônio cultural.

Bộ Văn hóa, Thể thao và Du lịch

4 giờ trước

O desejo de construir uma plataforma de comércio eletrônico "puramente vietnamita" sob pressão de plataformas estrangeiras

O desejo de construir uma plataforma de comércio eletrônico "puramente vietnamita" sob pressão de plataformas estrangeiras

Bộ Công thương

7 giờ trước

Bac Ninh promove o consumo de produtos essenciais: Rumo a um mercado sustentável

Bac Ninh promove o consumo de produtos essenciais: Rumo a um mercado sustentável

Bộ Công thương

7 giờ trước

Local

Ensaio geral do programa de arte para celebrar o sucesso do Congresso Provincial do Partido Thai Nguyen

Ensaio geral do programa de arte para celebrar o sucesso do Congresso Provincial do Partido Thai Nguyen

baothainguyen-vn

Báo Thái Nguyên

27 phút trước

Dando boas-vindas ao 1º Congresso do Comitê Provincial do Partido de Khanh Hoa, período 2025-2030: A aspiração de contribuição da juventude de Khanh Hoa

Dando boas-vindas ao 1º Congresso do Comitê Provincial do Partido de Khanh Hoa, período 2025-2030: A aspiração de contribuição da juventude de Khanh Hoa

Báo Khánh Hòa

27 phút trước

Controle rigoroso de navios e reservatórios antes do mais forte supertufão Ragasa da história no Mar do Leste

Controle rigoroso de navios e reservatórios antes do mais forte supertufão Ragasa da história no Mar do Leste

baoquangninh-vn

Báo Quảng Ninh

32 phút trước

O jornal Quang Ninh, rádio e televisão visitou e trabalhou com a estação de rádio e televisão Gangwon, Coreia

O jornal Quang Ninh, rádio e televisão visitou e trabalhou com a estação de rádio e televisão Gangwon, Coreia

baoquangninh-vn

Báo Quảng Ninh

một giờ trước

Dando boas-vindas ao 1º Congresso do Comitê Provincial do Partido de Khanh Hoa, mandato 2025-2030: A Frente e as organizações sociopolíticas contribuem para a construção de um Partido e um governo limpos e fortes.

Dando boas-vindas ao 1º Congresso do Comitê Provincial do Partido de Khanh Hoa, mandato 2025-2030: A Frente e as organizações sociopolíticas contribuem para a construção de um Partido e um governo limpos e fortes.

Báo Khánh Hòa

một giờ trước

Não ignore nem seja subjetivo sobre a tempestade Ragasa.

Não ignore nem seja subjetivo sobre a tempestade Ragasa.

baohaiphong-gov-vn

Báo Hải Phòng

một giờ trước

Produto

Promover a aplicação da biotecnologia na produção agrícola

Promover a aplicação da biotecnologia na produção agrícola

Báo Nhân dân

16 giờ trước

Luong Thinh: Nova direção, elevando produtos agrícolas essenciais

Luong Thinh: Nova direção, elevando produtos agrícolas essenciais

16 giờ trước

Localização da indústria automobilística: um teste à coragem industrial do Vietnã

Localização da indústria automobilística: um teste à coragem industrial do Vietnã

Báo Chính Phủ

21/09/2025

Construindo uma marca para produtos agrícolas vietnamitas que alcancem longe

Construindo uma marca para produtos agrícolas vietnamitas que alcancem longe

baoquangninh-vn

Báo Quảng Ninh

21/09/2025

An Giang: Organizando o Festival de Turismo e Culinária combinado com a feira de promoção comercial, produtos OCOP 2025

An Giang: Organizando o Festival de Turismo e Culinária combinado com a feira de promoção comercial, produtos OCOP 2025

Bộ Văn hóa, Thể thao và Du lịch

21/09/2025

Ca Mau aprova Programa de apoio às empresas para melhoria de produtividade e qualidade no período 2026-2030

Ca Mau aprova Programa de apoio às empresas para melhoria de produtividade e qualidade no período 2026-2030

21/09/2025

Depois da chuva

Depois da chuva

Visite Dong Loc (Nghe An) para mergulhar nos vinhedos repletos de frutas

Tempo

Mercado do país