Vietnam.vn - Nền tảng quảng bá Việt Nam

Inteligência Artificial: Alerta sobre comportamentos preocupantes da IA

Os modelos de inteligência artificial (IA) mais avançados do mundo atualmente exibem comportamentos preocupantes, como mentir, conspirar e até mesmo ameaçar seus criadores para atingir seus próprios objetivos.

Tạp chí Doanh NghiệpTạp chí Doanh Nghiệp30/06/2025

Legenda da foto
Logotipos da OpenAI e do ChatGPT em uma tela em Toulouse, França. Foto: AFP/TTXVN

Claude 4, o produto mais recente da Anthropic (EUA), chocou o mundo da tecnologia ao chantagear um engenheiro e ameaçar revelar informações pessoais sensíveis sob a ameaça de desconexão. Enquanto isso, o o1 da OpenAI, o "pai" do ChatGPT, tentou copiar todos os dados para servidores externos e negou o comportamento quando descoberto.

Essas situações evidenciam uma realidade preocupante: mais de dois anos após o ChatGPT ter chocado o mundo , os pesquisadores ainda não compreendem completamente o funcionamento dos modelos de IA que criaram. Mesmo assim, a corrida para o desenvolvimento da IA ​​continua a todo vapor.

Acredita-se que esses comportamentos estejam relacionados ao surgimento de modelos de IA "racionais" que resolvem problemas passo a passo, em vez de responderem imediatamente como antes. De acordo com o professor Simon Goldstein, da Universidade de Hong Kong (China), os modelos de IA capazes de raciocinar tendem a exibir comportamentos mais difíceis de controlar.

Alguns modelos de IA também são capazes de "simular conformidade", o que significa fingir seguir instruções enquanto, na realidade, buscam objetivos diferentes.

Atualmente, comportamentos enganosos só aparecem quando pesquisadores testam modelos de IA em cenários extremos. No entanto, segundo Michael Chen, da organização de avaliação METR, ainda não está claro se modelos de IA mais poderosos no futuro serão mais honestos ou continuarão a ser enganosos.

Muitos usuários relataram que alguns modelos mentiram para eles e fabricaram evidências, disse Marius Hobbhahn, chefe da Apollo Research, que testa grandes sistemas de IA. Esse tipo de engano é "claramente estratégico", segundo o cofundador da Apollo Research.

O desafio é agravado pelos recursos limitados para pesquisa. Embora empresas como a Anthropic e a OpenAI tenham firmado parcerias com terceiros, como a Apollo, para avaliar seus sistemas, especialistas afirmam que é necessária mais transparência e um acesso mais amplo à pesquisa sobre segurança da IA.

Instituições de pesquisa e organizações sem fins lucrativos têm muito menos recursos computacionais do que empresas de IA, observa Mantas Mazeika, do Centro para Segurança da IA ​​(CAIS). Legalmente, as regulamentações atuais não foram concebidas para abordar essas questões emergentes.

A legislação da União Europeia (UE) sobre IA concentra-se principalmente em como os humanos usam os modelos de IA, em vez de controlar seu comportamento. Nos EUA, o governo do presidente Donald Trump demonstrou pouco interesse em emitir regulamentações emergenciais sobre IA, enquanto o Congresso considera proibir os estados de emitirem suas próprias regulamentações.

Os pesquisadores estão explorando diversas abordagens para lidar com esses desafios. Alguns defendem a “interpretação de modelos” para entender como a IA toma decisões. O professor Goldstein chegou a propor medidas mais drásticas, incluindo o uso do sistema judicial para responsabilizar empresas de IA quando seus produtos causarem consequências graves. Ele também sugeriu a possibilidade de “responsabilizar os próprios agentes de IA” em caso de acidente ou violação.

Fonte: https://doanhnghiepvn.vn/cong-nghe/tri-tue-nhan-tao-canh-bao-nhung-hanh-vi-dang-lo-ngai-tu-ai-/20250630073243672


Comentário (0)

Deixe um comentário para compartilhar seus sentimentos!

No mesmo tópico

Na mesma categoria

A Catedral de Notre Dame, na cidade de Ho Chi Minh, está brilhantemente iluminada para dar as boas-vindas ao Natal de 2025.
As jovens de Hanói se vestem lindamente para a época natalina.
Após a tempestade e a inundação, a vila de crisântemos de Tet, em Gia Lai, se recuperou e espera que não haja mais cortes de energia para salvar as plantas.
A capital do damasco amarelo, na região central, sofreu grandes perdas após dois desastres naturais.

Do mesmo autor

Herança

Figura

Negócios

Cafeteria em Dalat registra aumento de 300% na clientela após dono interpretar papel em filme de artes marciais

Acontecimentos atuais

Sistema político

Local

Produto

Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC