Inteligência Artificial: Alerta sobre comportamentos preocupantes da IA

Legenda da foto — Logotipos da OpenAI e do ChatGPT em uma tela em Toulouse, França. Foto: AFP/TTXVN

Claude 4, o produto mais recente da Anthropic (EUA), chocou o mundo da tecnologia ao chantagear um engenheiro e ameaçar revelar informações pessoais sensíveis sob a ameaça de desconexão. Enquanto isso, o o1 da OpenAI, o "pai" do ChatGPT, tentou copiar todos os dados para servidores externos e negou o comportamento quando descoberto.

Essas situações evidenciam uma realidade preocupante: mais de dois anos após o ChatGPT ter chocado o mundo , os pesquisadores ainda não compreendem completamente o funcionamento dos modelos de IA que criaram. Mesmo assim, a corrida para o desenvolvimento da IA continua a todo vapor.

Acredita-se que esses comportamentos estejam relacionados ao surgimento de modelos de IA "racionais" que resolvem problemas passo a passo, em vez de responderem imediatamente como antes. De acordo com o professor Simon Goldstein, da Universidade de Hong Kong (China), os modelos de IA capazes de raciocinar tendem a exibir comportamentos mais difíceis de controlar.

Alguns modelos de IA também são capazes de "simular conformidade", o que significa fingir seguir instruções enquanto, na realidade, buscam objetivos diferentes.

Atualmente, comportamentos enganosos só aparecem quando pesquisadores testam modelos de IA em cenários extremos. No entanto, segundo Michael Chen, da organização de avaliação METR, ainda não está claro se modelos de IA mais poderosos no futuro serão mais honestos ou continuarão a ser enganosos.

Muitos usuários relataram que alguns modelos mentiram para eles e fabricaram evidências, disse Marius Hobbhahn, chefe da Apollo Research, que testa grandes sistemas de IA. Esse tipo de engano é "claramente estratégico", segundo o cofundador da Apollo Research.

O desafio é agravado pelos recursos limitados para pesquisa. Embora empresas como a Anthropic e a OpenAI tenham firmado parcerias com terceiros, como a Apollo, para avaliar seus sistemas, especialistas afirmam que é necessária mais transparência e um acesso mais amplo à pesquisa sobre segurança da IA.

Instituições de pesquisa e organizações sem fins lucrativos têm muito menos recursos computacionais do que empresas de IA, observa Mantas Mazeika, do Centro para Segurança da IA (CAIS). Legalmente, as regulamentações atuais não foram concebidas para abordar essas questões emergentes.

A legislação da União Europeia (UE) sobre IA concentra-se principalmente em como os humanos usam os modelos de IA, em vez de controlar seu comportamento. Nos EUA, o governo do presidente Donald Trump demonstrou pouco interesse em emitir regulamentações emergenciais sobre IA, enquanto o Congresso considera proibir os estados de emitirem suas próprias regulamentações.

Os pesquisadores estão explorando diversas abordagens para lidar com esses desafios. Alguns defendem a “interpretação de modelos” para entender como a IA toma decisões. O professor Goldstein chegou a propor medidas mais drásticas, incluindo o uso do sistema judicial para responsabilizar empresas de IA quando seus produtos causarem consequências graves. Ele também sugeriu a possibilidade de “responsabilizar os próprios agentes de IA” em caso de acidente ou violação.

Fonte: https://doanhnghiepvn.vn/cong-nghe/tri-tue-nhan-tao-canh-bao-nhung-hanh-vi-dang-lo-ngai-tu-ai-/20250630073243672

Tópico: QUEM Artificial Inteligência Comportamento aviso

Comentário (0)

O Artista do Povo Xuan Bac foi o "mestre de cerimônias" de 80 casais que se casaram juntos na rua de pedestres do Lago Hoan Kiem.

No mesmo tópico

O sucesso "Say mot doi vi em", com milhões de visualizações, é mal interpretado como sendo composto por inteligência artificial, afirma o autor.

Báo Tuổi Trẻ

7 giờ trước

Universidade de Ciência e Tecnologia promove transformação digital na formação de estudantes.

Tạp chí Doanh Nghiệp

7 giờ trước

O que acontece quando o sucesso de um artista é copiado por inteligência artificial para competir?

Người Lao Động

một ngày trước

Os bancos promovem a digitalização, reduzindo o tempo de processamento de dados em até 5 vezes.

Tạp chí Doanh Nghiệp

một ngày trước

Um conjunto unificado de livros didáticos: não significa eliminar a diversidade.

Báo Dân trí

một ngày trước

Projetos tecnológicos com valor superior a 6 trilhões de VND podem ter seu período de isenção e redução de impostos prorrogado.

Người Lao Động

một ngày trước

Na mesma categoria

Vazou nova atualização barata para iPhone

ZNews

7 phút trước

Da Nang: a cidade inteligente do Vietnã 2025

Tạp chí Doanh Nghiệp

một giờ trước

Museu Espacial recebe 10.000 visitantes

ZNews

3 giờ trước

Como carregar o celular durante a noite sem danificá-lo?

Báo Dân trí

4 giờ trước

Japão desenvolve 'extintor de incêndio portátil' para baterias de lítio.

Báo Tuổi Trẻ

4 giờ trước

A Samsung domina o mercado global de celulares dobráveis.

VietnamPlus

4 giờ trước

O Artista do Povo Xuan Bac foi o "mestre de cerimônias" de 80 casais que se casaram juntos na rua de pedestres do Lago Hoan Kiem.

A Catedral de Notre Dame, na cidade de Ho Chi Minh, está brilhantemente iluminada para dar as boas-vindas ao Natal de 2025.

As jovens de Hanói se vestem lindamente para a época natalina.

Após a tempestade e a inundação, a vila de crisântemos de Tet, em Gia Lai, se recuperou e espera que não haja mais cortes de energia para salvar as plantas.