
Os programas de inteligência artificial alcançaram muitos avanços nos últimos anos - Foto: REUTERS
Não podemos observar todo o processo, desde a entrada de dados até a saída, de grandes modelos de linguagem (LLMs).
Para facilitar a compreensão, os cientistas usaram termos comuns como "raciocínio" para descrever como esses programas funcionam. Eles também afirmam que os programas podem "pensar", "raciocinar" e "compreender" da mesma forma que os humanos.
Exagerar as capacidades da IA.
Nos últimos dois anos, muitos executivos de IA têm usado linguagem exagerada para dar destaque a conquistas técnicas simples, de acordo com o ZDNET, em 6 de setembro.
Em setembro de 2024, a OpenAI anunciou que seu modelo de raciocínio o1 "usa uma cadeia de raciocínio ao resolver problemas, semelhante à forma como os humanos pensam por um longo tempo quando confrontados com questões difíceis".
No entanto, os cientistas da área da IA discordam. Eles argumentam que a IA não possui inteligência semelhante à humana.
Um estudo baseado no banco de dados arXiv, realizado por uma equipe de autores da Universidade Estadual do Arizona (EUA), testou a capacidade de raciocínio da IA por meio de um experimento simples.
Os resultados sugerem que "referenciar por meio de sequências de pensamento é uma ilusão frágil", não um verdadeiro mecanismo lógico, mas meramente uma forma sofisticada de reconhecimento de padrões.
O termo "CoT" (Co-Thought Chain) permite que a IA não apenas forneça uma resposta final, mas também apresente cada etapa do raciocínio lógico, como em modelos como GPT-o1 ou DeepSeek V1.

Ilustração do modelo de linguagem GPT-2 da OpenAI - Foto: ECHOCRAFTAI
Veja o que a IA realmente faz.
A equipe de pesquisa afirmou que análises em larga escala mostraram que o LLM tende a se basear mais na semântica e em pistas superficiais do que em processos de raciocínio lógico.
"Os LLMs constroem sequências lógicas superficiais com base em associações de entrada aprendidas, muitas vezes falhando em tarefas que se desviam dos métodos de raciocínio convencionais ou de padrões familiares", explicou a equipe.
Para testar a hipótese de que o LLM apenas identifica padrões e não realiza inferências de fato, a equipe de pesquisa treinou o GPT-2, um modelo de código aberto da OpenAI lançado em 2019.
Inicialmente, o modelo foi treinado em tarefas muito simples envolvendo as 26 letras do alfabeto inglês, como reorganizar algumas letras, por exemplo, trocar "APPLE" por "EAPPL". Em seguida, a equipe alterou a tarefa e pediu ao GPT-2 para processá-la.
Os resultados mostraram que, para tarefas não incluídas nos dados de treinamento, o GPT-2 não conseguiu resolvê-las com precisão usando o CoT.
Em vez disso, o modelo tenta aplicar as tarefas aprendidas da forma mais fiel possível. Portanto, seu "raciocínio" pode parecer lógico, mas os resultados geralmente estão errados.
O grupo concluiu que não se deve confiar demasiadamente ou cegamente nas respostas da LLM, pois elas podem produzir "afirmações sem sentido, mas muito convincentes".
Eles também enfatizaram a necessidade de compreender a verdadeira natureza da IA, evitar exageros e parar de promover a ideia de que a IA possui habilidades de raciocínio semelhantes às humanas.
Fonte: https://tuoitre.vn/nghien-cuu-moi-ai-khong-suy-luan-nhu-con-nguoi-20250907152120294.htm







Comentário (0)