O chatbot da OpenAI está em constante aprimoramento por meio de novas tecnologias. Foto: New York Times . |
Em setembro de 2024, a OpenAI lançou o ChatGPT, uma versão da IA que integra o modelo o1, capaz de raciocinar em tarefas relacionadas à matemática, ciência e programação de computadores.
Diferentemente da versão anterior do ChatGPT, a nova tecnologia levará um tempo para "pensar" em soluções para problemas complexos antes de fornecer uma resposta.
Seguindo os passos da OpenAI, muitos concorrentes como Google, Anthropic e DeepSeek também introduziram modelos de raciocínio semelhantes. Embora não seja perfeita, essa ainda é uma tecnologia de aprimoramento de chatbots na qual muitos desenvolvedores confiam.
Como a IA raciocina
Essencialmente, o raciocínio significa que os chatbots podem dedicar mais tempo à resolução de problemas apresentados pelos usuários.
"O raciocínio é a forma como o sistema realiza trabalho adicional após receber uma pergunta", disse Dan Klein, professor de ciência da computação da Universidade da Califórnia, ao New York Times .
Um sistema lógico pode decompor um problema em etapas menores e individuais, ou resolvê-lo por meio de tentativa e erro.
Quando foi lançado, o ChatGPT conseguia responder perguntas instantaneamente, extraindo e sintetizando informações. Em contraste, os sistemas de raciocínio precisavam de alguns segundos (ou até minutos) a mais para resolver o problema e fornecer uma resposta.
![]() |
Um exemplo do processo de raciocínio do modelo O1 em um chatbot de atendimento ao cliente. Imagem: OpenAI . |
Em alguns casos, o sistema de raciocínio mudará sua abordagem ao problema, aprimorando continuamente a solução. Além disso, o modelo pode testar várias soluções antes de fazer uma escolha ideal ou verificar a precisão das respostas anteriores.
Em geral, o sistema de raciocínio considerará todas as respostas possíveis para a pergunta. Isso é semelhante a alunos do ensino fundamental que anotam várias opções no papel antes de escolher a solução mais adequada para um problema de matemática.
Segundo o New York Times , a inteligência artificial já é capaz de raciocinar sobre praticamente qualquer assunto. No entanto, ela será mais eficaz em questões relacionadas à matemática, ciência e programação de computadores.
Como o sistema teórico é treinado?
Em um chatbot típico, os usuários ainda podem solicitar explicações sobre o processo ou verificar a precisão da resposta. Aliás, muitos conjuntos de dados de treinamento do ChatGPT já incluem procedimentos de resolução de problemas.
O sistema de raciocínio torna-se ainda mais avançado quando consegue realizar operações sem intervenção do usuário. Esse processo é mais complexo e abrangente. As empresas utilizam o termo "raciocínio" porque o sistema opera de forma semelhante ao pensamento humano.
Muitas empresas, como a OpenAI, acreditam que os sistemas de raciocínio serão a melhor solução disponível atualmente para aprimorar os chatbots. Durante anos, elas acreditaram que os chatbots teriam um desempenho melhor quanto mais informações fossem utilizadas para seu treinamento na internet.
Até 2024, os sistemas de IA terão consumido quase todo o texto disponível na internet. Isso significa que as empresas precisam encontrar novas soluções para aprimorar os chatbots, incluindo sistemas de raciocínio.
![]() |
A startup DeepSeek causou sensação com seu modelo de raciocínio que tinha custos mais baixos que o da OpenAI. Foto: Bloomberg . |
Desde o ano passado, empresas como a OpenAI têm se concentrado em técnicas de aprendizado por reforço. Esse processo normalmente leva vários meses, durante os quais a IA aprende comportamentos por meio de tentativa e erro.
Por exemplo, ao resolver milhares de problemas, o sistema consegue identificar o método ideal para chegar à resposta correta. A partir daí, os pesquisadores desenvolvem mecanismos de feedback sofisticados que ajudam o sistema a distinguir entre soluções corretas e incorretas.
"É semelhante a como você treina um cachorro. Se o sistema funcionar bem, você dá um petisco. Caso contrário, você diz: 'Esse cachorro é travesso'", compartilhou Jerry Tworek, pesquisador da OpenAI.
A inteligência artificial é o futuro?
Segundo o New York Times , as técnicas de aprendizado por reforço são eficazes para lidar com requisitos em matemática, ciências e programação de computadores. Essas são áreas onde respostas corretas ou incorretas podem ser claramente definidas.
Por outro lado, o aprendizado por reforço é ineficaz na escrita, filosofia ou ética — áreas em que distinguir entre o bem e o mal é difícil. Mesmo assim, pesquisadores afirmam que essa técnica ainda pode melhorar o desempenho da IA, inclusive em questões não matemáticas.
"Os sistemas aprenderão os caminhos que levam a resultados positivos e negativos", disse Jared Kaplan, Diretor Científico da Anthropic.
![]() |
Site da Anthropic, a startup proprietária do modelo de IA Claude. Foto: Bloomberg . |
É importante notar que aprendizado por reforço e sistemas de raciocínio são dois conceitos diferentes. Especificamente, o aprendizado por reforço é um método para construir sistemas de raciocínio. Esta é a etapa final de treinamento para permitir que os chatbots raciocinem.
Por ser uma área relativamente nova, os cientistas ainda não podem afirmar com certeza se o raciocínio de chatbots ou o aprendizado por reforço podem ajudar a IA a pensar como humanos. Vale ressaltar que muitas tendências atuais de treinamento de IA se desenvolvem muito rapidamente no início e depois desaceleram gradualmente.
Além disso, o raciocínio dos chatbots ainda pode cometer erros. Com base na probabilidade, o sistema escolherá o processo que mais se assemelha aos dados que aprendeu, seja da internet ou por meio de aprendizado por reforço. Portanto, os chatbots ainda podem escolher soluções incorretas ou ilógicas.
Fonte: https://znews.vn/ai-ly-luan-nhu-the-nao-post1541477.html










Comentário (0)