O chatbot da OpenAI continua a ser aprimorado por meio de novas tecnologias. Foto: New York Times . |
Em setembro de 2024, a OpenAI lançou uma versão do ChatGPT que integra o modelo o1, capaz de raciocinar sobre tarefas relacionadas à matemática, ciência e programação de computadores.
Diferentemente da versão anterior do ChatGPT, a nova tecnologia levará um tempo para "pensar" em soluções para problemas complexos antes de dar uma resposta.
Após a OpenAI, muitos concorrentes como Google, Anthropic e DeepSeek também introduziram modelos de raciocínio semelhantes. Embora não seja perfeita, essa ainda é uma tecnologia de aprimoramento de chatbots na qual muitos desenvolvedores confiam.
Como a IA raciocina
Basicamente, o raciocínio significa que o chatbot pode dedicar mais tempo à resolução do problema apresentado pelo usuário.
“O raciocínio é a forma como o sistema realiza trabalho adicional depois de receber uma pergunta”, disse Dan Klein, professor de ciência da computação da Universidade da Califórnia, ao New York Times .
O sistema de raciocínio pode decompor um problema em etapas individuais ou resolvê-lo por meio de tentativa e erro.
Quando foi lançado, o ChatGPT conseguia responder perguntas instantaneamente, extraindo e sintetizando informações. Entretanto, o sistema de raciocínio precisava de alguns segundos (ou até minutos) a mais para resolver o problema e fornecer uma resposta.
![]() |
Exemplo do processo de raciocínio do modelo o1 em um chatbot de atendimento ao cliente. Foto: OpenAI . |
Em alguns casos, o sistema de raciocínio mudará sua abordagem ao problema, aprimorando continuamente a solução. Alternativamente, o modelo pode tentar várias soluções antes de se decidir pela escolha ideal, ou testar a precisão das respostas anteriores.
Em geral, o sistema de raciocínio considerará todas as respostas possíveis para a pergunta. Isso é semelhante a um aluno do ensino fundamental anotando várias respostas possíveis em um pedaço de papel antes de escolher a maneira mais adequada de resolver um problema de matemática.
Segundo o New York Times , a IA agora é capaz de raciocinar sobre qualquer assunto. No entanto, a tarefa será mais eficaz com questões relacionadas à matemática, ciências e programação de computadores.
Como o sistema teórico é treinado?
Em um chatbot típico, os usuários ainda podem pedir explicações sobre o processo ou verificar se uma resposta está correta. Aliás, muitos conjuntos de dados de treinamento do ChatGPT já incluem um processo de resolução de problemas.
Um sistema de raciocínio vai ainda mais longe quando consegue executar uma ação sem que o usuário precise pedir. O processo é mais complexo e abrangente. As empresas usam a palavra "raciocínio" porque o sistema funciona de maneira semelhante ao pensamento humano.
Muitas empresas, como a OpenAI, apostam que os sistemas de raciocínio são a melhor maneira de aprimorar os chatbots. Durante anos, acreditou-se que os chatbots funcionariam melhor se fossem treinados com o máximo de informações possível disponíveis na internet.
Até 2024, os sistemas de IA terão consumido quase todo o texto disponível na internet. Isso significa que as empresas precisarão encontrar novas soluções para aprimorar os chatbots, incluindo sistemas de raciocínio.
![]() |
A startup DeepSeek certa vez "causou alvoroço" com um modelo de raciocínio que custava menos que o da OpenAI. Foto: Bloomberg . |
Desde o ano passado, empresas como a OpenAI têm se concentrado em uma técnica chamada aprendizado por reforço, um processo que normalmente leva vários meses, no qual a IA aprende comportamentos por meio de tentativa e erro.
Por exemplo, ao resolver milhares de problemas, o sistema pode aprender o método ideal para obter a resposta correta. A partir daí, os pesquisadores construíram mecanismos de feedback complexos que ajudam o sistema a aprender as soluções certas e erradas.
“É como treinar um cachorro. Se ele se comporta bem, você dá um petisco. Se ele se comporta mal, você diz: ‘Esse cachorro é mau’”, disse Jerry Tworek, pesquisador da OpenAI.
A inteligência artificial é o futuro?
Segundo o New York Times , o aprendizado por reforço funciona bem com questões de matemática, ciências e programação de computadores, onde existem respostas certas ou erradas claramente definidas.
Em contrapartida, o aprendizado por reforço não é tão eficaz na escrita criativa, filosofia ou ética, áreas onde é difícil distinguir entre o bem e o mal. Mas os pesquisadores afirmam que a técnica ainda pode melhorar o desempenho da IA, mesmo em questões fora da matemática.
“Os sistemas aprenderão os caminhos que levam a resultados positivos e negativos”, disse Jared Kaplan, Diretor Científico da Anthropic.
![]() |
Site da Anthropic, a startup proprietária do modelo de IA Claude. Foto: Bloomberg . |
É importante notar que aprendizado por reforço e sistemas de raciocínio são dois conceitos diferentes. Especificamente, o aprendizado por reforço é um método para construir sistemas de raciocínio. Esta é a etapa final de treinamento para que os chatbots adquiram capacidades de raciocínio.
Por serem ainda relativamente novas, os cientistas não podem ter certeza se os chatbots de raciocínio ou o aprendizado por reforço podem ajudar a IA a pensar como humanos. É importante notar que muitas tendências atuais no treinamento de IA se desenvolvem muito rapidamente no início e depois se estabilizam gradualmente.
Além disso, chatbots racionais ainda podem cometer erros. Com base na probabilidade, o sistema escolherá o processo mais semelhante aos dados que aprendeu, sejam eles provenientes da internet ou de aprendizado por reforço. Portanto, chatbots ainda podem escolher a solução errada ou inadequada.
Fonte: https://znews.vn/ai-ly-luan-nhu-the-nao-post1541477.html













Comentário (0)