Muitas tentativas foram feitas para aproveitar o poder da inteligência artificial (IA) e de grandes modelos de linguagem (LLMs) para prever os resultados de novas reações químicas. No entanto, o sucesso tem sido limitado, principalmente porque esses modelos não estão vinculados a princípios físicos fundamentais, como a lei da conservação da massa.
Agora, uma equipe do MIT descobriu uma maneira de incorporar restrições físicas em modelos de previsão de reações, melhorando significativamente a precisão e a confiabilidade dos resultados.

O trabalho, publicado em 20 de agosto na revista Nature, teve como coautores Joonyoung Joung (atualmente professor assistente na Universidade Kookmin, Coreia do Sul), o ex-engenheiro de software Mun Hong Fong (atualmente na Universidade Duke), o estudante de pós-graduação em engenharia química Nicholas Casetti, o pesquisador de pós-doutorado Jordan Liles, o estudante de física Ne Dassanayake e o autor principal Connor Coley, professor de Desenvolvimento de Carreira de 1957 no Departamento de Engenharia Química e no Departamento de Ciência e Engenharia Elétrica.
Por que a previsão de reações é importante?
“Prever o resultado de uma reação é uma tarefa muito importante”, explica Joung. Por exemplo, se você quiser criar um novo medicamento, “precisa saber como sintetizá-lo. Isso requer saber quais produtos provavelmente aparecerão” a partir de um conjunto de materiais de partida.
Tentativas anteriores muitas vezes analisaram apenas os dados de entrada e saída, ignorando etapas intermediárias e limitações físicas, como a impossibilidade de criar ou perder massa naturalmente.
Joung destaca que, embora os LLMs como o ChatGPT tenham tido algum sucesso em pesquisas, eles carecem de um mecanismo para garantir que seus resultados sigam as leis da física. "Sem conservar os 'tokens' (que representam átomos), os LLMs criarão ou destruirão átomos arbitrariamente na reação", afirma. "Isso se assemelha mais à alquimia do que à ciência."
Solução FlowerER: Baseada em plataforma antiga, aplicada a uma nova tecnologia.
Para superar esse problema, a equipe utilizou um método desenvolvido na década de 1970 pelo químico Ivar Ugi – a matriz de elétrons de ligação – para representar os elétrons em uma reação.
Com base nisso, eles desenvolveram o programa FlowER (Flow matching for Electron Redistribution), que permite o rastreamento detalhado do movimento dos elétrons, garantindo que nenhum elétron seja adicionado ou perdido artificialmente.
Essa matriz usa um valor diferente de zero para representar uma ligação ou um par de elétrons livres, e zero para o oposto. "Isso nos permite conservar tanto o átomo quanto o elétron", explica Fong. Isso é fundamental para incorporar a conservação da massa ao modelo.
Evidências iniciais, mas promissoras.
Segundo Coley, o sistema atual é apenas uma demonstração — uma prova de conceito que mostra que o método de "correspondência de fluxo" é adequado para prever reações químicas.
Apesar de ter sido treinada com dados de mais de um milhão de reações químicas (coletados do Escritório de Patentes dos EUA), a base de dados ainda carece de reações baseadas em metais e catalisadores.
“Estamos entusiasmados com o fato de o sistema conseguir prever o mecanismo de reação de forma confiável”, disse Coley. “Ele conserva massa, conserva elétrons, mas certamente existem maneiras de expandir e aprimorar a robustez nos próximos anos.”
O modelo já está disponível publicamente no GitHub. Coley espera que ele seja uma ferramenta útil para avaliar a reatividade e construir mapas de resposta.
Fontes de dados abertas e amplo potencial de aplicação
“Tornamos tudo público — desde o modelo, aos dados, até um conjunto de dados anterior criado por Joung que detalhava as etapas mecanísticas conhecidas da reação”, disse Fong.
Segundo a equipe, o FlowER pode igualar ou superar os métodos existentes na descoberta de mecanismos padrão, além de generalizar para classes de reações nunca antes vistas. As aplicações potenciais variam da química farmacêutica, descoberta de materiais, pesquisa de incêndios, química atmosférica a sistemas eletroquímicos.
Em comparação com outros sistemas, Coley observa: "Com a escolha arquitetônica que utilizamos, alcançamos um salto qualitativo em validade e integridade, mantendo ou melhorando ligeiramente a precisão."
O diferencial, segundo Coley, é que o modelo não "inventa" mecanismos, mas sim os infere com base em dados experimentais da literatura de patentes. "Estamos extraindo mecanismos de dados experimentais — algo que nunca foi feito e compartilhado nessa escala."
Próximo passo
A equipe planeja expandir a compreensão do modelo sobre metais e catálise. "Ainda estamos apenas arranhando a superfície", admite Coley.
A longo prazo, ele acredita que o sistema poderá ajudar a descobrir novas reações complexas, bem como elucidar mecanismos até então desconhecidos. "O potencial a longo prazo é enorme, mas isso é apenas o começo."
A pesquisa recebeu apoio do consórcio Machine Learning for Pharmaceutical Discovery and Synthesis e da Fundação Nacional de Ciência dos EUA (NSF).
(Fonte: MIT)
Fonte: https://vietnamnet.vn/moi-hinh-ai-moi-du-doan-phan-ung-hoa-hoc-chinh-xac-nho-bao-toan-khoi-luong-2444232.html






Comentário (0)