Muitas tentativas foram feitas para aproveitar o poder da inteligência artificial (IA) e dos grandes modelos de linguagem (LLMs) para prever os resultados de novas reações químicas. No entanto, o sucesso tem sido limitado, em grande parte porque esses modelos não estão vinculados a princípios físicos fundamentais, como a lei da conservação da massa.
Agora, uma equipe do MIT encontrou uma maneira de incorporar restrições físicas em modelos de previsão de reação, melhorando significativamente a precisão e a confiabilidade dos resultados.

O trabalho, publicado em 20 de agosto na revista Nature, foi coautorado por Joonyoung Joung (atualmente professor assistente na Universidade Kookmin, Coreia do Sul), o ex-engenheiro de software Mun Hong Fong (atualmente na Universidade Duke), o estudante de graduação em engenharia química Nicholas Casetti, o pesquisador de pós-doutorado Jordan Liles, o estudante de física Ne Dassanayake e o autor principal Connor Coley, professor de desenvolvimento de carreira em 1957 no Departamento de Engenharia Química e no Departamento de Ciência e Engenharia Elétrica.
Por que a previsão de reações é importante?
“Prever o resultado de uma reação é uma tarefa muito importante”, explica Joung. Por exemplo, se você quer criar um novo medicamento, “precisa saber como sintetizá-lo. Isso requer saber quais produtos provavelmente surgirão” a partir de um conjunto de materiais iniciais.
Tentativas anteriores muitas vezes analisaram apenas dados de entrada e saída, ignorando etapas intermediárias e restrições físicas, como a incapacidade de criar ou perder massa naturalmente.
Joung ressalta que, embora LLMs como o ChatGPT tenham obtido algum sucesso em pesquisa, eles carecem de um mecanismo para garantir que seus resultados sigam as leis da física. "Sem conservar os 'tokens' (que representam átomos), os LLMs criarão ou destruirão átomos arbitrariamente na reação", diz ele. "Isso se parece mais com alquimia do que com ciência."
Solução FlowerER: Baseada em plataforma antiga, aplicada a nova tecnologia
Para superar isso, a equipe usou um método desenvolvido na década de 1970 pelo químico Ivar Ugi – a matriz de elétrons de ligação – para representar elétrons em uma reação.
Com base nisso, eles desenvolveram o programa FlowER (Flow matching for Electron Redistribution), que permite o rastreamento detalhado do movimento dos elétrons, garantindo que nenhum elétron seja adicionado ou perdido artificialmente.
Esta matriz usa um valor diferente de zero para representar uma ligação ou um par de elétrons livres, e zero para o oposto. "Isso nos permite conservar tanto o átomo quanto o elétron", explica Fong. Isso é fundamental para incorporar a conservação de massa ao modelo.
Evidências iniciais, mas promissoras
De acordo com Coley, o sistema atual é apenas uma demonstração — uma prova de conceito que mostra que o método de “correspondência de fluxo” é bem adequado para prever reações químicas.
Apesar de ter sido treinado com dados de mais de um milhão de reações químicas (coletados do Escritório de Patentes dos EUA), o banco de dados ainda carece de reações baseadas em metais e catalisadores.
“Estamos entusiasmados com a capacidade do sistema de prever com confiabilidade o mecanismo de reação”, disse Coley. “Ele conserva massa, conserva elétrons, mas certamente há maneiras de expandir e melhorar sua robustez nos próximos anos.”
O modelo já está disponível publicamente no GitHub. Coley espera que seja uma ferramenta útil para avaliar a reatividade e construir mapas de resposta.
Fontes de dados abertas e amplo potencial de aplicação
“Tornamos tudo público — desde o modelo, os dados e um conjunto de dados anterior criado por Joung que detalhava as etapas mecanicistas conhecidas da reação”, disse Fong.
De acordo com a equipe, o FlowER pode igualar ou superar os métodos existentes na busca por mecanismos padrão, além de generalizar para classes de reações nunca antes vistas. As aplicações potenciais variam da química farmacêutica, descoberta de materiais, pesquisa de incêndios, química atmosférica e sistemas eletroquímicos.
Em comparação com outros sistemas, Coley observa: “Com a escolha arquitetônica que usamos, alcançamos um salto quântico em validade e integridade, ao mesmo tempo em que mantemos ou melhoramos ligeiramente a precisão”.
O que é único, diz Coley, é que o modelo não "inventa" mecanismos, mas os infere com base em dados experimentais da literatura de patentes. "Estamos extraindo mecanismos de dados experimentais — algo que nunca foi feito e compartilhado nessa escala."
Próximo passo
A equipe planeja ampliar a compreensão do modelo sobre metais e ciclos catalíticos. "Ainda arranhamos a superfície", admite Coley.
A longo prazo, ele acredita que o sistema poderá ajudar a descobrir novas reações complexas, bem como lançar luz sobre mecanismos até então desconhecidos. "O potencial a longo prazo é enorme, mas isso é apenas o começo."
A pesquisa foi apoiada pelo consórcio Machine Learning for Pharmaceutical Discovery and Synthesis e pela National Science Foundation (NSF) dos EUA.
(Fonte: MIT)
Fonte: https://vietnamnet.vn/moi-hinh-ai-moi-du-doan-phan-ung-hoa-hoc-chinh-xac-nho-bao-toan-khoi-luong-2444232.html
Comentário (0)