Se han hecho muchos intentos para aprovechar el poder de la inteligencia artificial (IA) y los grandes modelos de lenguaje (LLM) para predecir los resultados de nuevas reacciones químicas. Sin embargo, el éxito ha sido limitado, en gran medida porque estos modelos no están vinculados a principios físicos fundamentales como la ley de conservación de la masa.

Ahora, un equipo del MIT ha encontrado una manera de incorporar restricciones físicas en los modelos de predicción de reacciones, mejorando significativamente la precisión y confiabilidad de los resultados.

Imagen de la lección 86.png
El sistema FlowER (Flow Matching for Electron Redistribution) permite un seguimiento detallado del movimiento de los electrones, garantizando que no se añadan ni se pierdan electrones artificialmente. Foto: MIT News

El trabajo, publicado el 20 de agosto en la revista Nature, fue coescrito por Joonyoung Joung (ahora profesor asistente en la Universidad Kookmin, Corea del Sur), el ex ingeniero de software Mun Hong Fong (ahora en la Universidad de Duke), el estudiante de posgrado en ingeniería química Nicholas Casetti, el investigador postdoctoral Jordan Liles, el estudiante de física Ne Dassanayake y el autor principal Connor Coley, profesor de Desarrollo Profesional de 1957 en el Departamento de Ingeniería Química y el Departamento de Ciencias e Ingeniería Eléctrica.

¿Por qué es importante la predicción de reacciones?

“Predecir el resultado de una reacción es una tarea muy importante”, explica Joung. Por ejemplo, si se quiere crear un nuevo fármaco, “se necesita saber cómo sintetizarlo. Esto requiere saber qué productos es probable que surjan” a partir de un conjunto de materiales de partida.

Los intentos anteriores a menudo se han centrado únicamente en los datos de entrada y salida, ignorando los pasos intermedios y las limitaciones físicas, como la incapacidad de crear o perder masa de forma natural.

Joung señala que, si bien los LLM como ChatGPT han tenido cierto éxito en la investigación, carecen de un mecanismo que garantice que sus resultados cumplan las leyes de la física. «Sin conservar las 'fichas' (que representan átomos), los LLM crearán o destruirán átomos arbitrariamente en la reacción», afirma. «Esto se parece más a la alquimia que a la ciencia».

Solución FlowerER: Basada en plataforma antigua, aplicada a nueva tecnología

Para superar esto, el equipo utilizó un método de la década de 1970 desarrollado por el químico Ivar Ugi –la matriz de enlaces electrónicos– para representar a los electrones en una reacción.

En base a esto, desarrollaron el programa FlowER (Flow Matching for Electron Redistribution), que permite un seguimiento detallado del movimiento de los electrones, garantizando que no se añadan ni se pierdan electrones artificialmente.

Esta matriz utiliza un valor distinto de cero para representar un enlace o un par de electrones libres, y cero para lo contrario. «Esto nos permite conservar tanto el átomo como el electrón», explica Fong. Esto es clave para incorporar la conservación de la masa en el modelo.

Evidencia temprana pero prometedora

Según Coley, el sistema actual es sólo una demostración: una prueba de concepto que muestra que el método de “adaptación de flujo” es muy adecuado para predecir reacciones químicas.

A pesar de haber sido entrenada con datos de más de un millón de reacciones químicas (recopilados de la Oficina de Patentes de EE. UU.), la base de datos aún carece de reacciones basadas en metales y catalizadores.

“Nos entusiasma que el sistema pueda predecir con fiabilidad el mecanismo de reacción”, dijo Coley. “Conserva la masa y los electrones, pero sin duda hay maneras de ampliar y mejorar su robustez en los próximos años”.

El modelo ya está disponible públicamente en GitHub. Coley espera que sea una herramienta útil para evaluar la reactividad y crear mapas de respuesta.

Fuentes de datos abiertas y amplio potencial de aplicación

“Hicimos público todo: desde el modelo hasta los datos y un conjunto de datos previo creado por Joung que detallaba los pasos mecanísticos conocidos de la reacción”, dijo Fong.

Según el equipo, FlowER puede igualar o incluso superar los métodos existentes en la búsqueda de mecanismos estándar, a la vez que se generaliza a clases de reacciones nunca antes vistas. Sus posibles aplicaciones abarcan desde la química farmacéutica, el descubrimiento de materiales, la investigación sobre incendios, la química atmosférica y los sistemas electroquímicos.

En comparación con otros sistemas, Coley señala: “Con la elección arquitectónica que utilizamos, logramos un salto cuántico en validez e integridad, al tiempo que mantenemos o mejoramos ligeramente la precisión”.

Lo singular, dice Coley, es que el modelo no "inventa" mecanismos, sino que los infiere a partir de datos experimentales de la literatura de patentes. "Estamos extrayendo mecanismos de datos experimentales, algo que nunca se había hecho ni compartido a esta escala".

Siguiente paso

El equipo planea ampliar la comprensión del modelo sobre los metales y los ciclos catalíticos. «Solo hemos arañado la superficie», admite Coley.

A largo plazo, cree que el sistema podría ayudar a descubrir nuevas reacciones complejas, además de arrojar luz sobre mecanismos previamente desconocidos. «El potencial a largo plazo es enorme, pero esto es solo el principio».

La investigación fue apoyada por el consorcio Machine Learning for Pharmaceutical Discovery and Synthesis y la Fundación Nacional de Ciencias de EE. UU. (NSF).

(Fuente: MIT)

Fuente: https://vietnamnet.vn/moi-hinh-ai-moi-du-doan-phan-ung-hoa-hoc-chinh-xac-nho-bao-toan-khoi-luong-2444232.html