Se han realizado numerosos intentos para aprovechar el poder de la inteligencia artificial (IA) y los grandes modelos de lenguaje (GML) para predecir los resultados de nuevas reacciones químicas. Sin embargo, el éxito ha sido limitado, principalmente porque estos modelos no se basan en principios físicos fundamentales como la ley de conservación de la masa.
Ahora, un equipo del MIT ha encontrado una manera de incorporar restricciones físicas en los modelos de predicción de reacciones, mejorando significativamente la precisión y la fiabilidad de los resultados.

El trabajo, publicado el 20 de agosto en la revista Nature, fue coescrito por Joonyoung Joung (actualmente profesor asistente en la Universidad Kookmin, Corea del Sur), el ex ingeniero de software Mun Hong Fong (actualmente en la Universidad de Duke), el estudiante de posgrado en ingeniería química Nicholas Casetti, el investigador postdoctoral Jordan Liles, el estudiante de física Ne Dassanayake y el autor principal Connor Coley, profesor de desarrollo profesional de 1957 en el Departamento de Ingeniería Química y el Departamento de Ciencia e Ingeniería Eléctrica.
¿Por qué es importante la predicción de reacciones?
«Predecir el resultado de una reacción es una tarea muy importante», explica Joung. Por ejemplo, si se quiere fabricar un nuevo fármaco, «es necesario saber cómo sintetizarlo. Esto requiere conocer qué productos es probable que aparezcan» a partir de un conjunto de materiales de partida.
Los intentos anteriores a menudo solo se han fijado en los datos de entrada y salida, ignorando los pasos intermedios y las limitaciones físicas, como la incapacidad de crear o perder masa de forma natural.
Joung señala que, si bien los algoritmos de aprendizaje automático (LLM, por sus siglas en inglés), como ChatGPT, han tenido cierto éxito en la investigación, carecen de un mecanismo que garantice que sus resultados se ajusten a las leyes de la física. «Sin conservar los "tokens" (que representan átomos), los LLM crearán o destruirán átomos arbitrariamente en la reacción», afirma. «Esto se asemeja más a la alquimia que a la ciencia».
Solución FlowerER: Basada en una plataforma antigua, aplicada a la nueva tecnología.
Para superar este obstáculo, el equipo utilizó un método de la década de 1970 desarrollado por el químico Ivar Ugi –la matriz de electrones de enlace– para representar los electrones en una reacción.
Sobre esa base, desarrollaron el programa FlowER (Flow matching for Electron Redistribution), que permite un seguimiento detallado del movimiento de los electrones, asegurando que no se agreguen ni se pierdan electrones artificialmente.
Esta matriz utiliza un valor distinto de cero para representar un enlace o un par de electrones libres, y cero para lo contrario. «Esto nos permite conservar tanto el átomo como el electrón», explica Fong. Esto es fundamental para incorporar la conservación de la masa al modelo.
Evidencia temprana pero prometedora
Según Coley, el sistema actual es solo una demostración, una prueba de concepto que muestra que el método de "ajuste de flujo" es muy adecuado para predecir reacciones químicas.
A pesar de haber sido entrenada con datos de más de un millón de reacciones químicas (recopilados de la Oficina de Patentes de EE. UU.), la base de datos aún carece de reacciones basadas en metales y catalizadores.
“Nos entusiasma que el sistema pueda predecir de forma fiable el mecanismo de reacción”, dijo Coley. “Conserva la masa, conserva los electrones, pero sin duda hay maneras de ampliar y mejorar su robustez en los próximos años”.
El modelo ya está disponible públicamente en GitHub. Coley espera que sea una herramienta útil para evaluar la reactividad y crear mapas de respuesta.
Fuentes de datos abiertas y amplio potencial de aplicación
“Hicimos público todo: desde el modelo hasta los datos, pasando por un conjunto de datos anterior creado por Joung que detallaba los pasos mecánicos conocidos de la reacción”, dijo Fong.
Según el equipo, FlowER puede igualar o superar los métodos existentes en la identificación de mecanismos estándar, además de generalizar a clases de reacciones hasta ahora desconocidas. Sus aplicaciones potenciales abarcan desde la química farmacéutica, el descubrimiento de materiales, la investigación de incendios y la química atmosférica, hasta los sistemas electroquímicos.
En comparación con otros sistemas, señala Coley: “Con la arquitectura que elegimos, logramos un salto cualitativo en validez e integridad, manteniendo o incluso mejorando ligeramente la precisión”.
Lo singular, según Coley, es que el modelo no «inventa» mecanismos, sino que los infiere a partir de datos experimentales de la literatura de patentes. «Estamos extrayendo mecanismos de datos experimentales, algo que nunca se había hecho ni compartido a esta escala».
Siguiente paso
El equipo planea ampliar la comprensión del modelo sobre los metales y la catálisis. "Apenas hemos empezado", admite Coley.
A largo plazo, cree que el sistema podría ayudar a descubrir nuevas reacciones complejas, además de esclarecer mecanismos hasta ahora desconocidos. «El potencial a largo plazo es enorme, pero esto es solo el principio».
La investigación contó con el apoyo del consorcio Machine Learning for Pharmaceutical Discovery and Synthesis y la Fundación Nacional de Ciencias de Estados Unidos (NSF).
(Fuente: MIT)
Fuente: https://vietnamnet.vn/moi-hinh-ai-moi-du-doan-phan-ung-hoa-hoc-chinh-xac-nho-bao-toan-khoi-luong-2444232.html






Kommentar (0)