Es wurden bereits zahlreiche Versuche unternommen, die Leistungsfähigkeit künstlicher Intelligenz (KI) und großer Sprachmodelle (LLMs) zur Vorhersage der Ergebnisse neuer chemischer Reaktionen zu nutzen. Der Erfolg war jedoch begrenzt, vor allem weil diese Modelle nicht an fundamentale physikalische Prinzipien wie den Massenerhaltungssatz gebunden sind.
Ein Team am MIT hat nun einen Weg gefunden, physikalische Randbedingungen in Reaktionsvorhersagemodelle einzubeziehen und so die Genauigkeit und Zuverlässigkeit der Ergebnisse deutlich zu verbessern.

Die Arbeit, die am 20. August in der Zeitschrift Nature veröffentlicht wurde, wurde von Joonyoung Joung (jetzt Assistenzprofessor an der Kookmin University, Südkorea), dem ehemaligen Softwareingenieur Mun Hong Fong (jetzt an der Duke University), dem Chemieingenieur-Doktoranden Nicholas Casetti, dem Postdoktoranden Jordan Liles, dem Physikstudenten Ne Dassanayake und dem Erstautor Connor Coley, einem 1957 Career Development Professor im Department of Chemical Engineering und im Department of Electrical Science & Engineering, gemeinsam verfasst.
Warum ist die Reaktionsvorhersage wichtig?
„Die Vorhersage des Reaktionsausgangs ist eine sehr wichtige Aufgabe“, erklärt Joung. Wenn man beispielsweise ein neues Medikament entwickeln möchte, „muss man wissen, wie man es synthetisiert. Dazu muss man wissen, welche Produkte aus einer Reihe von Ausgangsmaterialien wahrscheinlich entstehen.“
Bisherige Versuche haben sich oft nur mit Eingangs- und Ausgangsdaten befasst und dabei Zwischenschritte und physikalische Beschränkungen wie die Unfähigkeit, auf natürliche Weise Masse zu erzeugen oder zu verlieren, ignoriert.
Joung weist darauf hin, dass LLMs wie ChatGPT zwar in der Forschung einige Erfolge erzielt haben, ihnen aber ein Mechanismus fehlt, der sicherstellt, dass ihre Ergebnisse den Gesetzen der Physik entsprechen. „Ohne die Erhaltung der ‚Tokens‘ (die Atome repräsentieren) erzeugen oder zerstören LLMs willkürlich Atome in der Reaktion“, sagt er. „Das ist eher Alchemie als Wissenschaft.“
FlowerER-Lösung: Basierend auf einer alten Plattform, angewendet auf neue Technologie
Um dieses Problem zu lösen, nutzte das Team eine in den 1970er Jahren von dem Chemiker Ivar Ugi entwickelte Methode – die Bindungselektronenmatrix –, um Elektronen in einer Reaktion darzustellen.
Darauf aufbauend entwickelten sie das FlowER-Programm (Flow matching for Electron Redistribution), das eine detaillierte Verfolgung der Elektronenbewegung ermöglicht und sicherstellt, dass keine Elektronen künstlich hinzugefügt oder verloren gehen.
Diese Matrix verwendet einen Wert ungleich null, um eine Bindung oder ein freies Elektronenpaar darzustellen, und null für das Gegenteil. „Dadurch können wir sowohl das Atom als auch das Elektron erhalten“, erklärt Fong. Dies ist entscheidend für die Integration der Massenerhaltung in das Modell.
Erste, aber vielversprechende Hinweise
Laut Coley handelt es sich bei dem aktuellen System lediglich um eine Demonstration – einen Machbarkeitsnachweis, der zeigt, dass die Methode des „Flow Matching“ gut geeignet ist, chemische Reaktionen vorherzusagen.
Obwohl die Datenbank mit Daten aus über einer Million chemischer Reaktionen (aus dem US-Patentamt) trainiert wurde, fehlen ihr immer noch metall- und katalytisch basierte Reaktionen.
„Wir freuen uns, dass das System den Reaktionsmechanismus zuverlässig vorhersagen kann“, sagte Coley. „Es erhält die Masse, es erhält die Elektronen, aber es gibt sicherlich Möglichkeiten, die Robustheit in den kommenden Jahren zu erweitern und zu verbessern.“
Das Modell ist nun öffentlich auf GitHub verfügbar. Coley hofft, dass es ein nützliches Werkzeug zur Beurteilung der Reaktivität und zur Erstellung von Reaktionskarten sein wird.
Offene Datenquellen und breites Anwendungspotenzial
„Wir haben alles öffentlich gemacht – vom Modell über die Daten bis hin zu einem früheren Datensatz von Joung, der die bekannten mechanistischen Schritte der Reaktion detailliert beschreibt“, sagte Fong.
Dem Team zufolge kann FlowER bestehende Methoden bei der Ermittlung von Standardmechanismen erreichen oder sogar übertreffen und gleichzeitig auf bisher unbekannte Reaktionsklassen angewendet werden. Die potenziellen Anwendungsgebiete reichen von der pharmazeutischen Chemie über die Materialforschung , die Brandforschung und die Atmosphärenchemie bis hin zu elektrochemischen Systemen.
Im Vergleich zu anderen Systemen, so Coley, „erreichen wir mit der von uns gewählten Architektur einen Quantensprung in Bezug auf Validität und Integrität bei gleichzeitiger Beibehaltung oder sogar leichter Verbesserung der Genauigkeit.“
Das Besondere an dem Modell, so Coley, ist, dass es keine Mechanismen „erfindet“, sondern sie anhand experimenteller Daten aus der Patentliteratur ableitet. „Wir extrahieren Mechanismen aus experimentellen Daten – etwas, das in diesem Umfang noch nie zuvor gemacht und geteilt wurde.“
Nächster Schritt
Das Team plant, das Verständnis des Modells für Metalle und Katalyse zu erweitern. „Wir haben erst an der Oberfläche gekratzt“, räumt Coley ein.
Langfristig, so glaubt er, könne das System dazu beitragen, neue komplexe Reaktionen zu entdecken und bisher unbekannte Mechanismen aufzuklären. „Das langfristige Potenzial ist enorm, aber das ist erst der Anfang.“
Die Forschung wurde vom Konsortium Machine Learning for Pharmaceutical Discovery and Synthesis und der US National Science Foundation (NSF) unterstützt.
(Quelle: MIT)
Quelle: https://vietnamnet.vn/moi-hinh-ai-moi-du-doan-phan-ung-hoa-hoc-chinh-xac-nho-bao-toan-khoi-luong-2444232.html






Kommentar (0)