Számos kísérlet történt a mesterséges intelligencia (MI) és a nagy nyelvi modellek (LLM) erejének kiaknázására az új kémiai reakciók kimenetelének előrejelzésére. A siker azonban korlátozott volt, nagyrészt azért, mert ezek a modellek nem kötődnek olyan alapvető fizikai elvekhez, mint a tömegmegmaradás törvénye.

Az MIT egyik csapata most talált egy módszert a fizikai korlátok beépítésére a reakcióelőrejelzési modellekbe, jelentősen javítva az eredmények pontosságát és megbízhatóságát.

86. lecke képe.png
A FlowER (Flow matching for Electron Redistribution) rendszer lehetővé teszi az elektronok mozgásának részletes nyomon követését, biztosítva, hogy ne kerüljön sor mesterséges elektronok hozzáadására vagy elvesztésére. Fotó: MIT News

A Nature folyóiratban augusztus 20-án megjelent munka társszerzői Joonyoung Joung (jelenleg a dél-koreai Kookmin Egyetem adjunktusa), Mun Hong Fong korábbi szoftvermérnök (jelenleg a Duke Egyetemen), Nicholas Casetti vegyészmérnöki posztgraduális hallgató, Jordan Liles posztdoktori kutató, Ne Dassanayake fizikushallgató, valamint Connor Coley, a Vegyészmérnöki Tanszék és a Villamosmérnöki és Mérnöki Tanszék 1957-es karrierfejlesztési professzora voltak.

Miért fontos a reakcióelőrejelzés?

„Egy reakció kimenetelének előrejelzése nagyon fontos feladat” – magyarázza Joung. Például, ha új gyógyszert szeretne előállítani, „tudnia kell, hogyan kell szintetizálni. Ehhez tudni kell, hogy mely termékek jelennek meg valószínűleg” egy adott kiindulási anyagkészletből.

A korábbi kísérletek gyakran csak a bemeneti és kimeneti adatokat vizsgálták, figyelmen kívül hagyva a köztes lépéseket és a fizikai korlátokat, például a tömeg természetes létrehozásának vagy elvesztésének képtelenségét.

Joung rámutat, hogy bár az olyan LLM-ek, mint a ChatGPT, elértek némi sikert a kutatásban, hiányzik belőlük egy olyan mechanizmus, amely biztosítaná, hogy eredményeik a fizika törvényeit kövessék. „A »tokenek« (az atomokat jelölő elemek) megőrzése nélkül az LLM-ek önkényesen létrehoznak vagy elpusztítanak atomokat a reakcióban” – mondja. „Ez inkább alkímiához hasonlít, mint tudományhoz.”

FlowerER megoldás: Régi platformon alapul, új technológiára alkalmazva

Ennek leküzdésére a csapat egy Ivar Ugi vegyész által az 1970-es években kidolgozott módszert – a kötés-elektron mátrixot – használt az elektronok reakcióban való ábrázolására.

Ennek alapján fejlesztették ki a FlowER (Flow matching for Electron Redistribution) programot, amely lehetővé teszi az elektronok mozgásának részletes nyomon követését, biztosítva, hogy ne kerüljön mesterségesen hozzáadásra vagy elvesztésre elektron.

Ez a mátrix egy nem nulla értéket használ a kötés vagy a szabad elektronpár ábrázolására, és nullát az ellenkezőjükre. „Ez lehetővé teszi számunkra, hogy mind az atomot, mind az elektront megőrizzük” – magyarázza Fong. Ez kulcsfontosságú a tömegmegmaradás modellbe való beépítéséhez.

Korai, de ígéretes bizonyítékok

Coley szerint a jelenlegi rendszer csupán egy demonstráció – egy koncepcióbizonyítás, amely azt mutatja, hogy az „áramlási illesztés” módszer jól alkalmas a kémiai reakciók előrejelzésére.

Annak ellenére, hogy több mint egymillió kémiai reakcióból származó adatokkal képezték ki (az Egyesült Államok Szabadalmi Hivatalától gyűjtött adatokkal), az adatbázisból továbbra sem hiányoznak a fém- és katalitikus alapú reakciók.

„Izgatottak vagyunk, hogy a rendszer megbízhatóan képes megjósolni a reakciómechanizmust” – mondta Coley. „Tömeget és elektronokat takarít meg, de minden bizonnyal vannak módok a robusztusság bővítésére és javítására az elkövetkező években.”

A modell mostantól nyilvánosan elérhető a GitHubon. Coley reményei szerint hasznos eszköz lesz a reaktivitás felmérésére és a választérképek elkészítésére.

Nyílt adatforrások és széleskörű alkalmazási lehetőségek

„Mindent nyilvánosságra hoztunk – a modelltől kezdve az adatokon át egészen a Joung által korábban összeállított adathalmazig, amely részletesen ismertette a reakció ismert mechanizmusának lépéseit” – mondta Fong.

A csapat szerint a FlowER képes megfelelni a meglévő módszereknek, vagy akár túl is szárnyalni azokat a standard mechanizmusok megtalálásában, miközben általánosítható a korábban nem ismert reakcióosztályokra is. A lehetséges alkalmazások a gyógyszerkémiától, az anyagfelfedezésen , a tűzkutatáson, a légköri kémián át az elektrokémiai rendszerekig terjednek.

Coley megjegyzi: „Más rendszerekhez képest az általunk alkalmazott architektúrával kvantumugrást érünk el az érvényesség és az integritás terén, miközben fenntartjuk vagy kissé javítjuk a pontosságot.”

Coley szerint az egyedülálló abban rejlik, hogy a modell nem „talál ki” mechanizmusokat, hanem a szabadalmi szakirodalomban található kísérleti adatok alapján következtet rájuk. „Kísérleti adatokból vonunk ki mechanizmusokat – ezt még soha nem tették meg és nem osztották meg ilyen léptékben.”

Következő lépés

A csapat azt tervezi, hogy bővíti a modell fémekkel és katalízissel kapcsolatos ismereteit. „Csak a felszínt kapargattuk” – ismeri el Coley.

Hosszú távon úgy véli, hogy a rendszer segíthet új komplex reakciók felfedezésében, valamint fényt deríthet a korábban ismeretlen mechanizmusokra. „A hosszú távú potenciál hatalmas, de ez csak a kezdet.”

A kutatást a Machine Learning for Pharmaceutical Discovery and Synthesis konzorcium és az Egyesült Államok Nemzeti Tudományos Alapítványa (NSF) támogatta.

(Forrás: MIT)

Forrás: https://vietnamnet.vn/moi-hinh-ai-moi-du-doan-phan-ung-hoa-hoc-chinh-xac-nho-bao-toan-khoi-luong-2444232.html