S-au făcut numeroase încercări de a valorifica puterea inteligenței artificiale (IA) și a modelelor lingvistice mari (LLM) pentru a prezice rezultatele noilor reacții chimice. Cu toate acestea, succesul a fost limitat, în mare parte pentru că aceste modele nu sunt legate de principii fizice fundamentale, cum ar fi legea conservării masei.

Acum, o echipă de la MIT a găsit o modalitate de a încorpora constrângeri fizice în modelele de predicție a reacțiilor, îmbunătățind semnificativ acuratețea și fiabilitatea rezultatelor.

Imagine cu lecția 86.png
Sistemul FlowER (Flow matching for Electron Redistribution - potrivirea fluxului pentru redistribuirea electronilor) permite urmărirea detaliată a mișcării electronilor, asigurându-se că nu se adaugă sau se pierd electroni artificial. Fotografie: MIT News

Lucrarea, publicată pe 20 august în revista Nature, a fost realizată în colaborare de Joonyoung Joung (acum profesor asistent la Universitatea Kookmin, Coreea de Sud), fostul inginer software Mun Hong Fong (acum la Universitatea Duke), studentul absolvent de inginerie chimică Nicholas Casetti, cercetătorul postdoctoral Jordan Liles, studentul la fizică Ne Dassanayake și autorul principal Connor Coley, profesor de dezvoltare a carierei din 1957 în cadrul Departamentului de Inginerie Chimică și al Departamentului de Științe și Inginerie Electrică.

De ce este importantă predicția reacțiilor?

„Prezicerea rezultatului unei reacții este o sarcină foarte importantă”, explică Joung. De exemplu, dacă vrei să creezi un medicament nou, „trebuie să știi cum să îl sintetizezi. Acest lucru necesită să știi ce produse sunt susceptibile să apară” dintr-un set de materii prime.

Încercările anterioare au analizat adesea doar datele de intrare și ieșire, ignorând etapele intermediare și constrângerile fizice, cum ar fi incapacitatea de a crea sau pierde în mod natural masă.

Joung subliniază că, deși LLM-urile precum ChatGPT au avut un oarecare succes în cercetare, le lipsește un mecanism care să asigure că rezultatele lor respectă legile fizicii. „Fără a conserva «token-urile» (care reprezintă atomii), LLM-urile vor crea sau distruge arbitrar atomii în reacție”, spune el. „Aceasta seamănă mai mult cu alchimia decât cu știința.”

Soluția FlowerER: Bazată pe o platformă veche, aplicată la o tehnologie nouă

Pentru a depăși acest lucru, echipa a folosit o metodă din anii 1970 dezvoltată de chimistul Ivar Ugi – matricea de legătură-electron – pentru a reprezenta electronii într-o reacție.

Pe baza acestui fapt, au dezvoltat programul FlowER (Flow matching for Electron Redistribution), care permite urmărirea detaliată a mișcării electronilor, asigurându-se că nu se adaugă sau se pierd electroni artificial.

Această matrice folosește o valoare diferită de zero pentru a reprezenta o legătură sau o pereche de electroni liberi și zero pentru opusul acesteia. „Acest lucru ne permite să conservăm atât atomul, cât și electronul”, explică Fong. Acest lucru este esențial pentru încorporarea conservării masei în model.

Dovezi timpurii, dar promițătoare

Potrivit lui Coley, sistemul actual este doar o demonstrație - o dovadă a conceptului care arată că metoda de „potrivire a fluxului” este potrivită pentru prezicerea reacțiilor chimice.

Deși a fost antrenată cu date din peste un milion de reacții chimice (colectate de la Oficiul de Brevete din SUA), baza de date încă nu conține reacții bazate pe metale și catalitice.

„Suntem încântați că sistemul poate prezice în mod fiabil mecanismul de reacție”, a spus Coley. „Conservă masa, conservă electroni, dar există cu siguranță modalități de a extinde și îmbunătăți robustețea în următorii ani.”

Modelul este acum disponibil publicului pe GitHub. Coley speră că va fi un instrument util pentru evaluarea reactivității și construirea hărților de răspuns.

Surse de date deschise și potențial larg de aplicații

„Am făcut public totul - de la model, la date, până la un set de date anterior construit de Joung care detalia etapele mecanistice cunoscute ale reacției”, a spus Fong.

Potrivit echipei, FlowER poate egala sau chiar depăși metodele existente în găsirea mecanismelor standard, generalizând totodată la clase de reacții nemaivăzute până acum. Aplicațiile potențiale variază de la chimia farmaceutică, descoperirea materialelor, cercetarea incendiilor, chimia atmosferică, până la sistemele electrochimice.

Comparativ cu alte sisteme, Coley notează: „Prin alegerea arhitecturală pe care o folosim, realizăm un salt cuantic în ceea ce privește validitatea și integritatea, menținând sau îmbunătățind ușor precizia.”

Ceea ce este unic, spune Coley, este faptul că modelul nu „inventează” mecanisme, ci mai degrabă le deduce pe baza datelor experimentale din literatura de brevete. „Extragem mecanisme din date experimentale - ceva ce nu a mai fost făcut și distribuit niciodată la această scară.”

Următorul pas

Echipa intenționează să extindă înțelegerea modelului asupra metalelor și a ciclurilor catalitice. „Am început doar să zgârâim suprafața”, recunoaște Coley.

Pe termen lung, el consideră că sistemul ar putea ajuta la descoperirea de noi reacții complexe, precum și la clarificarea unor mecanisme necunoscute anterior. „Potențialul pe termen lung este imens, dar acesta este doar începutul.”

Cercetarea a fost susținută de consorțiul Machine Learning for Pharmaceutical Discovery and Synthesis și de Fundația Națională pentru Știință din SUA (NSF).

(Sursa: MIT)

Sursă: https://vietnamnet.vn/moi-hinh-ai-moi-du-doan-phan-ung-hoa-hoc-chinh-xac-nho-bao-toan-khoi-luong-2444232.html