Було зроблено багато спроб використати можливості штучного інтелекту (ШІ) та моделей великих мов (LLM) для прогнозування результатів нових хімічних реакцій. Однак успіх був обмеженим, значною мірою тому, що ці моделі не пов'язані з фундаментальними фізичними принципами, такими як закон збереження маси.
Тепер команда вчених з Массачусетського технологічного інституту знайшла спосіб врахувати фізичні обмеження в моделях прогнозування реакцій, що значно покращило точність і надійність результатів.

Робота, опублікована 20 серпня в журналі Nature, була написана у співавторстві з Джунйонгом Чжуном (зараз доцентом Університету Кукмін, Південна Корея), колишнім інженером-програмістом Муном Хонг Фонгом (зараз працює в Університеті Дьюка), аспірантом факультету хімічної інженерії Ніколасом Касетті, постдокторантом Джорданом Лайлзом, студентом-фізиком Не Дассанаяке та провідним автором Коннором Колі, професором з розвитку кар'єри 1957 року на кафедрі хімічної інженерії та кафедрі електротехніки та інженерії.
Чому важливе прогнозування реакції?
«Прогнозування результату реакції — дуже важливе завдання», — пояснює Юнг. Наприклад, якщо ви хочете створити новий препарат, «вам потрібно знати, як його синтезувати. Це вимагає знання того, які продукти, ймовірно, з’являться» з набору вихідних матеріалів.
Попередні спроби часто розглядали лише вхідні та вихідні дані, ігноруючи проміжні кроки та фізичні обмеження, такі як нездатність природним чином створювати або втрачати масу.
Йонг зазначає, що хоча такі програми LLM, як ChatGPT, досягли певного успіху в дослідженнях, їм бракує механізму, який би гарантував, що їхні результати відповідають законам фізики. «Без збереження «токенів» (які представляють атоми), LLM довільно створюватимуть або знищуватимуть атоми в реакції», – каже він. «Це більше схоже на алхімію, ніж на науку».
Рішення FlowerER: Базовано на старій платформі, застосовано до нової технології
Щоб подолати це, команда використала метод, розроблений хіміком Іваром Угі в 1970-х роках – матрицю зв'язків-електронів – для представлення електронів у реакції.
На основі цього вони розробили програму FlowER (Flow matching for Electron Redistribution), яка дозволяє детально відстежувати рух електронів, гарантуючи, що жодні електрони не будуть штучно додані або втрачені.
Ця матриця використовує ненульове значення для представлення зв'язку або пари вільних електронів, а нуль — для протилежного. «Це дозволяє нам зберегти як атом, так і електрон», — пояснює Фонг. Це ключ до включення закону збереження маси в модель.
Ранні, але багатообіцяючі докази
За словами Колі, поточна система є лише демонстрацією — підтвердженням концепції, яке показує, що метод «узгодження потоку» добре підходить для прогнозування хімічних реакцій.
Незважаючи на те, що база даних навчена на даних понад мільйона хімічних реакцій (зібраних з Патентного відомства США), у ній все ще бракує реакцій на основі металів та каталізаторів.
«Ми раді, що система може надійно передбачати механізм реакції», — сказав Колі. «Вона зберігає масу, вона зберігає електрони, але, безумовно, є способи розширити та покращити її надійність у найближчі роки».
Модель тепер публічно доступна на GitHub. Колі сподівається, що вона стане корисним інструментом для оцінки реактивності та побудови карт реагування.
Відкриті джерела даних та широкий потенціал застосування
«Ми оприлюднили все — від моделі до даних і попереднього набору даних, створеного Йонгом, який детально описував відомі механістичні етапи реакції», — сказав Фонг.
За словами команди, FlowER може відповідати або перевершувати існуючі методи у пошуку стандартних механізмів, а також узагальнювати його на раніше невідомі класи реакцій. Потенційні застосування варіюються від фармацевтичної хімії, відкриття матеріалів, дослідження вогню, атмосферної хімії до електрохімічних систем.
Порівняно з іншими системами, Колі зазначає: «Завдяки використаній нами архітектурі ми досягаємо квантового стрибка в достовірності та цілісності, зберігаючи або дещо покращуючи точність».
Унікальність моделі, каже Колі, полягає в тому, що вона не «винаходить» механізми, а радше робить висновки на основі експериментальних даних з патентної літератури. «Ми витягуємо механізми з експериментальних даних — щось, що ніколи раніше не робили та не поширювали в такому масштабі».
Наступний крок
Команда планує розширити розуміння моделі металів та каталізу. «Ми лише поверхнево торкнулися цього питання», – визнає Колі.
У довгостроковій перспективі, на його думку, система може допомогти відкрити нові складні реакції, а також пролити світло на раніше невідомі механізми. «Довгостроковий потенціал величезний, але це лише початок».
Дослідження було підтримано консорціумом «Машинне навчання для фармацевтичних відкриттів та синтезу» та Національним науковим фондом США (NSF).
(Джерело: MIT)
Джерело: https://vietnamnet.vn/moi-hinh-ai-moi-du-doan-phan-ung-hoa-hoc-chinh-xac-nho-bao-toan-khoi-luong-2444232.html
Коментар (0)