تلاش‌های زیادی برای مهار قدرت هوش مصنوعی (AI) و مدل‌های زبانی بزرگ (LLM) برای پیش‌بینی نتایج واکنش‌های شیمیایی جدید انجام شده است. با این حال، موفقیت محدود بوده است، عمدتاً به این دلیل که این مدل‌ها به اصول اساسی فیزیک مانند قانون پایستگی جرم وابسته نیستند.

اکنون، تیمی در MIT راهی برای گنجاندن محدودیت‌های فیزیکی در مدل‌های پیش‌بینی واکنش پیدا کرده‌اند که به طور قابل توجهی دقت و قابلیت اطمینان نتایج را بهبود می‌بخشد.

تصویر درس ۸۶.png
سیستم FlowerER (تطبیق جریان برای توزیع مجدد الکترون) امکان ردیابی دقیق حرکت الکترون‌ها را فراهم می‌کند و تضمین می‌کند که هیچ الکترونی به طور مصنوعی اضافه یا از دست نرود. عکس: MIT News

این اثر که در ۲۰ آگوست در مجله نیچر منتشر شد، توسط جونیونگ جونگ (که اکنون استادیار دانشگاه کوکمین کره جنوبی است)، مون هونگ فونگ، مهندس نرم‌افزار سابق (که اکنون در دانشگاه دوک است)، نیکلاس کاستی، دانشجوی کارشناسی ارشد مهندسی شیمی، جردن لیلز، محقق پسادکترا، نه داسانایاک، دانشجوی فیزیک و کانر کولی، نویسنده اصلی، استاد توسعه شغلی در سال ۱۹۵۷ در دانشکده مهندسی شیمی و دانشکده علوم و مهندسی برق، به طور مشترک نوشته شده است.

چرا پیش‌بینی واکنش مهم است؟

جونگ توضیح می‌دهد: «پیش‌بینی نتیجه یک واکنش یک کار بسیار مهم است.» برای مثال، اگر می‌خواهید یک داروی جدید بسازید، «باید بدانید که چگونه آن را سنتز کنید. این امر مستلزم دانستن این است که کدام محصولات احتمالاً از مجموعه‌ای از مواد اولیه ظاهر می‌شوند.»

تلاش‌های قبلی اغلب فقط به داده‌های ورودی و خروجی نگاه می‌کردند و مراحل میانی و محدودیت‌های فیزیکی مانند عدم توانایی در ایجاد یا از دست دادن جرم به طور طبیعی را نادیده می‌گرفتند.

یانگ اشاره می‌کند که اگرچه LLMهایی مانند ChatGPT در تحقیقات تا حدودی موفق بوده‌اند، اما فاقد مکانیسمی برای اطمینان از پیروی نتایجشان از قوانین فیزیک هستند. او می‌گوید: «بدون حفظ «توکن‌ها» (که نمایانگر اتم‌ها هستند)، LLMها به طور دلخواه اتم‌ها را در واکنش ایجاد یا از بین می‌برند. این بیشتر شبیه کیمیاگری است تا علم.»

راهکار FlowerER: مبتنی بر پلتفرم قدیمی، اعمال شده بر فناوری جدید

برای غلبه بر این مشکل، تیم از روشی که در دهه ۱۹۷۰ توسط شیمیدان ایوار اوگی توسعه داده شده بود - ماتریس پیوند-الکترون - برای نمایش الکترون‌ها در یک واکنش استفاده کرد.

بر این اساس، آنها برنامه FlowerER (تطبیق جریان برای توزیع مجدد الکترون) را توسعه دادند که امکان ردیابی دقیق حرکت الکترون‌ها را فراهم می‌کند و تضمین می‌کند که هیچ الکترونی به طور مصنوعی اضافه یا از دست نرود.

این ماتریس از یک مقدار غیر صفر برای نمایش یک پیوند یا یک جفت الکترون آزاد و از صفر برای عکس آن استفاده می‌کند. فانگ توضیح می‌دهد: «این به ما اجازه می‌دهد که هم اتم و هم الکترون را حفظ کنیم.» این کلید گنجاندن پایستگی جرم در مدل است.

شواهد اولیه اما امیدوارکننده

به گفته کولی، سیستم فعلی فقط یک نمایش است - اثبات مفهومی که نشان می‌دهد روش «تطبیق جریان» برای پیش‌بینی واکنش‌های شیمیایی بسیار مناسب است.

با وجود آموزش با داده‌های بیش از یک میلیون واکنش شیمیایی (جمع‌آوری‌شده از اداره ثبت اختراعات ایالات متحده)، این پایگاه داده هنوز فاقد واکنش‌های مبتنی بر فلز و کاتالیزور است.

کولی گفت: «ما از اینکه این سیستم می‌تواند به طور قابل اعتمادی مکانیسم واکنش را پیش‌بینی کند، هیجان‌زده‌ایم. این سیستم جرم و الکترون‌ها را حفظ می‌کند، اما مطمئناً راه‌هایی برای گسترش و بهبود استحکام آن در سال‌های آینده وجود دارد.»

این مدل اکنون در گیت‌هاب به صورت عمومی در دسترس است. کولی امیدوار است که این ابزار مفیدی برای ارزیابی واکنش‌پذیری و ساخت نقشه‌های پاسخ باشد.

منابع داده باز و پتانسیل کاربرد گسترده

فانگ گفت: «ما همه چیز را عمومی کردیم - از مدل گرفته تا داده‌ها، و مجموعه داده‌های قبلی ساخته شده توسط جونگ که مراحل مکانیکی شناخته شده واکنش را با جزئیات شرح می‌داد.»

طبق گفته‌ی این تیم، FlowerER می‌تواند در یافتن مکانیسم‌های استاندارد با روش‌های موجود برابری کند یا از آنها پیشی بگیرد، ضمن اینکه به دسته‌های واکنش‌های قبلاً دیده نشده نیز تعمیم می‌دهد. کاربردهای بالقوه از شیمی دارویی، کشف مواد، تحقیقات آتش، شیمی اتمسفری و سیستم‌های الکتروشیمیایی متغیر است.

کولی در مقایسه با سایر سیستم‌ها خاطرنشان می‌کند: «با انتخاب معماری که ما استفاده می‌کنیم، به جهش کوانتومی در اعتبار و یکپارچگی دست می‌یابیم، در حالی که دقت را حفظ یا اندکی بهبود می‌بخشیم.»

کولی می‌گوید نکته‌ی منحصر به فرد این است که این مدل مکانیسم‌ها را «اختراع» نمی‌کند، بلکه آنها را بر اساس داده‌های تجربی از منابع ثبت اختراع استنباط می‌کند. «ما مکانیسم‌ها را از داده‌های تجربی استخراج می‌کنیم - چیزی که هرگز در این مقیاس انجام نشده و به اشتراک گذاشته نشده است.»

مرحله بعدی

این تیم قصد دارد درک مدل از فلزات و چرخه‌های کاتالیزوری را گسترش دهد. کولی اذعان می‌کند: «ما فقط به سطح اولیه رسیده‌ایم.»

او معتقد است که در درازمدت، این سیستم می‌تواند به کشف واکنش‌های پیچیده جدید و همچنین روشن کردن مکانیسم‌های ناشناخته قبلی کمک کند. «پتانسیل بلندمدت بسیار زیاد است، اما این فقط آغاز راه است.»

این تحقیق توسط کنسرسیوم یادگیری ماشینی برای کشف و سنتز دارویی و بنیاد ملی علوم ایالات متحده (NSF) پشتیبانی شده است.

(منبع: دانشگاه ام‌آی‌تی)

منبع: https://vietnamnet.vn/moi-hinh-ai-moi-du-doan-phan-ung-hoa-hoc-chinh-xac-nho-bao-toan-khoi-luong-2444232.html