تلاشهای زیادی برای مهار قدرت هوش مصنوعی (AI) و مدلهای زبانی بزرگ (LLM) برای پیشبینی نتایج واکنشهای شیمیایی جدید انجام شده است. با این حال، موفقیت محدود بوده است، عمدتاً به این دلیل که این مدلها به اصول اساسی فیزیک مانند قانون پایستگی جرم وابسته نیستند.
اکنون، تیمی در MIT راهی برای گنجاندن محدودیتهای فیزیکی در مدلهای پیشبینی واکنش پیدا کردهاند که به طور قابل توجهی دقت و قابلیت اطمینان نتایج را بهبود میبخشد.

این اثر که در ۲۰ آگوست در مجله نیچر منتشر شد، توسط جونیونگ جونگ (که اکنون استادیار دانشگاه کوکمین کره جنوبی است)، مون هونگ فونگ، مهندس نرمافزار سابق (که اکنون در دانشگاه دوک است)، نیکلاس کاستی، دانشجوی کارشناسی ارشد مهندسی شیمی، جردن لیلز، محقق پسادکترا، نه داسانایاک، دانشجوی فیزیک و کانر کولی، نویسنده اصلی، استاد توسعه شغلی در سال ۱۹۵۷ در دانشکده مهندسی شیمی و دانشکده علوم و مهندسی برق، به طور مشترک نوشته شده است.
چرا پیشبینی واکنش مهم است؟
جونگ توضیح میدهد: «پیشبینی نتیجه یک واکنش یک کار بسیار مهم است.» برای مثال، اگر میخواهید یک داروی جدید بسازید، «باید بدانید که چگونه آن را سنتز کنید. این امر مستلزم دانستن این است که کدام محصولات احتمالاً از مجموعهای از مواد اولیه ظاهر میشوند.»
تلاشهای قبلی اغلب فقط به دادههای ورودی و خروجی نگاه میکردند و مراحل میانی و محدودیتهای فیزیکی مانند عدم توانایی در ایجاد یا از دست دادن جرم به طور طبیعی را نادیده میگرفتند.
یانگ اشاره میکند که اگرچه LLMهایی مانند ChatGPT در تحقیقات تا حدودی موفق بودهاند، اما فاقد مکانیسمی برای اطمینان از پیروی نتایجشان از قوانین فیزیک هستند. او میگوید: «بدون حفظ «توکنها» (که نمایانگر اتمها هستند)، LLMها به طور دلخواه اتمها را در واکنش ایجاد یا از بین میبرند. این بیشتر شبیه کیمیاگری است تا علم.»
راهکار FlowerER: مبتنی بر پلتفرم قدیمی، اعمال شده بر فناوری جدید
برای غلبه بر این مشکل، تیم از روشی که در دهه ۱۹۷۰ توسط شیمیدان ایوار اوگی توسعه داده شده بود - ماتریس پیوند-الکترون - برای نمایش الکترونها در یک واکنش استفاده کرد.
بر این اساس، آنها برنامه FlowerER (تطبیق جریان برای توزیع مجدد الکترون) را توسعه دادند که امکان ردیابی دقیق حرکت الکترونها را فراهم میکند و تضمین میکند که هیچ الکترونی به طور مصنوعی اضافه یا از دست نرود.
این ماتریس از یک مقدار غیر صفر برای نمایش یک پیوند یا یک جفت الکترون آزاد و از صفر برای عکس آن استفاده میکند. فانگ توضیح میدهد: «این به ما اجازه میدهد که هم اتم و هم الکترون را حفظ کنیم.» این کلید گنجاندن پایستگی جرم در مدل است.
شواهد اولیه اما امیدوارکننده
به گفته کولی، سیستم فعلی فقط یک نمایش است - اثبات مفهومی که نشان میدهد روش «تطبیق جریان» برای پیشبینی واکنشهای شیمیایی بسیار مناسب است.
با وجود آموزش با دادههای بیش از یک میلیون واکنش شیمیایی (جمعآوریشده از اداره ثبت اختراعات ایالات متحده)، این پایگاه داده هنوز فاقد واکنشهای مبتنی بر فلز و کاتالیزور است.
کولی گفت: «ما از اینکه این سیستم میتواند به طور قابل اعتمادی مکانیسم واکنش را پیشبینی کند، هیجانزدهایم. این سیستم جرم و الکترونها را حفظ میکند، اما مطمئناً راههایی برای گسترش و بهبود استحکام آن در سالهای آینده وجود دارد.»
این مدل اکنون در گیتهاب به صورت عمومی در دسترس است. کولی امیدوار است که این ابزار مفیدی برای ارزیابی واکنشپذیری و ساخت نقشههای پاسخ باشد.
منابع داده باز و پتانسیل کاربرد گسترده
فانگ گفت: «ما همه چیز را عمومی کردیم - از مدل گرفته تا دادهها، و مجموعه دادههای قبلی ساخته شده توسط جونگ که مراحل مکانیکی شناخته شده واکنش را با جزئیات شرح میداد.»
طبق گفتهی این تیم، FlowerER میتواند در یافتن مکانیسمهای استاندارد با روشهای موجود برابری کند یا از آنها پیشی بگیرد، ضمن اینکه به دستههای واکنشهای قبلاً دیده نشده نیز تعمیم میدهد. کاربردهای بالقوه از شیمی دارویی، کشف مواد، تحقیقات آتش، شیمی اتمسفری و سیستمهای الکتروشیمیایی متغیر است.
کولی در مقایسه با سایر سیستمها خاطرنشان میکند: «با انتخاب معماری که ما استفاده میکنیم، به جهش کوانتومی در اعتبار و یکپارچگی دست مییابیم، در حالی که دقت را حفظ یا اندکی بهبود میبخشیم.»
کولی میگوید نکتهی منحصر به فرد این است که این مدل مکانیسمها را «اختراع» نمیکند، بلکه آنها را بر اساس دادههای تجربی از منابع ثبت اختراع استنباط میکند. «ما مکانیسمها را از دادههای تجربی استخراج میکنیم - چیزی که هرگز در این مقیاس انجام نشده و به اشتراک گذاشته نشده است.»
مرحله بعدی
این تیم قصد دارد درک مدل از فلزات و چرخههای کاتالیزوری را گسترش دهد. کولی اذعان میکند: «ما فقط به سطح اولیه رسیدهایم.»
او معتقد است که در درازمدت، این سیستم میتواند به کشف واکنشهای پیچیده جدید و همچنین روشن کردن مکانیسمهای ناشناخته قبلی کمک کند. «پتانسیل بلندمدت بسیار زیاد است، اما این فقط آغاز راه است.»
این تحقیق توسط کنسرسیوم یادگیری ماشینی برای کشف و سنتز دارویی و بنیاد ملی علوم ایالات متحده (NSF) پشتیبانی شده است.
(منبع: دانشگاه امآیتی)
منبع: https://vietnamnet.vn/moi-hinh-ai-moi-du-doan-phan-ung-hoa-hoc-chinh-xac-nho-bao-toan-khoi-luong-2444232.html
نظر (0)