נעשו ניסיונות רבים לרתום את כוחה של הבינה המלאכותית (AI) ומודלים של שפה גדולה (LLM) כדי לחזות את תוצאותיהן של תגובות כימיות חדשות. עם זאת, ההצלחה הייתה מוגבלת, בעיקר משום שמודלים אלה אינם קשורים לעקרונות פיזיקליים בסיסיים כמו חוק שימור המסה.

כעת, צוות ב-MIT מצא דרך לשלב אילוצים פיזיקליים במודלים של חיזוי תגובות, ובכך לשפר משמעותית את הדיוק והאמינות של התוצאות.

תמונה של שיעור 86.png
מערכת FlowER (התאמת זרימה לחלוקת אלקטרונים) מאפשרת מעקב מפורט אחר תנועת האלקטרונים, ומבטיחה שלא יתווספו או יאבדו אלקטרונים באופן מלאכותי. צילום: חדשות MIT

העבודה, שפורסמה ב-20 באוגוסט בכתב העת Nature, נכתבה במשותף על ידי ג'וניונג ג'ונג (כיום פרופסור עוזר באוניברסיטת קוקמין, דרום קוריאה), מהנדס התוכנה לשעבר מון הונג פונג (כיום באוניברסיטת דיוק), סטודנט לתואר שני בהנדסה כימית ניקולס קסטי, חוקר פוסט-דוקטורט ג'ורדן לילס, סטודנט לפיזיקה נה דאסנייקה, והמחבר הראשי קונור קולי, פרופסור לפיתוח קריירה משנת 1957 במחלקה להנדסה כימית ובמחלקה למדעי החשמל וההנדסה.

מדוע חיזוי תגובה חשוב?

"ניבוי התוצאה של תגובה היא משימה חשובה מאוד", מסביר ג'ונג. לדוגמה, אם רוצים לייצר תרופה חדשה, "צריך לדעת כיצד לסנתז אותה. זה דורש לדעת אילו תוצרים עשויים להופיע" מקבוצת חומרי מוצא.

ניסיונות קודמים בחנו לעתים קרובות רק נתוני קלט ופלט, תוך התעלמות משלבי ביניים ומאילוצים פיזיים כגון חוסר היכולת ליצור או לאבד מסה באופן טבעי.

יונג מציין כי בעוד שתוכניות לימודי משפטים כמו ChatGPT זכו להצלחה מסוימת במחקר, הן חסרות מנגנון להבטיח שהתוצאות שלהן יעמדו בחוקי הפיזיקה. "מבלי לשמר את ה'טוקנים' (המייצגים אטומים), תוכניות לימודי משפטים ייצרו או יהרסו אטומים באופן שרירותי בתגובה", הוא אומר. "זה יותר כמו אלכימיה מאשר מדע".

פתרון FlowerER: מבוסס על פלטפורמה ישנה, ​​מיושם על טכנולוגיה חדשה

כדי להתגבר על כך, הצוות השתמש בשיטה משנות ה-70 שפותחה על ידי הכימאי אייבר אוגי - מטריצת קשר-אלקטרון - כדי לייצג אלקטרונים בתגובה.

בהתבסס על כך, הם פיתחו את תוכנת FlowER (התאמת זרימה לחלוקה מחדש של אלקטרונים), המאפשרת מעקב מפורט אחר תנועת האלקטרונים, ומבטיחה שלא יתווספו או יאבדו אלקטרונים באופן מלאכותי.

מטריצה ​​זו משתמשת בערך שאינו אפס כדי לייצג קשר או זוג אלקטרונים חופשיים, ובערך אפס כדי לייצג את הקשר ההפוך. "זה מאפשר לנו לשמר גם את האטום וגם את האלקטרון", מסביר פונג. זהו המפתח לשילוב שימור מסה במודל.

ראיות מוקדמות אך מבטיחות

לדברי קולי, המערכת הנוכחית היא רק הדגמה - הוכחת היתכנות שמראה ששיטת "התאמת הזרימה" מתאימה היטב לחיזוי תגובות כימיות.

למרות שאומן עם נתונים ממעל מיליון תגובות כימיות (שנאספו ממשרד הפטנטים האמריקאי), מסד הנתונים עדיין חסר תגובות מבוססות מתכות וקטליטיות.

"אנו נרגשים מכך שהמערכת יכולה לחזות באופן אמין את מנגנון התגובה", אמר קולי. "היא משמרת מסה, היא משמרת אלקטרונים, אבל בהחלט יש דרכים להרחיב ולשפר את החוסן בשנים הקרובות."

המודל זמין כעת לציבור ב-GitHub. קולי מקווה שהוא יהיה כלי שימושי להערכת תגובתיות ולבניית מפות תגובה.

מקורות נתונים פתוחים ופוטנציאל יישום רחב

"פרסמנו הכל - מהמודל, דרך הנתונים, ועד למערך נתונים קודם שבנה ג'ונג שפירט את השלבים המכניסטיים הידועים של התגובה", אמר פונג.

על פי הצוות, FlowER יכול להתאים או להתעלות על שיטות קיימות במציאת מנגנונים סטנדרטיים, תוך הכללה גם לסוגי תגובות שלא נראו קודם לכן. יישומים פוטנציאליים נעים בין כימיה פרמצבטית, גילוי חומרים, מחקר אש, כימיה אטמוספרית ועד מערכות אלקטרוכימיות.

בהשוואה למערכות אחרות, מציין קולי: "עם הבחירה הארכיטקטונית בה אנו משתמשים, אנו משיגים קפיצת מדרגה בתוקף ובשלמות, תוך שמירה או שיפור קל של הדיוק."

מה שמייחד, אומר קולי, הוא שהמודל אינו "ממציא" מנגנונים, אלא מסיק אותם על סמך נתונים ניסיוניים מספרות פטנטים. "אנחנו מפיקים מנגנונים מנתונים ניסיוניים - משהו שמעולם לא נעשה ולא שותפו בקנה מידה כזה."

השלב הבא

הצוות מתכנן להרחיב את הבנת המודל לגבי מתכות וקטליזה. "רק גירדנו את פני השטח", מודה קולי.

בטווח הארוך, הוא מאמין שהמערכת תוכל לסייע בגילוי תגובות מורכבות חדשות, וכן לשפוך אור על מנגנונים שלא היו ידועים קודם לכן. "הפוטנציאל לטווח ארוך הוא עצום, אבל זו רק ההתחלה."

המחקר נתמך על ידי קונסורציום Machine Learning for Pharmaceutical Discovery and Synthesis והקרן הלאומית למדע של ארה"ב (NSF).

(מקור: MIT)

מקור: https://vietnamnet.vn/moi-hinh-ai-moi-du-doan-phan-ung-hoa-hoc-chinh-xac-nho-bao-toan-khoi-luong-2444232.html