Έχουν γίνει πολλές προσπάθειες αξιοποίησης της δύναμης της τεχνητής νοημοσύνης (AI) και των μοντέλων μεγάλης γλώσσας (LLM) για την πρόβλεψη των αποτελεσμάτων νέων χημικών αντιδράσεων. Ωστόσο, η επιτυχία ήταν περιορισμένη, κυρίως επειδή αυτά τα μοντέλα δεν συνδέονται με θεμελιώδεις φυσικές αρχές όπως ο νόμος διατήρησης της μάζας.
Τώρα, μια ομάδα στο MIT βρήκε έναν τρόπο να ενσωματώσει φυσικούς περιορισμούς σε μοντέλα πρόβλεψης αντιδράσεων, βελτιώνοντας σημαντικά την ακρίβεια και την αξιοπιστία των αποτελεσμάτων.

Η εργασία, που δημοσιεύθηκε στις 20 Αυγούστου στο περιοδικό Nature, συνυπέγραψαν ο Joonyoung Joung (νυν Επίκουρος Καθηγητής στο Πανεπιστήμιο Kookmin της Νότιας Κορέας), ο πρώην μηχανικός λογισμικού Mun Hong Fong (νυν στο Πανεπιστήμιο Duke), ο μεταπτυχιακός φοιτητής χημικής μηχανικής Nicholas Casetti, ο μεταδιδακτορικός ερευνητής Jordan Liles, ο φοιτητής φυσικής Ne Dassanayake, και ο κύριος συγγραφέας Connor Coley, καθηγητής επαγγελματικής εξέλιξης του 1957 στο Τμήμα Χημικών Μηχανικών και στο Τμήμα Ηλεκτρολογικών Επιστημών και Μηχανικών.
Γιατί είναι σημαντική η πρόβλεψη αντιδράσεων;
«Η πρόβλεψη του αποτελέσματος μιας αντίδρασης είναι ένα πολύ σημαντικό έργο», εξηγεί ο Γιουνγκ. Για παράδειγμα, αν θέλετε να φτιάξετε ένα νέο φάρμακο, «πρέπει να ξέρετε πώς να το συνθέσετε. Αυτό απαιτεί να γνωρίζετε ποια προϊόντα είναι πιθανό να εμφανιστούν» από ένα σύνολο αρχικών υλικών.
Προηγούμενες προσπάθειες συχνά εξέταζαν μόνο δεδομένα εισόδου και εξόδου, αγνοώντας ενδιάμεσα βήματα και φυσικούς περιορισμούς, όπως η αδυναμία φυσικής δημιουργίας ή απώλειας μάζας.
Ο Γιουνγκ επισημαίνει ότι, ενώ τα LLM όπως το ChatGPT έχουν σημειώσει κάποια επιτυχία στην έρευνα, δεν έχουν έναν μηχανισμό που να διασφαλίζει ότι τα αποτελέσματά τους ακολουθούν τους νόμους της φυσικής. «Χωρίς να διατηρούν τα «tokens» (που αντιπροσωπεύουν άτομα), τα LLM θα δημιουργούν ή θα καταστρέφουν αυθαίρετα άτομα στην αντίδραση», λέει. «Αυτό μοιάζει περισσότερο με αλχημεία παρά με επιστήμη».
Λύση FlowerER: Βασισμένο σε παλιά πλατφόρμα, εφαρμοσμένο σε νέα τεχνολογία
Για να ξεπεράσει αυτό το πρόβλημα, η ομάδα χρησιμοποίησε μια μέθοδο που αναπτύχθηκε τη δεκαετία του 1970 από τον χημικό Ivar Ugi - τον πίνακα δεσμού-ηλεκτρονίων - για να αναπαραστήσει ηλεκτρόνια σε μια αντίδραση.
Με βάση αυτό, ανέπτυξαν το πρόγραμμα FlowER (Flow matching for Electron Redistribution), το οποίο επιτρέπει την λεπτομερή παρακολούθηση της κίνησης των ηλεκτρονίων, διασφαλίζοντας ότι δεν προστίθενται ή χάνονται τεχνητά ηλεκτρόνια.
Αυτός ο πίνακας χρησιμοποιεί μια μη μηδενική τιμή για να αναπαραστήσει έναν δεσμό ή ένα ζεύγος ελεύθερων ηλεκτρονίων και μηδέν για το αντίθετο. «Αυτό μας επιτρέπει να διατηρήσουμε τόσο το άτομο όσο και το ηλεκτρόνιο», εξηγεί ο Fong. Αυτό είναι το κλειδί για την ενσωμάτωση της διατήρησης της μάζας στο μοντέλο.
Πρώιμα αλλά πολλά υποσχόμενα στοιχεία
Σύμφωνα με τον Coley, το τρέχον σύστημα είναι απλώς μια επίδειξη - μια απόδειξη της ιδέας που δείχνει ότι η μέθοδος «αντιστοίχισης ροής» είναι κατάλληλη για την πρόβλεψη χημικών αντιδράσεων.
Παρά το γεγονός ότι έχει εκπαιδευτεί με δεδομένα από πάνω από ένα εκατομμύριο χημικές αντιδράσεις (που συλλέχθηκαν από το Γραφείο Ευρεσιτεχνιών των ΗΠΑ), η βάση δεδομένων εξακολουθεί να μην περιλαμβάνει αντιδράσεις που βασίζονται σε μέταλλα και καταλύτες.
«Είμαστε ενθουσιασμένοι που το σύστημα μπορεί να προβλέψει αξιόπιστα τον μηχανισμό αντίδρασης», δήλωσε ο Coley. «Διατηρεί μάζα, διατηρεί ηλεκτρόνια, αλλά σίγουρα υπάρχουν τρόποι για να επεκταθεί και να βελτιωθεί η ανθεκτικότητα τα επόμενα χρόνια».
Το μοντέλο είναι πλέον διαθέσιμο δημόσια στο GitHub. Ο Coley ελπίζει ότι θα αποτελέσει ένα χρήσιμο εργαλείο για την αξιολόγηση της αντιδραστικότητας και τη δημιουργία χαρτών απόκρισης.
Ανοιχτές πηγές δεδομένων και ευρύ δυναμικό εφαρμογών
«Δημοσιοποιήσαμε τα πάντα — από το μοντέλο, τα δεδομένα, μέχρι ένα προηγούμενο σύνολο δεδομένων που δημιούργησε ο Joung, το οποίο περιέγραφε λεπτομερώς τα γνωστά μηχανιστικά βήματα της αντίδρασης», δήλωσε ο Fong.
Σύμφωνα με την ομάδα, το FlowER μπορεί να ταιριάξει ή να ξεπεράσει τις υπάρχουσες μεθόδους στην εύρεση τυπικών μηχανισμών, ενώ παράλληλα γενικεύει σε προηγουμένως άγνωστες κατηγορίες αντιδράσεων. Οι πιθανές εφαρμογές κυμαίνονται από τη φαρμακευτική χημεία, την ανακάλυψη υλικών, την έρευνα πυρκαγιών, την ατμοσφαιρική χημεία έως τα ηλεκτροχημικά συστήματα.
Σε σύγκριση με άλλα συστήματα, ο Coley σημειώνει: «Με την αρχιτεκτονική επιλογή που χρησιμοποιούμε, επιτυγχάνουμε ένα κβαντικό άλμα στην εγκυρότητα και την ακεραιότητα, διατηρώντας ή βελτιώνοντας ελαφρώς την ακρίβεια».
Αυτό που είναι μοναδικό, λέει ο Coley, είναι ότι το μοντέλο δεν «εφευρίσκει» μηχανισμούς, αλλά μάλλον τους συνάγει με βάση πειραματικά δεδομένα από τη βιβλιογραφία διπλωμάτων ευρεσιτεχνίας. «Εξάγουμε μηχανισμούς από πειραματικά δεδομένα - κάτι που δεν έχει γίνει ποτέ και δεν έχει κοινοποιηθεί σε αυτή την κλίμακα».
Επόμενο βήμα
Η ομάδα σχεδιάζει να επεκτείνει την κατανόηση του μοντέλου για τα μέταλλα και τους καταλυτικούς κύκλους. «Έχουμε μόλις φτάσει στην επιφάνεια», παραδέχεται ο Κόλεϊ.
Μακροπρόθεσμα, πιστεύει ότι το σύστημα θα μπορούσε να βοηθήσει στην ανακάλυψη νέων πολύπλοκων αντιδράσεων, καθώς και να ρίξει φως σε προηγουμένως άγνωστους μηχανισμούς. «Το μακροπρόθεσμο δυναμικό είναι τεράστιο, αλλά αυτή είναι μόνο η αρχή».
Η έρευνα υποστηρίχθηκε από την κοινοπραξία Μηχανικής Μάθησης για Φαρμακευτική Ανακάλυψη και Σύνθεση και το Εθνικό Ίδρυμα Επιστημών των ΗΠΑ (NSF).
(Πηγή: ΜΙΤ)
Πηγή: https://vietnamnet.vn/moi-hinh-ai-moi-du-doan-phan-ung-hoa-hoc-chinh-xac-nho-bao-toan-khoi-luong-2444232.html
Σχόλιο (0)