L'intelligenza artificiale ricostruisce molecole a partire da frammenti esplosivi
I ricercatori hanno addestrato una rete neurale in grado di utilizzare la quantità di moto degli ioni per lavorare a ritroso e prevedere la geometria pre-esplosione di una molecola
Annunci
Ricercatori dello SLAC National Accelerator Laboratory negli Stati Uniti, dell'European XFEL e di istituzioni che collaborano tra loro hanno recentemente costruito un modello generativo di intelligenza artificiale in grado di ricreare le strutture molecolari dal movimento degli ioni della molecola dopo che sono stati fatti esplodere dai raggi X, una tecnica chiamata Coulomb explosion imaging. I dati dello strumento Small Quantum Systems (SQS) dell'European XFEL sono stati fondamentali per dimostrare l'applicabilità di questo metodo appena sviluppato.
La ricerca, pubblicata su Nature Communications, rappresenta un passo importante verso la possibilità di scattare istantanee delle molecole durante le reazioni chimiche, un progresso che potrebbe avere un impatto importante in medicina e nell'industria. Il modello di apprendimento automatico ha previsto con precisione le geometrie di una serie di molecole diverse composte da meno di dieci atomi, aprendo la strada all'applicazione della tecnica a molecole più grandi. "Eravamo piuttosto entusiasti di questo risultato", ha dichiarato Xiang Li, scienziato associato presso la Linac Coherent Light Source (LCLS) dello SLAC e autore principale dello studio. "È il primo modello di intelligenza artificiale costruito per la ricostruzione della struttura molecolare a partire da immagini di esplosioni di Coulomb". Rebecca Boll, scienziata dello strumento SQS e coautrice dell'articolo, ha aggiunto: "Ricostruire una molecola esplosa nello spazio reale a partire dai momenti registrati è molto difficile. L'intelligenza artificiale può aiutarci a farlo".
Un nuovo modo di vedere le molecole
Attualmente le opzioni disponibili per l'imaging di molecole isolate in fase gassosa sono limitate. Con la microscopia elettronica, ad esempio, i soggetti devono essere fissati in posizione, rendendo impossibile l'immagine di molecole libere. Inoltre, per far funzionare le tecniche basate sulla diffrazione, il campione di molecole deve essere abbastanza denso da generare un forte segnale nel rivelatore. L'immagine risultante è tecnicamente una media di molte molecole, il che limita i ricercatori a studiare i dettagli visibili solo quando si immaginano molecole isolate.
Nel documento, i ricercatori si sono invece concentrati sull'imaging dell'esplosione di Coulomb. In questa tecnica, un impulso di raggi X colpisce una singola molecola in una camera a vuoto, strappandole gli elettroni. Ciò lascia dietro di sé ioni positivi che si respingono esplosivamente l'uno dall'altro e si schiantano contro un rivelatore. Il rilevatore cattura la loro quantità di moto, che può essere utilizzata per ricostruire la struttura della molecola. "Questa tecnica ha la capacità di isolare dettagli minori che sono rilevanti dal punto di vista chimico", ha dichiarato James Cryan, vicedirettore ad interim dell'LCLS per la scienza, la ricerca e lo sviluppo e coautore dell'articolo.
"In passato abbiamo utilizzato l'imaging dell'esplosione di Coulomb all'SQS con grande successo", ha dichiarato il coautore Michael Meyer, scienziato capo dello strumento europeo XFEL. "Ma spesso, a causa dei vincoli di calcolo, non è stato possibile effettuare una vera e propria ricostruzione della geometria molecolare". Mentre l'impulso di raggi X elimina rapidamente gli elettroni, gli ioni rimanenti non esplodono istantaneamente. Durante questo breve ritardo, gli atomi possono spostarsi leggermente, il che rende difficile ricostruire la struttura originale utilizzando la legge di Coulomb per le forze elettrostatiche. "Non sarà accurata perché il semplice uso di questa legge funziona solo se il processo di carica è istantaneo", ha spiegato Li.
A complicare ulteriormente le cose, ogni atomo in più nella molecola aggiunge un livello esponenziale di complessità. "È molto impegnativo lavorare a ritroso per ottenere la struttura originale", ha detto il coautore Phay Ho, fisico dell'Argonne National Laboratory negli Stati Uniti. "È un po' come rompere un bicchiere e cercare di rimetterlo insieme partendo da come i pezzi sono volati via". Molti problemi della fisica e della chimica moderna comportano la ricostruzione di strutture nascoste a partire da misure indirette. Questo lavoro dimostra come l'intelligenza artificiale possa aiutare ad affrontare tali problemi inversi".
Apprendimento automatico per le strutture molecolari
Il team di ricerca ha cercato di costruire un modello di apprendimento automatico che potesse superare questa limitazione informatica. Hanno sviluppato e addestrato il modello presso la Shared Science Data Facility (S3DF) dello SLAC. I modelli di intelligenza artificiale generativa sono adatti a questo compito perché "pensano" in modo diverso da una simulazione standard al computer. Invece di lavorare attraverso una serie di equazioni, imparano trovando modelli nei dati di addestramento. Poi usano questi modelli per fare previsioni statistiche.
Per raccogliere i dati di addestramento, il team si è rivolto a una simulazione costruita da Ho. La simulazione analizza le strutture molecolari e calcola la quantità di moto dei loro ioni dopo un'esplosione di Coulomb. Dopo aver funzionato per oltre un mese, la simulazione ad alta intensità di calcolo, che utilizza equazioni di meccanica quantistica e fisica classica, ha prodotto un set di dati di 76.000 campioni molecolari.
Inizialmente, i ricercatori hanno addestrato l'intelligenza artificiale solo su questo set di dati, che è piccolo per gli standard di addestramento dell'intelligenza artificiale, e hanno scoperto che il modello prevedeva strutture imprecise dai dati dell'esplosione. Hanno quindi ripetuto l'addestramento, aggiungendo un altro set di dati ricavato solo dalla fisica classica. Il secondo set era meno preciso, ma circa 100 volte più grande del primo.
Questo addestramento in due fasi è stato il trucco per prevedere strutture precise.
I ricercatori hanno testato il modello AI chiedendogli di prevedere le strutture molecolari in una porzione di dati di simulazione che non aveva visto durante l'addestramento. Il modello, che il team ha chiamato MOLEXA (abbreviazione di "molecular structure reconstruction from Coulomb explosion imaging"), ha preso i momenti degli ioni e ha calcolato le strutture più probabili. "Abbiamo scoperto che questo processo di addestramento in due fasi ha soppresso l'errore di previsione di un fattore due", ha detto Li.
Il team ha poi testato MOLEXA con set di dati sperimentali registrati presso l'SQS. Le molecole testate comprendevano acqua, tetrafluorometano ed etanolo. Hanno inserito nel modello i momenti ionici sperimentali, ricostruito le strutture molecolari e confrontato le ricostruzioni con le strutture note elencate dal National Institute of Standards and Technology.
Hanno scoperto che le previsioni si sovrapponevano in gran parte alle strutture note. In generale, i legami si trovavano nei punti giusti, con solo lievi variazioni nei loro angoli. Gli errori di posizione erano generalmente inferiori alla metà della lunghezza di un tipico legame chimico. "Il modello, in realtà, nella maggior parte dei casi fa meglio di così", ha aggiunto Li. "È solo un punto di partenza per la ricerca futura, che non solo migliorerà l'accuratezza del modello, ma estenderà anche la sua applicabilità a sistemi molecolari più grandi".
Espansione a molecole e reazioni chimiche più grandi
"Esperimenti come l'imaging dell'esplosione di Coulomb spesso generano una quantità spropositata di dati difficili da interpretare", ha spiegato Serguei Molodtsov, direttore scientifico di European XFEL. "Utilizzando l'intelligenza artificiale per analizzare questi dati, possiamo ampliare la portata degli esperimenti che è possibile condurre presso la nostra struttura, consentendo ai nostri utenti di esplorare studi precedentemente ritenuti troppo complessi". In futuro, i ricercatori intendono aumentare il numero di atomi che il modello di apprendimento automatico è in grado di ricomporre e applicare il modello a esperimenti risolti nel tempo presso l'LCLS e l'XFEL europeo. Ciò aiuterà i ricercatori a ricostruire istantanee di molecole in movimento, creando film molecolari simili a un libro a fogli mobili con approfondimenti sullo svolgimento delle reazioni chimiche.
Il team sta anche testando la capacità del modello di ricostruire le molecole da dati incompleti. Il più delle volte, infatti, al rilevatore sfugge uno ione prodotto nell'esplosione di Coulomb. Li vuole sapere, ad esempio: L'intelligenza artificiale è in grado di ricostruire una molecola di etanolo se uno o più ioni idrogeno non vengono registrati dal rivelatore?
Se queste sfide saranno risolte, la tecnica potrebbe diventare più applicabile nella ricerca in biologia e chimica. Le proteine, ad esempio, possono essere composte da migliaia di atomi. "È proprio questo l'obiettivo", ha detto Li. "Saremo in grado di studiare sistemi più rilevanti dal punto di vista biologico o industriale".
Il team comprendeva anche ricercatori dello Stanford PULSE Institute, della Stanford University, della Kansas State University, del Max Planck Institute for Nuclear Physics, in Germania, del Fritz Haber Institute, in Germania, e dell'Università Sorbona, in Francia.
Nota: questo articolo è stato tradotto utilizzando un sistema informatico senza intervento umano. LUMITOS offre queste traduzioni automatiche per presentare una gamma più ampia di notizie attuali. Poiché questo articolo è stato tradotto con traduzione automatica, è possibile che contenga errori di vocabolario, sintassi o grammatica. L'articolo originale in Inglese può essere trovato qui.
Pubblicazione originale
Xiang Li, Till Jahnke, Rebecca Boll, Jiaqi Han, Minkai Xu, Michael Meyer, Maria Novella Piancastelli, Daniel Rolles, Artem Rudenko, Florian Trinter, Thomas J. A. Wolf, Jana B. Thayer, James P. Cryan, Stefano Ermon, Phay J. Ho; "Generative modeling enables molecular structure retrieval from Coulomb explosion imaging"; Nature Communications, 2026-3-3