Plus de données en chimie

Une communication plus claire des résultats expérimentaux négatifs améliorerait la planification des réactions en chimie

13.06.2022 - Allemagne

Des bases de données contenant d'énormes quantités de données expérimentales sont à la disposition des chercheurs dans une grande variété de disciplines chimiques. Cependant, une équipe de chercheurs a découvert que les données disponibles ne permettent pas de prédire les rendements de nouvelles synthèses à l'aide de l'intelligence artificielle (IA) et de l'apprentissage automatique. Leur étude, publiée dans la revue Angewandte Chemie, suggère que cela est dû en grande partie à la tendance des scientifiques à ne pas signaler les expériences ratées.

© Wiley-VCH

Bien que les modèles basés sur l'IA se soient avérés particulièrement efficaces pour prédire les structures moléculaires et les propriétés des matériaux, ils fournissent des prédictions plutôt inexactes pour les informations relatives aux rendements des produits en synthèse, comme l'ont découvert Frank Glorius et son équipe de chercheurs de la Westfälische Wilhelms-Universität Münster, en Allemagne.

Les chercheurs attribuent cet échec aux données utilisées pour former les systèmes d'IA. "Il est intéressant de noter que la prédiction des rendements de réaction (réactivité) est beaucoup plus difficile que la prédiction des propriétés moléculaires. Les réactifs, les réactifs, les quantités, les conditions, l'exécution expérimentale - tout cela détermine le rendement, et donc, le problème de la prédiction du rendement devient très gourmand en données", explique Glorius. Ainsi, malgré l'énorme quantité de littérature et de résultats disponibles, les chercheurs ont réalisé que les données ne permettaient pas de prédire avec précision le rendement attendu.

Le problème n'est pas seulement dû à un manque d'expériences. En revanche, l'équipe a identifié trois causes possibles de données biaisées. Premièrement, les résultats des synthèses chimiques peuvent être faussés en raison d'une erreur expérimentale. Deuxièmement, lorsque les chimistes planifient leurs expériences, ils peuvent, consciemment ou inconsciemment, introduire un biais basé sur leur expérience personnelle et leur confiance dans des méthodes bien établies. Enfin, comme seules les réactions dont le résultat est positif sont censées contribuer au progrès, les réactions ratées sont signalées moins fréquemment.

Pour déterminer lequel de ces trois facteurs avait le plus d'influence, Glorius et son équipe ont délibérément modifié les ensembles de données pour quatre réactions organiques différentes, couramment utilisées (et donc riches en données). Ils ont artificiellement augmenté l'erreur expérimentale, réduit la taille des ensembles d'échantillonnage des données ou supprimé les résultats négatifs des données. Leurs recherches ont montré que l'erreur expérimentale avait la plus petite influence sur le modèle, tandis que la contribution apportée par l'absence de résultats négatifs était fondamentale.

Le groupe espère que ces résultats encourageront les scientifiques à toujours signaler les expériences qui ont échoué ainsi que celles qui ont réussi. Cela améliorerait la disponibilité des données pour l'entraînement de l'IA, ce qui contribuerait finalement à accélérer la planification et à rendre l'expérimentation plus efficace. Glorius ajoute : "L'apprentissage automatique en chimie (moléculaire) augmentera considérablement l'efficacité et moins de réactions devront être exécutées pour atteindre un certain objectif, par exemple une optimisation. Cela donnera plus de pouvoir aux chimistes et les aidera à rendre les processus chimiques - et le monde - plus durables."

Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.

Publication originale

Autres actualités du département science

Actualités les plus lues

Plus actualités de nos autres portails

Découvrez les derniers développements de la technologie des batteries !