Un nouveau système d'IA extrait des données numériques de textes académiques, libérant ainsi les chercheurs de tâches routinières

Le cadre Quinex structure automatiquement les données quantitatives et est conçu pour aider à gérer le flot croissant de données

21.04.2026

Image symbolique

AI-generated image

Annonces

Sonde d’autosampler ICP haute précision avec filtration des particules

Scanner CT à haute tension et à haute résolution pour la recherche non destructive et l'inspection industrielle

AQ700 - L'analyseur séquentiel très hautes performances, capacités et cadence

Les chiffres sont le langage de la science. Pourtant, dans les articles de recherche, ils sont souvent noyés dans le texte et difficiles à analyser. Des chercheurs de Jülich ont mis au point un système d'intelligence artificielle qui identifie automatiquement ces chiffres, les classe et les convertit en données structurées. Le cadre Quinex élimine ainsi la nécessité d'un travail manuel fastidieux.

Que ce soit dans le domaine de l'énergie, du climat ou de la recherche sur les matériaux, les articles scientifiques regorgent de chiffres ou, plus précisément, de données quantitatives : rendements, températures, coûts, émissions. Ces données sont souvent cruciales pour améliorer les modèles ou identifier les tendances. Parallèlement, le nombre de publications scientifiques augmente rapidement. Pour de nombreuses questions de recherche, il est aujourd'hui pratiquement impossible d'évaluer manuellement toutes les publications pertinentes - le temps et les ressources nécessaires seraient énormes.

Le cadre Quinex ("Quantitative Information Extraction"), développé par des chercheurs de Jülich, est basé sur des modèles de langage et automatise ce processus : L'intelligence artificielle identifie les valeurs numériques, les affecte aux unités appropriées et reconnaît ce qui a été mesuré, quand, où et comment. Ainsi, une phrase telle que "Des niveaux d'efficacité de 63 à 71 % sont supposés pour 2025" est transformée en un ensemble de données structuré contenant toutes les informations contextuelles pertinentes, depuis l'année et la méthode de mesure jusqu'à la source.

Siemens ouvre son plus grand centre de recherche mondial au nord de Munich

"Deux champions internationaux made in Bavaria unissent leurs forces - le succès est donc inévitable"

Lire le actualité

Une IA ouverte et efficace

Contrairement à de nombreuses solutions d'IA propriétaires, Quinex est entièrement basé sur des modèles de langage ouverts, relativement petits et donc efficaces. Ceux-ci ont été spécifiquement entraînés pour reconnaître et classer les informations quantitatives dans les textes scientifiques. Comparé à des systèmes similaires, Quinex fournit des résultats plus précis, capture les informations contextuelles de manière plus nuancée et prend également en compte les caractéristiques implicites.

Malgré sa taille compacte, Quinex atteint une précision de reconnaissance (F1) d'environ 98 % pour les nombres et les unités associées, et d'environ 87 et 82 % pour la classification des propriétés et entités quantifiées. Ces taux de précision élevés ont été obtenus grâce à des ensembles de données d'entraînement spécialement créés et à des améliorations méthodologiques.

"Nous voulions développer un outil puissant, mais aussi transparent et économe en ressources", explique Jann Weinand, chef du département des scénarios intégrés à Jülich System Analysis. "Quinex rend l'intelligence artificielle plus accessible pour l'analyse des données dans le domaine scientifique.

Essai pratique réussi

Pour tester l'aptitude pratique de Quinex, le système a été appliqué à des milliers de résumés scientifiques provenant de divers domaines. Il a extrait avec succès des données sur les coûts de production d'électricité pour diverses technologies énergétiques, sur l'absorption maximale d'oxygène chez l'homme, sur la magnitude et la localisation des tremblements de terre et sur les bandes interdites des matériaux photovoltaïques.

Les valeurs dérivées automatiquement correspondent étroitement aux données de référence respectives. Cela démontre que Quinex est bien adapté à l'analyse de grands volumes de littérature académique dans un large éventail de domaines de recherche et qu'il permet d'en déduire des tendances fiables.

De nouvelles perspectives pour la recherche

"Les modèles linguistiques ouvrent de nouvelles perspectives pour la science et aident à maintenir une vue d'ensemble de domaines de recherche entiers", explique l'auteur principal Jan Göpfert. "Ils permettent des recherches bibliographiques automatisées, la création de bases de données de recherche uniformément structurées et des analyses de tendances qui révèlent les développements scientifiques et technologiques à un stade précoce.

"Notre objectif est de soulager les chercheurs du travail de routine", déclare le Dr Patrick Kuckertz, chef du groupe de gestion des données de recherche. "Quinex est conçu pour les aider à parvenir plus rapidement à des conclusions et à gérer le flot croissant de données dans le domaine de la science.

Limites et améliorations futures

Quinex n'est pas totalement exempt d'erreurs, mais la transparence fait partie de sa conception. "Le système reconnaît les nombres et les unités de manière très fiable", explique Jan Göpfert. Comme ils sont tirés directement du texte, ils ne peuvent pas être "hallucinés". Cependant, des erreurs d'interprétation se produisent parfois, par exemple lorsque des références importantes sont disséminées dans le texte".

Quinex reste donc un outil qui soutient les personnes mais ne les remplace pas. "Nous recommandons d'utiliser Quinex lorsqu'il informe et soulage les chercheurs, mais la responsabilité de l'interprétation des résultats leur incombe toujours", précise M. Göpfert. Chaque numéro reconnu peut être retracé jusqu'à sa source et, dans la mesure du possible, est mis en évidence dans le texte original.

L'équipe travaille à la poursuite du développement de Quinex avec d'autres ensembles de données et modèles spécifiques à un domaine, afin de le rendre encore plus efficace et suffisamment flexible pour s'adapter aux diverses exigences de la recherche.

Bienvenue à la collaboration ouverte

Le Forschungszentrum Jülich met Quinex à disposition en tant que projet open-source.

L'objectif est de donner aux chercheurs du monde entier la possibilité de tester, d'étendre et d'adapter le système à leurs propres domaines - de la recherche énergétique à la chimie et à la biomédecine.

Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.

Publication originale

Jan Göpfert, Patrick Kuckertz, Gian Müller, Luna Lütz, Celine Körner, Hang Khuat, Detlef Stolten, Jann Michael Weinand; "Quinex: Quantitative information extraction from text using open and lightweight LLMs"; The Innovation

https://www.chemeurope.com/fr/news/1188534/un-nouveau-systeme-d-ia-extrait-des-donnees-numeriques-de-textes-academiques-liberant-ainsi-les-chercheurs-de-taches-routinieres.html

Publication originale

Sujets

intelligence artificielle analyse des données recherche documentaire littérature scientifique analyse des données

Afficher plus

Organisations

Forschungszentrum Jülich

Lien connexe

https://github.com/FZJ-IEK3-VSA/quinex

Annonces

Analyseur de potentiel zêta pour surfaces solides

Microscope d’imagerie confocal Raman 3D

La chromatographie membranaire numérique ouvre de nouveaux horizons dans l'analyse des protéines

L'intelligence artificielle révolutionne-t-elle la chimie ?

Découvrir les actualités de l'IA

Plus dans le département science S'abonner à la newsletter

Un nouveau système d'IA extrait des données numériques de textes académiques, libérant ainsi les chercheurs de tâches routinières

Le cadre Quinex structure automatiquement les données quantitatives et est conçu pour aider à gérer le flot croissant de données

Siemens ouvre son plus grand centre de recherche mondial au nord de Munich

Une IA ouverte et efficace

Essai pratique réussi

De nouvelles perspectives pour la recherche

Limites et améliorations futures

Bienvenue à la collaboration ouverte

Publication originale

L'apprentissage automatique stimule la recherche de nouveaux matériaux

Autres actualités du département science

Une nouvelle source de matières premières pour l'industrie chimique

La nature, modèle pour le stockage durable de l'hydrogène

De nouvelles solutions au problème des PFAS

De l’engrais de proximité: où l’implantation de petites fabriques d’ammoniac serait-elle rentable?

Les fournisseurs d'énergie en tant que fournisseurs de matières premières : la géothermie devrait fournir du lithium pour les batteries

La chimie des interfaces de précision permet aux cellules solaires en pérovskite d'atteindre un rendement supérieur à 26 %

La personnalité du fondateur détermine la manière dont les start-ups font face aux crises

Des molécules tridimensionnelles grâce à une « cascade de dominos »

Ce matériau permet de récupérer l'eau potable à partir de l'air – et refroidit plus efficacement que les systèmes actuels

Une avancée scientifique vers la mise au point d'un nouvel antibiotique de réserve

Du mycélium fongique à la place de la résine époxy : mise au point d'un circuit imprimé compostable

Des chercheurs observent le déroulement d'une réaction chimique atome par atome

L'Université technique de Berlin et le BAM créent un institut commun dédié à une technologie des procédés sûre, numérique et durable

Les bactéries transforment l'uranium en un composé chimique stable

Des batteries « bavardes » : des chercheurs mettent au point un nouveau système de communication

Les déchets deviennent des matières recyclables

La lumière laser contrôle les structures moléculaires

Les ultrasons ouvrent des cages supramoléculaires et libèrent le cisplatine, un médicament anticancéreux

Imagerie magnétique : des « micro-fleurs » renforcent le champ magnétique local

Les machines moléculaires programmables sont de plus en plus proches de la réalité

Actualités les plus lues

Les bactéries transforment l'uranium en un composé chimique stable

Un pilote industriel valide la technologie d’Oxyle : vers un système full scale capable de détruire plus de 99,9 % des PFAS C3

La microscopie à la limite de l'espace-temps

Ce matériau permet de récupérer l'eau potable à partir de l'air – et refroidit plus efficacement que les systèmes actuels

L'Europe dépend fortement des importations de lithium : le consortium LiSA entend changer la donne

Des chercheurs découvrent une voie de synthèse inattendue : une nouvelle méthode pour produire du méthane sans impact sur le climat

La fusion plutôt que le charbon et l'acier : Proxima Fusion pourrait jeter les bases d'un nouveau « Wirtschaftswunder »

L'Inde construit sa première usine hydrométallurgique à grande échelle au service de l'économie circulaire des batteries

Les PFAS présents dans les médicaments peuvent souvent être remplacés par des alternatives

Les machines moléculaires programmables sont de plus en plus proches de la réalité

Les bouteilles en plastique pourraient trouver une nouvelle vie dans les batteries sous forme de graphite

GETEC rachète Cogenio

Plus actualités de nos autres portails

Merck élargit son portefeuille dans le domaine des sciences de la vie grâce à l'acquisition de Bio-Techne pour 11,3 milliards de dollars

Les produits d'origine végétale vendus en supermarché contiennent deux fois plus d'additifs que leurs équivalents d'origine animale

L'IA accélère les simulations moléculaires d'un facteur 10 000

Pourquoi les innovations dans l'agriculture n'ont-elles souvent qu'un effet progressif ?

eXoZymes se voit attribuer une subvention de 2 millions de dollars du NIH pour faire progresser la recherche sur les analogues des cannabinoïdes dans le cadre de la découverte de nouveaux médicaments

Le croisement entre d'anciennes races de poules et des hybrides améliore le bien-être animal et le rendement en œufs

SPIE rachète nimeg et renforce ses activités dans le domaine des sciences de la vie en Suisse

Les compléments alimentaires à base de levure pourraient constituer une stratégie nutritionnelle sûre pour renforcer l'immunité face au cancer

Lonza renforce ses capacités de production de HPAPI à Visp

Conséquences du changement climatique : une chaleur modérée suffit à déclencher des signes d'inflammation et de coagulation chez les vaches laitières

Des « mini-cerveaux » issus de cellules de patients suggèrent que la vitamine B3 pourrait constituer un traitement contre une maladie infantile rare

Les PFAS présents dans les médicaments peuvent souvent être remplacés par des alternatives

Une avancée majeure pour les nouvelles techniques génomiques en Europe

Tentamus acquiert BioMeca et renforce son portefeuille dans le domaine des sciences de la vie

Un composé de cuivre déjà connu se révèle efficace contre les dépôts protéiques caractéristiques de la maladie d'Alzheimer

L'intelligence artificielle révolutionne-t-elle la chimie ?