L’IA pour vérifier la pertinence des références dans un manuscrit
J’ai découvert ce communiqué de presse de Springer Nature du 7 avril 2025 avec pour titre : ‘New research integrity AI tool added to Springer Nature’s growing portfolio‘. Je traduis des extraits (merci DeepL) : Un nouvel outil d’IA permettant d’identifier les références non pertinentes dans les manuscrits soumis a été lancé pour être utilisé dans les revues et les livres de Springer Nature. Il s’agit du dernier outil piloté par l’IA qui a été développé en interne par Springer Nature pour éliminer les soumissions problématiques et garantir la véracité des publications. Cet outil sera utilisé par le groupe d’intégrité de la recherche (RIG) de Springer Nature pour évaluer les soumissions à presque toutes les revues et tous les livres publiés par Springer Nature, en analysant la pertinence de chaque référence utilisée. Si un certain nombre de références sont identifiées comme non pertinentes, la soumission sera signalée au RIG qui vérifiera manuellement le manuscrit et décidera si la soumission doit être retirée. L’outil de vérification des références non pertinentes a fait l’objet de plusieurs séries de tests et de validations afin de s’assurer qu’il fournit une évaluation précise et fiable des références dans toutes les disciplines universitaires. Une supervision humaine restera toujours en place, conformément aux principes de Springer Nature en matière d’IA.
Les autres éditeurs internationaux vont suivre, ou ont déjà intégré cet outil. Je ne l’ai pas vu fonctionner et je ne sais pas comment il identifie des erreurs…. Méfiance ?
D’autres outils intégrés par les éditeurs
En juin 2024, Springer Nature avait introduit deux autres outils d’IA pour identifier les manuscrits générés avec une IA sans le dire et une IA pour analyser les images. Je traduis des extraits de ce communiqué de juin :
Geppetto divise le papier en sections et utilise ses propres algorithmes pour vérifier la cohérence du texte dans chaque section. Les sections se voient ensuite attribuer un score basé sur la probabilité que le texte qu’elles contiennent ait été généré par l’IA. Plus la note est élevée, plus la probabilité de problèmes est grande, ce qui déclenche une vérification humaine par le personnel de Springer Nature. Geppetto a déjà permis d’identifier des centaines de faux articles peu après leur soumission, les empêchant ainsi d’être publiés et de prendre le temps précieux des rédacteurs en chef et des évaluateurs.
SnappShot, également développé en interne, est un outil d’analyse de l’intégrité des images assisté par l’IA. Actuellement utilisé pour analyser les fichiers PDF contenant des images de gel et de blot et pour rechercher les doublons dans ces types d’images – un autre problème d’intégrité connu dans l’industrie – il sera étendu pour couvrir d’autres types d’images et de problèmes d’intégrité et pour accélérer les contrôles sur les documents.