Un challenge pour les revues scientifiques et pour tous les chercheurs est de ne pas se tromper entre les articles écrits par des humains et pas ChatGPT. Il existe des outils pour faire la différence, et cet article de Cell Reports Physical Science (juin 2023) est bien fait. Son titre : Distinguishing academic science writing from humans or ChatGPT with over 99% accuracy using off-the-shelf machine learning tools
Les humains utilisent des mots inutiles
J’ai repris ci-contre un tableau de l’article. Regardez tranquillement et vous verrez que ChatGPT n’a pas de style, ce qui est excellent pour une rédaction scientifique. Vous verrez que les humains font des phrases plus longues et utilisent des mots inutiles (however, but, because…). ETONNANT
Voici le résumé traduit : ChatGPT a permis au plus grand nombre d’accéder à l’écriture générée par l’intelligence artificielle (IA), amorçant un changement culturel dans la façon dont les gens travaillent, apprennent et écrivent. Le besoin de distinguer l’écriture humaine de l’IA est maintenant à la fois critique et urgent. Pour répondre à ce besoin, nous présentons une méthode permettant de distinguer le texte généré par ChatGPT de celui des scientifiques universitaires (humains), en nous appuyant sur des méthodes de classification supervisée répandues et accessibles. L’approche utilise de nouvelles caractéristiques pour distinguer ces humains de l’IA ; à titre d’exemple, les scientifiques écrivent de longs paragraphes et ont un penchant pour le langage équivoque, utilisant fréquemment des mots tels que « mais », « cependant » et « bien que ». Avec un ensemble de 20 caractéristiques, nous avons construit un modèle qui attribue l’auteur, humain ou IA, avec une précision de plus de 99 %. Cette stratégie pourrait être adaptée et développée par d’autres personnes ayant des compétences de base en matière de classification supervisée, ce qui permettrait d’accéder à de nombreux modèles très précis et ciblés pour détecter l’utilisation de l’IA dans les écrits universitaires et au-delà.