Comment repérer les contenus générés par une intelligence artificielle?
Le 13 février 2023La technologie de l’IA se développe à un rythme effréné et de plus en plus d’entreprises l’utilisent sous une forme ou une autre. Certaines en ont effectivement recours pour générer des contenus en ligne.
De nombreux articles rédigés par des logiciels d’intelligence artificielle se retrouvent ainsi sur la toile. Il est par conséquent nécessaire de bien distinguer les textes écrits par l’homme de ceux créés par un programme d’IA. Comment faire la différence entre ces deux types de contenu ?
Utiliser des outils de détection de contenu IA
Dans un contenu dit « artificiel », les phrases semblent correctes, car les programmes d’IA utilisent le bon type de mots placés dans le bon ordre. Il est cependant important de rappeler que les assistants d’écriture ou les chatbots comme ChatGPT sont dépourvus de logique humaine. Ils n’ont pas idée de ce qui est réellement approprié et pertinent. Pourtant, les réponses qu’ils donnent ressemblent à des vérités absolues. Le recours aux outils suivants permettra donc de déterminer si la création d’un contenu, quel qu’en soit le type, est le travail d’une intelligence artificielle ou d’une personne.
Draft & Goal
Lancé par l’entreprise montréalaise Draft & Goal, ce détecteur permet de vérifier avec une fiabilité de 93 % si la rédaction d’un contenu a été réalisée par un robot conversationnel ou non. Pour ce faire, il examine les différentes empreintes laissées par les modèles d’intelligence artificielle. Pour l’instant, il est capable d’analyser uniquement les textes en anglais. Ses développeurs affirment toutefois qu’il sera bientôt disponible en version française.
AI Text Classifier
Lancé par OpenAI depuis le 31 janvier dernier, il est capable de vérifier correctement jusqu’à 1000 caractères, soit 250 mots. Il permet alors d’analyser un extrait de textes. Les porte-paroles de l’entreprise affirment qu’il s’agit d’un projet toujours en cours de développement. C’est pourquoi ils n’ont fait aucune promesse en ce qui concerne sa fiabilité. Si les enjeux sont importants, une analyse humaine est donc à envisager en complément. Ils précisent également qu’il serait préférable de l’utiliser sur des textes en anglais.
Copyleaks AI
Il utilise un système d’analyse de contenus alimenté par des algorithmes d’intelligence artificielle. Il est par conséquent capable de détecter tout ce qui a été créé par des robots textuels tels que ChatGPT. Et ce, dans plusieurs langues comme l’anglais, le français, l’allemand, le portugais ou l’espagnol. Les utilisateurs de l’outil peuvent facilement l’intégrer dans les systèmes existants. En outre, la plateforme utilise des algorithmes de cryptage avancés pour la protection des contenus analysés et respecte les normes en matière de traitement de données.
GLTR
Ce système connu sous « Giant Language model Test Room » est indispensable dans la création de contenu. Il permet entre autres de vérifier la vraisemblance de chacun des mots en prenant en compte son contexte. On peut donc s’en servir comme outil d’optimisation étant donné qu’il est capable de garantir l’authenticité d’un travail. Ce sont des chercheurs de l’Université Harvard, en collaboration avec ceux du MIT-IBM Watson Lab, qui l’ont développé.
Content at Scale Detector
Ce détecteur de contenu IA affiche une interface utilisateur sur laquelle il est possible d’insérer une URL ou d’ajouter manuellement du texte. Il fonctionne en français ainsi que dans d’autres langues. C’est aussi un outil efficace pour la rédaction de contenu puisqu’il peut fournir une table de matières ou des extraits d’informations utiles à l’optimisation sémantique. Cette fonctionnalité permet plus précisément d’utiliser la terminologie appropriée à un domaine spécifique afin qu’un contenu soit compréhensible pour ses lecteurs.
Originality.AI
Ce détecteur a été développé par des experts en marketing de contenu afin de confirmer toute suspicion d’utilisation d’outils d’écriture AI. Il détecte donc les textes générés avec une intelligence artificielle comme ChatGPT ou GPT-3. Il dispose d’une extension pour Chrome pour simplifier les tests. La plateforme comprend également des outils pour la gestion des équipes et des projets, permettant la prise en charge de plusieurs sites à la fois.
GPTZero
Cette application a été développée par Edward Tian, étudiant de Princeton. Elle fonctionne en utilisant des variables comme la perplexité, différenciant l’écriture d’une machine de celle d’un humain. Autrement dit, les textes écrits par un générateur de textes automatisé, dont le niveau de langage utilisé s’exécute de façon robotique, seront facilement identifiables. Jusqu’ici, le logiciel est toujours en perfectionnement continuel afin de venir à bout des plagiats sur ChatGPT.
Writer.com
Ce site est capable de détecter les contenus générés par ChatGPT. Cette fonction de détection de l’IA étudie les modèles et les caractéristiques de chaque forme d’écriture. C’est pourquoi la plateforme est en mesure de mettre en évidence les textes générés par des robots. Il a d’autres fonctionnalités comme l’optimisation sémantique pour corriger le style d’écriture et la détection de plagiat en vue d’un meilleur référencement.
Détecter les indices qui mettent la puce à l’oreille
Outre le recours à l’un de ces outils, il existe aussi d’autres moyens pour faire la différence entre le langage humain et celui d’une intelligence artificielle. Pour analyser les contenus IA par ChatGPT par exemple, il est possible de les examiner soi-même. Pour cela, il faudra tenir compte du fonctionnement et des limites de ce générateur de contenus. Bien entendu, une machine ne peut évidemment pas reproduire le ton et le style d’écriture d’une personne ou remplacer son point de vue.
Un excellent niveau d’orthographe
Cet indice devrait vous interpeller lorsqu’il s’agit de distinguer le travail d’un humain de celui d’une machine. Le fait que ChatGPT ne fasse pas de faute d’orthographe s’avère ainsi être une bonne nouvelle. Dans ce cas, il sera par exemple difficile pour les lecteurs de distinguer des coquilles dans ses textes malgré la complexité de la langue française. Cependant, il suffit d’intégrer une petite faute dans ses contenus pour faire illusion d’humanité.
Une base de connaissance limitée
Si l’on demande à ChatGPT de présenter le patron de Twitter, il est fort probable qu’il raconte la vue de Jack Dorsey. En conséquence, il sera facile de deviner que le contenu fourni aura été généré par cette intelligence artificielle. En d’autres termes, la base de connaissance de ChatGPT se limite en 2021. Tous les articles évoquant des événements survenus les années suivantes sont susceptibles d’être le travail d’un humain.
Une connaissance non approfondie
Les développeurs de cet outil ont certainement fait un choix pragmatique lors de sa conception. Ils ont alors décidé de miser sur la quantité des informations sans tenir compte de la qualité. À vrai dire, ChatGPT connait beaucoup de sujets en surface, mais peu en profondeur. Les contenus générés par l’intelligence artificielle manquent ainsi de détails précis, de mots complexes ou spécifiques au sujet traité.
Des contenus assez similaires
En se focalisant sur les textes générés par ChatGPT, il est possible de constater leur ressemblance. Tous les travaux pourraient effectivement présenter des constructions grammaticales identiques. Il se peut également qu’ils affichent le même raisonnement. Pour un professeur qui corrige les devoirs de ses élèves, c’est un cas qui devrait certainement l’interpeller. Cela peut évidemment arriver lorsque ces derniers n’ont pas personnalisé leur requête.
Un manque de style et de cohérence
Il est impossible, voire difficile, pour ChatGPT d’imiter le style d’écriture d’un humain. C’est pourquoi ses textes manquent d’émotion, de pertinence et de jugement. Les contenus générés ont tendance à être dénués de références personnelles qu’un auteur pourrait intégrer dans ses travaux. Il faut aussi préciser que le style d’écriture d’une intelligence artificielle reste souvent plat et dépourvu de tons spécifiques.