Comment détecter l'écriture d'IA en 2023
Publié: 2023-07-29Depuis la sortie de ChatGPT fin 2022, l'intelligence artificielle (IA) a explosé. Il existe des programmes d'IA pour créer de l'art, des voix, des vidéos, de l'écriture et bien plus encore. L'IA peut être un excellent compagnon pour augmenter la productivité et stimuler la créativité. Cependant, comme pour toute nouvelle technologie, certaines personnes en profiteront de manière contraire à l'éthique. Dans cet article, nous explorerons le monde de l'IA et offrirons quelques conseils sur la façon de détecter l'écriture de l'IA.
Commençons.
- 1 Qu'est-ce que l'écriture IA ?
- 2 Comment fonctionnent les rédacteurs IA ?
- 3 défis de l'écriture d'IA
- 4 Comment détecter l'écriture de l'IA
- 4.1 Ton et style
- 4.2 Précision
- 4.3 Manque de touche personnelle
- 4.4 Langage répétitif
- 4.5 Outils de détection de contenu IA
- 5 Utiliser Originality.ai pour détecter l'écriture AI
- 5.1 Inscrivez-vous à Originality.ai
- 5.2 Réalisation de votre premier scan
- 6 Utilisation de GPTZero pour détecter l'écriture AI
- 7 réflexions finales sur la détection de l'écriture de l'IA
Qu'est-ce que l'écriture IA ?
L'écriture par IA est l'utilisation de l'intelligence artificielle pour créer un contenu original via des modèles de langage, tels que ChatGPT. Tout ce que vous avez à faire est de saisir une invite de texte décrivant le type de contenu que vous souhaitez, et AI fournira ce contenu en quelques secondes. Alors que l'écriture assistée par l'IA existe depuis quelques années, elle a explosé au cours de la dernière année. Il existe des dizaines de logiciels d'écriture d'IA disponibles, chacun avec sa propre niche. Ils peuvent créer des contours de blog, des titres accrocheurs, des articles de blog complets, etc. Au fur et à mesure que la technologie évolue, il sera de plus en plus difficile de détecter l'écriture de l'IA. Cependant, ces derniers mois, plusieurs détecteurs de contenu IA ont été publiés qui peuvent aider à repérer le contenu généré artificiellement.
Comment fonctionnent les rédacteurs IA ?
La plupart des rédacteurs d'IA sont basés sur le transformateur 3 pré-formé génératif (GPT3) d'OpenAI, qui utilise un algorithme de modèle de grand langage (LLC). Les LLM fonctionnent en utilisant l'ensemble de données sur lequel ils ont été formés pour enchaîner des phrases en prédisant quels mots sont susceptibles d'être placés les uns à côté des autres tout en conservant le contexte. Dans la plupart des cas, l'IA réussit. Cependant, il y a des moments où des hallucinations ou des mensonges se produisent. Généralement, cela se produit environ 20 % du temps.
Lorsque vous utilisez l'IA générative pour écrire du contenu, il y a quelques points à garder à l'esprit. Dans le cas de ChatGPT, son ensemble de données est basé sur environ 570 Go d'informations extraites d'Internet jusqu'en septembre 2021. Cela comprend des blogs, des livres, des résultats de recherche et d'autres informations pertinentes. Par conséquent, si vous posez des questions sur quoi que ce soit au-delà de 2021, cela générera généralement une sortie incorrecte. C'est pourquoi il est extrêmement important non seulement de vérifier tout ce qu'il génère, mais essentiellement de ne jamais copier ce qu'il vous donne mot pour mot.
Défis de l'écriture d'IA
Les outils d'écriture d'IA peuvent aider à stimuler la productivité et la créativité et aider ceux qui ont peu ou pas de compétences en écriture à devenir de meilleurs créateurs de contenu. Cependant, ils présentent des défis. Avec les améliorations apportées aux générateurs de texte IA, il deviendra de plus en plus difficile de faire la différence entre le contenu écrit par l'homme et celui écrit par ordinateur. Le contenu écrit par l'IA peut sembler sans émotion, manquer de créativité et se limiter à l'ensemble de données sur lequel il est formé. Bien qu'OpenAI déclare que le contenu généré est original, il utilise une association de mots et extrait ses informations de données sur Internet. Pour cette raison, le plagiat, les fausses informations et la violation du droit d'auteur suscitent des inquiétudes.
Sans freins et contrepoids, certaines personnes utiliseront l'IA de manière irresponsable, obligeant les entreprises à prendre des mesures supplémentaires pour s'assurer que les employés utilisent l'IA de manière responsable et éthique. Heureusement, il y a quelques éléments à surveiller lors de la détection de l'écriture par l'IA.
Comment détecter l'écriture de l'IA
Même avec de bons outils de détection d'IA, il n'y aura jamais de certitude à 100 % qu'ils capteront chaque élément de contenu généré par l'IA. Par conséquent, il est important de l'identifier par d'autres moyens.
Ton et style
L'un des plus gros problèmes avec le contenu de l'IA est à quel point le ton et le style peuvent être incohérents. Alors que les modèles d'IA ont fait des progrès incroyables au cours de la dernière année, ils ont encore du mal à produire du contenu de type humain. Cela peut être principalement attribué aux données sur lesquelles les modèles GPT3 ont été entraînés. Comme mentionné précédemment, lorsque les LLM créent du contenu, ils utilisent l'association pour déterminer la probabilité de placement des mots. Par conséquent, la sortie est souvent enchaînée, ce qui lui donne un manque de mots de transition ou de tonalités variables, ce qui la rend presque robotique. Prenons ChatGPT comme exemple.
Nous avons fourni l'invite : Écrivez un paragraphe sur les animaux marins .
ChatGPT a produit ceci :
Il est difficile de déterminer le contenu généré par l'IA à l'aide de cette méthode, mais il y a une chose à retenir. Lorsque les gens écrivent, les tons et les styles varient généralement dans le texte, contrairement aux ordinateurs. Il y a souvent des changements dans les schémas de pensée chez les humains, entraînant un changement de ton. Avec les ordinateurs, ils produisent le contenu contenu dans leur ensemble de données, ce qui donne un résultat plus uniforme.
Précision
Un autre drapeau rouge est un manque de précision. Nous en avons parlé plus tôt dans cet article, mais il est important de le développer. Comme indiqué précédemment, ChatGPT a été formé sur une énorme quantité de données jusqu'en 2021. Par conséquent, les résultats seront sans aucun doute faussés s'ils sont interrogés sur les événements actuels ou des informations après cette date. Ainsi, lors de la lecture de contenu sur Internet, il est impératif de tout vérifier. Les mises à jour récentes de ChatGPT incluent du verbiage indiquant que la réponse est pertinente à partir de septembre 2021 lorsque vous posez des questions sur les événements actuels. Gardez à l'esprit, cependant, que même si cette mise à jour est utile, il est toujours possible d'obtenir une sortie qui n'est pas exacte.
À l'aide de ChatGPT, nous avons saisi l'invite suivante : fournissez un paragraphe expliquant ce qu'est l'IA du personnage.
C'était la sortie:
Nous essayions de le tromper pour qu'il nous donne de fausses informations en posant des questions sur l'IA du personnage. ChatGPT a fait de son mieux pour nous informer de ce qu'il pensait être Character AI, étant donné que la plate-forme n'était accessible au public qu'un an plus tard.
Manque de touche personnelle
Un excellent moyen de repérer le contenu créé par ordinateur consiste à noter un manque d'opinion personnelle ou d'émotion. La plupart des écrivains humains incorporeront de l'argot ou fourniront des opinions personnelles tout au long de leur écriture. Alternativement, les ordinateurs sont plus pragmatiques, ne vous présentant qu'une réponse. Vous ne trouverez généralement aucune émotion ou croyance.
Par exemple, nous avons demandé à ChatGPT de fournir un paragraphe sur les avatars IA de Synthesia.
C'était sa sortie:
Bien qu'il ait bien expliqué ce que l'entreprise fait avec les avatars IA, cela semble très monotone, manquant d'émotion ou de profondeur.
Langage répétitif
Une autre façon de repérer le contenu généré par l'IA consiste à utiliser un langage répétitif. Si vous remarquez beaucoup de bourrage de mots-clés dans un article, il y a de fortes chances qu'il ait été créé par l'intelligence artificielle. Étant donné que les gens utilisent des invites pour générer une sortie AI, ils incluent souvent des mots-clés dans l'invite. Cela se traduit généralement par des cas où ce mot est répété encore et encore dans le texte.
Par exemple, nous avons demandé à ChatGPT de nous fournir une explication sur l'IA. C'était le résultat:
Il a produit environ 250 mots, le mot AI étant répété 16 fois. Selon un plugin SEO populaire, Yoast SEO, il ne devrait y avoir que 8 instances de ce mot-clé dans cette quantité de texte.
Outils de détection de contenu IA
Enfin, vous pouvez utiliser un outil de détection de contenu IA pour aider à identifier le contenu généré par ordinateur. Ils analysent le texte en utilisant le contexte pour comprendre la probabilité que des mots apparaissent ensemble. Plus le modèle est prévisible, plus il est probable qu'il soit généré par l'IA. Contrairement aux humains, l'IA n'écrit généralement pas de phrases plus créatives, est plus prévisible et n'offre pas d'opinions.
Il existe plusieurs outils de détection de contenu AI pour le texte et les images, certains des plus populaires étant Originality AI et GPTZero. Dans la section suivante, nous vous donnerons un bref aperçu de la façon dont chacun fonctionne et comment l'utiliser.
Utiliser Originality.ai pour détecter l'écriture de l'IA
Originality.ai est l'un des principaux outils utilisés par les spécialistes du marketing pour détecter le contenu de l'IA. Créé principalement pour identifier le contenu généré via ChatGPT, GPT-4 et Bard, il utilise le traitement du langage naturel pour identifier l'IA. Bien qu'il ne s'agisse pas d'un service gratuit, son prix est raisonnable de 0,01 ¢ pour 100 mots vérifiés. Il existe également une extension Chrome que vous pouvez essayer et qui vous donne 50 crédits.
Inscrivez-vous à Originality.ai
La première étape consiste à vous inscrire. Allez sur leur site Web et cliquez sur le bouton S'inscrire en haut à droite de votre écran pour commencer.
Ensuite, entrez votre nom, votre adresse e-mail, créez un mot de passe et acceptez les termes et conditions. Cliquez ensuite sur Continuer .
À l'étape suivante, vous remplirez les informations de votre carte de crédit et accepterez d'acheter 20 $ de crédits, vous achetant environ 20 000 mots de détection d'IA.
Réalisation de votre premier scan
Une fois connecté, le tableau de bord est intuitif. Le contenu peut être analysé en saisissant une URL, en téléchargeant un fichier ou en collant du texte. Pour effectuer votre première analyse, cliquez sur l'onglet analyseur de contenu , puis sélectionnez démarrer une nouvelle analyse .
Nous allons saisir quelques paragraphes d'un article de presse extrait de Google dans le scanner pour tester la fonctionnalité. Pour démarrer un scan, collez le texte dans l'éditeur (1). Ensuite, cliquez sur analyser maintenant (2). Vous pouvez entrer un titre ou laisser Originality.ai en créer un pour vous (3).
Une fois l'analyse terminée, Originality.ai évaluera votre contenu et déterminera s'il est humain, partiel ou entièrement IA. Dans cet exemple, le scanner d'Originality a noté un score d'origine de 100 %.
Essayons un autre exemple avec un paragraphe entièrement généré avec ChatGPT.
Comme vous pouvez le voir, les résultats sont assez précis. Cependant, il est important de détecter l'IA avec un œil exercé et d'utiliser un outil de détection d'IA pour obtenir les meilleurs résultats.
Utilisation de GPTZero pour détecter l'écriture AI
Utilisons un autre détecteur de contenu AI populaire, GPTZero. Celui-ci vous permet de détecter gratuitement jusqu'à 5000 caractères. Vous pouvez acheter des personnages supplémentaires en créant un compte. La numérisation de texte est facile avec GPTZero. Collez le texte (1) que vous souhaitez numériser ou téléchargez un fichier (2), acceptez les conditions d'utilisation (3), puis cliquez sur le bouton Obtenir les résultats (4).
En utilisant le premier paragraphe de notre page Divi, GPTZero nous fait savoir que notre texte est susceptible d'être entièrement écrit par un humain :
Enfin, utilisons le texte que nous avons généré à l'aide de ChatGPT :
Bien qu'il n'ait pas pu identifier que le contenu a été entièrement généré à l'aide de l'IA, il a découvert qu'il était probablement utilisé.
Réflexions finales sur la détection de l'écriture IA
L'écriture d'IA a rapidement évolué depuis la sortie de ChatGPT, devenant une partie intégrante de la façon dont le contenu est créé. Bien qu'il y ait des avantages à l'utiliser, il est important de pouvoir reconnaître le contenu de l'IA. Avec la technologie qui progresse à un rythme rapide, il sera toujours difficile de détecter l'écriture de l'IA. En reconnaissant les incohérences telles que le ton et le style incohérents, le manque d'émotion et le langage répétitif, vous pouvez entraîner vos yeux à identifier où l'IA est utilisée. De plus, vous pouvez incorporer un outil de détection d'IA comme Originality.ai ou GPTZero pour vous aider à l'identifier.
Vous souhaitez en savoir plus sur l'IA ? Découvrez quelques-uns de nos articles récents :
- 31 façons d'utiliser l'IA aujourd'hui (Guide 2023)
- 16 meilleurs assistants IA pour vous rendre plus productif en 2023
- Writesonic Review 2023 : Le meilleur logiciel d'écriture IA ?
- Qu'est-ce que Copy.ai et comment l'utiliser (10 conseils de pro)
Image sélectionnée via BestForBest / shutterstock.com