Comment nous utilisons l'IA et l'apprentissage automatique pour augmenter les performances du contenu SEO de 30 %

Publié: 2021-07-13

Quiconque m'a parlé au cours des neuf derniers mois saura que j'ai été au fond d'un trou de lapin d'IA. Je me suis complètement absorbé dans le fonctionnement de l'IA, et chez Ellipsis, nous l'avons rapidement adopté dans nos processus.

Le plus grand bénéficiaire a été notre travail de contenu SEO, qui constitue la majeure partie de notre travail quotidien. Nous disposons désormais d'un ensemble d'outils internes optimisés spécifiquement pour la création de contenu pour les entreprises WordPress. Cet ensemble d'outils est nettement meilleur que tout ce qui est disponible dans le commerce et nous aide à garantir que notre contenu obtient des classements et des conversions.

Nous appelons le système FALCON, et grâce à lui, nous avons amélioré les résultats du contenu SEO d'environ 30 %. C'est ainsi que tout fonctionne.

Ce post est intéressant comme instantané dans le temps ! Mais il est désormais obsolète. FALCON AI est maintenant massivement plus puissant, obtient des résultats encore meilleurs que ce que nous avons suivi ici, et des informations à jour peuvent être trouvées sur cette page dédiée : https://getellipsis.com/falcon-ai/

Présentation : que peut faire l'IA ?

Nous nous intéressons ici à quatre types d'IA :

  • classification de texte (dans quelle catégorie se trouve un texte ?)
  • génération de texte (créer une réponse principalement originale)
  • prédiction (que se passera-t-il ensuite, sur la base des données passées ?)
  • compréhension du langage naturel (que signifie le texte ?)

L'IA en 2021 est bien adaptée à ces cas d'utilisation. Chacun de ces types nécessite un « modèle » utilisé pour générer la sortie. Il en existe deux types : les auto-formés et les pré-formés.

Les modèles auto-formés sont des modèles personnalisés construits sur vos propres données pour votre cas d'utilisation. Ceci est alimenté par Machine Learning (ML), vous voyez donc souvent ML utilisé de manière interchangeable ici. Les modèles pré-formés sont formés avec les données de quelqu'un d'autre. Celles-ci ont tendance à être beaucoup plus générales, mais un bon modèle général est très puissant.

Si vous voulez savoir si une nouvelle demande de formulaire de contact est un e-mail de vente ou une demande d'assistance client, vous pouvez probablement utiliser un modèle pré-formé. Si vous souhaitez savoir à quelle équipe un message d'assistance spécifique doit être acheminé, vous aurez probablement besoin d'un modèle personnalisé auto-formé.

La grande percée de l'année dernière a été l'amélioration significative des modèles pré-formés. Les goûts du GPT-3 d'Open AI, qui génère extrêmement bien du texte, ont ouvert beaucoup plus de possibilités. Cela a été combiné avec la formation de modèles personnalisés devenant beaucoup plus accessibles (merci au client Ellipsis Akkio) : auparavant, vous aviez besoin d'un Data Scientist pour le faire.

C'est le contexte de ce que l'IA peut faire et comment nous pouvons l'utiliser. Examinons maintenant les cas d'utilisation spécifiques d'Ellipsis pour chacun d'entre eux dans notre processus de contenu SEO.

Apprentissage automatique pour augmenter le taux de réussite des combinaisons de mots clés et de titres

L'une des premières étapes du processus de production de contenu SEO est la sélection des mots clés. Nous identifierons dans quel groupe de sujets nous voulons que le contenu du client s'intègre, puis nous chercherons un bon mot-clé cible pour la publication. Si vous choisissez le mauvais mot-clé, rien de ce que vous pouvez faire avec la création de contenu ne fera fonctionner la publication.

Avec FALCON, nous utilisons un modèle d'apprentissage automatique personnalisé pour prédire les performances d'une combinaison de mots clés et de titres, en fonction de nos données internes sur le succès des publications précédentes. Ce modèle personnalisé est à lui seul responsable de la part du lion de l'augmentation de 30 % de nos performances de contenu SEO.

Nous en avons quatre versions, à vérifier :

  1. Mots clés existants
  2. Mots-clés associés
  3. Mots-clés de longue traine
  4. Mots-clés sur le contenu qui est déjà en ligne

Le premier vérifie simplement le mot-clé que vous lui avez donné et peut vérifier jusqu'à 100 mots-clés à la fois. La seconde recherche des mots-clés associés et les exécute à travers la prédiction à grande échelle (jusqu'à 100 à la fois), vous montrant les mots-clés associés qui fonctionneraient. Cela peut à son tour gérer 100 mots-clés de base à la fois, nous vérifions donc 1000 mots-clés en quelques minutes. Le troisième est similaire mais va plus loin dans les mots-clés à longue traîne. La version finale vérifie si un mot-clé cible différent sur un article existant serait plus performant.

Grâce à notre utilisation de FALCON, nous constatons à la fois une augmentation des performances du contenu que nous produisons - car nous avons une grande confiance dans le classement de la publication - et des améliorations dans les mots-clés que nous pouvons trouver, car l'IA facilite la mise en évidence des mots-clés.

Classification de l'intention de recherche à l'aide de BERT

Google souhaite offrir la meilleure expérience utilisateur possible au chercheur. Cela signifie fournir une réponse complète à tout ce qu'ils ont recherché, rapidement. Pour ce faire, Google doit comprendre ce que le chercheur recherche et si les résultats qu'il affiche fournissent la réponse à cela. Nous appelons cela l'intention de recherche.

Nous comprenons ce que le chercheur recherche en regardant les résultats affichés par Google.

BERT est une méthodologie de compréhension du langage naturel (NLU) open source de Google en 2018. BERT est utilisé par Google pour comprendre l'intention de recherche dans son contexte : si vous recherchez "albums Queen", il comprendra que Queen dans ce contexte signifie le groupe, pas reine la personne.

Google utilise la méthodologie pour comprendre ce que le chercheur recherche. Nous l'utilisons pour faire la même chose avec FALCON, en examinant les résultats et en les utilisant pour classer l'intention de recherche. Nous utilisons un modèle BERT pré-formé pour ce faire.

Cela entre dans notre processus de recherche de mots clés. Vous pouvez le faire manuellement, mais manuellement, cela a tendance à être fait sur la requête de recherche et non sur les résultats de recherche : c'est assez intuitif « acheter des thèmes WordPress » est un mot-clé d'intention d'achat. Cependant, Google génère de plus en plus de résultats inattendus, car il répond aux utilisateurs du monde réel. L'utilisation de BERT nous permet donc d'examiner les 10 meilleurs résultats et de faire une classification basée sur chacun d'eux - et cela prend environ une demi-seconde.

Traitement du langage naturel pour identifier les sujets

Google veut comprendre ce que le chercheur recherche. Afin de déterminer où classer le contenu, il doit comprendre ce qui se trouve sur une page afin de pouvoir comprendre dans quelle mesure le résultat correspond au besoin du chercheur.

Google utilise pour cela le traitement du langage naturel (NLP). Le NLP permet à Google de prendre une URL et de comprendre les entités et les sujets contenus dans la page. Une fois qu'il sait ce qu'il y a sur la page, il peut comprendre où le classer.

Le NLP est depuis longtemps un domaine de pointe du référencement, et il fait partie intégrante de notre processus de contenu depuis trois ans. Des outils commerciaux comme Clearscope, MarketMuse et Frase ont popularisé la méthodologie : ils examineront les 10 à 30 premiers résultats pour un mot-clé cible, puis agrégeront les sujets dans ces résultats. Cela vous donnera une liste de 30 à 50 sujets à couvrir dans le message, et les couvrir vous permet de vous assurer que vous avez bien répondu à toutes les questions qu'un chercheur se posera.

Il s'agit d'un processus qui a fait ses preuves et qui donne de bons résultats depuis plusieurs années.

Un exemple de couverture thématique alimentée par la PNL. Nous utilisons des outils comme Clearscope depuis un certain nombre d'années, mais nous pouvons maintenant aller au-delà avec la PNL personnalisée.

Les outils commerciaux ont cependant certaines limites. Le principal est l'IA : la PNL est bonne, mais elle a des limites. Les outils dépendent des bons résultats de la PNL qu'ils utilisent. Google, par exemple, n'est capable d'identifier qu'environ 18 % des sujets sur une page, et il les identifie souvent à tort.

Nous constatons la même chose avec les outils commerciaux : il est courant qu'ils utilisent un seul fournisseur de PNL, de sorte qu'ils passeront à côté des sujets et des entités que les publications doivent couvrir. Si vous basez votre contenu sur une liste incomplète de sujets, vous passez à côté.

Comme vous pouvez le voir dans cet exemple, j'ai exécuté la démo NLP de Google sur le meilleur poste de classement pour le "meilleur hébergement WordPress":

La classification a généralement fonctionné, mais Google pense que Hostinger est une personne et non une entreprise.

Cela nous a conduit à développer notre propre solution FALCON NLP, pour mieux capter les sujets spécifiques à WordPress .

Grâce à notre solution NLP interne, nous pouvons obtenir une meilleure identification des sujets. Cela nous permet de produire un contenu plus complet même que le contenu concurrent produit avec des outils commerciaux.

Si vous pouvez obtenir une meilleure identification des sujets à couvrir et vous assurer que votre contenu permet à Google d'identifier vos sujets, vous avez un avantage concurrentiel. C'est ce que contient notre contenu.

Nous utilisons également le NLP dans notre phase de recherche de mots clés pour regrouper automatiquement les mots clés en groupes de sujets. Auparavant, il s'agissait d'un processus manuel lent, l'automatisation est donc extrêmement utile.

Modèles GPT-3 personnalisés pour la génération de titres

J'ai souligné GPT-3 ci-dessus. GPT-3 est une technologie remarquable créée par Open AI. Il fait de la génération de texte, et il fait du bon travail. GPT-3 est formé sur 175 milliards de paramètres et peut écrire un texte court qui ne se distingue pas de ce qu'un humain peut faire. C'est assez incroyable.

Nous n'utilisons pas GPT-3 pour la génération de contenu de forme longue, comme j'y reviendrai plus tard. Ce que nous faisons, cependant, c'est utiliser des modèles personnalisés pour des parties spécifiques du processus de contenu. C'est un truc assez puissant.

Une grande partie du battage médiatique pour GPT-3 vient de ce que vous pouvez en faire. Il y a une longue liste d'applications construites dessus. La «rédaction d'IA» est l'un des domaines les plus évidents pour GPT-3, et il y a actuellement une course aux armements pour créer des outils qui le font. Tous ces outils sont construits sur l'API GPT-3 d'Open AI.

La limitation des outils commerciaux est que vous dépendez des invites génériques. Le "générateur de titres d'articles de blog" que vous obtiendrez d'un "rédacteur IA" SaaS doit fonctionner avec tous les types de titres. Nous avons besoin de quelque chose de spécifiquement optimisé pour le contenu WordPress.

Nous utilisons l'IA pour générer des titres extrêmement bien optimisés pour le référencement. Avec FALCON, nous pouvons prendre un mot-clé cible, rechercher les meilleurs résultats, puis utiliser GPT-3 pour générer des titres similaires aux résultats de contenu les mieux classés (nous filtrons les résultats des publications hors blog). Le résultat est un titre parfaitement optimisé pour Google , car il est basé sur ce qui est déjà classé.

C'est là que l'IA est bien meilleure que les humains : l'IA peut examiner les nuances des résultats et générer plusieurs versions à la volée. Nous générons ainsi plusieurs options de titre et les exécutons à travers l'étape d'apprentissage automatique décrite ci-dessus : FALCON produira alors le titre gagnant.

FALCON au travail sur des titres hautement optimisés : l'IA génère des titres en fonction des meilleurs résultats, puis nous testons plusieurs versions pour obtenir l'option gagnante.

Nous ne réalisons aucune économie de temps ou d'argent ici (cela prend plus de temps et coûte plus cher), mais nous pouvons désormais évaluer de nombreuses autres options à grande échelle et proposer les meilleures à nos clients. Mes remerciements au Dr Oliver Crook de l'Université d'Oxford pour son soutien à ce sujet.

Une question évidente est : qu'en est-il du contenu généré par l'IA ? Je suis assez optimiste sur le fait que c'est une idée terrible, car j'y reviendrai.

Qu'en est-il du contenu généré par l'IA ?

Nous n'utilisons PAS GPT-3 pour la génération de contenu long. GPT-3 est terrible pour le contenu long car il ne sait pas de quoi il parle. Il n'a aucune idée de ce qu'est la vérité : il peut relier des mots entre eux, mais il n'a aucune idée de ce qu'ils signifient.

Alors que Google valorise de plus en plus l'autorité en la matière, utiliser une IA qui n'a aucune idée de ce dont elle parle est une recette pour le désastre.

Des outils comme Conversion.AI sont sympas, mais les utiliser pour la génération de contenu long est une très mauvaise idée. Le contenu long doit avoir une perspicacité et une expertise, et l'IA n'a aucune idée de quoi il parle.

Nous utilisons donc la génération de texte en marge de notre processus de contenu pour apporter des améliorations et trouver des gains d'efficacité, mais nous n'utilisons pas GPT-3 pour la génération de contenu long.

Au contraire, l'augmentation de cela nous rend plus heureux de doubler notre travail avec des experts en la matière. Ces experts coûtent cher, mais si d'autres commencent à essayer de générer automatiquement du contenu qui pourrait être absurde, nous et nos clients aurons encore plus d'avantages concurrentiels. L'amener sur!

Le système FALCON et comment l'obtenir

Jusqu'à présent, nos résultats ont montré une amélioration de 30 % des résultats de contenu SEO depuis que nous avons commencé à implémenter sérieusement l'IA dans notre processus de contenu. Depuis le début de cette année, nous avons commencé à réaliser ces résultats pour nos clients.

Le système dans son ensemble est étiqueté le système FALCON. Il s'agit de notre collection d'outils internes conçus pour augmenter le succès du travail de contenu SEO que nous effectuons pour les clients.

FALCON est désormais inclus dans tous nos packages de croissance de contenu pour le contenu SEO. Vous pouvez voir les détails ici, ou nous contacter pour voir comment nous pouvons vous aider.