Comment optimiser votre WordPress Robots.txt pour le référencement à l'aide de Yoast SEO

Publié: 2023-10-25

L'optimisation des moteurs de recherche (SEO) est un élément crucial de la création d'un site Web efficace, et l'un des facteurs les plus importants pour réussir son référencement est d'utiliser les bons outils pour optimiser votre site. L'un de ces outils est le fichier Robots.txt, qui contrôle la manière dont les robots des moteurs de recherche accèdent et indexent votre contenu.

L'optimisation de votre fichier WordPress Robots.txt peut vous aider à obtenir un meilleur classement dans les moteurs de recherche, à améliorer la visibilité de votre site Web et à augmenter votre trafic.

Cependant, malgré son importance, de nombreux propriétaires de sites Web ne savent pas comment configurer correctement leur fichier Robots.txt. Dans cet article de blog, nous vous guiderons à travers tout ce que vous devez savoir pour maîtriser votre WordPress Robots.txt pour le référencement et libérer tout le potentiel du référencement pour votre site Web.

Comprendre le rôle du robots.txt dans le référencement

Comprendre la fonction du fichier robots.txt dans l’optimisation des moteurs de recherche est essentiel pour tirer le meilleur parti des efforts d’optimisation de votre site WordPress et générer les meilleurs résultats possibles. Un fichier texte appelé Robots.txt, qui peut également être appelé Protocole d'exclusion des robots, donne des instructions aux robots des moteurs de recherche sur les zones de votre site Web qu'ils doivent explorer et indexer.

Lorsque les robots des moteurs de recherche visitent votre site Web, la première chose qu’ils font est de rechercher dans le répertoire racine un fichier appelé robots.txt. Ce fichier sert de guide aux robots, les informant sur les sites et fichiers qu'ils sont autorisés à visiter ainsi que sur ceux qu'ils ne peuvent pas visiter.

Vous avez un contrôle total sur le matériel présenté aux moteurs de recherche et sur ce qui leur est masqué si vous configurez correctement votre fichier robots.txt.

L'efficacité de l'analyse de votre site Web doit principalement être améliorée en utilisant le fichier robots.txt. Il aide les robots des moteurs de recherche à se concentrer sur l'exploration et l'indexation des parties les plus vitales de votre site Web, évitant ainsi de gaspiller des ressources sur des sites non essentiels ou des documents sensibles qui ne devraient pas être mis à la disposition du grand public.

WordPress Robots.txt pour le référencement

Qu'est-ce qu'un fichier Robots.txt exactement ?

Un simple fichier texte appelé Robots.txt dirige les robots d'exploration utilisés par les moteurs de recherche vers certaines pages Web de votre site Web. De plus, il demande aux robots de ne pas explorer certains sites.

Il est essentiel que vous compreniez le fonctionnement d’un moteur de recherche avant de procéder à l’analyse approfondie de cet article.
L'exploration, l'indexation et le classement sont les trois principales activités effectuées par les moteurs de recherche.

La première chose que font les moteurs de recherche est d’envoyer leurs robots d’exploration, également appelés araignées ou robots, partout sur le World Wide Web. Ces programmes, appelés robots, sont des logiciels intelligents qui parcourent l'ensemble du Web à la recherche de nouvelles connexions, pages et sites Web. L'exploration est le terme donné au processus de recherche dans le contenu du Web.

Les pages de votre site Web seront organisées en une structure de données qui pourra être utilisée une fois que les robots les auront découvertes. L'indexation est le nom donné à cette procédure.

Et au final, tout se résume au classement. Lorsqu'un utilisateur saisit une requête de recherche, le moteur de recherche doit offrir à l'utilisateur les informations les meilleures et les plus pertinentes qu'il puisse trouver en fonction de ce qu'il recherche.

À quoi ressemble le fichier Robots.txt ?

Le fichier robots.txt est un élément essentiel de la structure et des fonctionnalités d'un site Web, mais vous êtes-vous déjà demandé comment il apparaît réellement ?

Le fichier est applicable à tous les robots des moteurs de recherche qui visitent le site Web, comme l'indique l'astérisque qui suit User-agent. Chaque moteur de recherche utilise un agent utilisateur différent pour explorer Internet.

Par exemple, Google utilise Googlebot pour indexer le contenu de votre site Web pour la recherche Google. Ces user-agents se comptent par centaines. Des instructions personnalisées peuvent être configurées pour chaque agent utilisateur. Par exemple, la première ligne de votre fichier robots.txt devrait être : « Si vous souhaitez définir des instructions spécifiques pour le Googlebot, il sera connu sous le nom d'agent utilisateur : Googlebot.

Qu’est-ce que le budget Crawl exactement ?

Le budget d'exploration fait référence au nombre de pages qu'un moteur de recherche est prêt à explorer sur un site Web dans un délai donné. Il est déterminé par divers facteurs tels que l'autorité du site Web, sa popularité et la capacité du serveur à gérer les demandes d'exploration. De plus, vous devez vous assurer que le budget d’exploration est utilisé aussi efficacement que possible pour votre site Web.

Vos pages les plus importantes doivent sûrement être explorées en premier par le bot si votre site Web comporte plusieurs pages. Il est donc impératif de le préciser spécifiquement dans votre fichier robots.txt.

Comment localiser et modifier le fichier robots.txt dans WordPress ?

La localisation et la modification du fichier robots.txt dans WordPress sont une étape cruciale dans l'optimisation de votre site Web pour les moteurs de recherche. En configurant correctement ce fichier, vous pouvez contrôler quelles parties de votre site sont accessibles aux robots des moteurs de recherche, en vous assurant qu'ils se concentrent sur les pages et le contenu les plus importants.

Pour localiser et modifier le fichier robots.txt dans WordPress, suivez ces étapes simples :

1. Connectez-vous à votre tableau de bord WordPress.
2. Accédez à l'onglet « Paramètres » dans le menu de gauche.
3. Cliquez sur « Lecture » pour accéder aux paramètres de lecture.
4. Faites défiler vers le bas jusqu'à ce que vous trouviez la section « Visibilité des moteurs de recherche ».
5. Ici, vous verrez une option indiquant « Dissuader les moteurs de recherche d'indexer ce site ». Assurez-vous que cette option n'est pas cochée, car elle générera un fichier robots.txt de base qui limitera l'accès des moteurs de recherche à l'ensemble de votre site.
6. Si vous souhaitez personnaliser davantage votre fichier robots.txt, vous pouvez le faire en accédant au répertoire racine de votre site Web. Cela peut généralement être effectué via un client FTP ou un gestionnaire de fichiers cPanel.
7. Une fois que vous avez localisé le répertoire racine, recherchez le fichier nommé « robots.txt ».
8. Téléchargez une copie du fichier robots.txt existant sur votre ordinateur en tant que sauvegarde, au cas où des problèmes surviendraient lors de l'édition.
9. Ouvrez le fichier robots.txt à l'aide d'un éditeur de texte.
10. Personnalisez le fichier selon vos besoins. Vous pouvez ajouter des directives spécifiques pour autoriser ou interdire l'accès à certaines zones de votre site. Par exemple, vous pouvez empêcher les moteurs de recherche d'explorer votre zone d'administration en ajoutant la ligne suivante :
1. Interdire : /wp-admin/
11. Enregistrez les modifications apportées au fichier robots.txt et téléchargez-le à nouveau dans le répertoire racine de votre site Web, en remplaçant la version précédente.
12. Enfin, testez votre fichier robots.txt à l'aide de l'outil de test robots.txt de Google ou d'autres outils similaires pour vous assurer qu'il est correctement configuré.

Le contrôle de la manière dont les robots des moteurs de recherche interagissent avec votre site Web peut être effectué dans WordPress en identifiant et en modifiant le fichier robots.txt au bon emplacement. Cela vous permettra d'obtenir les meilleurs résultats possibles en termes de visibilité et de classement de votre site Web. Si vous investissez le temps d’apprendre et de devenir un expert dans cette facette de l’optimisation des moteurs de recherche (SEO), vous serez sur la bonne voie pour débloquer le succès de votre site WordPress.

Comment créer un fichier Robots.txt dans WordPress ?

Allons de l'avant et créons un fichier Robots.txt WordPress pour le référencement maintenant que nous avons expliqué ce qu'est un fichier robots.txt et pourquoi il est si crucial. WordPress vous propose deux options distinctes pour générer un fichier robots.txt. La première méthode implique l’utilisation d’un plugin WordPress, tandis que la seconde implique le téléchargement manuel du fichier dans le dossier racine de votre site Web.

Étape 1 : Il s'agit d'utiliser le plugin Yoast SEO pour créer un fichier Robots.txt

Vous pouvez utiliser des plugins SEO pour vous aider à optimiser votre site Web construit sur WordPress. La majorité de ces plugins fournissent leur propre générateur de fichiers robots.txt dans leur package d'installation.

Tout d’abord, téléchargez et installez le plugin.

Accédez au menu Plugins et cliquez sur « Ajouter un nouveau ». L'étape suivante consiste à rechercher le plugin Yoast SEO, à le télécharger et à l'activer si vous ne l'avez pas déjà.

Créez le fichier robots.txt comme deuxième étape

Créer un fichier txt de robots à l'aide de Yoast

Vous remarquerez le fichier créé avec certaines directives par défaut.

Le générateur de fichiers robots.txt pour Yoast SEO inclura automatiquement les directives suivantes :

Agent utilisateur : * Interdire : /wp-admin/ Autoriser : /wp-admin/admin-ajax.php

Ajoutez des instructions supplémentaires au robots.txt. Après avoir modifié le fichier robots.txt, cliquez sur Enregistrer.

Entrez votre nom de domaine et « /robots.txt ». Votre fichier robots.txt est complet si le navigateur affiche les directives par défaut, comme indiqué ci-dessous.
fichier txt des robots générés

Nous vous recommandons également d'ajouter l'URL du plan du site dans votre robots.txt.

Fichier txt des robots par défaut
Une fois le plugin activé, accédez à Yoast SEO > Outils et choisissez Éditeur de fichiers dans le menu déroulant. Continuez à remplir votre nom de domaine, puis suivez-le avec « /robots.txt ». Si vous regardez sur le navigateur, vous remarquerez certaines directives par défaut affichées.

Étape 2 : Utilisation de FTP pour créer manuellement le fichier Robots.txt

  • Créer un fichier robots.txt sur votre ordinateur local, puis le télécharger dans le dossier racine de votre site Web WordPress est la prochaine étape du processus.
  • En plus de cela, vous aurez besoin d'accéder à votre hébergement WordPress via l'utilisation d'un programme FTP tel que Filezilla. Si vous ne disposez pas déjà des identifiants nécessaires pour vous connecter, ils vous seront rendus accessibles via le panneau de contrôle de votre service d'hébergement. Par conséquent, vous pouvez vérifier si le fichier robots.txt est présent dans le dossier racine de votre site Web après vous être connecté avec votre programme FTP.
  • robots

  • Cliquez avec le bouton droit sur le fichier et choisissez Modifier s'il existe.

modifier des robots

Par conséquent, lorsque vous vous serez connecté avec succès avec votre client FTP, vous pourrez vérifier si le fichier robots.txt se trouve dans le dossier racine de votre site Web. Entrer votre nom de domaine suivi de « /robots.txt » est le meilleur moyen de déterminer si votre fichier a été téléchargé avec succès ou non.

Après avoir effectué vos modifications, cliquez sur « Enregistrer ».

Vous devrez créer le fichier s'il n'existe pas déjà. On pourrait en faire en ajoutant les directives à un fichier à l'aide d'un éditeur de texte de base comme le Bloc-notes. Tel que

Agent utilisateur : * Interdire : /wp-admin/ Autoriser : /wp-admin/admin-ajax.php

Cliquez sur « Télécharger un fichier » dans votre client FTP pour télécharger le fichier dans le dossier racine du site Web.

dossier racine

Tapez votre nom de domaine et « /robots.txt » pour voir si votre fichier a été téléchargé avec succès.

C'est la méthode pour télécharger manuellement le fichier robots.txt sur votre site WordPress !

Robots.txt : connaît ses avantages et ses inconvénients

Les avantages de l'utilisation du fichier robots.txt

Il demande au moteur de recherche de ne pas passer de temps sur les sites que vous ne souhaitez pas indexer, ce qui permet d'optimiser les budgets d'exploration du moteur de recherche. Ce faisant, vous augmentez la probabilité que les moteurs de recherche explorent les sites qui vous sont les plus essentiels.

Bloquer les robots qui gaspillent ainsi les ressources de votre serveur Web contribue à l'optimisation du serveur.
Il est utile pour masquer les pages de remerciement, les pages de destination, les pages de connexion et autres pages qui n'ont pas besoin d'être indexées par les moteurs de recherche.

Aspects négatifs du fichier robots.txt

Vous devriez maintenant pouvoir afficher le fichier robots.txt sur n'importe quel site Web en utilisant les informations fournies ici. Ce n'est pas trop difficile à comprendre. Tapez simplement le nom de domaine, suivi de « /robots.txt » et appuyez sur Entrée.

Cependant, cela comporte également, dans une certaine mesure, un danger. Il est possible que le fichier WordPress Robots.txt pour SEO contienne des URL vers certaines des pages internes de votre site Web que vous souhaiteriez ne pas indexer par les moteurs de recherche.

Par exemple, il peut y avoir une page de connexion que vous ne souhaitez pas indexer pour une raison quelconque. Cependant, le fait qu’il soit mentionné dans le fichier robots.txt permet aux attaquants de voir le site Internet. Si vous tentez de dissimuler certaines informations sensibles, la même chose s'applique.

Même si vous faites une seule faute de frappe lors de la rédaction du fichier robots.txt, cela perturbera tous vos efforts d'optimisation des moteurs de recherche (SEO). Cela est vrai même si le fichier est facile à créer.

Où placer le fichier Robots.txt
Supposons qu'à ce stade, vous connaissiez l'emplacement où le fichier robots.txt doit être inséré.

Le fichier robots.txt de votre site Web doit toujours se trouver dans le répertoire racine du site Web. L'URL du fichier robots.txt sur votre site Web sera https://votredomaine.com/robots.txt si votre nom de domaine est votredomaine.com.

En plus de placer votre fichier robots.txt dans le répertoire racine de votre site Web, voici quelques autres pratiques recommandées qui doivent être respectées :

  • Il est très nécessaire de donner à votre fichier le nom robots.txt.
  • Il est important de mettre le nom en majuscule. Par conséquent, vous devez l’obtenir correctement, sinon il ne fonctionnera pas.
  • Chaque instruction doit être placée sur une ligne distincte.
  • Lorsqu'une URL est complète, elle doit être marquée du signe « $ ».
  • Une seule instance de chaque agent utilisateur doit être utilisée.
  • Afin de fournir aux humains une explication du contenu de votre fichier robots.txt, utilisez les commentaires en commençant chaque ligne par un dièse (#).

Tester et valider votre fichier robots.txt

Tester et valider votre fichier robots.txt est une étape cruciale pour garantir que les moteurs de recherche explorent et indexent correctement votre site Web. Un fichier robots.txt bien optimisé peut empêcher les moteurs de recherche d'accéder à des pages sensibles ou non pertinentes, améliorer l'efficacité de l'exploration et, en fin de compte, améliorer les performances globales de votre site Web.

Pour commencer à tester votre fichier robots.txt, vous pouvez utiliser divers outils en ligne spécialement conçus à cet effet. Ces outils vous permettent de saisir vos directives robots.txt et de simuler la façon dont les moteurs de recherche les interprètent et les suivent.

En analysant les résultats, vous pouvez identifier tout problème potentiel ou mauvaise configuration dans votre fichier. Il est crucial de surveiller et de mettre à jour régulièrement votre fichier robots.txt, en particulier lorsque vous apportez des modifications à la structure ou au contenu de votre site Web.

En restant vigilant, vous pouvez rapidement identifier et corriger tout problème qui pourrait survenir. Cette approche méticuleuse contribuera à terme à la perceptibilité, à l'indexation et au succès global de votre site Web dans le paysage numérique.

L'outil que nous vous proposons ici est Google Search Console

Vous pouvez ajouter votre site Web à Google Search Console en accédant au lien « Ajouter une propriété maintenant » et en suivant les instructions simples qui s'affichent à l'écran. Une fois que vous avez terminé, le menu déroulant intitulé « Veuillez sélectionner une propriété » inclura votre site Web parmi les options.

Après avoir sélectionné le site Web, l'outil obtiendra automatiquement le fichier robots.txt associé à votre site Web et mettra en évidence les erreurs ou les avertissements, le cas échéant.

Un fichier Robots.txt est-il nécessaire pour votre site Web WordPress ?

En effet, votre site WordPress a besoin d’un fichier robots.txt. Même si votre site Web ne possède pas de fichier robots.txt, les moteurs de recherche l'exploreront et l'indexeront néanmoins. Maintenant que nous avons discuté de l'objectif, du fonctionnement et du budget d'exploration de robots.txt, pourquoi voudriez-vous en omettre un ?

Les moteurs de recherche apprennent ce qu’il faut explorer et, plus important encore, ce qu’il ne faut pas explorer via le fichier robots.txt.

Considérer les conséquences négatives du budget de crawl est l’une des principales raisons d’ajouter le fichier robots.txt.

Comme dit précédemment, chaque site Web dispose d’un budget d’exploration. Tout dépend du nombre de sites visités par un robot en une seule session. Le robot reviendra et poursuivra son exploration lors de la session suivante s'il ne termine pas toutes les pages de votre site Web au cours de cette session.
En outre, cela ralentit la vitesse à laquelle votre site Web est indexé.

Vous pouvez enregistrer votre quota d'exploration en corrigeant rapidement ce problème en empêchant les robots de recherche d'analyser les ressources multimédias, les répertoires de thèmes, les plugins et les sites superflus.

Derniers mots
Nous accordons la priorité à l'optimisation du contenu, à la recherche de mots clés, à la création de backlinks, à la création d'un sitemap.xml et à d'autres tâches liées au référencement tout en travaillant sur votre site Web. WordPress Robots.txt pour le référencement est un aspect que certains webmasters négligent.

Le fichier robots.txt peut ne pas être très important lors du premier lancement de votre site Web. Cela étant dit, lorsque votre site Web devient plus grand et compte plus de pages, cela rapportera gros si nous commençons à utiliser le fichier robots.txt recommandé.