Cum să remediați eroarea „Sitemap-ul dvs. pare a fi o pagină HTML”.

Publicat: 2022-08-28

O hartă a site-ului constă din pagini create special pentru roboții și crawlerele motoarelor de căutare. Acesta vizează o mai bună înțelegere a site-urilor web și indexarea paginilor. Cu alte cuvinte, este o listă structurată de pagini pe care roboții motoarelor de căutare să le acceseze cu crawlere și să le indexeze pe site-ul dvs.

Cu o hartă a site-ului, vă puteți promova conținutul în motoarele de căutare și îi puteți ajuta să indexeze conținutul mai rapid. Este, de asemenea, o modalitate utilă de a ajuta roboții motoarelor de căutare să înțeleagă structura site-ului dvs. și să știe ce pagini să acceseze cu crawlere, relația lor sau chiar ultima lor actualizare.

Ce se întâmplă dacă întâmpinăm o problemă cu sitemap-ul, de exemplu, eroarea „sitemap-ul dvs. pare a fi o pagină HTML” ?

Este timpul să aflați despre Google Search Console, precum și despre cum să o utilizați.

  • Ce este Google Search Console?
  • Formate acceptabile pentru Google Search Console
  • Motivul erorii
  • Diferențele dintre HTML și XML
  • Soluție pentru eroare
  • Sugestii pentru utilizarea corectă a unui Sitemap

Ce este Google Search Console?

Google Search Console este un instrument gratuit pentru proprietarii de site-uri de la Google. Folosind acest instrument, puteți analiza cu ușurință performanța site-ului dvs. în căutările Google. De asemenea, puteți accesa date importante despre multe subiecte, cum ar fi backlink-urile și traficul pe site.

Pe scurt, puteți vedea dacă site-ul dvs. funcționează bine, ceea ce vă ajută să faceți îmbunătățiri SEO mult mai reușite.

În afară de aceasta, este posibil să detectați erori pe site-ul dvs. cu Google Search Console. Astfel, puteți atinge și corecta problemele tehnice într-o manieră integrată cu Google Analytics, Google Trends și Google Ads.

Formate acceptabile pentru Google Search Console

Rețineți că nu toate linkurile sunt potrivite pentru a le trimite către Google Search Console sub formă de hartă a site-ului. Singurele formate acceptabile sunt:

  1. XML
  2. RSS, mRSS și Atom 1.0
  3. Fisier text

Pentru mai multe detalii, consultați articolul nostru despre cum să trimiteți site-ul dvs. la motoarele de căutare.

Motivul erorii

Motivul pentru care obțineți eroarea „harta site-ului dvs. pare a fi o pagină HTML” derivă din aceste formate. Harta dvs. de site ar trebui să fie în format XML, deoarece Google nu o acceptă în format HTML. Luați, de exemplu:

https://wpblogx.com/sitemap_index.xml

Dacă încărcați un fișier HTML ca hartă de site, va apărea această eroare.

ppwp-your-sitemap-appears-to-be-o-html-page-error

Să aruncăm o privire prin diferențele dintre HTML și XML înainte de a descoperi soluția și sugestiile pentru a rezolva eroarea.

Diferențele dintre HTML și XML

XML (Extensible Markup Language)

XML se referă la un limbaj de marcare care este similar cu HTML în multe privințe. Caracteristica cea mai distinctivă este că XML este mai preocupat de datele în sine. Poate fi util în situații precum primirea, transportul și transmiterea datelor.

Etichetele utilizate în XML nu sunt predefinite ca în HTML. Adică, structura fișierului XML este complet creată de utilizator.

ppwp-xml-file-exemplu

Pentru referință, am publicat un ghid detaliat despre cum să creați un sitemap XML în WordPress. Verifică.

HTML (HyperText Markup Language)

HTML, pe de altă parte, este mai mult despre modul în care datele sunt prezentate ca imagine. Acesta își asumă sarcina de a proiecta interfața pe care utilizatorii o vor vedea pe pagină. Ar putea fi culoarea datelor, determinarea fonturilor și dimensiunea fontului. În plus, permite funcționarea instrumentelor multimedia (video, imagini etc.).

ppwp-html-file-example

Să aruncăm o privire la rezumatul de mai jos pentru o mai bună înțelegere.

Diferențele cheie:

  1. HTML este unul dintre tipurile de documente, folosit pentru formatarea titlurilor, diferitelor fonturi, liste, figuri și imagini din documente. XML definește, descrie și trimite date între diferite medii. Cu alte cuvinte, este o completare a HTML cu caracteristicile sale de definire a datelor.
  2. XML este un limbaj de marcare precum HTML; cu toate acestea, descrie datele, nu pentru a afișa date precum HTML. Permite schimbul de date între organizații.
  3. HTML permite unui cuvânt să fie aldine sau cursive prin introducerea lui între etichete, în timp ce XML oferă un schelet pentru etichetarea datelor structurate.

Diferențe în ceea ce privește utilizarea:

  1. Când lucrați în XML, etichetele sunt sensibile la majuscule și minuscule.
  2. Etichetele create în XML ar trebui să fie închise în ordine ordonată, nu aleatoriu.
  3. În XML, caracterele de spațiu sunt definite în liniile de comentarii.

Soluție pentru eroare

Pentru a crea un site XML compatibil Google Search Console pentru site-ul dvs. WordPress, puteți utiliza un plugin pentru hartă site. Vă recomandăm cu căldură să instalați Yoast SEO sau Rank Math. Aceste pluginuri creează automat un sitemap și trebuie doar să adăugați sitemap-ul la Google Search Console.

Adresele URL ale sitemapului trebuie excluse din pluginul Swift Performance. Puteți urma procedurile de mai jos pentru a preveni stocarea în cache a adreselor URL ale sitemap-urilor. Aplicați aceeași metodă cu W3Total Cache, WPRocket și alte pluginuri de cache. Pașii pot varia în funcție de instrument.

După ce încărcați fișierul /sitemap_index.xml în Google Search Console, este posibil să vedeți eroarea în imaginea de mai jos.

ppwp-submitted-sitemap-google-search-console

Dacă dați clic pe eroare, va apărea descrierea detaliată.

  1. Deschideți panoul de administrare a site-ului web, apoi accesați Instrumente > Performanță rapidă și faceți clic pe fila Setări .

ppwp-tools-swift-performance

2. Inserați linkul pentru sitemap în câmpul următor: /sitemap_index.xml . Apoi faceți clic pe butonul Salvare modificări . Ca rezultat, acest lucru vă ajută să excludeți adresa URL a sitemap-ului din memoria cache.

ppwp-sitemap-indexed

3. Faceți clic pe Reset Warmup Table pentru a confirma modificările făcute în tabel.

ppwp-resetare-tabel-încălzire

4. Selectați butonul Dashboard > Clear All Caches .

ppwp-șterge-toate-cache-urile

5. După ce ștergeți toate cache-urile, este timpul să încercați să retrimiteți harta site-ului dvs. Accesați Google Search Console > Sitemap . Încărcați harta site-ului și trimiteți-o.

ppwp-google-search-console-add-new-sitemap

Acum, ați actualizat cu succes harta site-ului!

ppwp-google-search-console-submitted-sitemap

Deși este ușor să eliminați eroarea cu puține informații suplimentare, ne-ar plăcea să vă oferim câteva sugestii pentru a o evita.

Sugestii pentru utilizarea corectă a unui Sitemap

Verificați erorile

În primul rând, verificați pagina de sitemap pentru orice coduri de eroare ciudate. Dacă codul este clar, va fi foarte ușor să diagnosticați problema.

Conflictul de plugin este de obicei cauza principală a problemei. Plugin-uri precum Yoast care generează sitemap-uri pot fi rădăcina conflictelor. Un plugin de cache poate fi, de asemenea, un vinovat care cauzează problema.

Uneori, chiar și un supliment aleatoriu poate duce la erori. Puteți instala pluginul Health Check and Troubleshoot pentru a le identifica dacă există.

Dezactivați memorarea în cache

Atunci când un sitemap este stocat în cache, poate cauza ocazional probleme cu Google citirea lui ca pagină HTML, deoarece nu ar trebui să memorați fișiere XML în cache în acest fel.

Verificați adresa URL a sitemapului dvs

Deși pare o sugestie simplă, merită întotdeauna să verificați din nou adresa URL a sitemapului dvs. Verificați linkul postat atât prin Google, cât și prin orice plugin pentru sitemap pentru a vă asigura că trimiteți adresa URL corectă.

Eliminați sitemap-urile suplimentare

Dacă aveți sitemap-uri suplimentare active, vă poate provoca probleme sau confuzie. Pluginurile pe care le utilizați din când în când pot genera diferite sitemap-uri. Verificați-le și asigurați-vă că dezactivați orice funcționalități redundante ale sitemap-ului.

Nu lăsați eroarea „Sitemap-ul dvs. pare a fi o pagină HTML” să vă mai deranjeze!

Eroarea „harta site-ului dvs. pare a fi o pagină HTML” este o supărare ori de câte ori apare. Practic este rezultatul unei pagini malformate sau al unui conflict de cache care poate fi remediat. Puteți rezolva problema cu câțiva pași menționați în acest articol.

Ați învățat cum să remediați problema, este timpul să vă optimizați sitemap-ul pentru a stimula SEO.

Ai probleme similare? Suntem aici sa ajutam. Vă rugăm să ne contactați sau să lăsați câteva cuvinte în secțiunea de comentarii.

Sau ați putea fi interesat de 5 moduri de a elimina paginile din harta site-ului în WordPress.