¿Qué es un sitemap.xml y cómo usarlo de manera correcta?

El sitemap.xml es un archivo que se sube al FTP junto con el resto de contenidos de nuestra web y que sirve para listar todas las urls indexables de nuestro site, con el objetivo de que los buscadores puedan encontrarlas de manera sencilla. Es decir, un listado de urls de nuestra web para los buscadores.

Su uso permite que las arañas o bots puedan encontrar de una manera rápida y sencilla todas las páginas que queremos indexar, sin necesidad de tener que estar navegando a través de nuestros enlaces internos. Sin embargo, su uso no garantiza una indexación completa de todas las urls, ya que los buscadores determinarán, como hacen siempre, de qué contenidos deben valerse.

¿Cómo configuro un sitemap.xml en mi web?

Dependiendo del CMS o la programación de tu web, podrás utilizar diferentes herramientas para la creación del sitemap.xml. Independientemente de ello, debes saber que los sitemap se rigen mediante unos protocolos marcados por sitemaps.org.

Según estas directrices, un sitemap puede configurarse de la siguiente manera:

Sitemap XML

La primera línea de código marca la codificación del archivo y es obligatoria, mientras que la etiqueta urlset marca el listato de urls y debe tener una apertura y un cierra obligatorios. Dentro del <urlset>, encontraremos tantas etiquetas <url> como páginas queramos mostrar en nuestro archivo sitemap.xml.

Por último, dentro de cada etiqueta <url> encontramos cuantro etiquetas de información diferentes:

<loc> Sirve para introducir una url única. Es una etiqueta de uso obligatorio.

<lastmod> Indica la fecha de la última modificación textual o de programación en dicha url. Su uso no es obligatorio.

<changefreq> Esta etiqueta indica la frecuencia en la que se realizan modificaciones textuales o de código en esa url. Su uso no es obligatorio.

<priority> Indica en un rago de 0 a 1 la importancia que el webmaster atribuye a esa url en concreto respecto a la web en su conjunto. Su uso no es obligatorio.

En muchos casos, podréis haber visto archivo sitemap.xml en los que faltan todas o algunas de las etiquetas lastmod, changefreq o priority. No pasa nada si faltan, ya que su uso no es obligatorio y, desde una opinión personal, no sirven para nada.

Debemos tener en cuenta que, por mucho que nosotros indiquemos en nuestro sitemap la importancia, la última modificación o la frecuencia de cambio que nosotros condiremos oportunos, Google y el resto de buscadores ya obtienen esa información a través de sus bots. Ya saben la primera vez que encontraron la página y cuántas modificaciones y con qué frecuencia las han sufrido. Y en cuanto a la importancia… ni que decir tiene que de eso ya se encargan sus propios algoritmos.

Por lo cual, el sitemap con que sea un simple listado de urls ya sería suficiente.

Algunas especificaciones técnicas más

También hay que tener en cuenta un par de aspectos técnicos más sobre el archivo sitemap.xml: su peso y su cantidad máxima de urls. El archivo sitemap.xml no puede superar el 50MB de peso ni las 50mil urls.

Si cuentas con un proyecto que supere esos datos, tendrás que pensar en crear más de un archivo sitemap.xml. De hecho, hacerlo es muy recomendable para proyectos grandes, ya que si creas diferentes dependiendo del tipo de contenido, podrás tenerlos mucho más controlados de cara a cualquier cambio o modificación en el futuro.

Porque, tampoco lo olvides. Si el sitemap es un listado de todas las urls indexables de tu web, deberás tenerlo siempre al día y actualizado ante subidas o bajadas de urls en tu site.

Sitemap de sitemaps

Cuando optas por dividir tus contenidos en diferentes sitemaps, debes saber también que existe la posibilidad de hacer un sitemap de sitemaps. O lo que es lo mismo, un listado de todos los sitemaps de tu site.

La configuración de los sitemaps individuales debe realizarse igual que como hemos comentado anteriormente, mientras que el listado de sitemaps se configuraría de la siguiente manera:

Sitemap de Sitemaps

Como podemos observar, las principales diferencias son:

<sitemapindex> Sustituye a la etiqueta urlset. Indica que se trata de un listado de sitemaps, en lugar de un listado de urls.

<sitemap> Sustituye a la etiqueta url. Indica que se trata de un sitemap y no de una url.

<loc> Se mantiene igual que el sitemap individual y su uso es obligatorio.

<lastmod> Sirve para indicar la última modificación de dicho sitemap, pero su uso no es obligatorio.

Sí, sí, pero… ¿Cómo creo mi sitemap.xml

Ahora que ya conocer las principales características técnicas que debe cumplir un sitemap.xml, toca crear el tuyo propio. Como hemos comentado anteriormente, depende de cada proyecto y cada CMS, podremos utilizar diferentes herramientas para la creación y actualización automática de nuestro sitemap.xml.

WordPress:

La mejor opción en la actualidad es utilizar el sitemap.xml que genera el plugin de Yoast SEO. Esta herramienta nos generará un sitemap de sitemaps dependiendo el tipo de contenido.

Sitemap Yoast

Recuerda siempre ir a la configuración del sitemap.xml dentro del plugin de Yoast para evitar lanzar a través del sitemap páginas que no te interese indexar.

Configurar Yoast Sitemap

Una recomenzación más en cuanto a wordpress es la de no utilizar el plugin XML-Sitemap. De un tiempo a esta parte está dando muchos errores a la hora de que Google a través de Search Console pueda leer los sitemaps que genera.

Prestashop:

Un módulo de Prestashop que te solucionará todos los problema relacionados con el sitemap.xml y sus actualizaciones automáticas es el Google Sitemap. Tal y como ocurre con WordPress, no olvides configurarlo o llenarás tu archivo sitemap de contenidos indeseados.

Sitemap Prestashop

Joomla:

Como ocurre con WordPress y Prestashop, en Joomla también existen gran cantidad de componentes o plugins para la generación y actualización automática del sitemap. Uno sencillo y que funciona a la perfección el Sitemap Generator. La única pega de este plugin es que, si tu web cuenta con más de 500 urls, tendrás que utilizar la versión de pago.

Sitemap Joomla

Para webs de programación hechas a medida o proyectos muy grandes, lo mejor es que programes la generación de tu propio sitemap automático. Si se trata de proyectos pequeños, puedes hacerlos a mano o utilizar herramientas online como https://www.xml-sitemaps.com/

Por último, mándale el sitemap a los buscadores

Una vez listo tu sitemap.xml o tu listado de sitemaps, el último paso es mandárselo a los buscadores para que lo localicen y lo utilicen como archivo de apoyo a la indexación de los contenidos de tu web.

En el caso de Google, debemos acceder a nuestra cuenta de Search Console, acudir a la sección ‘Sitemaps’ y subir nuestros archivos. Aquí podremos comprobar tanto la cantidad de urls lanzadas, como la cantidad de urls que Google ha indexado.

Search Console Sitemap

Errores y Advertencias

Cuando subas tus sitemaps a Search Console, puede que te encuentres con avisos de advertencia o de error como en este caso:

Sitemap Errores

Las advertencias indican por lo general que en el listado de urls estamos enviando algunas que, bien por robots.txt o por meta robots, estamos pidiendo su no indexación. No pasa nada porque existan estas advertencias, pero sería recomendable eliminar del sitemap esas urls.

En cuanto a los errores, generalmente se producen por fallos en la configuración o la formulación del archivo. Revísalo porque, en caso contrario, tu archivo sitemap no servirá de nada.

0 Comentarios
Escribe un comentario

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.

ACEPTAR
Aviso de cookies