¿Qué es un sitemap.xml y cómo usarlo de manera correcta?

Un sitemap es un anglicismo que significa “Mapa del sitio”, es decir, un archivo o una url que contiene todas y cada una de las páginas de una web. En este artículo te vamos a explicar porqué es tan importante generar uno, cómo debes crearlo correctamente y diferentes maneras de crear uno.

QUE ES UN SITEMAP

Existen varias formas de generar un Sitemap. Una de ellas muy sencilla que hasta un niño de 8 años puede hacerlo. ¡Eso sí! Hay que hacerlo de la manera correcta porque de lo contrario podemos complicar mucho nuestra web desde el punto de vista del SEO.

como posicionarse en google

¿Quieres saber cómo posicionarte en Google siguiendo 9 directrices?

Empecemos con la manera más fácil de generar un sitemap y qué es lo que deberíamos tener en cuenta.

Crear un sitemap .xml

Depende de cada proyecto y cada CMS, podremos utilizar diferentes herramientas para la creación y actualización automática de nuestro sitemap.xml.

Lo primero de todo. Tienes que saber qué contenido quieres que Google indexe, es decir, si quieres que Google muestre en los resultados de búsqueda categorías, etiquetas, atributos…

Por ejemplo, en Adrenalina no queremos que Google nos indexe las categorías. No queremos que se generen urls del tipo adrenalina.com/category/marketing-online. Si vamos a atacar la keyword “Marketing Online” preferimos crear una página específica con buen contenido y cuya url sea adrenalina.com/marketing-online.

Una vez que hemos decidido esto, vamos a ver cómo generar un .xml.

Xml en WordPress

La mejor opción en la actualidad es utilizar el sitemap.xml que genera el plugin de Yoast SEO. Esta herramienta nos generará las urls .xml de los diferentes tipos de contenido que queremos que se indexe.

Para ello tienes que ir al apartado “General” del plugin y en “Características” bajas hasta donde dice “Mapas del sitio XML”. Verás que hay un interrogante al lado de esa frase. Haz clic en él y te aparecerá un enlace que dice “Ver mapa del sitio XML”.

sitemap xml yoast

Haz clic en él y, por ejemplo, estos son nuestros sitemaps:

sitemaps xml yoast

Como veis, nosotros hemos configurado nuestro plugin Yoast para que no nos indexe ni categorías, ni etiquetas, ni plantillas, ni archivos que van metiendo diferentes plugins que se instalan. Desde el mismo Yoast, tú le puedes decir qué quieres que se te indexe y qué no.

A continuación vamos a Google Search Console y en el apartado “Sitemaps” colocaríamos esas urls y mandaríamos esos sitemaps a Google para que los localicen y los utilicen como archivo de apoyo a la indexación de los contenidos de tu web.

sitemaps search console

como posicionarse en google

¿Quieres saber cómo posicionarte en Google siguiendo 9 directrices?

Una recomendación más en cuanto a WordPpress es la de no utilizar el plugin XML-Sitemap. De un tiempo a esta parte está dando muchos errores a la hora de que Google, a través de Search Console, pueda leer los sitemaps que genera.

Errores y Advertencias

Cuando subas tus sitemaps a Search Console, puede que te encuentres con avisos de advertencia o de error como en este caso:

Sitemap Errores

Las advertencias indican por lo general que en el listado de urls estamos enviando algunas que, bien por robots.txt o por meta robots, estamos pidiendo su no indexación. No pasa nada porque existan estas advertencias, pero sería recomendable eliminar del sitemap esas urls.

En cuanto a los errores, generalmente se producen por fallos en la configuración o la formulación del archivo. Revísalo porque, en caso contrario, tu archivo sitemap no servirá de nada.

Prestashop:

Un módulo de Prestashop que te solucionará todos los problema relacionados con el sitemap.xml y sus actualizaciones automáticas es el Google Sitemap. Tal y como ocurre con WordPress, no olvides configurarlo o llenarás tu archivo sitemap de contenidos indeseados.

Sitemap Prestashop

Joomla:

Como ocurre con WordPress y Prestashop, en Joomla también existen gran cantidad de componentes o plugins para la generación y actualización automática del sitemap. Uno sencillo y que funciona a la perfección el Sitemap Generator. La única pega de este plugin es que, si tu web cuenta con más de 500 urls, tendrás que utilizar la versión de pago.

Sitemap Joomla

Para webs de programación hechas a medida o proyectos muy grandes, lo mejor es que programes la generación de tu propio sitemap automático. Si se trata de proyectos pequeños, puedes hacerlos a mano o utilizar herramientas online como https://www.xml-sitemaps.com/

Generar archivos sitemap para otros proyectos

El sitemap.xml es un archivo que se sube al FTP junto con el resto de contenidos de nuestra web y que sirve para listar todas las urls indexables de nuestro site, con el objetivo de que los buscadores puedan encontrarlas de manera sencilla. Es decir, un listado de urls de nuestra web para los buscadores.

Su uso permite que las arañas o bots puedan encontrar de una manera rápida y sencilla todas las páginas que queremos indexar, sin necesidad de tener que estar navegando a través de nuestros enlaces internos. Sin embargo, su uso no garantiza una indexación completa de todas las urls, ya que los buscadores determinarán, como hacen siempre, de qué contenidos deben valerse.

¿Cómo configuro un sitemap.xml en mi web?

Dependiendo del CMS o la programación de tu web, podrás utilizar diferentes herramientas para la creación del sitemap.xml. Independientemente de ello, debes saber que los sitemap se rigen mediante unos protocolos marcados por sitemaps.org.

Según estas directrices, un sitemap puede configurarse de la siguiente manera:

Sitemap XML

La primera línea de código marca la codificación del archivo y es obligatoria, mientras que la etiqueta urlset marca el listato de urls y debe tener una apertura y un cierra obligatorios. Dentro del <urlset>, encontraremos tantas etiquetas <url> como páginas queramos mostrar en nuestro archivo sitemap.xml.

Por último, dentro de cada etiqueta <url> encontramos cuantro etiquetas de información diferentes:

<loc> Sirve para introducir una url única. Es una etiqueta de uso obligatorio.

<lastmod> Indica la fecha de la última modificación textual o de programación en dicha url. Su uso no es obligatorio.

<changefreq> Esta etiqueta indica la frecuencia en la que se realizan modificaciones textuales o de código en esa url. Su uso no es obligatorio.

<priority> Indica en un rago de 0 a 1 la importancia que el webmaster atribuye a esa url en concreto respecto a la web en su conjunto. Su uso no es obligatorio.

En muchos casos, podréis haber visto archivo sitemap.xml en los que faltan todas o algunas de las etiquetas lastmod, changefreq o priority. No pasa nada si faltan, ya que su uso no es obligatorio y, desde una opinión personal, no sirven para nada.

Debemos tener en cuenta que, por mucho que nosotros indiquemos en nuestro sitemap la importancia, la última modificación o la frecuencia de cambio que nosotros condiremos oportunos, Google y el resto de buscadores ya obtienen esa información a través de sus bots.

Ya saben la primera vez que encontraron la página y cuántas modificaciones y con qué frecuencia las han sufrido. Y en cuanto a la importancia… ni que decir tiene que de eso ya se encargan sus propios algoritmos.

Por lo cual, el sitemap con que sea un simple listado de urls ya sería suficiente.

Algunas especificaciones técnicas más

También hay que tener en cuenta un par de aspectos técnicos más sobre el archivo sitemap.xml: su peso y su cantidad máxima de urls. El archivo sitemap.xml no puede superar el 50MB de peso ni las 50mil urls.

Si cuentas con un proyecto que supere esos datos, tendrás que pensar en crear más de un archivo sitemap.xml. De hecho, hacerlo es muy recomendable para proyectos grandes, ya que si creas diferentes dependiendo del tipo de contenido, podrás tenerlos mucho más controlados de cara a cualquier cambio o modificación en el futuro.

Porque, tampoco lo olvides. Si el sitemap es un listado de todas las urls indexables de tu web, deberás tenerlo siempre al día y actualizado ante subidas o bajadas de urls en tu site.

Sitemap de sitemaps

Cuando optas por dividir tus contenidos en diferentes sitemaps, debes saber también que existe la posibilidad de hacer un sitemap de sitemaps. O lo que es lo mismo, un listado de todos los sitemaps de tu site.

La configuración de los sitemaps individuales debe realizarse igual que como hemos comentado anteriormente, mientras que el listado de sitemaps se configuraría de la siguiente manera:

Sitemap de Sitemaps

Como podemos observar, las principales diferencias son:

<sitemapindex> Sustituye a la etiqueta urlset. Indica que se trata de un listado de sitemaps, en lugar de un listado de urls.

<sitemap> Sustituye a la etiqueta url. Indica que se trata de un sitemap y no de una url.

<loc> Se mantiene igual que el sitemap individual y su uso es obligatorio.

<lastmod> Sirve para indicar la última modificación de dicho sitemap, pero su uso no es obligatorio.

¿Dudas?

Si después de lo que hemos visto en este artículo, te siguen quedando algunas dudas, puedes dejarnos tu comentario y te las responderemos en breve.

Por último, si este artículo te ha servido de ayuda, puedes agradecérnoslo compartiéndolo en tus redes sociales.

Muchas gracias.

2 comentarios en “¿Qué es un sitemap.xml y cómo usarlo de manera correcta?”

  1. Dentro de Sitemap.xml el apartado de post-sitemap.xml me da error, no aparece nada.
    Los demás están bien, tanto page-sitemap.xml como project-sitemap.xml.
    Es una web sencilla de un autónomo. ¿Para que sirve ese apartado de “post-sitemap.xml” y cómo corrijo el error?

  2. Daniel Cana Flórez

    Hola Juan, esa parte que dices es la correspondiente a los posts o entradas (artículos). Si no has escrito ninguno, no te aparecerá nada.

Dejar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *