Lo primero de todo es agradecer a Dan Petrovic su permiso para traducir y publicar en nuestro blog su post sobre Hijacking.
Gracias Dan
Introducción Al Hijacking
Dan Petrovic de Australia es uno de los SEO más reconocidos a nivel internacional, en esta ocasión ha subido en el blog de la empresa Dejanseo donde es director gerente, un curioso caso de estudio para que los webmasters tomen nota de como defenderse ante ataques de dominios de mayor autoridad. Introducción a la teoría: Antes de nada, dejar claro que esta práctica en ningún momento corresponde a hacking o bug, simplemente es Hijacking una característica contemplada en el algoritmo de Google. Todo va bien hasta que nos encontramos en la otra escala de la duplicidad, donde un sitio web con mayor autoridad nos copia el contenido original que tanto nos ha costado trabajar. La teoría es sencilla, cuando hay dos documentos idénticos en la web (a nivel de contenidos), Google escogerá de entre los dos el que tiene mayor PageRank y lo repercutirá en las Serp’s (resultados de búsqueda). Por ejemplo, si el mismo contenido está bajo distintas direcciones URL, sólo la dirección URL con el PageRank más elevado aparecerá en el índice de resultados.
Estudio de Hijacking # 1: MarketBizz
26 de octubre 2012: Rob Maas amablemente se ofreció para la primera prueba de concepto y ofreció una de sus páginas en inglés para nuestro primer intento de secuestrar un resultado de las Serp’s. Dan ha creado un subdominio llamado rob.dejanseo.com.au y creó una página http://rob.dejanseo.com.au/ReferentieEN.htm copiando el HTML original y las imágenes, así como enlazándola desde su blog. En esta etapa no se sabía cuán similares tenían que ser los documentos para la prueba. 30 de octubre 2012: Resultado de la búsqueda secuestrada con éxito. No sólo nuestro nuevo subdominio reemplaza la página de Rob en los resultados, incluso para la página original el rango de PageRank 1 fue reemplazado por el PageRank “0″ de la nueva página.
Observar cómo al realizar la búsqueda de la dirección URL devuelve el dominio de prueba en su lugar. La búsqueda de texto desde la página original también devolvió el nuevo documento:
Un hecho interesante es que el sitio: www.marketbizz.nl sigue devolviendo la página original “www.marketbizz.nl / en / ReferentieEN.htm” y no lo omita de los resultados de búsqueda del sitio. Curiosamente esa URL no devuelve ningún resultado guardado en la cache, al igual que la copia que hemos creado.
Estudio de Hijacking # 4: Blog de Rand Fishkin
De los cuatro casos prácticos que Dan comenta en su blog, nosotros vamos a centrarnos en el caso práctico más duro, el que se ha concentrado en el dominio de mayor autoridad, el blog de Rand Fishkin CEO de SEOMoz. Lo primero de todo ha sido generar un subdominio por el nombre de Rand. Acto seguido Dan se las apañó para “secuestrar” de las Serp’s el resultado Rand Fishkin y el título de uno de sus artículos para las búsquedas en Australia. El primer resultado es el subdominio con pocos días de vida que creo Dan, lo mismo para el artículo del blog que ahora reemplaza el sitio original en los resultados de búsqueda australianos:
Este “geo-locking” podría estar pasando lo menos por dos razones:
- Por la autoridad del dominio que hospeda la copia
- Autoridad de los enlaces que apuntan hacia el dominio de la página copiada
Observaciones interesantes
En el experimento hemos observado como en una página duplicada se muestra su PageRank, caché, enlaces, información, pero en el caso de la prueba con el blog de Rand también se muestran los +1′ s. Sí, incluso los +1′ s. En la página de ejemplo: http://rand.dejanseo.com.au/ – durante el experimento había 18 +1′ s que realmente pertenecían al blog principal de Rand. Cuando creamos una copia de un dominio y recibe mayor PageRank, todos los enlaces y las señales sociales serán reasignados a la versión de más autoridad. Hasta el momento tenemos dos variantes del “Secuestro”.
Canonicalización
La mayoría de los sitios web simplemente replicarán o scrapearan una cantidad sustancial de contenido de tu sitio. Esto normalmente se realiza a nivel de código (especialmente si está automatizado). Esto significa que la presencia de una rel = “canonical” (URL completa) configurada correctamente asegura que Google sabe qué documento es la versión canónica. Eso si, Google se toma rel = “canonical” como una sugerencia y no una directriz absoluta, por lo que podría pasar que la sustitución de la URL sucediese en los resultados de búsqueda incluso habiendo canonicalizado tus páginas. Hay una manera de proteger tus documentos también (por ejemplo, PDF) a través del uso de la canonizalización de cabeceras http : GET /papel-blanco.pdf HTTP/1.1 Host: www.ejemplo.com (… Resto de cabeceras de petición HTTP …) HTTP/1.1 200 OK Content-Type: application / pdf Enlace: <http://www.ejemplo.com/papel-blanco.html>; rel = “canonical” Content-Length: 785710 (… Resto de cabeceras de respuesta HTTP …) Autoría La autoría por lo tanto no es un rasgo para Google lo suficientemente fuerte como para evitar el intercambio de resultados de búsqueda a partir de una URL con más autoridad, sin embargo, podría ser un factor a tener en cuenta en un futuro si se aplica de forma independiente.
Enlaces internos
El uso de URLs completas para hacer referencia tanto a tu página de inicio como a las demás páginas de tu sitio web significa que si alguien scrapea tu contenido, automáticamente estarán enlazando tu página web y, de paso, te pasarán su PageRank . Por supuesto, esto no sucederá si editan la página para configurar las URL’s a su propio dominio.
Monitorización de los contenidos
Mediante el uso de servicios como CopyScape o Google Alerts los webmasters pueden detectar los contenidos duplicados. Si el dominio que nos está copiando los contenidos es de gran autoridad, una muy buena opción será pedirle o bien que elimine ese contenido duplicado o que añada un enlace o citación a tu sitio web.
Ver post original sobre Hijacking en DejanSeo
Más información en Adrenalina
Si deseas más información sobre técnicas e I+D, contacta con Adrenalina tu agencia de marketing online, especializada en posicionamento en Google y diseño web en Barcelona profesional y responsive, no lo dudes nos adaptaremos a las necesidades de negocio de tu proyecto online y cubrimos todos los factores de posicionamiento web en Google para hacer de tu proyecto el líder con un servicio SEO de primer nivel para tu expansión internacional.