Hijacking: Cómo Dejanseo secuestró el blog de Rand Fishkin | Adrenalina

Hijacking: Cómo Dejanseo secuestró el blog de Rand Fishkin

Publicado Por | 09 septiembre , 2013 | Black Hat, SEO, sin categoria | No Comments

Lo primero de todo es agradecer a Dan Petrovic su permiso para traducir y publicar en nuestro blog su post sobre Hijacking.

Gracias Dan :)

Introducción Al Hijacking

Dan Petrovic de Australia es uno de los SEO más reconocidos a nivel internacional, en esta ocasión ha subido en el blog de la empresa Dejanseo donde es director gerente, un curioso caso de estudio para que los webmasters tomen nota de como defenderse ante ataques de dominios de mayor autoridad. Introducción a la teoría: Antes de nada, dejar claro que esta práctica en ningún momento corresponde a hacking o bug, simplemente es Hijacking una característica contemplada en el algoritmo de Google. Todo va bien hasta que nos encontramos en la otra escala de la duplicidad, donde un sitio web con mayor autoridad nos copia el contenido original que tanto nos ha costado trabajar. La teoría es sencilla, cuando hay dos documentos idénticos en la web (a nivel de contenidos), Google escogerá de entre los dos el que tiene mayor PageRank y lo repercutirá en las Serp’s (resultados de búsqueda). Por ejemplo, si el mismo contenido está bajo distintas direcciones URL, sólo la dirección URL con el PageRank más elevado aparecerá en el índice de resultados.

Estudio de Hijacking # 1: MarketBizz

Hijacking

26 de octubre 2012: Rob Maas amablemente se ofreció para la primera prueba de concepto y ofreció una de sus páginas en inglés para nuestro primer intento de secuestrar un resultado de las Serp’s. Dan ha creado un subdominio llamado rob.dejanseo.com.au y creó una página http://rob.dejanseo.com.au/ReferentieEN.htm copiando el HTML original y las imágenes, así como enlazándola desde su blog. En esta etapa no se sabía cuán similares tenían que ser los documentos para la prueba. 30 de octubre 2012: Resultado de la búsqueda secuestrada con éxito. No sólo nuestro nuevo subdominio reemplaza la página de Rob en los resultados, incluso para la página original el rango de PageRank 1 fue reemplazado por el PageRank “0″ de la nueva página.

Hijacking

Observar cómo al realizar la búsqueda de la dirección URL devuelve el dominio de prueba en su lugar. La búsqueda de texto desde la página original también devolvió el nuevo documento:

Hijacking

Un hecho interesante es que el sitio: www.marketbizz.nl sigue devolviendo la página original “www.marketbizz.nl / en / ReferentieEN.htm” y no lo omita de los resultados de búsqueda del sitio. Curiosamente esa URL no devuelve ningún resultado guardado en la cache, al igual que la copia que hemos creado.

Estudio de Hijacking # 4: Blog de Rand Fishkin

De los cuatro casos prácticos que Dan comenta en su blog, nosotros vamos a centrarnos en el caso práctico más duro, el que se ha concentrado en el dominio de mayor autoridad, el blog de Rand Fishkin CEO de SEOMoz. Lo primero de todo ha sido generar un subdominio por el nombre de Rand. Acto seguido Dan se las apañó para “secuestrar” de las Serp’s el resultado Rand Fishkin y el título de uno de sus artículos para las búsquedas en Australia. Hijacking El primer resultado es el subdominio con pocos días de vida que creo Dan, lo mismo para el artículo del blog que ahora reemplaza el sitio original en los resultados de búsqueda australianos:

Hijacking Artículo Rand

Este “geo-locking” podría estar pasando lo menos por dos razones:

  1. Por la autoridad del dominio que hospeda la copia
  2. Autoridad de los enlaces que apuntan hacia el dominio de la página copiada
Lo que no hemos podido completar con la prueba ha sido sustituir completamente su URL en el índice de resultados de Google, que si se consiguió con la página de Rob. Podría deberse en parte al hecho de que el código fue ligeramente diferente del original y posiblemente debido al enlace de autoría de Rand Fishkin. Naturalmente el blog de Rand también tiene más señales sociales y enlaces entrantes que las páginas de prueba generadas para el experimento.

Observaciones interesantes

En el experimento hemos observado como en una página duplicada se muestra su PageRank, caché, enlaces, información, pero en el caso de la prueba con el blog de Rand también se muestran los +1′ s. Sí, incluso los +1′ s. En la página de ejemplo: http://rand.dejanseo.com.au/ – durante el experimento había 18 +1′ s que realmente pertenecían al blog principal de Rand. Cuando creamos una copia de un dominio y recibe mayor PageRank, todos los enlaces y las señales sociales serán reasignados a la versión de más autoridad. Hasta el momento tenemos dos variantes del “Secuestro”.

Hijacking fuga

Canonicalización

La mayoría de los sitios web simplemente replicarán o scrapearan una cantidad sustancial de contenido de tu sitio. Esto normalmente se realiza a nivel de código (especialmente si está automatizado). Esto significa que la presencia de una rel = “canonical” (URL completa) configurada correctamente asegura que Google sabe qué documento es la versión canónica. Eso si, Google se toma rel = “canonical” como una sugerencia y no una directriz absoluta, por lo que podría pasar que la sustitución de la URL sucediese en los resultados de búsqueda incluso habiendo canonicalizado tus páginas. Hay una manera de proteger tus documentos también (por ejemplo, PDF) a través del uso de la canonizalización de cabeceras http : GET /papel-blanco.pdf HTTP/1.1 Host: www.ejemplo.com (… Resto de cabeceras de petición HTTP …) HTTP/1.1 200 OK Content-Type: application / pdf Enlace: <http://www.ejemplo.com/papel-blanco.html>; rel = “canonical” Content-Length: 785710 (… Resto de cabeceras de respuesta HTTP …) Autoría La autoría por lo tanto no es un rasgo para Google lo suficientemente fuerte como para evitar el intercambio de resultados de búsqueda a partir de una URL con más autoridad, sin embargo, podría ser un factor a tener en cuenta en un futuro si se aplica de forma independiente.

Enlaces internos

El uso de URLs completas para hacer referencia tanto a tu página de inicio como a las demás páginas de tu sitio web significa que si alguien scrapea tu contenido, automáticamente estarán enlazando tu página web y, de paso, te pasarán su PageRank . Por supuesto, esto no sucederá si editan la página para configurar las URL’s a su propio dominio.

Monitorización de los contenidos

Mediante el uso de servicios como CopyScape o Google Alerts los webmasters pueden detectar los contenidos duplicados. Si el dominio que nos está copiando los contenidos es de gran autoridad, una muy buena opción será pedirle o bien que elimine ese contenido duplicado o que añada un enlace o citación a tu sitio web.

Ver post original sobre Hijacking en DejanSeo

Más información en Adrenalina

Si deseas más información sobre técnicas e I+D, contacta con Adrenalina tu agencia de marketing online, especializada en posicionamento en Google y diseño web en Barcelona profesional y responsive, no lo dudes nos adaptaremos a las necesidades de negocio de tu proyecto online y cubrimos todos los factores de posicionamiento web en Google para hacer de tu proyecto el líder con un servicio SEO de primer nivel para tu expansión internacional.

Autor: Robert

SEO en Adrenalina.es - Astrónomo aficionado y amante de los deportes de motor.

Estudiamos y analizamos su negocio en profundidad, definimos objetivos y planteamos la estrategia de marketing más adecuada centrándonos en conseguir cada uno de los objetivos propuestos. Solicita Presupuesto Ahora

Uso de cookies

En este sitio web utilizamos cookies propias y de terceros para mejorar nuestros servicios, para que usted tenga la mejor experiencia de usuario y analizar su visita. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.