Contenido duplicado: causas y soluciones

Contenido duplicado: causas y soluciones

Google ha estado lidiando con el contenido duplicado desde hace mucho tiempo y ahora su proceso de selección del mejor URL para mostrar en los SERP es mucho más afinado. Sin embargo, es un problema que existe y que los profesionales del marketing online tenemos que contrarrestar a fin de obtener mejor posicionamiento en los motores de búsqueda.

¿Qué es el contenido duplicado?

El término “duplicate content” hace referencia a contenido similar que se está mostrando en varias ubicaciones (URL) en una misma web. Como consecuencia, los motores de búsqueda no saben qué URL mostrar en los resultados de búsqueda. Esto puede dañar el ranking de una web. El problema se hace más grande cuando la gente comienza a vincular a todas las diferentes versiones del contenido.

No hay una sola forma de lidiar con él, muchos dicen que debe ser eliminado, otros que debe ser re-direccionado y así son muchas las soluciones que se encuentran expuestas.

El contenido duplicado también puede hacer referencia textos copiados entre sitios externos. En muchos casos cuando esto pasa puede tratarse de plagio o contenido robado. Obviamente, el contenido publicado con posterioridad será el considerado duplicado por regla general y Google penalizará este tipo de prácticas haciendo descender considerablemente su posicionamiento.

¿Qué puede causar el contenido duplicado?

Son muchas las causas por las que aparece un contenido duplicado, y por lo general se refiere a razones técnicas. Es inusual que una persona quiera colocar el mismo contenido en dos páginas o más sin referenciar a la fuente principal.

Parámetros URL: parámetros que agregamos a las URL como el rastreo de clics y algunas analíticas pueden causar contenido publicado.

Printer-Fiendly: cuando tienes una página con el contenido para imprimir puede considerarse contenido duplicado, sobre todo cuando múltiples versiones de la página son indexadas.

ID de sesión: esto ocurre cuando a cada usuario que visita la página web se le asigna un ID que se almacena en el URL. Este tipo de acciones pasan sobre todo cuando queremos rastrear al usuario o si tienes un carrito de compras disponible en tu web.

Srappers y Sindicación de contenido: muchas veces otras páginas web utilizan tu contenido sin redirigir a tu sitio, esto pasará más y más mientras más grande te hagas. Los buscadores no saben entonces cuál es la fuente principal del contenido y por ello se les hace más difícil organizar la información en los resultados de búsqueda.

WWW vs. No WWW: a veces los motores de búsqueda todavía se equivocan cuando tu sitio web es accesibles con o sin WWW. Una situación menos común, pero que también ocurre con http y https.

Estas son solo algunas de las múltiples causas que pueden generar que el contenido se duplique en tu sitio web.

¿Cómo solucionarlo?

Por lo general se plantean tres escenarios: bloquearlos, redirigirlos o canonizarlos. Analicemos cada uno de ellos:

Bloquearlos utilizando robots.txt:

Esta es una solución muy rústica que se utilizaba al principio. Es una opción que funciona, los motores de búsqueda harán caso a las órdenes de seguimiento dictadas en el robots.txt y no indexarán los URL que marquemos. Sin embargo, el problema con esto es que muchas personas pueden estar vinculando tu contenido con el URL que es excluido, entonces estos links ya no estarán contribuyendo con la posibilidad de tu sitio de escalar en los rankings de las páginas web. Archivo robots .txt Utilizando la etiqueta NoIndex/Follow:

El valor NoIndex le dice al motor de búsqueda que no indexe la página y por lo tanto conseguimos así eliminar el contenido duplicado. El valor Follow le dice al motor de búsqueda que siga rastreando el link encontrado en esa página, de modo que si fue compartido siga siendo indexado en otras web.

El 301 Redirect: con esto lo que hacemos es redirigir todos los sitios duplicados al sitio de tu preferencia, de esta forma todos los url son válidos y llegan exactamente al lugar que corresponde. Esta es una solución mucho más favorable que las dos anteriores, sin embargo no es la mejor.

La etiqueta rel=”Canonical”: esta funciona de forma parecida a la anterior y toma mucho menos tiempo de desarrollo para implementar. Esta etiqueta le dice a Google que la página en cuestión debe ser vista como si se tratara de una copia de la URL.

Esta opción es mejor que la anterior ya que no redirige al usuario. A pesar de que la página no redirige, a la hora de programarla si debes indicar cuál es tu URL preferida.

Vinculando con el contenido original:

Si no puedes hacer cualquiera de las optimizaciones anteriores, posiblemente sea porque no controlas la sección <head> de la página en la que aparece tu contenido. Añadir un enlace al artículo original encima o debajo del artículo es siempre una buena idea.

El problema del contenido duplicado es algo con lo que todas las web deben lidiar, y no puede ser ignorado. Aplicar las soluciones anteriores no solo te ayudará a contrarrestar el problema, sino que hará que tu página posicione mucho mejor en los resultados de búsqueda y evitar sanciones por parte de los motores de búsqueda y en especial de nuestro amigo Google.

 

admin_mg
No Comments

Post a Comment

Comment
Name
Email
Website