¿Qué es el contenido duplicado?

Aprende a evitar el contenido duplicado en tu web

El contenido es el rey del marketing digital, lo repetimos por activa y pasiva, e incluso en nuestra guía SEO lo remarcamos. Cuidar el contenido escrito de una web es fundamental, y debemos de tratar de no caer en errores clásicos para incrementar el número de palabras, como lo es el contenido duplicado.

Trabajar el contenido de una página web debe ser una tarea que se haga con tiempo y esté bien diseñada, ya que el contenido es la información que le ofrecemos al usuario para que conozca a la marca y los servicios que se ofrecen.

Este contenido debe estar bien redactado y que sea entendible por el usuario, aportando valor y criterio, por lo que todo aquel contenido duplicado será penalizado y no influirá en la decisión de compra del usuario, siendo uno de los principales aspectos que vigila Google con sus algoritmos.

El usuario antes de hacer la compra analiza muchos elementos para determinar que marca le aporta más comodidades o facilidades en la compra, y este contenido le ayudará a tomar la decisión.

Es importante evitar a toda costa el contenido duplicado, por eso queremos hacer un análisis de como puede influir este en el posicionamiento de tu web.

¡Empezamos!

¿Qué es el contenido duplicado?

El contenido duplicado es todo aquel texto que se replica de manera parcial o total en diferentes URLs, ya sea dentro de un mismo dominio o en diferentes páginas web.

Normalmente las réplicas se producen por el plagio de terceros, mientras que el contenido duplicado interno ocurre cuando se producen errores dentro de la estructura de la página web, haciendo que varias URLs lleven a una misma página o porque el texto que se ha utilizado en las descripciones de dos o más páginas es prácticamente el mismo.

El contenido se puede calificar como duplicado cuando este supera el 30% del mismo que se encuentra en otras páginas publicadas de manera literal.

Tipos de contenido duplicado 

Dentro del SEO y del contenido que podemos encontrar, destacamos dos modalidades de contenido duplicado, el interno y el externo.

Como bien decíamos anteriormente, el contenido duplicado interno es todo aquel que se encuentra dentro del dominio de nuestra página web. Google rastrea todos los enlaces que hay dentro de un dominio, por lo que es interesante corregirlo o hacer que solo Google rastree aquellas páginas que nos interesa o que son más importantes.

El contenido duplicado externo es aquel que está copiado de otra página web externa, como puede ser la descripción de productos dentro de los e-Commerce. A veces puede pasar que el contenido original se encuentre por debajo del contenido duplicado, y esto se debe a que este último enlace tiene mucha más autoridad y relevancia que el original. 

Cuando ocurre esto, Google ayuda a las páginas web afectadas poniendo a disposición herramientas que ayuden a detectarlo y denunciarlo.

Causas del contenido duplicado

Antes de comenzar con el desarrollo de una página web hay que tener en cuenta las causas por las que se puede producir el contenido duplicado, evitando así posibles errores en el futuro.

Dominio duplicado

En el caso de que no indiquemos a Google la versión de dominio que vamos a utilizar, la web funcionará tanto con las 3 w como sin ellas, funcionando también con https o sin el certificado de seguridad. Es decir, a ojos de Google, https://digitalvar.es y https://www.digitalvar.es serían páginas diferentes, cuando en realidad no es así.

Aquí es fundamental determinar cual es el único dominio que vamos a utilizar para evitar que otras versiones puedan estar activas.

Filtros de productos

En los e-Commerce encontramos los filtros de productos, los cuales crean URLs de manera continua. Esto hay que tenerlo en cuenta para evitar que Google lo califique como contenido duplicado. 

Aunque los filtros pueden ser buenos, hay que configurarlos para que se entienda como una sola página válida del producto. Dejando solo aquellos que sean útiles de verdad y utilizando correctamente la canonical. 

Esto también puede pasar con las entradas del blog.

Localización mal etiquetada

Cuando se utiliza el mismo contenido para distintos países o regiones o en zonas que se hable el mismo idioma, pueden surgir problemas, incluso cuando este está traducido. 

Para esto, conviene emplear las etiquetas hreflang, ayudando a Google a entender que es contenido para otras zonas geográficas.

Etiquetas, archivos y categorías

En el momento de etiquetar y categorizar debemos tener cuidado y hacerlo adecuadamente, porque sino podemos enfrentarnos a problemas de contenido duplicado. 

Para entender esto mejor, si etiquetamos 4 artículos utilizando dos etiquetas distintas, las URLs de las etiquetas se mostrarán en los mismos 4 artículos, siendo de esta manera contenido duplicado porque se muestra la misma información en ambas etiquetas. 

Paginaciones

Es conveniente evitar el tema de las paginaciones, porque pueden crear urls de contenido muy parecido. Para evitar esto, hay que indicar a Google las etiquetas que posee para que sepa que no es contenido duplicado.

Una buena solución para aquellas tiendas online o blog es la creación de una única página que al hacer scroll vaya mostrando más contenido.

Fichas de productos 

A la hora de elaborar las descripciones de un producto hay que asegurarse de que esa información sea autentica y que no estemos copiando o redactando la información como la descripción del proveedor. 

La mejor manera de evitar el contenido duplicado en este caso sería con la creación de contenido propio, nada de copiar, pegar y realizar pequeñas modificaciones.

Parámetros en URL 

Muchas URLs tienen parámetros en su dirección, porque se hace una búsqueda realizada o un filtro implementado. Para ello hay que configurar el CMS, plugin o herramienta para que no se produzca el duplicado del contenido.

Formas de corregir el contenido duplicado 

Después de conocer las causas por las que se produce el contenido duplicado debemos saber como actuar o como se puede corregir esto.

Contenido original

Una de las formas con las que mejor se solucionan los problemas de contenido duplicado es escribiendo siempre este de manera original y sin copiarnos de otros textos.

Canonical

Destacar una URL como canonical sirve para decirle a Google que página es la importante o la original, para que esta reciba toda la autoridad. De esta manera, en el caso de que se produzcan las paginaciones, la canonical se considerará siempre como la página 1, o en caso de tener filtro que esta URL sea siempre la de producto original.

No index

Otra manera con la que podemos evitar los problemas de duplicidades es hacer que Google no indexe las páginas, logrando que no aparezcan en los resultados de búsqueda las páginas que no nos interesan.

Si la página no se indexa a Google le dará igual que el contenido sea duplicado o thin content, no debería de ser un problema.

Redirección 301

Como alternativa para acabar con el contenido duplicado se pueden crear redirecciones 301 para aquellas páginas web que no nos interesen. Con esto logramos que cuando se visite una página web, el robot de Google se vaya a la página web que queremos posicionar.

Robots.txt

Para solucionar esto, también podemos indicarles a los robots que no accedan a algunas partes del contenido de nuestra web, evitando así que analice aquellas menos importantes como la de login o páginas de autor.

Borrar la página índice 

Podemos borrar páginas del índice de Google, para ello disponemos de diferentes opciones. Una de ellas es usando la herramienta de retirada, que le indica a Google que la retire durante un tiempo determinado.

También se puede hacer un redireccionamiento 410 Gone, que sirve para que Google detecte que esa url o contenido no va a estar disponible y que pasado un tiempo se acabara borrando.

Reescribir contenido 

Reescribir los contenidos puede ser otra alternativa que permita hacer que esos contenidos sean más diferentes y por tanto más originales. Aquí es interesante cambiar algunos aspectos importantes del SEO como la URL, el title, el metatitle, la descripción, las etiquetas H1…

Denunciar en Google 

Google dispone de una herramienta de ayuda legal que permite hacer las denuncias de contenido duplicado que vulneran la ley.

¿Penaliza el contenido duplicado?

En la gran mayoría de los casos, el contenido duplicado no produce una penalización como tal, pero si que nos afecta en el posicionamiento de la página web o en la desindexación de estas. 

Evidentemente no podemos poner en duda que si el sitio web está repleto de contenido duplicado el algoritmo Panda acabe actuando y sancionando a la web.

Herramientas para saber si tengo contenido duplicado

A continuación, os vamos a mostrar algunas herramientas muy útiles para saber si una página web cuenta con contenido duplicado.

SE Ranking 

Destaca por ser una de las herramientas a nivel mundial con más funciones, además de que con un presupuesto pequeño se pueden usar diferentes funcionalidades con gran potencia de análisis.

Dispone de una auditoría SEO On Page que analiza de manera individual lo preparada o no que está una página a la hora de optimizar su posicionamiento web. Pero, además, entre las funciones de Se Rankingencontramos la posibilidad de hacer un análisis sobre el contenido duplicado tanto en el interno como en el externo.

Copyleaks 

Es una herramienta especializada por completo en la detección de plagios y de contenido duplicado, con informes claros y sencillos. En su dashboard podemos introducir la url del sitio web o la posibilidad de subir un texto, para comprobar la existencia de contenido duplicado. 

Semrush 

Semrush es una de las herramientas de marketing digital más popular y usada. Mediante esta herramienta podremos conocer el contenido duplicado interno de la página web con la auditoría SEO automática que realiza, ofreciendo también las soluciones más adecuadas para terminar con ello.

En cuanto al contenido duplicado externo no nos ofrece mucha información, porque no dispone de muchas funcionalidades a la hora de analizar el contenido de varias páginas web. Aunque cabe destacar que una de las funcionalidades que sí dispone es la de detectar si el contenido que escriben los propios redactores contiene o no contenido duplicado externo o interno.

Siteliner 

Es una herramienta muy útil para analizar el contenido duplicado interno por utilización de categorías o de etiquetas. Junto con esto, nos permite detectar aquellos enlaces que estén rotos dentro de nuestra página web.

Cuando se haga el análisis con esta herramienta, es interesante que se navegue por las diferentes páginas para saber que ha detectado Siteliner como contenido duplicado y cual es el contenido duplicado real y cual no.

Duplicate Content Checker de SEO

Se caracteriza por tener un buen grado de fiabilidad, pero hay que tener en cuenta que esta herramienta detecta contenido duplicado en páginas individuales, con el inconveniente de que no se puede realizar un análisis completo de SEO de la web entera.

Copyscape 

Es una herramienta clave a la hora de analizar el contenido duplicado externo, pudiendo hacer de manera gratuita el análisis de una página o con la versión de pago para analizar múltiples páginas web.

Small Seo Tools 

Esta aplicación gratuita ayuda a detectar el contenido duplicado, pudiendo introducir el texto en vez de una url. Permite la subida del texto plano o mediante documento de Word o TXT. 

Al final, ofrece la posibilidad de que se pueda especificar la url en concreto para que no la tenga en cuenta en la comprobación.

Hive Digital Duplicate Content 

Con la ayuda de esta herramienta podremos analizar si hay redirección del dominio, si la caché de Google no tiene duplicados, si no hay páginas similares como /index y detecta que devolvamos errores 404 para que Google no tenga en cuenta la página 404 como página de contenido duplicado.

Duplichecker 

Gracias a esta herramienta, podremos analizar de manera gratuita si el contenido es duplicado, siempre que no se introduzcan más de 1000 palabras. Permite añadir ficheros, urls o texto plano copiado en un formulario.

También ofrece la posibilidad de comprobar la gramática y de buscar imágenes duplicadas. Junto con esto, ayuda a las webs reescribiendo textos, pudiendo scrapear textos y reescribirlos para posicionarlos de manera más rápida.

Google Search Console 

Mediante Google Search Console, podremos analizar lo que Google tiene en la base de datos, pudiendo ver que contenido duplicado interno ha detectado Google. 

Las páginas web de internet, así como e-Commerce o blogs, deben asegurarse de que el contenido que ofrecen es de calidad y que ayuda a los usuarios a resolver sus dudas. Todo aquello que sea considerado como contenido duplicado influirá negativamente en el posicionamiento de la web, perdiendo visibilidad en los motores de búsqueda.

Es interesante que las marcas analicen y desarrollen correctamente la información que ofrecen, tratando de ayudar al usuario y conseguir un buen posicionamiento.

Esperamos que este articulo os haya servido para comprender más sobre el contenido duplicado y las acciones que hay que evitar para no sufrir las consecuencias negativas de esto. ¡Os leemos!

Agencia de marketing digital Digitalvar

5/5 (1 Review)

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio
Call Now Button