¿Cómo detectar contenido duplicado?

La importancia de saber detectar y corregir el contenido duplicado

Utilizar contenido duplicado fue una técnica muy popular hace unos años para lograr tener mucho contenido escrito en una web sin perder tiempo redactándolo, pero eso ya no es suficiente, como os comentamos en este extenso artículo sobre “EL CONTENIDO DUPLICADO”

Tener una página web calificada con contenido duplicado es algo que no beneficia en nada a la marca o empresa, sobre todo a nivel de SEO, pues es considerada una técnica Black Hat. Por ello es tan importante detectar contenido duplicado y eliminarlo de una web.

El objetivo principal de Google es ofrecer información de calidad a sus usuarios, logrando cumplir con sus expectativas y necesidades. De esta manera, se puede situar y posicionar en un ranking aquellas webs que mejores servicios e información ofrecen, mostrando el contenido en los resultados de búsqueda de mayor a menor calidad.

En el momento en el que se detecta contenido copiado o sin valor, se penalizará a la web, encontrándose así en desventaja. Por todo esto, es interesante saber cómo detectar contenido duplicado y evitar que nuestra web sufra alguna sanción inesperada.

¿Qué es el contenido duplicado?

Aunque ya habrás oído hablar de este concepto mil veces, y lo hemos explicado en algún otro artículo, queremos recordártelo, para que lo tengas presente y claro a la hora de detectar contenido duplicado.

Se considera que un texto es contenido duplicado cuando este se replica de manera parcial o total en otras URLs. Estas URLs se pueden encontrar tanto dentro del dominio como en otras webs ajenas.

Se determina que la réplica se produce cuando el plagio se produce de terceros, pero cuando ocurre el contenido duplicado interno este se debe a errores dentro de la estructura de la página web, de manera que varias URLs llevan a una misma página. También este último caso se puede deber a que el texto se ha repetido de manera exacta en las descripciones de dos o más páginas.

Se dice que aquel contenido que es idéntico en al menos un 30% de su texto será contenido duplicado.

¿Afecta al SEO el contenido duplicado?

Detectar contenido duplicado es fundamental para evitar penalizaciones de dominio, y es que como hemos mencionado brevemente al principio del artículo, debemos saber que tener contenido duplicado sí que afecta al SEO. Google rastrea las páginas y en cuanto considera que el contenido no es el apropiado, pondrá una penalización. Esta penalización puede variar y nos veremos afectados de diferentes formas:

  • Google decide no mostrar ese contenido en los resultados de Google.
  • Penalización automática cuando el algoritmo Panda detecta una copia.
  • Penalización manual cuando se denuncia por plagio y es revisado por Google.

Detectar contenido duplicado se convierte en una actividad esencial, por lo que, si no has creado los textos de tus webs o artículos, te recomendamos encarecidamente que revises ese contenido, no vayas a tener un problema a medio y largo plazo.

Google Panda y contenido duplicado

Detectar contenido duplicado es necesario por la existencia del algoritmo de Google Panda, el encargado de analizar y supervisar todo lo relacionado con los textos.

Todo comienza con la creación de Google Inc, compañía que se lanzó en 1998, revolucionando el mundo ya que introducía un motor de búsqueda de contenido en internet. Dentro de esto motor podemos encontrar diferentes productos y servicios, lo que permite procesar una gran cantidad de búsquedas.

Tras el poco tiempo de aparecer Google, se desarrolló el mundo del SEO, donde las arañas rastreaban las páginas web inspeccionándolas y extrayendo los enlaces internos y externos. Con el tiempo, estas arañas empezaron a evolucionar, siendo mucho más autónomas e inteligentes, y sobre todo, más difíciles de engañar.

Junto con esto, los dueños de las páginas web se dieron cuenta de que era importante aparecer en los primeros resultados, dando lugar a las técnicas de posicionamiento.

Con ello, los algoritmos de Google iban también evolucionando, haciendo que las búsquedas que realizaban fueran de mayor calidad. Fue en 2011 cuando apareció el algoritmo de Google Panda, una nueva actualización que trataba de penalizar aquellas páginas que ofrecieran contenido duplicado o escaso. En su momento, afectó a más del 12% de los resultados de las búsquedas de ese año y ya hubo personas que tuvieron que empezar a detectar contenido duplicado para paliar su bajada de tráfico.

Después de esto, se ha seguido actualizando, siendo Google Panda uno de los algoritmos que más cambios ha sufrido y uno de los más perfeccionados, de ahí la importancia de detectar contenido duplicado.

Herramientas para detectar contenido duplicado

Detectar contenido duplicado puede ser algo complejo, pero por suerte, existen infinidad de herramientas para ayudarte con esta tarea.

  • SE Ranking: La herramienta SE Ranking ofrece múltiples funcionalidades, con una gran calidad y con la capacidad de iniciar su estrategia con un pequeño presupuesto. Tiene una gran capacidad de detectar contenido duplicado, haciendo auditorias de SEO On Page. Se encarga de analizar el contenido duplicado interno y externo, para conocer si tenemos contenido de la página duplicado dentro de la web o si este contenido está duplicado en otras páginas web.
  • Copyleaks: Esta empresa se encarga de detectar contenido duplicado y plagios, ofreciendo informes sencillos y claros. Dentro de la herramienta encontramos un apartado donde se puede subir una url o un texto para analizar la duplicidad de ese contenido. Permite hacer hasta 10 análisis de manera gratuita al mes, pasando sino a la modalidad de pago.
  • Semrush: Podremos detectar contenido duplicado con la auditoría de SEO que nos realiza, investigando el contenido duplicado interno y la manera de solucionarlo. Sin embargo, cabe destacar que no nos ofrece información sobre qué otras páginas de nuestra web tienen contenido duplicado de otras webs.
  • Siteliner: Esta herramienta es muy útil de cara a detectar contenido duplicado mediante la utilización de categorías y etiquetas. Podemos incluir un servicio añadido para detectar enlaces rotos de la página. Aunque nunca vamos a tener un 0% de contenido duplicado, debemos revisar aquellas páginas que tenemos con contenido duplicado y analizar cual es real y cual no.
  • CopyscapeCon el uso de esta herramienta podemos detectar contenido duplicado externo, utilizándola de manera gratuita para analizar una única página o utilizando una versión de pago para poder analizar múltiples páginas web.
  • Small SEO Tools: Gracias a esta aplicación online podemos saber de manera gratuita el contenido duplicado de nuestra web, introduciendo la url. También podemos subir textos o documentos Word o TXT.
  • Hive Digital Duplicate Content: Aunque no es una herramienta tan potente, podemos tener un punto de vista diferente sobre nuestra web. Podremos analizar si hay redirección del dominio a la raíz o viceversa, si la caché de Google no tiene duplicados o si no tenemos páginas parecidas.
  • Duplichecker: En este caso es posible comprobar el contenido siempre que no supere las 1000 palabras. Podemos introducir ficheros, urls o texto plano. También nos ayuda a comprobar la gramática y la posibilidad de buscar imágenes duplicadas. Junto con esto, destacamos otra de las funcionalidades que dispone, en la que se puede reescribir textos para posicionarlos de manera rápida.
  • Google Search Console: Dentro de la sección de mejoras HTML, podemos detectar contenido duplicado interno que tiene detectado Google. Siempre os comentamos que esta herramienta es gratuita y es la mejor herramienta, aquí os dejamos un enlace donde os contamos todos los trucos de esta herramienta.

¿Cómo solucionar el contenido duplicado?

Tras haber analizado las herramientas que podemos utilizar para detectar contenido duplicado, debemos conocer la manera en la que se puede solucionar ese contenido plagiado para no sufrir penalizaciones. 

  1. Insertar la etiqueta <rel=canonical> en el código de tu página: Cuando hay productos con descripciones muy similares, empleando esta etiqueta se le indicará al buscador cual es la versión original y la que debe indexar, evitando así que lo considere como contenido duplicado. Esto es muy habitual en las tiendas de productos, donde puede haber productos con diferentes variaciones.
  2. Redirección 301: Puede darse la situación que encontremos dos URL que lleven a un mismo sitio. Por eso debemos conseguir una sola URL, redireccionando la URL duplicada a la original. 
  3. Indicar que URL hay que indexar: Si le indicamos al buscador que URL es la correcta, conseguiremos que rastree esa, pero para ello también debemos bloquear aquella que no queremos que rastree, mediante la herramienta de Google Search Console y el sitemap.
  4. Ser creativo con las descripciones: Aunque pueda llevar más tiempo es beneficioso ser creativos con las descripciones, mostrando las keywords adecuadas, con fotos de calidad y un lenguaje adecuado que llame la atención del público.
  5. Redactar las meta-title y las meta-descripciones diferentes para cada producto: El meta-title es el título azul que aparece cuando hacemos una búsqueda, y la meta-descripción el texto que aparece debajo. Cada producto debe tener un texto correspondiente diferente, evitando así el contenido duplicado.
  6. Parámetros en Webmaster Tools: Webmaster Tools nos permite informar sobre los parámetros que usamos para el seguimiento de las URLs, algo fundamental para detectar contenido duplicado.
  7. Meta robots: Con la etiqueta no index, no follow podemos comunicar a Google que no indexe algunas páginas determinadas, excluyendo así cualquier problema de contenido duplicado.
  8. Unificar páginas: Cuando tenemos un número elevado de páginas debemos revisar cuales son de un mismo producto y decidir si se puede unificar ese contenido en una sola página, haciendo así una versión más interesante para el usuario.
  9. Diseñar versión para el móvil: El uso del dispositivo móvil se ha visto incrementado en los últimos tiempos, por lo que pueden presentarse dos URLs para la página en todas las páginas de la web. Esto supone tener que crear un diseño responsive, con todas las páginas con diferentes URL.

Cuando se gestiona una página web debemos saber tomar las medidas más adecuadas para mejorar el rendimiento de esta y detectar contenido duplicado es algo esencial. La estructura y contenido que ofrezcamos en ella debe ser de calidad, donde los usuarios saquen un beneficio con una mejor experiencia de usuario y logremos así posicionarlo mejor en los motores de búsqueda.

Para ello los algoritmos trabajan constantemente para analizar esa información, por eso debemos utilizar las herramientas que nos ayuden a detectar contenido duplicado, para corregirlo rápidamente y que este no nos afecte en el desarrollo de nuestra web.

Confiamos en que este artículo sobre cómo detectar contenido duplicado os haya resultado de ayuda. Todas las herramientas que os hemos indicado os ayudarán enormemente a mejorar vuestra redacción y a no correr riesgos de penalizaciones.

Como siempre, estaremos encantados de resolver vuestras dudas sobre cómo detectar contenido duplicado o cualquier otro aspecto del marketing digital, ¡os leemos!

Agencia de marketing digital Digitalvar

5/5 (1 Review)

2 comentarios en “¿Cómo detectar contenido duplicado?”

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio
Call Now Button