Qué es el Contenido duplicado y thin content en SEO y cómo solucionarlo

Penúltima guía de la serie SEO TÉCNICO. Hoy hablamos de contenido duplicado y contenido de baja calidad (thin content), algo que puede hacer mucho daño a nivel SEO a nuestra web.

  1. Qué es SEO Técnico
  2. Operadores de Google (footprints)
  3. Arquitectura Web para SEO
  4. Qué es la Indexación
  5. Qué es Robots.txt
  6. Crawl Budget (Presupuesto de rastreo)
  7. Sitemaps para SEO
  8. Qué son las Core Web Vitals
  9. Contenido Duplicado y Thin content
  10. Qué es la Canibalización SEO

El contenido duplicado y el thin content en SEO son auténticos cánceres. Literalmente. Si entran en tu web es muy probable que se extiendan, y si lo hacen, pueden llegar a matar tu proyecto.

¿No me crees?

Entonces, necesitas leer detenidamente esta guía.

¿Me crees?

Pues también deberías leerla, porque te contamos cómo estar prevenido frente a este riesgo.

¿Qué es el thin content?

El thin content es, básicamente, contenido de poco valor, ya sea por su extensión o porque no dice nada.

Parece mentira que un contenido de 2.000 palabras pueda ser thin content, pero así es. Un contenido generado con un spintax y que no dice nada de valor puede ser perfectamente thin content.

Y, por supuesto, un contenido de apenas 200 palabras acostumbra a ser thin content. Aunque no siempre tiene por qué ser así. Hay búsquedas que se resuelven correctamente con 200 palabras y eso no sería thin content.

No obstante, habitualmente, cuando un contenido es muy breve, es probable que sea thin content. De hecho, existe una cierta ratio entre HTML y texto que puede indicar thin content (aunque esta sería una métrica muy imperfecta, como puedes suponer).

En ocasiones, también se considera al contenido duplicado como thin content. A mí, personalmente, no me gusta esta asimilación. Prefiero tratarlos como cosas separadas. Pero tiene cierto sentido en la medida en que el contenido duplicado tampoco aporta valor.

Y es que, al final, lo del thin content va de eso: de si aportas o no aportas valor al usuario.

¿Cuándo puede aparecer thin content en tu web?

El thin content puede aparecer en una web por varias razones. Algunas son fruto de la mala fe o la desidia y otras son fruto de despistes (por ejemplo, en la estructura de tu web).

Pongamos algunos ejemplos:

Contenido de mala calidad

Imagina que has contratado a un redactor SEO y le has pedido que escriba sobre un tema del que no tiene ni idea. Y en vez de decirte que no tiene ni idea, te acepta el trabajo y, para llegar al número de palabras que le has exigido, se pone a dar vueltas sin hablar de nada.

Esto sería thin content.

También lo sería si escribe un artículo de 200 palabras que no aporta prácticamente ningún valor, cuando en realidad responder a la query del usuario requiere un artículo de 2.000 palabras de buena calidad.

Eso también sería thin content.

Imagina que ese contenido debía ser una guía de compra, y al final, la guía de compra se reduce a dos párrafos y una lista con enlaces de afiliado a productos sin ni siquiera explicar las características de esos productos.

Eso también sería thin content.

Ejemplo de página con contenido de baja calidad (thin content)
Ejemplo de página con contenido de baja calidad (thin content)

En definitiva, tu web puede acabar con thin content por un mal trabajo de redacción, sea por mala fe, desconocimiento o lo que sea. En resumen, no resolver la intención de búsqueda del usuario.

Contenido automático

Otra forma en la que puede aparecer thin content en tu web es por el contenido generado automáticamente.

Aunque, seamos serios, si estás generando contenido automático o semi-automático, ya sabes que eso es un riesgo. De hecho, probablemente lo estás haciendo por eso.

En cualquier caso, sí, el contenido automático es otra forma de que tu web tenga thin content.

Todo lo que tiene que ver con traducciones automáticas, texto spin, texto confeccionado a partir de copiar de diferentes fuentes… Todo eso puede funcionar durante un tiempo, pero lo más probable es que, en poco tiempo, Google lo detecte y te penalice (o no te posicione).

contenido automático

No es recomendable usar estas técnicas para tu web si es tu negocio principal y estás ganando dinero con ella. Te recomiendo hacer pruebas en webs secundarias entendiendo el riesgo que conlleva.

Páginas irrelevantes o vacías

Por último, la forma más habitual de que aparezca thin content en webs White Hat mínimamente serias es mediante las páginas irrelevantes o vacías.

Estas páginas son resultado de ciertos CMS o estructuras de contenido que hacen que se generen páginas que no aportan valor.

Por ejemplo, cuando tienes una categoría o etiqueta en WordPress y en dicha categoría sólo se listan los títulos de las entradas dentro de esa categoría, esa es una página con thin content.

Categoría de recetas de Pijiteces.com con poco contenido, posible thin content
Categoría de recetas de Pijiteces.com con poco contenido, posible thin content

Cuando generas páginas para fichas de producto muy parecidas entre sí y sin apenas descripción, también es thin content.

En general, todos los CMS generan páginas que son útiles para la estructuración interna de la web, pero que, a nivel de contenido, no ofrecen valor al usuario.

Por suerte, hay formas de solucionarlo.

¿Cómo afecta el thin content al SEO?

El thin content puede afectar de dos formas distintas al SEO:

1. Sin permitirte posicionar. En este caso, tus páginas, simplemente, no llegarán a posicionar. Es lo habitual en thin content “natural”, en el que no buscas engañar al buscador.

2. Penalización. En los casos en que sí buscas engañar al buscador (con spin, por ejemplo), es posible que posiciones durante un tiempo, pero, al cabo de un tiempo, te penalicen y te hagan desaparecer.

Sea como sea, es importante corregirlo, porque te está impidiendo alcanzar las primeras posiciones (o te lo impedirá en el futuro).

¿Cómo detectar el contenido duplicado y thin content?

🖐🏻 Manualmente:

  • Busca el mismo contenido en diferentes URLs (categorías y etiquetas con los mismos artículos, descripciones de productos, artículos sobre un tema repetidos...).
  • Mira en Search Console qué páginas has mandado a indexar y no están indexadas.
  • Mira en Analytics o Search Console que páginas reciben menos tráfico y a qué se debe.
  • Si tienes redirecciones o canonicals, comprueba que están funcionando correctamente.

🛠 Con herramientas:

🔗 Siteliner.com: comprueba el contenido duplicado de 500 URLS de forma gratuita

🔗 Screaming Frog: Analiza una web completamente y comprueba el % de similaridad entre los contenidos y la longitud de los contenidos.

¿Cómo solucionarlo?

La forma de resolver el problema dependerá del tipo thin content que tengas. Vamos a ver de qué forma se pueden resolver los dos tipos básicos de thin content:

Crea contenido de calidad

Por supuesto, para resolver un problema de contenido de mala calidad, hay que crear contenido de calidad.

No hacía falta una guía para esto, ¿verdad?

Si has escrito contenidos muy pobres o tu redactor te ha estafado y tienes contenidos de baja calidad, antes de seguir publicando, tienes que corregir lo que ya tienes.

¡Y cuidado! Como dijimos antes, corregir no es necesariamente añadir más palabras.

En algunos casos, será necesario añadir palabras. En otros, en cambio, será necesario recortar el contenido y crear algo más magro, con mayor contenido real por cada cien palabras.

Con la herramienta Análisis de Contenidos de Kiwosan podrás crear contenidos optimizados de forma muy sencilla. Escribe la palabra clave que quieres posicionar y conoce todas las keywords, palabras, términos semánticamente relacionados debes añadir a tu contenido para SEO optimizarlo.

Gráfica de las keywords más relevantes para una temática
Gráfica de las keywords más relevantes para una temática

¿No consigues posicionar tus artículos? Optimiza tus contenidos

Quiero mejorar mis contenidos

Evita las páginas autogeneradas de mala calidad

En el caso de que tengas un problema de thin content producto de la creación de páginas autogeneradas de mala calidad, tendrás que buscar la forma de arreglar esto.

Y esto se puede hacer de muchas formas.

Lo que yo te recomiendo es lo siguiente:

  1. Haz una búsqueda en Google poniendo un site:tudominio.com
  2. Revisa qué páginas estás indexando (si tu web es muy grande, este método no te servirá y tendrás que usar Screaming Frog para hacer la tarea más fácil)
  3. Identifica las páginas autogeneradas (categorías, fichas de producto, URLs con parámetros… Lo que sea.
  4. . Valora si necesitas indexar esas página
    1. En caso de que sí, añade contenido de valor a esas páginas
    2. En caso de que no, añade una etiqueta no-index a dichas páginas

Otra opción, en el último caso, sería cambiar la estructura de la web y que, directamente, esas páginas dejen de generarse. Sin embargo, esto te daría problemas de errores 404 y podría ser peor el remedio que la enfermedad.

¿Qué es el contenido duplicado?

El contenido duplicado, por su parte, es contenido que no es único.

Y aquí no hablamos de originalidad y “calidad de contenido”. Es decir, muchas veces hablamos de que un contenido que dice lo mismo que otro, pero con distintas palabras no es un contenido original.

Y eso es cierto.

Pero no es de lo que hablamos cuando hablamos de contenido duplicado.

¿Qué es exactamente el contenido duplicado?

Cuando hablamos de contenido duplicado, hablamos de contenido idéntico. Copiado. Replicado.

ejemplo contenido duplicado

¿Cuándo puede aparecer el contenido duplicado en tu web?

El contenido duplicado puede aparecer en tu web de varias formas, pero siempre bajo una de estas dos formas:

Contenido duplicado interno intersite

El contenido duplicado intersite es el contenido que está en tu web y, además, está en otra web que no es tuya.

Lo normal en estos casos es que tu redactor (o tú mismo, vaya), haya cogido un texto de otra web y lo haya publicado en la tuya tal cual. Esto, obviamente, a Google no le hace ninguna gracia.

Sin embargo, también puede pasar lo contrario. Puede ser que hayas publicado un contenido en tu web y otra web te lo haya copiado. En este caso, no tienes de qué preocuparte (salvo que esa otra web haya indexado el contenido antes que tú).

Pero no es la única forma en que se puede duplicar el contenido entre dos webs.

También puede pasar que estés creando una web que, por su diseño de proyecto, implica el coger contenidos de otras webs para replicarlo en tu web, aunque sólo represente una parte del total del contenido (por ejemplo, las listas de productos de afiliados de AAWP).

En este caso, dependiendo de la proporción de contenido duplicado y original, podrás estar haciendo un buen trabajo o uno no tan bueno.

En cualquier caso, a pesar de lo anterior, lo mejor es que tengas como base que un contenido duplicado siempre es malo.

Contenido duplicado externo intrasite

Después está el contenido duplicado intrasite, que es el que se produce entre dos páginas o más dentro de tu propia web.

Este contenido duplicado tiende a ser menos malo, pero también se debería evitar si se quiere tener el mejor SEO posible.

El contenido duplicado intrasite se da por la estructura de la web. Por ejemplo, las páginas de categoría suelen contener contenido duplicado, porque son las primeras líneas de los posts de dicha categoría.

No entramos aquí en dos contenidos publicados en la web y que sean muy parecidos entre sí, porque eso no sería contenido duplicado como tal y tendría más que ver con la canibalización de keywords.

¿Cómo afecta el contenido duplicado al SEO?

El contenido duplicado puede afectar de dos formas a tu web, dependiendo del tipo de contenido duplicado que tengas.

1. Si es intersite: mismo efecto que el thin content. No posicionarás y, si posicionas (cosa rara) en cualquier momento pueden pegarte un pandazo y hacerte desaparecer.

2. Si es intrasite: puedes posicionar razonablemente bien, porque Google es consciente de cuándo una página es de categoría y entiende que ahí puede duplicarse un poco el contenido, pero siempre tendrás un pequeño peso que te impedirá posicionar tan bien como podrías. Por eso, es conveniente corregirlo.

¿Cómo solucionar el contenido duplicado?

Para resolver el contenido duplicado, deberás hacer lo siguiente:

Crea contenido único

En primer lugar, obviamente, tienes que crear contenido único y no copiarlo de webs de terceros.

Si tienes contenido copiado, lo mejor que puedes hacer es corregirlo o, si no quieres hacerte cargo, eliminarlo.

Sí. Eliminarlo.

Ese contenido no está jugando a tu favor y te está restando fuerza. Así que es mejor eliminarlo que mantenerlo (aunque lo mejor sería corregirlo y mejorarlo, claro).

🔗 Guía: Cómo escribir un contenido SEO optimizado

Ten una estructura adecuada (y con originalidad)

El siguiente paso sería tener una buena estructura y una arquitectura interna eficaz, que no duplique demasiado contenido intrasite.

Idealmente, cada página que duplique contenido (por ejemplo, las páginas de categoría), deberían tener alguna parte de contenido original, de tal modo que, aunque duplique una parte del contenido de dicha página, otra parte sea original.

Y, en el caso de que tengas una estructura más compleja con muchas más páginas con contenido duplicado, plantéate si realmente necesitas esa estructura (y si necesitas indexarla). Tal y como sucede con el thin content, vaya.

🔗 Cómo crear una arquitectura web para SEO

Usa noindex o canonicals

Por último, dependiendo del tipo de proyecto que gestiones es posible que tengas contenidos duplicados que no puedas eliminar. Ciertas fichas de producto o ciertas taxonomías, por ejemplo.

En estos casos, puedes plantearte el uso de noindex para evitar que esos contenidos se indexen y, de este modo, a ojos de Google sólo haya contenido original (aunque después no sea así) o, en caso de no poder usar el noindex, las etiquetas canonical para indicar a Google la página principal.

ejemplo canonical ecommerce

Como puedes ver, el contenido duplicado y el thin content son muy peligrosos para el SEO de tu web. Esperamos que, con esta guía, hayas entendido las claves para evitar su aparición, ya sea por despiste (o mala fe) de los redactores o por malas estructuras en tu web.

Sigamos con la guía SEO definitiva. Ahora vamos a ver 👇🏻

Ángel Rodríguez es el CEO y fundador de Kiwosan.com

Ha trabajado más de 6 años como SEO, programador y redactor de contenidos.
Especializado en análisis de palabras clave, análisis de contenidos y de la competencia.

Actualmente también es redactor de los contenidos SEO del blog.

Artículos relacionados muy interesantes y que merecen mucho la pena 👇

Deja un comentario

Información sobre la Protección de Datos
Responsable: Ángel Rodríguez
Finalidad: Moderar los comentarios a los artículos publicados en el blog.
Legitimación: Consentimiento del usuario.
Destinatarios: No se comunicarán datos a persona u organización alguna.
Derechos: Tienes derecho a Acceder, rectificar y suprimir los datos.
Plazo de conservación de los datos: Hasta que no se solicite su supresión por el interesado.