Qué son las Entidades y cómo mejoran el SEO

Entidades. Octavo tutorial de la serie Palabras clave: La guía definitiva.

Las entidades, ese gran desconocido. El posicionamiento en buscadores es una mejora continua sin fin, los motores de búsqueda siempre están mejorando en busca de dar la respuesta perfecta al usuario que busca algo y para ello tiene que entender que está buscando. En ese punto es dónde entran en juego las entidades.

Tabla de Contenidos

 

Nota: Este es un tema complejo y que puede llegar a ser muy técnico, así que intentaré explicarlo de la forma más sencilla posible.

 

Evolución del motor de búsqueda Google

El inicio de Google fue relacionar webs por sus enlaces. Si una web recibía muchos enlaces en general es que era una web importante, pero si ademas esas webs eran de perros es que la web a la que enlazaban era una web sobre perros importante. ¿Problema de eso? Que si comprabas un pack de 5000 enlaces posicionabas una web fácilmente. Luego con el tema de las palabras clave lo mismo, hecha la ley, hecha la trampa. Si querías posicionar «comida para perros» solo tenías que poner la palabra «comida para perros» cientos de veces a lo largo de contenido junto con un texto, digamos, de dudosa calidad. Pero los algoritmo avanzan y los buscadores (especialmente Google) quieren dar la mejor respuesta al usuario con contenido de valor y no ser engañados. Para ello necesitan comprender el contenido.

Solución: Relacionar webs por el propio contenido, analizando y entendiendo la temática y el contexto de la web.

Llega la web semántica. Ya no se trata de buscar cadenas de texto en el contenido sino de identificar «cosas» y sus relaciones.

La semántica tiene que ver con el significado de las palabras y de las relaciones entre estas. Y solo voy a decir esto por simplificar, si quieres más información sobre el procesamiento del lenguaje natural (PLN) te recomiendo que leas y entiendas conceptos como:

  • RDF – Resource Description Framework
  • NLP – Natural Language Processing (Procesamiento del lenguaje natural)
  • NER – Named Entity Recognition (Identificación de Entidades)
  • Topic Modeling – Modelado de temáticas

Realmente no hace falta entender todos estos conceptos en profundidad para poder aplicarlos en nuestro favor. Lo que sí tienes que entender son las Entidades.

¿Qué es una entidad?

Como he comentado antes, Google no busca solo enlaces o palabras clave, busca identificar «cosas» en el contenido y sus relaciones con otras «cosas». ¿A qué me refiero con cosas? A las entidades.

Una entidad es una persona, un lugar o, literalmente, una cosa que es única y distinguible. Y estas entidades se pueden asociar a acciones, fechas, ubicaciones u otras entidades.

Una entidad se desglosa en:

ParámetroDescripción
NAMEEl nombre representativo de la entidad.
TYPETipo (clasificación) de la entidad (abajo tienes la clasificación completa).
METADATAPara la mayoría de los tipos de entidad, los metadatos son la URL de Wikipedia (wikipedia_url) y el Knowledge Graph MID (mid) si están disponibles.
SALIENCELa puntuación de saliencia asociada con la entidad en el rango [0, 1]. La puntuación «salience» para una entidad proporciona información sobre la importancia o centralidad de esa entidad para todo el texto del documento. Los puntajes más cercanos a 0 son menos sobresalientes, mientras que los puntajes más cercanos a 1.0 son altamente sobresalientes o relevantes.
MENTIONSLas menciones de esta entidad en el documento. La entidad puede ser mencionada de distintas maneras.
SENTIMENTPuntuación de sentimiento entre -1.0 (sentimiento negativo) y 1.0 (sentimiento positivo) de esa entidad en relación al texto.

 

Clasificación de Entidades

Los tipos de entidades, según la clasificación de Google, son:

TipoDescripción
UNKNOWNDesconocido
PERSONPersona
LOCATIONUbicación
ORGANIZATIONOrganización
EVENTEvento
WORK_OF_ARTObra de arte (películas, canciones, cuadros…)
UNKNOWNDesconocido
CONSUMER_GOODProducto de consumo
OTHEROtro tipo de entidad
PHONE_NUMBERNúmero de teléfono. Este metadato enumera el número de teléfono, formateado de acuerdo con la convención local, más los elementos adicionales que aparecen en el texto:

  • number – El número actual, desglosado en secciones según la convención local
  • national_prefix – Código del país
  • area_code – Código del área o región
  • extension – extensión del teléfono (se marcará después de la conexión)
ADDRESSDirección. Este metadato identifica la calle y localidad además de cualquier elemento que aparezca en el texto:

  • street_number – Número de la calle
  • locality – Ciudad o Pueblo
  • street_name – Nombre de la calle/ruta
  • postal_code – Código Postal
  • country – País
  • broad_region – Estado o Provincia
  • narrow_region – Área administrativa más pequeña como el condado
  • sublocality – Usado en direcciones de Asia para marcar un distrito dentro de una ciudad
DATEFecha. Este metadato identifica los componentes de la fecha:

  • year – 4 dígitos
  • month – 2 dígitos
  • day – 2 dígitos
NUMBERNúmero. Este metadado es el número en sí mismo.
PRICEPrecio. Este metadato identifica el valor y la moneda.

Ya sabemos que es una entidad, que parámetros y tiene y cómo se clasifican, pero… ¿qué hace Google con esta información y de dónde la saca?

Knowledge Graph

Google trabaja con entidades desde 2012. Sí, hace 8 años. Una de las primeras patentes de Google sobre entidades es de Febrero de 2012 (Related Entities) y ese mismo año Google lanzo el Gráfico de Conocimiento que luego veremos qué es. Amit Singhal, el jefe del equipo de búsqueda de Google en aquel año, dijo que a partir de ese momento ya no se centraban en cadenas de texto (refiriéndose, en parte, a las palabras clave) sino en entidades del mundo real y sus relaciones con otras.

¿Y cómo sabe Google qué son personas, lugares, cosas y qué conexiones hay entre ellas? ¿#GoogleEnsRoba? Pues no, (bueno, a veces sí nos roba, pero en este caso no) Google coge toda esa información de bases de datos de conocimiento como CIA World Factbook, Freebase, WikiData, Wikipedia y muchas más. Analizando toda esa información y organizándola ha creado el Knowledge Graph o grafo de conocimiento, una herramienta para almacenar y relacionar todas las entidades de forma visual y que sea accesible para el usuario.

Vamos con un ejemplo para entender todo esto mejor:

Michael Jackson. Si lo tratamos como una palabra clave se queda ahí. Un nombre propio. Fin. No se puede sacar más información de ahí pero, ¿y si lo tratamos como una entidad?

En ese caso podemos saber muchas cosas de él:

  • Nació en Gary, Indiana, Estados Unidos en 1958
  • Alias «El Rey del Pop»
  • Autor de canciones como «Thriller» y «Billie Jean»
  • Tiene una estrella en el Paseo de la fama de Hollywood

¿Y esto para qué sirve? Para relacionar la información por sí misma. Sin necesidad de enlaces (bakclinks) o información externa.

relacion entidad michael jackson
Si buscas «cantante de thriller», Google te devuelve el autor de la canción.

Otro caso, para las búsquedas:

  • Restaurantes indios en Madrid
  • Dónde comer comida india en Madrid
  • Cuál es el mejor sitio donde comer comida india en Madrid

Antes se podía hacer una página propia para cada palabra clave porque Google no veía la relación entre ellos, pero ahora Google reconoce las entidades «Madrid» e «India» acompañados de las palabras «comer» o «restaurantes». Da igual el resto de palabras clave que pongas como «mejor», «cual», «donde»… ya sabe que estás buscando restaurantes para comer comida india y eso es lo que te va a mostrar. Si buscas esas 3 palabras clave verás que los resultados de las SERPs son idénticos.

🏴 OFERTA BLACK FRIDAY: 25 % DE DESCUENTO 💸

Ver Oferta 👀

Las entidades y los buscadores. La importancia en el posicionamiento SEO

Para que termines de entender que es todo esto de las entidades te dejo este vídeo de los creadores de la Metaweb (Freebase) dónde lo explican muy bien (eso sí, en Inglés):


Fuente: Analistaseo.com

 

Cada vez Google mejora más sus algoritmos, inteligencias artificiales, redes neuronales o lo que sea que haga para analizar todas las webs de Internet. Va modificando las reglas del juego y nosotros tenemos que ir acompañándolo y no quedarnos atrás. El contenido de nuestras webs es más importante que nunca ya que Google va a buscar relaciones entre los textos, entre las palabras para conocer y comprender el significado de ese contenido y la semántica. ¿Y cómo hace eso? Buscando tripletas.

Una tripleta es una frase que contiene 3 componentes: sujeto + predicado + objeto

Llevando ese concepto de tripletas a nuestro caso con entidades podemos decir que el objetivo de estas tripletas es representar conocimiento, hechos. Cada tripleta tiene un significado:

Entidad/Nodo + Propiedad/Relación + Valor de la propiedad/Relación

Volviendo al ejemplo de Michel Jackson y aplicando las tripletas tenemos:

  • Michael Jackson nació en Indiana, Estados Unidos.
  • Michael Jackson cantó Thriller.

La entidad Michael Jackson está relacionada con la entidad Indiana y con la entidad Thriller. Si esta información la ponemos de forma gráfica obtenemos el gráfico de conocimiento (Knowledge Graph).

Vamos con otro ejemplo visual. Si cogemos el gráfico de entidades que tiene Google en una de sus patentes y le ponemos un ejemplo tendríamos algo así:

  • Dave Davies nació el 3 de Febrero de 1947.
  • Dave Davies tiene un hermanos que se llama Ray Davies.
  • Ray Davies tiene una banda de música que se llama The Kinks.
  • Dave Davies tiene una banda de música que se llama The Kinks.
  • Dave Davies es el guitarrista de la banda Kinks.
  • La banda de música The Kinks tiene un álbum que se llama Kinks.

 

 

Relación entidades grafo de conocimiento Dave Davies
Relación de entidades en forma de grafo de conocimiento de Dave Davies.

Si preguntamos a Google cosas como:

  • Quién es el guitarrista de The Kinks
  • Quien es el hermano de Ray Davies
  • Cuándo nació Dave Davies

Google nos responderá con un fragmento destacado en la posición 0 con la respuesta. No la está cogiendo de ninguna web, él ya sabe de quién estás hablando, sabe todas las relaciones que tiene esa persona/entidad y tiene toda la información. Y esto se puede aplicar a todas las entidades.

¿Cómo sé si algo es una entidad?

Respuesta corta y directa. Si tiene grafo de conocimiento propio al buscarlo en Google o si aparece en Wikipedia, es una entidad. Puede que haya algunas entidades que no aparezcan ni en Wikipedia ni en el grafo pero serán las mínimas y tarde o temprano Google acabará añadiéndolas.

 

Desambiguar entidades

El trabajo de Google es entender nuestro contenido pero un problema que tienen las entidades es que pueden ser ambiguas, es decir, pueden interpretarse de distintas maneras, por ejemplo:

  • Barcelona: puede referirse a la ciudad de España, equipo de Fútbol, ciudad de Venezuela…
  • Panda: Oso panda, Software antivirus, Grupo de música, nombre de una canción…

¿Cómo sabe Google a qué se refiere esa entidad? ¿Cómo entiende Google la temática y el contexto de nuestro contenido?

Nuestro trabajo como SEOs se ayudar a Google a entender nuestro contenido lo mejor posible para que pueda posicionarnos mejor. Podemos hacerlo de las siguiente formas:

  • Forma Implícita (directamente)
    Datos estructurados. Macar los datos con Schema.org para que Google vaya directamente a esta fuente de información a coger los datos. Schema es un marcado que viene definido y Google entiende. Cuántos más información que sea útil marquemos, mejor.
    Para ver los datos estructurados de una web puedes usar esta herramienta: https://search.google.com/structured-data/testing-tool/
  • Forma Explícita (indirectamente)
    Sacar información extra del grafo de conocimiento. Centrarse más en el usuario: Hacer un análisis tanto de keywords como de entidades teniendo en cuenta la intención de búsqueda. Las entidades y las keywords son complementarias, una cosa no sustituye a la otra.
  • Co-ocurrencia
    Las palabras que usamos dentro de nuestra página web orientan a los buscadores acerca de nuestro contenido. Por lo tanto, si los mismos términos aparecen en distintos contenidos, en frecuencia y proximidad similar, es probable que esos contenidos sean de la misma temática. Google analiza millones de páginas web y determina que hay ciertos términos que suelen co-ocurrir en aquellos documentos que hablan de cierto tema. Por ejemplo, si estamos hablando de smartphones tendremos que hablar cámara, características, batería, resolución, pulgadas, etc.
  • Co-citación (enlaces)
    Cuando un documento cita otros dos, hay una probabilidad alta de que esos 2 documentos citados estén relacionadas por su contenido.
    Ej: Web A (temática: perros) pone un enlace a la web B y a la web C. Como la web B y C están citadas por la web A (de perros) es probable que la temática de la web B y C sea de perros o esté relacionada con ellos.
    Tenemos que conseguir enlaces temáticos relacionados con nuestro contenido.

Cómo podemos extraer las entidades

Actualmente hay pocas herramientas que hagan análisis de entidades pero te recomiendo las 2 mejores:

La herramienta oficial de Google para el procesamiento del lenguaje: https://cloud.google.com/natural-language

Tiene una versión gratuita limitada a la que podemos pasarle un extracto de texto y nos analizará las entidades, el sentimiento, la sintaxis y su categoría.

 

Procesamiento del lenguaje natural análisis de entidades
Entidades de un texto con tu tipo y puntuación de saliencia (importancia/relevancia).

 

Procesamiento del lenguaje natural análisis de sentimiento
Análisis de sentimiento de un texto a nivel global y de cada entidad.

 

Procesamiento del lenguaje natural análisis sintáctico
Análisis sintáctico del texto (dependencia, morfología, unidad léxica…)

Cómo podemos ver Google lo sabe todo sobre nuestro texto, que significa cada palabra, que relación tiene con otras palabras, si es un nombre, verbo, preposición, etc.

Y como no podía ser de otra manera, la otra herramienta que te recomiendo es Kiwosan (oh, que sorpresa). Como bien sabrás, Kiwosan es un pack de herramientas SEO, pues una de esas herramientas es «Análisis de entidades» y tiene 2 opciones:

  1. Análisis de las SERPs. Escribes una palabra clave y te analiza el contenido del top 15 de Google para esa palabra clave clasificando todas las entidades (al igual que hace Google).
  2. Análisis Batch. En vez de escribir una palabra clave puede escribir un listado de URLs (por ejemplo, tu competencia o quién te interese analizar) y ver que entidades está usando.

 

gráfica entidades kiwosan
Gráfica de las entidades más repetidas de las SERPs

 

 

tabla de entidades seo de las serps
Tabla de entidades seo de las SERPs

 

Entidades seo de cada web al detalle
Entidades seo de cada web al detalle (Salience, tipo y cateogrías)

 

Si quieres más info tienes el tutorial completo aquí 👉  Análisis de Entidades SEO

 

Cómo optimizar nuestros contenidos con Entidades

  1. Elige el tema sobre el que vas a escribir e identifica la palabra clave principal por la que quieres posicionarte.
  2. Haz el análisis de Entidades (de Kiwosan, por ejemplo) para esa palabra clave. Obtendrás cientos de entidades.
  3. Ordena las entidades de mayor a menor salience. Ve eligiendo las entidades que cubran y tengan sentido para el tema principal que has elegido y ayuden a resolver la intención de búsqueda del usuario. No tienes que poner todas las entidades. No tienen por qué estar en encabezados (H1-H4).
  4. Escribe las entidades como parte del texto y con sentido, que no estén forzadas, si no te cuadra con lo que quieres escribir no la uses.

 

Cómo ser una entidad

Hay muchas razones por las que te puede interesar ser una entidad, sobre todo si eres una marca/empresa/persona:

  • Acceso rápido: Los usuarios obtienen acceso rápido a información útil sobre la marca sin necesidad de hacer clic en un sitio web. De esta manera, obtienes impresiones de marca y la oportunidad de comunicar elementos clave sin que el usuario tenga que dar el siguiente paso.
  • Confianza y autoridad:  La aparición del gráfico de conocimiento es cada vez más común. A medida que los usuarios se familiarizan con ellos, se convierten en un contribuyente importante para crear confianza y autoridad para tu marca.
  • Editar tu información:  Ahora Google permite a las personas y marcas autoeditar gráficos de conocimiento para optimizarlos a través de un sencillo proceso de verificación. Esta capacidad de edición te ayuda a controlar los tipos y la calidad de la información que los usuarios ven en los resultados del gráfico.

Ser dueño de una entidad  no depende al 100% de tí, depende de si Google quiere reconocerte como tal, tendrás que hacer méritos, pero básicamente tienes 2 opciones:

A) Tener la increíble suerte de que Google te reconozca como entidad por sus propios medios. Entonces solo tienes que buscarte en Google, ver tu grafo de conocimiento y hacer click en el botón «Registrarse como responsable de este panel de información» que aparece debajo.

B) Si no tienes esa suerte, que será lo normal, tendrás que ganártelo. Para empezar necesitas:

  1. Una web propia y presencia en Redes Sociales verificadas (Facebook, Twitter, LinkedIn, Instagram…) y/o una cuenta en Google My Business si eres un negocio.
  2. En tu web usa el marcado de datos (schema) de Organization con el itemprop sameAs referenciando a tus redes sociales.
  3. Crear un contenido que no sólo hable de tus productos y servicios, sino que trate el tema de tu sitio con mayor profundidad. Contenido que refuerce la asociación de tu sitio web con el tema para el que quieres ser clasificado. Esto tendrá el beneficio de aumentar tus probabilidades de que Google te vea como referente para responder las intenciones de búsqueda de los usuarios.
  4. Construye enlaces relevantes y consigue que tu marca y tu sitio se mencionen en páginas de relevancia temática. Los enlaces son mejores que las menciones, pero a medida que Google se esfuerza cada vez más por comprender su entidad, es posible (me atrevo a decir probable) que ya no requieran enlaces para asignar la asociación entre entidades. Truco, hack, tip: consigue una entrada en Wikipedia o Wikidata de tu marca/persona da muchos puntos.
  5. Cuando Google quiera te considerará una entidad. Cuanta más autoridad tengas como marca, más probable será.
  6. Cuando Google te considere una entidad ve a la opción A).

 

Patentes de Google sobre entidades e información adicional

 

Bueno si has llegado hasta aquí  y todavía no tienes muy claro que es todo esto te hago un…

Resumen definitivo sobre qué son las entidades y su importancia en el SEO

Google busca entidades (personas, fechas, eventos, lugares… o cualquier cosa que sea única y distinguible) en el contenido para entenderlo mejor y poder relacionarlo con el resto de contenido de Internet. Usa entidades en tu contenido para optimizarlo y que Google te de más cariño. Fin.

 

Otros artículos muy interesantes y que merecen mucho la pena 👇

Categorías SEO

2 comentarios en «Qué son las Entidades y cómo mejoran el SEO»

  1. Este es un artículo para leer con calma el fin de semana. Need time to process this. Gracias por este excelente contenido.

    Responder
    • Gracias David, me alegra que te haya gustado 😀

      La verdad es que es un tema complejo pero he intentado simplificarlo lo máximo posible. Hay que leerlo con calma para ir entendiéndolo todo bien porque se puede sacar mucho provecho de las entidades.

      Un saludo

      Responder

Deja un comentario

Información sobre la Protección de Datos
Responsable: Ángel Rodríguez
Finalidad: Moderar los comentarios a los artículos publicados en el blog.
Legitimación: Consentimiento del usuario.
Destinatarios: No se comunicarán datos a persona u organización alguna.
Derechos: Tienes derecho a Acceder, rectificar y suprimir los datos.
Plazo de conservación de los datos: Hasta que no se solicite su supresión por el interesado.