EEAT: recursos de Google, patentes y artículos científicos para mejorar en SEO

EEAT: recursos de Google, patentes y artículos científicos para mejorar en SEO


Categorías: Destacada, Internet, Tecnología
Etiquetas: ,

EEAT se ha convertido en una de las influencias de clasificación más importantes para los resultados de búsqueda de Google desde 2018 debido a las actualizaciones del Core y ganará importancia adicional con la introducción de SGE. Os dejamos algunas patentes que pueden servir para mejorar tu sEO y como funciona Google.

Os dejmaos EEAT: recursos de Google, patentes y artículos científicos para mejorar en SEO

Ajuste de puntuación de recursos basado en selecciones de entidades

ID de patente: US10303684B1
Países publicados para: Estados Unidos
Fecha de última publicación: 28 de mayo de 2019
Fecha de vencimiento: 6 de mayo de 2037
Inventores: Kenichi Kurihara

La Patente aborda los desafíos y mecanismos involucrados en la recuperación de información digital, particularmente en el contexto de los motores de búsqueda.

El proceso de clasificación implica calificar los recursos utilizando factores como puntajes de recuperación de información, que miden la relevancia de una consulta para el contenido de un recurso, y puntajes de autoridad, que evalúan la importancia de un recurso en relación con otros.

Además, los antecedentes destacan el uso de factores adicionales, incluidos los comentarios de los usuarios, para ajustar las puntuaciones de los recursos. Los recursos que frecuentemente satisfacen las necesidades de información de los usuarios para consultas específicas se seleccionan con mayor frecuencia, lo que indica su relevancia y utilidad. Estos datos de selección de usuarios permiten a los motores de búsqueda ajustar las puntuaciones de búsqueda, dando un «impulso» a los recursos que funcionan bien para satisfacer las necesidades de los usuarios. Sin embargo, el documento también señala el desafío de calificar recursos con datos de búsqueda y selección insuficientes, como recursos recientemente publicados, que pueden no tener un historial de interacciones de usuarios para informar su relevancia y clasificación.

Reclamos

Acceso a datos de recursos: el sistema accede a datos que especifican una pluralidad de recursos. Para cada recurso, estos datos incluyen un identificador único e información sobre una o más entidades a las que se hace referencia dentro del recurso.

El acceso a los datos de los recursos implica que el sistema del motor de búsqueda recopile y utilice información sobre diversos recursos en línea, como sitios web, artículos o vídeos. Cada recurso se identifica mediante un código o identificador único, que lo distingue de los demás. Además, el sistema identifica y registra los temas, conceptos o entidades específicos (como lugares, personas o cosas) que cada recurso menciona o analiza.

En términos más simples, imagine que el motor de búsqueda revisa una biblioteca de contenido digital y toma notas sobre de qué trata cada contenido y qué temas específicos cubre. Este proceso ayuda al motor de búsqueda a comprender el contenido y el contexto de cada recurso, preparándolo para un análisis más detallado, como determinar qué tan relevante es un recurso para ciertas consultas de búsqueda en función de las entidades a las que hace referencia.

Acceso a datos de términos de búsqueda: también accede a datos que especifican un conjunto de términos de búsqueda. Para cada término de búsqueda, hay un valor de selección para cada recurso, que se determina en función de las selecciones del usuario de los resultados de búsqueda que hacen referencia al recurso.

El acceso a los datos de los términos de búsqueda se refiere al proceso mediante el cual el motor de búsqueda recopila y analiza información sobre las palabras o frases (términos de búsqueda) que las personas usan cuando buscan información en línea. Para cada término de búsqueda, el sistema también recopila datos sobre cómo los usuarios interactúan con los resultados de la búsqueda, específicamente, en qué resultados eligen hacer clic o seleccionar. Esta interacción se mide a través de valores de selección asignados a cada recurso, indicando su relevancia o atractivo para los usuarios en función del término de búsqueda utilizado.

En pocas palabras, imagine que el motor de búsqueda realiza un seguimiento de lo que las personas buscan y observa qué sitios web o páginas terminan visitando de la lista de resultados que proporciona. Esto ayuda al motor de búsqueda a comprender qué recursos son más útiles o relevantes para los usuarios para términos de búsqueda específicos, guiándolo para mejorar la forma en que clasifica y presenta los resultados de búsqueda en el futuro.

Determinación de los valores de selección de entidad y término de búsqueda: a partir de los datos del recurso y del término de búsqueda, el sistema calcula un valor de selección de entidad y término de búsqueda para cada término de búsqueda y cada entidad. Este valor se basa en los valores de selección de recursos que hacen referencia a la entidad y se incluyeron en los resultados de búsqueda para consultas que contienen el término de búsqueda.

La determinación de los valores de selección de entidades y términos de búsqueda implica un proceso sofisticado en el que el motor de búsqueda calcula valores específicos que representan la frecuencia con la que los usuarios seleccionan recursos en función de las entidades a las que hacen referencia esos recursos en relación con términos de búsqueda específicos. Este proceso es una parte clave de la patente e implica varios pasos:

  1. Combinación de datos de recursos y términos de búsqueda: el sistema primero analiza la información que ha recopilado sobre los recursos (como páginas web o artículos) y las entidades (temas, conceptos o cosas) que mencionan. También considera los términos de búsqueda que utilizan las personas y cómo interactúan con los resultados de búsqueda relacionados con estos términos.
  2. Análisis de selecciones de usuario: para cada combinación de un término de búsqueda y una entidad, el sistema analiza con qué frecuencia se seleccionan los recursos que mencionan esa entidad cuando aparecen en los resultados de búsqueda para ese término de búsqueda. Esto implica observar los valores de selección de recursos, que se basan en los clics o las interacciones de los usuarios.
  3. Cálculo de valores de selección: basándose en este análisis, el sistema calcula un «valor de selección de entidad de término de búsqueda». Este valor refleja la probabilidad de que se seleccionen recursos que hacen referencia a una entidad particular en respuesta a un término de búsqueda específico. Es una medida de la relevancia y el atractivo de los recursos relacionados con determinadas entidades para consultas de búsqueda específicas.

En términos más simples, este proceso es como descubrir qué tan populares son ciertos temas entre las personas que buscan cosas específicas. Por ejemplo, si muchas personas buscan “recetas saludables” y a menudo eligen artículos que mencionan “quinua”, el valor de selección de entidad de término de búsqueda para “quinua” en relación con “recetas saludables” sería alto. Esto indica que la quinua es un tema relevante y atractivo para las personas interesadas en recetas saludables.

Este valor calculado ayuda al motor de búsqueda a comprender qué temas o entidades son más relevantes para los intereses de los usuarios en función de su comportamiento de búsqueda. Luego puede utilizar esta información para ajustar la forma en que clasifica y presenta los resultados de búsqueda, con el objetivo de mostrar a los usuarios primero la información más relevante y útil.

Almacenamiento de valores de selección de entidad y término de búsqueda: Finalmente, el sistema almacena estos valores de selección de entidad y término de búsqueda calculados en un almacenamiento de datos.

  1. Almacenamiento de datos: el motor de búsqueda utiliza un sistema de almacenamiento de datos, que podrían ser bases de datos u otras formas de almacenamiento digital, para mantener los valores calculados de selección de entidad y término de búsqueda. Este almacenamiento permite que el sistema acceda rápidamente a estos valores cuando sea necesario, sin tener que recalcularlos cada vez.
  2. Acceso organizado y eficiente: los valores se almacenan de manera organizada, lo que garantiza que el motor de búsqueda pueda recuperarlos de manera eficiente al procesar consultas de búsqueda. Esta organización podría implicar indexar los valores según términos de búsqueda, entidades u otros criterios relevantes para acelerar el acceso.
  3. Uso en el proceso de clasificación: cuando se ingresa una nueva consulta de búsqueda, el motor de búsqueda puede extraer del almacenamiento los valores de selección de entidad-término de búsqueda relevantes para ayudar a determinar la clasificación de los recursos en los resultados de la búsqueda. Esto significa que si una entidad en particular es muy relevante para un término de búsqueda basado en selecciones anteriores de usuarios, los recursos que hacen referencia a esa entidad pueden tener una clasificación más alta.

Implicaciones para el SEO

1. Optimización basada en entidades:

Las estrategias de SEO deben evolucionar más allá de la optimización tradicional de palabras clave para incluir la optimización basada en entidades. Esto significa crear contenido que no solo se dirija a palabras clave específicas, sino que también cubra en profundidad entidades relacionadas (personas, lugares, cosas, conceptos) que los usuarios podrían asociar con estas palabras clave. Comprender e incorporar entidades relevantes al contenido puede aumentar su visibilidad y clasificación en los resultados de búsqueda.

2. Intención y comportamiento del usuario:

La patente destaca la importancia de alinear el contenido con la intención y el comportamiento del usuario. Los profesionales de SEO deben analizar cómo los usuarios interactúan con el contenido relacionado con entidades y términos de búsqueda específicos. Esto implica comprender qué tipos de contenido prefieren los usuarios y cómo seleccionan los recursos en los resultados de búsqueda. Optimizar el contenido para satisfacer las expectativas de los usuarios y satisfacer sus necesidades de información puede conducir a una mejor participación y valores de selección más altos, lo que potencialmente mejora las clasificaciones de búsqueda.

3. Calidad y relevancia del contenido:

El mecanismo descrito en la patente sugiere que Google podría utilizar valores de selección como señal de calidad y relevancia del contenido. Por lo tanto, es fundamental producir contenido relevante y de alta calidad que aborde las necesidades e intereses del público objetivo. Es más probable que se seleccione el contenido que atrae eficazmente a los usuarios y coincide con su intención de búsqueda, lo que influye positivamente en los valores de selección de entidades y términos de búsqueda y, por extensión, en su clasificación de búsqueda.

4. Estrategias de SEO basadas en datos:

Las estrategias de SEO deberían basarse más en datos, con énfasis en analizar los datos del comportamiento del usuario para informar la creación y optimización de contenido. Esto incluye estudiar qué entidades se asocian frecuentemente con valores de selección altos para términos de búsqueda específicos y comprender el contexto en el que se analizan estas entidades. Será clave aprovechar las herramientas de análisis para recopilar información sobre las preferencias de los usuarios y el rendimiento del contenido.

5. Optimización de búsqueda semántica y de cola larga:

Dado el enfoque en las entidades y su relación con los términos de búsqueda, la optimización de las palabras clave de cola larga y la búsqueda semántica se vuelve cada vez más importante. Las palabras clave de cola larga, que suelen ser más específicas y parecidas a consultas, pueden capturar la intención del usuario con mayor precisión y pueden incluir entidades relevantes directamente. La optimización de la búsqueda semántica implica estructurar el contenido para responder preguntas y cubrir temas de manera integral, reflejando la forma natural en que las personas buscan información.

Puntuación de la calidad del sitio

La patente enfatiza la importancia de evaluar con precisión la calidad de los sitios para mejorar la relevancia y utilidad de los resultados de búsqueda presentados a los usuarios. Esto implica desarrollar métodos para calificar la calidad de los sitios basándose en métricas de interacción del usuario, como la duración de las visitas a los recursos del sitio, independientemente de las consultas específicas enviadas por los usuarios.

Reclamos

Obtención de mediciones: recopilación de una pluralidad de mediciones relacionadas con la duración de las visitas de los usuarios a los recursos dentro de un sitio específico. Estas mediciones pueden provenir de varias fuentes, incluidas interacciones directas del usuario (por ejemplo, tiempo pasado en una página después de hacer clic en un resultado de búsqueda) y datos de sistemas de monitoreo de red o registros del servidor.

Calcular el puntaje de calidad del sitio: el puntaje de calidad del sitio se calcula utilizando estas mediciones, específicamente calculando una medida estadística (como la media, la mediana o la moda) a partir de los datos recopilados. Esta puntuación pretende representar una medida independiente de la consulta de la utilidad del sitio para proporcionar información que satisfaga las necesidades informativas de sus visitantes.

  1. Mediciones de la duración de las visitas de los usuarios: la señal principal implica recopilar datos sobre cuánto tiempo pasan los usuarios en los recursos de un sitio. Esto incluye el tiempo transcurrido desde que un usuario hace clic en un resultado de búsqueda hasta que regresa a la página de resultados de búsqueda, lo que indica interacción con el contenido.
  2. Tipos de interacciones del usuario: la patente considera diferentes tipos de interacciones del usuario, como clics en los resultados de búsqueda, que pueden iniciar una visita a un recurso. La duración de estas visitas, medida por diversos medios, contribuye al puntaje de calidad del sitio.
  3. Datos de diversas fuentes: el sistema de puntuación puede utilizar datos obtenidos de los dispositivos de los usuarios (como navegadores web o barras de herramientas del navegador), sistemas de monitoreo de red (como enrutadores o firewalls) y servidores que alojan los recursos. Este enfoque integral garantiza un conjunto de datos sólido para el análisis.
  4. Ajustes basados ​​en el tipo de recurso: el sistema puede ajustar las mediciones según el tipo de recurso (por ejemplo, video, imagen, texto) para tener en cuenta las diferencias inherentes en cómo los usuarios interactúan con diferentes tipos de contenido. Por ejemplo, se podría esperar una duración de visita más larga para el contenido de vídeo en comparación con una imagen.
  5. Umbrales y límites: el método incluye descartar mediciones por debajo de un cierto umbral o ajustar mediciones que exceden un valor máximo predeterminado. Esto ayuda a filtrar los valores atípicos y garantizar que los datos reflejen con precisión la participación genuina del usuario.
  6. Filtrado de actividades sospechosas: las mediciones clasificadas como sospechosas, que posiblemente indiquen interacciones no genuinas (como bots automatizados o spam), se descartan para mantener la integridad del puntaje de calidad del sitio.

Además, la reivindicación cubre varias realizaciones y mejoras de este método básico, que incluyen:

Implicaciones para el SEO

  1. La participación del usuario es crucial: el énfasis en medir la duración de las visitas de los usuarios resalta la importancia de crear contenido atractivo y de alta calidad que mantenga a los usuarios en el sitio por más tiempo. Los sitios web deben centrarse en mejorar la experiencia del usuario a través de contenido relevante, informativo e interesante que satisfaga las necesidades informativas de los usuarios.
  2. Diversos tipos de contenido: dados los ajustes basados ​​en los tipos de recursos, diversificar los tipos de contenido ofrecidos (por ejemplo, incorporando videos, imágenes y artículos detallados) puede atender diferentes preferencias de los usuarios y patrones de participación, lo que podría mejorar el puntaje de calidad general del sitio.
  3. Monitoreo del comportamiento del usuario: las estrategias de SEO deben incluir el análisis de métricas de comportamiento del usuario, como la tasa de rebote, la duración promedio de la sesión y las páginas por sesión, para comprender cómo interactúan los usuarios con el sitio. Los conocimientos de estos análisis pueden guiar las mejoras de contenido y diseño.
  4. Evitar tácticas de manipulación: el enfoque de la patente en filtrar actividades sospechosas subraya la importancia de adherirse a prácticas éticas de SEO. Es probable que se identifiquen y se ignoren los intentos de inflar artificialmente las métricas de participación, lo que podría dañar la posición del sitio en los resultados de búsqueda.
  5. Estrategia de contenido: la capacidad del sistema de puntuación para ajustarse en función de la proporción de recursos de un tipo particular dentro de un sitio sugiere que tener un enfoque equilibrado y estratégico para la creación de contenido puede influir en el puntaje de calidad del sitio. Las estrategias de contenido deben considerar la combinación de tipos de recursos y su impacto potencial en la participación de los usuarios.
  6. SEO a largo plazo: mejorar el nivel de calidad de un sitio es una estrategia a largo plazo que implica ofrecer valor constantemente a los usuarios. Es menos probable que las soluciones rápidas o las tácticas a corto plazo tengan un impacto positivo duradero en las clasificaciones de búsqueda.

Clasificar sitios como sitios de baja calidad

Esta patente describe métodos, sistemas y programas informáticos para mejorar los resultados de búsqueda clasificando sitios como de baja calidad en función de la calidad de los enlaces que apuntan a ellos. Implica recibir una puntuación de calidad de los recursos para cada recurso que enlaza con un sitio, agrupar estos recursos en función de sus puntuaciones de calidad y luego utilizar la distribución de estas puntuaciones entre los grupos para determinar la puntuación de calidad del enlace de un sitio. Si esta puntuación está por debajo de cierto umbral, el sitio se clasifica como de baja calidad.

Reclamos

La reivindicación de patente se centra en un método para clasificar sitios web como de baja calidad basándose en la evaluación de los enlaces que apuntan a ellos. Este método implica varios pasos clave:

  1. Recibir una puntuación de calidad de los recursos: por cada recurso (como páginas web, documentos, etc.) que se vincula a un sitio, se recibe una puntuación de calidad. Esta puntuación evalúa el valor o la confiabilidad del recurso de enlace.
  2. Asignación de recursos a grupos de calidad: cada recurso vinculado se asigna a un grupo específico en función de su puntuación de calidad. Estos grupos son rangos de calidad predefinidos, lo que ayuda a categorizar los enlaces de mayor a menor calidad.
  3. Contar recursos en cada grupo: el método implica contar cuántos recursos se encuentran en cada grupo de calidad. Este paso es crucial para comprender la distribución de la calidad de los enlaces que apuntan al sitio.
  4. Determinación de un puntaje de calidad de enlace para el sitio: utilizando la distribución de recursos entre los grupos de calidad, se calcula un puntaje de calidad de enlace para el sitio. Esta puntuación refleja la calidad general de los enlaces que apuntan al sitio.
  5. Clasificación del sitio según el nivel de calidad del enlace: si el nivel de calidad del enlace del sitio cae por debajo de un cierto umbral, se clasifica como un sitio de baja calidad. Esta clasificación puede afectar la forma en que se presenta el sitio en los resultados de búsqueda, lo que podría reducir su visibilidad o clasificación.

Del contexto de la patente y las prácticas generales en SEO y análisis de enlaces, podemos inferir los tipos de métricas o señales que podrían usarse para crear estas puntuaciones:

  1. Relevancia del recurso de enlace: la relevancia del contenido de la página de enlace con respecto al contenido del sitio de destino podría ser un factor. Los enlaces más relevantes generalmente se consideran de mayor calidad.
  2. Autoridad del recurso de enlace: la autoridad o confiabilidad del sitio web que proporciona el enlace, a menudo inferida de su propio perfil de enlace, podría influir en el puntaje de calidad. Es probable que los sitios con enlaces de paso de alta autoridad contribuyan positivamente al puntaje de calidad del enlace.
  3. Contexto del enlace: el contexto dentro del cual aparece el enlace en la página, incluido el contenido circundante y su relevancia para el sitio vinculado, podría afectar la puntuación. Los enlaces integrados en contenido relevante y de alta calidad suelen valorarse más.
  4. Diversidad de fuentes de enlaces: se podría considerar la diversidad de los dominios de enlace y su relevancia para el tema del sitio. Una gama más amplia de fuentes relevantes y de alta calidad puede mejorar la puntuación de calidad del enlace.
  5. Métricas de participación del usuario: indirectamente, las métricas de participación del usuario, como las tasas de clics (CTR) del recurso de enlace al sitio, las tasas de rebote u otras señales de participación, pueden influir en la calidad percibida de un enlace.
  6. Señales de spam: la presencia de características o comportamientos de spam asociados con el recurso de enlace, como relleno de palabras clave, enlaces ocultos o participación en esquemas de enlaces, podría afectar negativamente la puntuación de calidad del recurso.
  7. Posición del enlace en la página: a los enlaces colocados en posiciones destacadas de una página, como dentro del cuerpo del contenido principal en lugar del pie de página o la barra lateral, se les pueden asignar puntuaciones de calidad más altas.
  8. Rendimiento histórico: el rendimiento histórico de un dominio vinculado en términos de proporcionar tráfico de calidad o estar asociado con sitios de buena reputación también podría influir.

La patente describe un sistema que probablemente utiliza una combinación de estas y posiblemente otras señales para evaluar la calidad de cada enlace y asignar una puntuación de calidad del recurso. Luego, estos puntajes se utilizan para agrupar enlaces y, en última instancia, determinan el puntaje general de calidad del enlace para un sitio, lo que puede influir en su clasificación como de baja calidad si el puntaje cae por debajo de un cierto umbral.

Implicaciones para el SEO

Calidad sobre cantidad de enlaces

La patente subraya la importancia de la calidad de los enlaces entrantes y no sólo de su cantidad. Las estrategias de SEO deben priorizar la obtención de enlaces de fuentes confiables y de alta calidad que sean relevantes para el contenido del sitio. Este enfoque es más beneficioso que acumular una gran cantidad de enlaces de baja calidad.

Relevancia del contenido vinculado

Es probable que los enlaces de recursos que están estrechamente relacionados con el contenido del sitio de destino sean más valiosos. Los esfuerzos de SEO deben centrarse en construir relaciones dentro de la misma industria o nicho para fomentar vínculos de retroceso relevantes, lo que puede impactar positivamente el puntaje de calidad del vínculo del sitio.

Evitación de esquemas de enlaces

La metodología descrita en la patente deja claro que las prácticas de manipulación de enlaces (como la compra de enlaces, el intercambio excesivo de enlaces o el uso de programas automatizados para crear enlaces) pueden llevar a que un sitio sea clasificado como de baja calidad. Las estrategias de SEO deben evitar este tipo de esquemas y centrarse en obtener enlaces a través de contenido de alta calidad y una participación genuina de la comunidad.

Diversificación del perfil de enlace

Un perfil de enlace diverso, que incluya enlaces de una variedad de fuentes, dominios y contextos, puede contribuir a una mayor puntuación de calidad del enlace. Los esfuerzos de SEO deben apuntar a un perfil de enlace de aspecto natural con una combinación de tipos de enlaces, de diferentes dominios y de varios temas relevantes.

Monitorear y desautorizar enlaces malos

El monitoreo regular del perfil de vínculo de retroceso de un sitio es crucial. Identificar y rechazar enlaces tóxicos o de baja calidad puede ayudar a mantener o mejorar el puntaje de calidad de los enlaces del sitio. Las herramientas de SEO que analizan el estado de los vínculos de retroceso pueden ser fundamentales en este proceso.

Determinar una medida de calidad para un recurso.

ID de patente: US9558233B1
Países de publicación: Estados Unidos
Fecha de última publicación: 31 de enero de 2017
Fecha de vencimiento: 16 de agosto de 2033
Inventores: Hyung-Jin Kim, Paul Haahr, Kien Ng, Chung Tin Kwok, Moustafa A. Hammad, Sushrut Karanjkar

La patente de Google aborda los desafíos y metodologías involucradas en la recuperación de información en Internet. Normalmente, los resultados de la búsqueda se ordenan para su visualización según su clasificación, que está determinada por varios factores.

Un enfoque común para clasificar los recursos implica analizar la cantidad de otros recursos que incluyen un enlace a un recurso determinado. Generalmente, un recurso que está vinculado por una gran cantidad de otros recursos puede tener una clasificación más alta que uno con menos recursos vinculados. Sin embargo, este método tiene sus limitaciones. Por ejemplo, algunos recursos pueden recibir una gran cantidad de enlaces pero no obtienen el tráfico correspondiente de estos enlaces, lo que lleva a una clasificación desproporcionada. Esta discrepancia resalta la necesidad de métodos más sofisticados para medir y clasificar con precisión la calidad de los recursos en Internet, teniendo en cuenta no sólo la cantidad de enlaces sino también la calidad y relevancia de estos enlaces en relación con la participación y el tráfico reales de los usuarios.

Reclamos

Determinación de la puntuación de semillas: el método implica calcular una puntuación de semillas para cada uno de un conjunto de recursos de semillas. Esta puntuación se basa en la cantidad de recursos que enlazan con el recurso inicial y la cantidad de veces que se seleccionan esos enlaces. Este enfoque tiene como objetivo evaluar tanto la popularidad como el compromiso con el recurso semilla.

  1. Identificación de recursos semillas: el proceso comienza con la identificación de un conjunto de recursos semillas. Estos recursos semilla se seleccionan en función de su confiabilidad y la disponibilidad de datos suficientes sobre los enlaces a ellos y el tráfico que reciben.
  2. Cálculo de puntuaciones de semilla: para cada recurso de semilla, se calcula una puntuación de semilla. Esta puntuación es un reflejo de la popularidad y el nivel de participación del recurso, derivado de dos factores principales:
    • Recuento de enlaces: el número de otros recursos que incluyen un enlace al recurso inicial. Este recuento es indicativo de la popularidad o el reconocimiento del recurso en Internet.
    • Recuento de selecciones: el número de veces que los usuarios seleccionan o hacen clic en los enlaces al recurso inicial. Este recuento proporciona información sobre el nivel de compromiso con el recurso, más allá del mero reconocimiento.
  3. Calidad de las selecciones: la determinación de una puntuación inicial también implica evaluar la calidad de las selecciones de enlaces. Esto puede incluir el análisis de la duración de los clics (clics cortos, medianos y largos), lo que ayuda a comprender la profundidad de la participación del usuario con el recurso inicial. Una duración de clic más larga podría indicar una participación más sustancial, lo que sugiere una mayor calidad.
  4. Puntuación basada en proporciones: la puntuación inicial puede basarse en una proporción que considere tanto el número de enlaces al recurso inicial como el número de selecciones de esos enlaces. Esta relación tiene como objetivo equilibrar la influencia de la popularidad (indicada por el número de enlaces) con la participación real del usuario (indicada por la selección de enlaces).
  5. Puntuación de calidad de selección: en algunas implementaciones, el proceso incluye determinar una puntuación de calidad de selección para cada selección de un enlace al recurso semilla. Esta puntuación es una medida de la calidad de la selección, potencialmente basada en factores como la duración del clic. Luego, la puntuación inicial general del recurso se puede ajustar en función de estas puntuaciones de calidad de selección, lo que proporciona una visión matizada del valor del recurso.
  6. Evaluación integral: la puntuación inicial refleja una evaluación integral de la calidad de un recurso, teniendo en cuenta no solo cuántas veces está vinculado sino también cómo los usuarios interactúan con esos enlaces. Este enfoque tiene como objetivo identificar recursos que no sólo sean populares sino también genuinamente valiosos para los usuarios.

Puntuación de fuentes y recursos: después de determinar las puntuaciones iniciales, el método identifica los recursos fuente (recursos que se vinculan a los recursos iniciales) y calcula una puntuación fuente para cada uno en función de las puntuaciones iniciales de los recursos iniciales vinculados. Posteriormente, se identifican los recursos a los que se hace referencia en las fuentes y se calcula una puntuación de recursos para cada uno, en función de las puntuaciones de las fuentes de los recursos que se vinculan a ellos.

Puntuación de fuente

    1. Identificación de los recursos de origen: después de calcular las puntuaciones iniciales, el siguiente paso consiste en identificar los recursos de origen. Estos son los recursos que incluyen enlaces a los recursos semilla. Esencialmente, los recursos fuente sirven como intermediarios, vinculándose con los recursos de semillas de alta calidad identificados en el primer paso.
    2. Cálculo de puntuaciones de origen: a cada recurso de origen se le asigna una puntuación de origen. Esta puntuación se determina en función de las puntuaciones de los recursos semilla a los que se vincula. La idea es evaluar la calidad de los recursos fuente mediante la calidad de sus enlaces salientes con los recursos semilla. Un recurso fuente que se vincula con recursos de semillas de alta calidad, como lo demuestran las altas puntuaciones de las semillas, probablemente sea de mayor calidad en sí mismo.
    3. Propagación de la calidad: la puntuación de origen propaga eficazmente la medida de calidad desde los recursos de semillas hasta los recursos de origen. Este paso reconoce que los recursos que contribuyen a la visibilidad y el tráfico de semillas de alta calidad probablemente sean en sí mismos valiosos y dignos de confianza.

Puntuación de recursos

    1. Identificación de recursos referenciados en fuente: Para cada recurso fuente, el proceso identifica recursos referenciados en fuente. Estos son los recursos a los que se vincula el recurso de origen, incluidos tanto los recursos iniciales como los recursos adicionales que no se evaluaron inicialmente como recursos iniciales.
    2. Cálculo de puntuaciones de recursos: luego se calcula una puntuación de recursos para cada recurso al que se hace referencia. Esta puntuación se basa en las puntuaciones de origen de los recursos de origen que enlazan con él. El cálculo tiene como objetivo evaluar la calidad de un recurso considerando la calidad de los recursos que se vinculan a él. Si un recurso está frecuentemente vinculado por recursos fuente de alta calidad, su puntuación de recurso será mayor, lo que indica su probable relevancia y valor.
    3. Evaluación integral: este mecanismo de puntuación permite una evaluación integral de los recursos web, extendiéndose más allá del conjunto inicial de recursos iniciales para incluir una gama más amplia de contenido. Al evaluar la interconexión y la calidad de estas conexiones, el sistema tiene como objetivo identificar recursos valiosos en la web.
    4. Puntuación dinámica: el proceso de puntuación de fuentes y recursos es dinámico, lo que permite la reevaluación continua de la calidad de los recursos a medida que se forman nuevos vínculos y la calidad de los recursos vinculados cambia con el tiempo. Esto garantiza que el sistema de clasificación de búsqueda pueda adaptarse al panorama cambiante de Internet.

Ajuste basado en puntuaciones: el método incluye ajustar las clasificaciones de los resultados de búsqueda en función de las puntuaciones de recursos calculadas. Este ajuste tiene como objetivo reflejar la medida de calidad de los recursos con mayor precisión en los resultados de búsqueda.

Ajustar la clasificación de los resultados de búsqueda

    1. Incorporación de puntuaciones de recursos: el núcleo del proceso de ajuste implica la integración de las puntuaciones de recursos en el algoritmo de clasificación de búsqueda. Los recursos con puntuaciones más altas, que indican mayor calidad y relevancia según la evaluación interconectada de los enlaces y la participación del usuario, tienen prioridad en los resultados de búsqueda. Esta priorización refleja el valor evaluado de un recurso para los usuarios, con el objetivo de mostrar el contenido más útil y relevante.
    2. Ajustes de clasificación dinámicos: los ajustes de clasificación son dinámicos, lo que permite cambios en tiempo real en los resultados de búsqueda a medida que se actualizan las puntuaciones de los recursos. Esta flexibilidad asegura que el motor de búsqueda pueda adaptarse a nueva información, como cambios en la popularidad o relevancia de los recursos, manteniendo la relevancia y calidad de los resultados de búsqueda a lo largo del tiempo.

Uso de puntuaciones en el proceso de clasificación

    1. Influencia de la puntuación del recurso: la puntuación del recurso influye en el proceso de clasificación al servir como factor para determinar la posición de un recurso en los resultados de búsqueda. Los recursos con puntuación alta pueden tener una clasificación más alta que aquellos con puntuaciones más bajas, suponiendo que otros factores (como la relevancia de la consulta) sean consistentes.
    2. Ajuste para consultas específicas: el sistema también puede ajustar las clasificaciones en función de las puntuaciones de tipos específicos de consultas, especialmente cuando ciertas consultas son más susceptibles al spam o a resultados de baja calidad. Para las consultas identificadas como de mayor riesgo de devolver contenido de baja calidad, el algoritmo puede poner mayor énfasis en las puntuaciones de los recursos para garantizar que se prioricen los resultados de alta calidad.
    3. Detección y mitigación de spam: al ajustar las clasificaciones en función de las puntuaciones, el sistema mitiga eficazmente el impacto del spam o las prácticas manipuladoras destinadas a inflar artificialmente la visibilidad del contenido de baja calidad. Los recursos con un número de enlaces inflado pero con baja participación o calidad (como lo reflejan sus puntuaciones) pueden ser degradados en los resultados de búsqueda.

Consideraciones adicionales en los ajustes basados ​​en puntajes

    1. Umbrales y Categorías: El sistema puede utilizar umbrales o categorizar recursos en función de sus puntuaciones para aplicar diferentes estrategias de ajuste. Por ejemplo, los recursos que caen por debajo de un cierto umbral de calidad podrían ser penalizados en las clasificaciones, mientras que aquellos que excedan un umbral de calidad o relevancia podrían recibir un impulso.
    2. Ajustes contextuales: los ajustes basados ​​en puntuaciones pueden ser contextuales, teniendo en cuenta la naturaleza específica de la consulta de búsqueda, el historial de búsqueda del usuario y otros factores que podrían influir en la relevancia y utilidad de los resultados de búsqueda.
    3. Bucles de retroalimentación: el proceso de ajuste puede incorporar mecanismos de retroalimentación, donde las interacciones del usuario con los resultados de búsqueda (como tasas de clics y métricas de participación) refinan y validan aún más los ajustes de puntuación y clasificación. Esta retroalimentación ayuda a mejorar continuamente la precisión y relevancia de los resultados de búsqueda.

Clasificación y descuento: los recursos fuente se clasifican según sus puntuaciones de origen y se puede descontar la influencia de los enlaces de ciertas categorías de recursos fuente en el proceso de clasificación. Este paso ayuda a refinar el proceso de clasificación al considerar la calidad de los recursos de origen.

Clasificación de recursos fuente

    1. Umbral de puntuación de la fuente: los recursos de la fuente se clasifican en función de sus puntuaciones de la fuente, que reflejan su calidad y confiabilidad. Se establece un umbral para diferenciar entre fuentes de alta calidad (calificadas) y de menor calidad (no calificadas). Este umbral se puede ajustar dinámicamente en función de varios factores, incluida la distribución de calidad general de los recursos de origen.
    2. Fuentes calificadas versus no calificadas: los recursos fuente con puntajes superiores al umbral se clasifican como fuentes calificadas, lo que indica que se consideran confiables y es probable que sus enlaces sean de alta calidad. Por el contrario, las fuentes con puntuaciones por debajo del umbral se clasifican como no calificadas, lo que sugiere que sus enlaces pueden no ser tan confiables o relevantes.

Proceso de descuento

    1. Descontar enlaces de fuentes no calificadas: se descuenta la influencia de los enlaces de fuentes no calificadas en el proceso de clasificación. Esto significa que, si bien estos enlaces todavía se consideran, tienen menos peso a la hora de determinar las puntuaciones de los recursos y, en consecuencia, la clasificación de los resultados de búsqueda. Este descuento ayuda a mitigar el impacto de las prácticas de enlaces manipuladoras o spam.
    2. Ajuste de puntuaciones de recursos: para los recursos que están vinculados por fuentes no calificadas, sus puntuaciones de recursos se ajustan para reflejar el valor descontado de esos enlaces. Este ajuste garantiza que la clasificación de estos recursos esté alineada con mayor precisión con su verdadero valor y relevancia, libre de inflación artificial por vínculos de baja calidad.
    3. Ajuste dinámico basado en la clasificación de fuentes: La clasificación de fuentes y el posterior descuento de enlaces son procesos dinámicos. A medida que las puntuaciones de las fuentes cambian con el tiempo, las fuentes pueden reclasificarse y el impacto de sus enlaces en las puntuaciones y clasificaciones de los recursos se ajustará en consecuencia. Este enfoque dinámico permite que el motor de búsqueda se adapte a los cambios en el ecosistema de la web y mantenga la calidad de los resultados de búsqueda.

Uso de texto ancla y N-Gramos: el método se extiende al análisis del texto ancla en busca de enlaces en recursos fuente, identificando n-gramas (secuencias de texto) dentro del texto ancla y asignando puntuaciones a estos n-gramas en función de las puntuaciones fuente. Este análisis detallado contribuye a una comprensión más matizada de la relevancia y calidad de los enlaces.

Analizando el texto ancla

    1. Identificación del texto ancla: el proceso comienza con la identificación del texto ancla para cada enlace presente en un recurso fuente. El texto ancla proporciona pistas contextuales sobre el contenido del recurso vinculado y es un factor crítico para comprender la relevancia y calidad del vínculo.
    2. Relevancia contextual: al analizar el texto ancla, el sistema puede evaluar la relevancia contextual de un enlace tanto para los recursos de origen como para los de destino. Esta relevancia es crucial para determinar la calidad del vínculo y su contribución al valor del recurso objetivo.

Extracción y puntuación de N-Gram

    1. Extracción de N-Gramos: del texto ancla identificado, el sistema extrae n-gramas. Esto implica dividir el texto ancla en secuencias de palabras o caracteres (por ejemplo, bigramas para secuencias de dos, trigramas para secuencias de tres, etc.). Este desglose permite un análisis granular del texto.
    2. Puntuación de N-Gram: a cada n-gram se le asigna una puntuación basada en las puntuaciones de los recursos fuente que incluyen el n-gram en su texto de anclaje. Esta puntuación refleja la medida de calidad colectiva de los contextos en los que aparece el n-grama, proporcionando información sobre la relevancia y confiabilidad del n-grama con respecto al contenido vinculado.

Aplicación en el ranking de búsqueda

    1. Mejora de las puntuaciones de recursos: las puntuaciones de n-gramas se pueden utilizar para ajustar las puntuaciones de los recursos vinculados. Si un recurso se vincula con frecuencia con n-gramas de alta puntuación, puede indicar que el recurso es de alta calidad y relevancia, lo que justifica una puntuación de recurso más alta.
    2. Relevancia de la consulta: el análisis de n-gramas también juega un papel crucial en la comprensión de la relevancia de los recursos para consultas de búsqueda específicas. Al hacer coincidir los n-gramas de los textos de anclaje con los términos de las consultas de búsqueda, el sistema puede evaluar mejor qué recursos son más relevantes para la intención del usuario.
    3. Ajuste de los resultados de la búsqueda: las puntuaciones de relevancia y calidad derivadas del texto ancla y del análisis de n-gramas se pueden utilizar para ajustar la clasificación de los resultados de la búsqueda. Los recursos vinculados con textos de anclaje relevantes y de alta calidad (como lo indican las puntuaciones altas de n-gramas) pueden tener una clasificación más alta, ya que se consideran más valiosos para los usuarios.

Ajuste de consultas y resultados de búsqueda: el método también incluye ajustar la clasificación de los resultados de búsqueda para consultas específicas en función de las puntuaciones de n-gramas encontradas en la consulta, lo que permite ajustes dinámicos de los resultados de búsqueda según el contenido de la consulta y las medidas de calidad de los enlaces. recursos.

Ajustar los resultados de la búsqueda según el análisis de consultas

    1. Puntuación de consultas: el sistema comienza analizando la consulta de búsqueda en sí, dividiéndola en componentes como n-gramas (secuencias de palabras o caracteres) y evaluando la relevancia y calidad de estos componentes. Cada componente de la consulta se califica, potencialmente en función de las puntuaciones de n-gramas derivadas del análisis del texto ancla, lo que indica la calidad y relevancia de los recursos asociados con estos n-gramas.
    2. Ajustes específicos de la consulta: según las puntuaciones asociadas con los componentes de la consulta, el motor de búsqueda ajusta la clasificación de los resultados de la búsqueda. Este ajuste está diseñado para priorizar recursos que no solo son relevantes para los términos de consulta sino también de alta calidad, como lo indican sus puntuaciones de recursos y la relevancia de los n-gramas dentro de ellos.

Ajustes de clasificación dinámica

    1. Incorporación de puntuaciones de recursos y N-Gram: el proceso de ajuste tiene en cuenta las puntuaciones de los recursos vinculados a los términos de consulta, así como las puntuaciones de n-gram del análisis del texto ancla. Este enfoque integral garantiza que los resultados de la búsqueda reflejen tanto la relevancia de los recursos para la consulta como la calidad general de estos recursos.
    2. Equilibrio de relevancia y calidad: el sistema equilibra la relevancia (qué tan cerca coinciden los recursos con los términos de la consulta) con la calidad (el valor evaluado de estos recursos en función del análisis de enlaces y la participación del usuario). Este equilibrio es crucial para ofrecer resultados de búsqueda que no sólo satisfagan las necesidades informativas inmediatas del usuario sino que también representen contenido valioso y confiable.

Detección y mitigación de spam

    1. Ajustes relacionados con el spam: para consultas que son particularmente susceptibles a arrojar resultados spam o de baja calidad, el sistema puede aplicar ajustes más estrictos basados ​​en los puntajes de calidad. Este enfoque ayuda a mitigar el impacto del spam y garantizar que a los usuarios se les presente información relevante y de alta calidad.
    2. Ajuste basado en la propensión al spam: el sistema puede ajustar la ponderación de ciertos factores, como la influencia del recuento de enlaces versus las métricas de participación del usuario, en función de la propensión de una consulta a mostrar resultados de búsqueda relacionados con el spam. Este ajuste dinámico ayuda a contrarrestar los intentos de manipular las clasificaciones de búsqueda mediante prácticas de spam.

Implicaciones para el SEO

Calidad y relevancia sobre cantidad

Las métricas de participación del usuario son importantes

Mitigación contra el spam y la manipulación

Importancia de las estrategias integrales de SEO

Puntuación de calidad del sitio

La patente se relaciona con el campo de la clasificación de los resultados de búsqueda de consultas de búsqueda en Internet. Los motores de búsqueda de Internet tienen como objetivo identificar y presentar recursos (como páginas web, imágenes, documentos de texto y contenido multimedia) que sean relevantes para las necesidades de información de un usuario. La patente aborda el desafío de determinar la calidad de los sitios web (u otras colecciones de recursos de datos) tal como los ve un motor de búsqueda, lo cual es crucial para clasificar eficazmente estos recursos en los resultados de búsqueda para satisfacer las expectativas de los usuarios. Los antecedentes preparan el escenario para presentar la solución de la patente para calcular un puntaje de calidad del sitio basado en las interacciones del usuario, que luego puede usarse para clasificar recursos o resultados de búsqueda asociados con esos sitios.

Reclamos

Determinación de consultas únicas: el proceso implica calcular un primer recuento de consultas únicas que se refieren a un sitio en particular y un segundo recuento de consultas únicas asociadas con el sitio. Se considera que una consulta hace referencia a un sitio si incluye una referencia a ese sitio, como una etiqueta de sitio o un término identificado como referencia al sitio. Una consulta se asocia con el sitio si conduce a que el usuario seleccione un resultado de búsqueda que identifique un recurso en ese sitio.

Determinación del recuento de consultas únicas

El proceso comienza determinando dos recuentos distintos de consultas únicas relacionadas con un sitio en particular:

Calcular el puntaje de calidad del sitio: el puntaje de calidad del sitio se determina en función del primer y segundo recuento de consultas únicas. Esto implica calcular una proporción en la que el numerador representa el interés del usuario en el sitio según lo indicado por las consultas dirigidas al sitio, y el denominador representa el interés del usuario en los recursos que se encuentran en el sitio como respuestas a todo tipo de consultas.

Calcular la proporción

El puntaje de calidad del sitio se calcula formando una relación entre el primer recuento y el segundo recuento. Esta relación tiene como objetivo cuantificar la calidad del sitio comparando el interés directo en el sitio (como lo indican las consultas que hacen referencia al sitio) con el interés más amplio en el contenido o los recursos del sitio (como lo indican las consultas que conducen a selecciones de contenido del sitio). El cálculo implica varios pasos:

Ajustes opcionales

La patente detalla características opcionales para refinar el cálculo del puntaje de calidad del sitio:

Uso del puntaje de calidad del sitio: el puntaje de calidad del sitio calculado se puede usar como una señal para clasificar recursos o resultados de búsqueda que identifican los recursos que se encuentran en un sitio en relación con los que se encuentran en otro sitio. Esto permite ajustar la clasificación de los resultados de búsqueda en función de la calidad percibida de los sitios.

Clasificación de resultados de búsqueda

La aplicación principal del puntaje de calidad del sitio es la clasificación de los resultados de búsqueda. Los motores de búsqueda tienen como objetivo proporcionar a los usuarios los resultados más relevantes y de alta calidad para sus consultas. Al incorporar el puntaje de calidad del sitio como señal en sus algoritmos de clasificación, los motores de búsqueda pueden ajustar la visibilidad de los recursos o páginas web en función de la calidad percibida de sus sitios anfitriones. Esto significa que si un sitio tiene un puntaje de calidad alto, lo que indica un gran interés y participación del usuario, su contenido puede tener una clasificación más alta en los resultados de búsqueda en comparación con contenido similar de sitios con puntajes de calidad más bajos.

Mejora de los algoritmos de búsqueda

El puntaje de calidad del sitio se puede utilizar para refinar varios componentes de los algoritmos de búsqueda más allá de la simple clasificación:

Filtrado de calidad

Además de influir en las clasificaciones, el nivel de calidad del sitio puede servir como filtro para mejorar la calidad de los resultados de búsqueda. Los sitios con puntuaciones de calidad consistentemente bajas, que pueden indicar baja relevancia o mala experiencia de usuario, podrían ser degradados o filtrados de los principales resultados de búsqueda. Esto ayuda a mantener un alto estándar de calidad en los resultados de búsqueda presentados a los usuarios.

Bucle de retroalimentación para webmasters

Aunque no se menciona explícitamente en la patente, el concepto de puntuación de calidad del sitio también podría proporcionar comentarios valiosos a los webmasters y profesionales de SEO. Comprender que los motores de búsqueda consideran la participación y el interés de los usuarios en las evaluaciones de calidad del sitio podría fomentar el desarrollo de contenido más centrado en el usuario y mejoras del sitio destinadas a aumentar la satisfacción y la participación del usuario.

Ajuste dinámico

El puntaje de calidad del sitio no es estático; puede cambiar en función de las interacciones y comportamientos continuos del usuario. Esta naturaleza dinámica permite a los motores de búsqueda adaptarse a los cambios en las preferencias de los usuarios y al panorama web en evolución. Los sitios que mejoran su contenido y experiencia de usuario pueden ver mejoras en sus niveles de calidad con el tiempo, lo que potencialmente conduce a mejores clasificaciones de búsqueda.

Detalles de implementación: Las reivindicaciones también detallan cómo se determina que una consulta incluye una referencia a un sitio en particular, incluido el uso de etiquetas de sitio o términos que se ha determinado que hacen referencia al sitio. Además, las reivindicaciones cubren los aspectos técnicos de la implementación de los métodos, incluido el uso de sistemas, aparatos y programas informáticos grabados en uno o más dispositivos de almacenamiento informático configurados para realizar estas operaciones.

Funciones opcionales: algunas reclamaciones incluyen funciones opcionales, como ajustar los recuentos según un valor umbral, calcular la proporción utilizando recuentos modificados y considerar las selecciones de resultados de búsqueda del usuario como parte de la asociación con un sitio en particular.

Implicaciones para el SEO

1. La participación del usuario como factor de clasificación:

La patente subraya la importancia de la participación y la interacción del usuario como factores para determinar la calidad de un sitio. Por lo tanto, las estrategias de SEO deben evolucionar para priorizar no solo la optimización del contenido y las palabras clave, sino también el diseño de la experiencia del usuario (UX), la usabilidad del sitio y las métricas de participación, como las tasas de clics (CTR), el tiempo en el sitio y las tasas de rebote.

2. Calidad y relevancia del contenido:

Para mejorar el nivel de calidad de un sitio, el contenido debe ser muy relevante para las consultas de los usuarios. Esto significa crear contenido que aborde directamente las necesidades y preguntas del público objetivo, en lugar de centrarse únicamente en la densidad de palabras clave o los factores tradicionales de SEO en la página. Es más probable que el contenido atractivo y de alta calidad atraiga consultas dirigidas específicamente al sitio, así como interacciones de los usuarios que indiquen relevancia y valor para los motores de búsqueda.

3. Estructura y navegación del sitio:

Una estructura de sitio bien organizada y una navegación intuitiva pueden mejorar la participación del usuario al facilitar que los visitantes encuentren la información que necesitan. Esto puede generar una mayor satisfacción del usuario, visitas de mayor duración y más interacciones con el sitio, todo lo cual puede impactar positivamente el nivel de calidad del sitio.

4. Reconocimiento de marca y comportamiento de búsqueda:

La patente destaca el papel del reconocimiento de marca en el comportamiento de búsqueda, ya que las consultas pueden incluir referencias a sitios o marcas específicas. Por lo tanto, las estrategias de SEO también deberían centrarse en generar conciencia y lealtad hacia la marca, animando a los usuarios a incluir nombres de marcas en sus consultas de búsqueda o navegar directamente al sitio a través de motores de búsqueda.

5. Personalización e intención del usuario:

Dado que el puntaje de calidad del sitio tiene en cuenta las interacciones de los usuarios que reflejan el interés en sitios específicos, las estrategias de SEO también deben considerar la intención del usuario y las experiencias de búsqueda personalizadas. Adaptar el contenido para satisfacer las diversas intenciones detrás de las consultas de búsqueda (informativas, de navegación, transaccionales) puede mejorar la participación del usuario y contribuir a una mayor puntuación de calidad del sitio.

7. Retroalimentación y Mejora Continua:

La naturaleza dinámica del puntaje de calidad del sitio significa que el SEO es un proceso continuo de monitoreo, análisis y ajuste. Los sitios web deben buscar continuamente comentarios a través de análisis, encuestas de usuarios y métricas de rendimiento para identificar áreas de mejora y adaptar sus estrategias de SEO en consecuencia.

Identificación de recursos de navegación para consultas informativas.

ID de patente: US9244972B1
Países publicados para: Estados Unidos
Fecha de última publicación: 26 de enero de 2016
Fecha de vencimiento: 30 de noviembre de 2033
Inventores: Lakshmi N. Chakrapani, April R. Lehman, Neil C. Fernandes

La patente identifica un tipo específico de consulta, denominada «consultas híbridas», que combinan características de consultas informativas y de navegación. Las consultas informativas son aquellas en las que el usuario busca información sobre un tema, mientras que las consultas de navegación tienen como objetivo encontrar un sitio web o una página específica. Un enfoque importante es identificar recursos de navegación para temas específicos basados ​​en consultas de usuarios anteriores. Esto implica analizar consultas registradas para determinar a qué recursos navegan los usuarios cuando buscan información sobre temas particulares.

Reclamos

Procesamiento de consultas híbridas

Creación y utilización de mapas

Creación de mapas

El proceso comienza con el análisis de los registros de consultas para identificar consultas híbridas. Estas consultas contienen una palabra clave de tema (que identifica un tema específico de interés para el usuario) y una palabra clave de navegación (que apunta a un recurso de navegación específico, como un sitio web o una página web).

Se crea un primer mapeo asociando recursos de navegación únicos identificados en las consultas híbridas con grupos de temas. Cada asociación en este mapeo vincula un recurso de navegación con uno o más temas identificados en las consultas híbridas que también mencionan ese recurso. Básicamente, este paso identifica qué recursos son relevantes para qué temas en función del comportamiento del usuario.

Luego, el proceso implica generalizar los temas asociados con cada recurso de navegación para incluir temas adicionales que no estaban presentes originalmente en el grupo. Esto significa ampliar el alcance de los temas con los que está asociado un recurso de navegación en particular, en función de las similitudes o relaciones con los temas ya identificados. Las asociaciones se amplían para incluir estos temas adicionales, ampliando así la relevancia de cada recurso de navegación.

Luego, el primer mapeo se invierte para crear un segundo mapeo. Este segundo mapeo asocia temas con grupos de recursos de navegación, esencialmente invirtiendo la perspectiva del primer mapeo. Ahora, para cada tema, hay una lista de recursos de navegación que son relevantes para ese tema.

Utilización del mapeo

El segundo mapeo se utiliza para calificar los resultados de búsqueda de candidatos para nuevas consultas de búsqueda. Esto implica evaluar la relevancia de los recursos de navegación para el tema de la consulta y utilizar las asociaciones y sus puntuaciones para clasificar los resultados de la búsqueda. El objetivo es priorizar los recursos de navegación que sean más relevantes y útiles para la consulta del usuario.

Las asignaciones permiten al motor de búsqueda ajustar la clasificación de los resultados de búsqueda en función de las asociaciones establecidas entre temas y recursos de navegación. Los recursos con una mayor relevancia para el tema consultado, según lo determinado por las asignaciones, pueden tener una clasificación más alta en los resultados de búsqueda, haciéndolos más visibles para el usuario.

Al aprovechar estas asignaciones, el motor de búsqueda puede hacer coincidir con mayor precisión las consultas de los usuarios con los recursos de navegación más relevantes. Esto no sólo mejora la experiencia del usuario al reducir la necesidad de realizar múltiples intentos de búsqueda para encontrar la información deseada, sino que también ayuda a dirigir el tráfico a los sitios web que sean más relevantes para las necesidades del usuario.

Mejoras en puntuación y clasificación

Calcular puntuaciones de asociación

El proceso comienza filtrando asociaciones iniciales entre temas y recursos de navegación según criterios de precisión. Estos criterios pueden incluir factores como la proporción de clics que recibe un recurso de navegación de consultas híbridas relacionadas con un tema específico, el número de sesiones de búsqueda que muestran una transición de una consulta informativa a una consulta de navegación para el recurso y el número mínimo de clics o interacciones necesarias para que un recurso se considere relevante para un tema.

Después del filtrado, se crea una asignación inicial de tema a recurso. Este mapeo incluye asociaciones entre temas únicos y grupos de recursos de navegación, donde cada recurso está vinculado a un tema según las asociaciones filtradas.

Este mapeo inicial luego se invierte para formar la base de la puntuación, similar al primer proceso de mapeo descrito anteriormente. Esta inversión asocia temas con recursos de navegación, preparando el escenario para calcular puntuaciones de asociación.

Uso de puntuaciones de asociación para calificar los resultados de búsqueda

Para cada recurso de navegación asociado con un tema, el sistema calcula una puntuación de asociación. Esta puntuación refleja la relevancia e importancia del recurso para el tema, en función de varios factores como:

Las puntuaciones de asociación calculadas se utilizan luego para calificar los resultados de búsqueda de candidatos para nuevas consultas. Esto implica ajustar la puntuación de relevancia de los recursos de navegación en función de sus puntuaciones de asociación, lo que potencialmente mejora su clasificación en los resultados de búsqueda cuando se consideran muy relevantes para el tema consultado.

El sistema de puntuación mejorado permite una clasificación de los resultados de búsqueda más dinámica y sensible al contexto. Los recursos de navegación con puntuaciones altas de asociación para un tema consultado tienen una clasificación más alta, lo que los hace más visibles para los usuarios. Esta priorización se basa en la premisa de que los recursos frecuentemente asociados con un tema a través de interacciones de usuarios probablemente sean de mayor calidad o relevancia.

Mapeos verticales y de autor

Mapeos verticales

El proceso implica categorizar cada tema único identificado en las asignaciones de tema a recurso en una o más verticales específicas. Las verticales son categorías amplias que representan áreas de interés o industrias, como salud, finanzas, tecnología, etc. Esta categorización ayuda a organizar los temas y sus recursos asociados en grupos más manejables y relevantes.

Una vez que los temas se clasifican en verticales, la patente describe la creación de asignaciones verticales a recursos. Estas asignaciones asocian cada vertical con un grupo de recursos de navegación que son relevantes para los temas dentro de esa vertical. Es una forma de decir: “Para el sector de salud, estos son los recursos clave que son más relevantes según las consultas e interacciones de los usuarios.

Las asignaciones de vertical a recursos se utilizan luego para calificar los resultados de búsqueda de candidatos para consultas que caen en una de las verticales categorizadas. Esto significa que si la consulta de un usuario se identifica como perteneciente al sector de salud, el motor de búsqueda puede priorizar los recursos asignados al sector de salud, lo que potencialmente mejora la relevancia de los resultados de la búsqueda.

Asignaciones de autor

Más allá de categorizar los temas en verticales, la patente también explora la idea de vincular los temas con los autores. Esto implica procesar registros de consultas para identificar consultas que incluyen términos relacionados con temas y autores específicos. Para cada autor, el sistema identifica los recursos en Internet sobre los cuales el autor ha reclamado la autoría.

Si los resultados de búsqueda que apuntan a recursos creados por una persona específica reciben una cantidad significativa de clics, se crea una asociación de tema a autor. Esto vincula el tema directamente con el autor, lo que sugiere que el autor es una fuente relevante y autorizada de información sobre ese tema.

Luego, la asignación de tema a autor se utiliza para calificar los resultados de búsqueda para consultas relacionadas con los temas. Los recursos escritos por los autores asociados pueden recibir una puntuación de relevancia más alta, lo que refleja su autoridad y experiencia en el tema. Esto puede generar una mayor visibilidad en los resultados de búsqueda para consultas relacionadas con el área de especialización del autor.

Elementos de la interfaz de usuario

Implicaciones para el SEO

1. Énfasis en la autoridad y relevancia del tema:

2. Importancia del análisis del comportamiento del usuario:

3. SEO vertical específico:

4. La autoría como factor de clasificación:

5. Calidad del contenido y del enlace:

Clasificación de resultados de búsqueda según métricas de entidad

El ID de la patente es US10235423B2. La patente se emitió oficialmente el 19 de marzo de 2019. Los inventores enumerados son Hongda Shen, David Francois Huynh, Grace Chung, Chen Zhou, Yanlai Huang y Guanghua Li, todos asociados con Google LLC, Mountain View, CA, EE. UU. Se publica para EE.UU. y la OMPI. Esto significa que es más probable que se utilice en la práctica.

Para mí, esta es la patente básica para la implementación algorítmica de las calificaciones EEAT.

Fondo:

La patente aborda el desafío de clasificar eficazmente los resultados de búsqueda de una manera que sea relevante y valiosa para el usuario. Reconoce las limitaciones de los métodos existentes para distinguir adecuadamente entre los matices de diferentes tipos de entidades y sus correspondientes métricas en los resultados de búsqueda.

Perspectivas principales:

Resumen:

El documento detalla un método sofisticado para clasificar los resultados de búsqueda según:

Reclamos:

Las reivindicaciones de la patente se centran en los procesos específicos para determinar las diversas métricas (métrica de entidad relacionada, métrica de tipo notable, métrica de contribución, métrica de premio), el método de cálculo de ponderaciones específicas del dominio y el mecanismo de puntuación general que sustenta la clasificación. de los resultados de la búsqueda.

Las métricas de la entidad.

Las reivindicaciones de la patente se centran en los procesos específicos para determinar las diversas métricas (métrica de entidad relacionada, métrica de tipo notable, métrica de contribución, métrica de premio), el método de cálculo de ponderaciones específicas del dominio y el mecanismo de puntuación general que sustenta la clasificación. de los resultados de la búsqueda.

  1. Métrica de entidad relacionada : esta métrica se determina en función de la coexistencia de una referencia de entidad contenida en una consulta de búsqueda con el tipo de entidad de la referencia de entidad en las páginas web. Por ejemplo, si la consulta de búsqueda contiene la referencia de entidad «Empire State Building», que se determina que es del tipo de entidad «Rascacielos», la coexistencia del texto «Empire State Building» y «Skyscraper» en las páginas web puede determinar la métrica de relación.
  2. Métrica de tipo notable : esta métrica es una métrica de popularidad global dividida por una clasificación de tipo de entidad notable. La clasificación del tipo de entidad notable indica la posición de un tipo de entidad en una lista de tipos de entidad notable, mostrando la importancia o prominencia del tipo de entidad en un contexto determinado.
  3. Métrica de contribución : según las revisiones críticas, las clasificaciones de fama y otra información, la métrica de contribución se pondera de manera que los valores más altos contribuyan en mayor medida a la métrica. Esta métrica evalúa la contribución o importancia de la entidad o contenido en su dominio respectivo.
  4. Métrica de premio : refleja el reconocimiento o los premios asociados con la entidad, donde dominios específicos, como películas, pueden incluir métricas asociadas con premios de películas particulares. Los valores de las métricas podrían determinarse en función de la configuración del sistema, las selecciones agregadas de referencias de entidades por parte del usuario y los datos asociados con las referencias de entidades.

Estas métricas se combinan con ponderaciones específicas del dominio para determinar una puntuación integral, que luego se utiliza para clasificar los resultados de la búsqueda. El enfoque del sistema para definir y aplicar estas métricas enfatiza la importancia del análisis tanto cuantitativo como cualitativo de las entidades y sus relaciones dentro del contexto de búsqueda.

Implicaciones para el SEO

En conclusión, las métricas detalladas de las entidades y su aplicación en la clasificación de los resultados de búsqueda requieren un enfoque holístico y matizado del SEO. Este enfoque debe priorizar el reconocimiento de entidades, la calidad y relevancia del contenido, los datos estructurados y las validaciones externas, todo ello adaptado a las demandas específicas del dominio en cuestión.

  1. Optimización de búsqueda basada en entidades : las estrategias de SEO deben evolucionar para centrarse más en la optimización de contenidos basada en entidades. Esto significa comprender cómo los motores de búsqueda reconocen y categorizan entidades dentro del contenido y optimizarlas para estas entidades además de las palabras clave tradicionales.
  2. Relevancia y calidad del contenido : el uso de métricas como la métrica de entidad relacionada y la métrica de tipo notable indica que los motores de búsqueda están analizando la relevancia y autoridad del contenido de una manera mucho más granular. Para SEO, esto significa priorizar contenido autorizado y de alta calidad que refleje con precisión las entidades discutidas.
  3. Datos estructurados y marcado de esquemas : la implementación de datos estructurados y marcado de esquemas se vuelve aún más crucial ya que estas herramientas ayudan a los motores de búsqueda a comprender las entidades dentro de una página y cómo se relacionan entre sí. Esto puede mejorar la visibilidad del contenido en los resultados de búsqueda que están cada vez más centrados en entidades.
  4. Contenido diverso y completo : con métricas que evalúan las contribuciones y premios (o reconocimientos), el contenido que cubre una amplia gama de temas relacionados e incluye debates completos sobre entidades (incluidos sus logros y reconocimientos) puede tener una clasificación más alta. Esto implica que las estrategias de SEO deben incluir la creación de contenido detallado que cubra entidades desde múltiples ángulos.
  5. Señales sociales y validación externa : la inclusión de métricas relacionadas con premios y contribuciones sugiere que la validación externa (como premios, menciones, reseñas y señales de redes sociales) juega un papel en la clasificación del contenido. Por lo tanto, los esfuerzos de SEO deberían considerar cómo obtener reconocimiento externo positivo y citas de fuentes acreditadas.
  6. Optimización específica del dominio : la patente sugiere ponderaciones específicas del dominio para las métricas, lo que sugiere que lo que es importante para la clasificación puede variar significativamente entre diferentes tipos de contenido o industrias. Los profesionales de SEO deben comprender los factores de clasificación específicos que más importan en su dominio y optimizarlos en consecuencia.
  7. Adaptación a la evolución de los motores de búsqueda : la patente refleja la evolución continua de los motores de búsqueda hacia la comprensión y la atención a la intención del usuario a través de una comprensión más profunda del contenido y el contexto. Las estrategias de SEO deben ser flexibles y adaptables, centrándose en contenido preparado para el futuro haciéndolo lo más relevante, autorizado y centrado en el usuario posible.

Obtener resultados de búsqueda autorizados

Esta patente de Google se publicó por primera vez en mayo de 2017. La patente se centra en mejorar los resultados de los motores de búsqueda incorporando resultados de búsqueda autorizados. Esto se logra identificando recursos en sitios autorizados relevantes para la consulta de un usuario e integrándolos en los resultados de búsqueda.

  1. Procesamiento de consultas de búsqueda : el sistema recibe una consulta de búsqueda y genera resultados de búsqueda iniciales.
  2. Identificación de resultados autorizados : identifica resultados de búsqueda autorizados, que son recursos de sitios considerados autorizados para la consulta específica.
  3. Clasificación e integración : estos resultados autorizados se clasifican junto con los resultados de búsqueda iniciales y se presentan al usuario.

Proceso de puntuación y factores

  1. Puntuación de los resultados de la búsqueda inicial :
    • El sistema primero genera un conjunto de resultados de búsqueda iniciales en respuesta a la consulta de un usuario.
    • Cada uno de estos resultados se califica según la relevancia, que podría incluir factores como la concordancia de palabras clave, la calidad del contenido, las métricas de participación del usuario y otros factores de SEO.
  2. Identificación de puntuaciones bajas :
    • El sistema evalúa las puntuaciones de estos resultados de búsqueda iniciales.
    • Si las puntuaciones son generalmente bajas o no alcanzan un cierto umbral, se genera la necesidad de resultados de búsqueda autorizados.
  3. Resultados de búsqueda autorizados :
    • Luego, el sistema busca resultados de búsqueda autorizados, que son recursos de sitios considerados autorizados para la consulta específica.
    • Esto implica un mapeo entre palabras clave y sitios autorizados. Cuando un término de la consulta coincide con una palabra clave en esta asignación, se identifica el sitio autorizado correspondiente.
  4. Puntuaciones de confianza para sitios autorizados :
    • A cada sitio autorizado asociado con una palabra clave se le asigna una puntuación de confianza.
    • Esta puntuación representa la probabilidad de que la palabra clave, si se recibe en una consulta, se refiera a ese sitio autorizado.
  5. Análisis de refinamiento de consultas :
    • El sistema también analiza cómo los usuarios refinan sus consultas.
    • Si los usuarios refinan con frecuencia una consulta para incluir una palabra clave específica y luego navegan a un sitio en particular, este sitio podría agregarse a la asignación para esa palabra clave.
  6. Clasificación de resultados autorizados :
    • Una vez identificados los resultados autorizados, se clasifican. Esta clasificación puede verse influenciada por varios factores:
      • Puntuaciones de IR modificadas : si la puntuación de recuperación de información (IR) inicial para un resultado autorizado es baja, podría modificarse para reflejar mejor su relevancia para la consulta.
      • Factores de degradación : se aplican en función de la similitud entre las consultas originales y revisadas. Una puntuación de similitud más baja podría dar lugar a un factor de degradación más alto, lo que afectaría la clasificación del resultado autorizado.
      • Puntuaciones de confianza : la puntuación de confianza del sitio autorizado también influye en la clasificación.
  7. Integración con resultados iniciales :
    • Finalmente, los resultados de búsqueda autorizados se integran con los resultados de búsqueda iniciales.
    • Luego, el conjunto combinado de resultados se presenta al usuario y la clasificación refleja tanto la relevancia como la autoridad.

Implicaciones para el SEO

Enfatiza la importancia no solo de optimizar las palabras clave y la relevancia del contenido, sino también de establecer autoridad en nichos específicos. Los sitios reconocidos como autorizados para ciertas palabras clave o temas tienen más probabilidades de aparecer en los resultados de búsqueda, especialmente cuando los resultados estándar no cumplen con los umbrales de calidad. Esto subraya la necesidad de contenido confiable y de alta calidad y el uso estratégico de palabras clave que se alineen con la experiencia y la autoridad del sitio.

Esta patente me parece la base del concepto EEAT.

Generar una clasificación de páginas utilizando distancias en un gráfico de enlaces web

Google renunció a esta patente de Google en 2017 en la última versión y el estado es activo. La patente describe cómo se puede generar una puntuación de clasificación para documentos vinculados en función de la proximidad a sitios de semillas seleccionados manualmente. En este caso se pesan individualmente los propios lugares de siembra.

En una variación de esta realización, una página semilla s  en el conjunto de páginas semilla está asociada con un peso predeterminado en el que 0<wi  1. Además, la página semilla s  está asociada con una distancia inicial d  en la que d i = −log (wi ) .

Las propias páginas semilla son de alta calidad o las fuentes tienen una gran credibilidad. Puede leer lo siguiente sobre estas páginas en la patente:

 En una realización de la presente invención, las semillas  102  son páginas de alta calidad especialmente seleccionadas que proporcionan una buena conectividad web con otras páginas que no son semillas. Más específicamente, para garantizar que se pueda acceder fácilmente a otras páginas de alta calidad desde las semillas  102 , las semillas en las semillas  102  deben ser confiables, diversas para cubrir una amplia gama de campos de interés público, así como estar bien conectadas con otras páginas (es decir, , teniendo una gran cantidad de enlaces salientes). Por ejemplo, Google Directory y The New York Times son buenas semillas que poseen dichas propiedades. Normalmente se supone que estas semillas también están «más cerca» de otras páginas de alta calidad en la web. Además, las semillas con una gran cantidad de enlaces salientes útiles facilitan la identificación de otras páginas útiles y de alta calidad, actuando así como «centros» en la web.

Según la patente, estas páginas de semillas deben seleccionarse manualmente y limitarse en número para evitar manipulaciones. La longitud de un enlace entre una página inicial y el documento que se va a clasificar se puede determinar, por ejemplo, mediante los siguientes criterios:

Es interesante observar que las páginas que no tienen un enlace directo o indirecto a al menos una página inicial ni siquiera se incluyen en la puntuación.

Esto también permite sacar conclusiones sobre por qué Google incluye algunos enlaces para la clasificación y otros no.

Sin embargo, tenga en cuenta que no todas las páginas del conjunto de páginas reciben puntuaciones de clasificación a través de este proceso. Por ejemplo, una página a la que no se puede acceder desde ninguna de las páginas iniciales no se clasificará.

Este concepto se puede aplicar al documento en sí, pero también al editor, dominio o autor en general. Un editor o autor al que a menudo se hace referencia directa en los sitios semilla obtiene una mayor autoridad para el tema y las palabras clave semánticamente relacionadas desde las que está vinculado. Estos sitios iniciales pueden ser un conjunto de sitios por tema que se determinan manualmente o alcanzan un umbral de autoridad y señales de confianza.

Combatir el spam web con Trust Rank

El artículo científico «Combating Web Spam with Trust Rank» describe cómo se pueden identificar automáticamente otros sitios semilla confiables seleccionando manualmente un conjunto de como máximo 200 sitios semilla.

Nuestros resultados muestran que podemos filtrar eficazmente el spam de una fracción significativa de la web, basándonos en un buen conjunto inicial de menos de 200 sitios.

Luego, un experto humano examina las páginas semilla y le dice al algoritmo si son spam (páginas malas) o no (páginas buenas). Finalmente, el algoritmo identifica otras
páginas que probablemente sean buenas en función de su conectividad con las páginas iniciales buenas.

La determinación algorítmica de otros sitios confiables parte del supuesto de que los sitios confiables no enlazan con sitios de spam por sí solos, sino con otras fuentes confiables.

Clasificación de resultados de búsqueda basada en la confianza

La patente US8818995B1 está publicada en Estados Unidos. La última fecha de publicación de esta patente es el 26 de agosto de 2014.

Los inventores enumerados para esta patente son:

La patente aborda un desafío fundamental en el diseño y la funcionalidad de los motores de búsqueda: la relevancia de los resultados de la búsqueda depende en gran medida de la intención y las circunstancias del usuario, que varían significativamente entre los usuarios. Los motores de búsqueda tradicionales a menudo tienen dificultades para inferir con precisión la intención de un usuario basándose únicamente en los términos de consulta proporcionados. Esta limitación surge del hecho de que la intención puede verse influenciada por numerosos factores situacionales que no son evidentes a partir de la consulta misma.

Los intentos de resolver este problema generalmente se han basado en indicadores relativamente débiles de la intención del usuario, como preferencias estáticas del usuario o métodos predefinidos de reformulación de consultas. Estos enfoques se basan en conjeturas fundamentadas sobre lo que podría interesarle al usuario, en función de los términos utilizados en la consulta de búsqueda. Sin embargo, se quedan cortos porque la intención del usuario es muy variable y depende de factores que no pueden extrapolarse fácilmente a partir de los términos de consulta únicamente.

Como resultado de estas limitaciones, los usuarios suelen recurrir a sitios web especializados, conocidos como sitios de conocimiento vertical, para obtener información más personalizada y relevante. Estos sitios, que pueden variar desde foros comunitarios para intereses compartidos hasta blogs de expertos en campos específicos, ofrecen análisis adicionales o comprensión del contenido disponible en Internet. Permiten a los usuarios vincular contenido, proporcionar etiquetas que describan el contenido y alojar comentarios y análisis de expertos o personas con conocimientos. Este enfoque ayuda a los usuarios a encontrar información que esté más estrechamente alineada con sus necesidades e intereses específicos.

Sin embargo, el problema persiste cuando los usuarios regresan a los motores de búsqueda generales, ya que estas plataformas no pueden incorporar la confiabilidad de los documentos o la credibilidad de los comentarios y opiniones asociados en sus resultados de búsqueda. Esta desconexión significa que los motores de búsqueda generales no utilizan el contexto adicional y la información basada en la reputación disponible en los sitios de conocimiento vertical para mejorar la relevancia y confiabilidad de los resultados de búsqueda para los usuarios.

Reclamos

Las reivindicaciones de patente describen un método y un sistema para mejorar los resultados de los motores de búsqueda incorporando relaciones de confianza y anotaciones en el proceso de clasificación. Los aspectos clave de las reclamaciones incluyen:

  1. Determinación de relaciones de confianza: el método implica determinar relaciones de confianza en función de los patrones de visitas web de un usuario. Estas relaciones de confianza indican que el usuario confía en ciertas entidades, y la solidez de estas relaciones puede aumentar o disminuir con el tiempo en función de las interacciones del usuario con las páginas web asociadas con estas entidades.
  2. Actualización de relaciones de confianza: el sistema actualiza el conjunto de relaciones de confianza para un usuario, donde la solidez de una relación de confianza con una entidad puede disminuir debido al paso del tiempo o permanecer sin cambios en función de la interacción continua del usuario con las páginas web asociadas con una segunda. entidad.
  3. Identificación de recursos y términos de etiquetas de anotación: el método incluye la identificación de recursos (como documentos o contenido web) que responden a una consulta de búsqueda. Cada recurso está asociado con uno o más términos de etiqueta de anotación, que se comparan con los términos de la consulta de búsqueda.
  4. Determinación de rangos de confianza: para cada término de etiqueta de anotación que coincida con un término de la consulta de búsqueda, se identifica un rango de confianza. Este rango de confianza indica la solidez de la relación de confianza entre el usuario y la entidad que asoció el término de la etiqueta de anotación con el recurso. Los rangos de confianza se basan en las relaciones de confianza determinadas a partir de los patrones de visitas web del usuario.
  5. Clasificación de recursos según rangos de confianza: los recursos se clasifican según los rangos de confianza asociados con los términos de la etiqueta de anotación. Este proceso de clasificación tiene en cuenta la solidez de las relaciones de confianza entre el usuario y las entidades que han proporcionado anotaciones, proporcionando así resultados de búsqueda adaptados a las fuentes confiables del usuario.

En la clasificación de los resultados de búsqueda de Google basada en la confianza, se hace referencia al uso de textos de anclaje como puntuación de confianza.

La patente describe cómo se complementa la puntuación de los documentos basándose en una etiqueta de confianza. Esta información puede provenir del documento en sí o de documentos de terceros de referencia en forma de texto de enlace u otra información relacionada con el documento o entidad. Estas etiquetas están asociadas con la URL y se registran en una base de datos de anotaciones.

El propio Google también ha confirmado que los textos ancla de los enlaces no sólo aumentan la relevancia de la página de destino, sino que también pueden tener un efecto positivo en todo el dominio.

Implicaciones para el SEO

  1. Énfasis en la confiabilidad: las estrategias de SEO deberían priorizar no solo la relevancia y la calidad del contenido, sino también su confiabilidad percibida. Es posible que los sitios web y los creadores de contenido deban centrarse en generar confianza con su audiencia a través de prácticas transparentes, vínculos de retroceso autorizados y respaldo de entidades confiables.
  2. Anotaciones y etiquetas: el uso de anotaciones o etiquetas por parte de entidades confiables para describir el contenido web sugiere que los metadatos y las estrategias de etiquetado podrían volverse más cruciales. Es posible que los esfuerzos de SEO deban incluir la optimización de dichas etiquetas para que coincidan con las consultas de búsqueda de los usuarios que confían en esas entidades, lo que podría influir en cómo se categoriza y descubre el contenido.
  3. Patrones de interacción y participación del usuario: dado que la patente sugiere que las relaciones de confianza se pueden determinar en función de los patrones de visitas web de un usuario, las estrategias de SEO podrían centrarse cada vez más en la participación y retención del usuario. Fomentar las visitas repetidas y la interacción prolongada con el contenido podría indicar confiabilidad a los motores de búsqueda.
  4. Gestión de la reputación: La importancia de la reputación, tanto online como offline, podría tener un mayor impacto en el SEO. Gestionar y mejorar la reputación entre los usuarios y las entidades de confianza podría influir directamente en los rankings de búsqueda. Esto podría implicar una participación más activa con comunidades, expertos y personas influyentes en campos relevantes.
  5. Colaboración con entidades de confianza: formar asociaciones o colaboraciones con entidades en las que los usuarios confían podría convertirse en una estrategia para mejorar el SEO. Ser presentado o respaldado por dichas entidades, o tener contenido anotado por ellas, podría aumentar el rango de confianza de un sitio web o su contenido.
  6. Calidad y profundidad del contenido: para atraer anotaciones y participación positiva de entidades y usuarios confiables, la calidad y profundidad del contenido seguirán siendo primordiales. Es más probable que el contenido de alta calidad, informativo y autorizado sea reconocido y etiquetado por entidades confiables, lo que mejora su visibilidad en los resultados de búsqueda.

Credibilidad de un autor de contenido online 

Para mí esta patente de Google es la más interesante según la EEAT. En Credibilidad de un autor de contenido en línea, se hace referencia a varios factores que pueden usarse para determinar algorítmicamente la credibilidad de un autor. Esta patente de Google tiene el estado «El estado de la aplicación está activo».

La naturaleza vasta y democrática de Internet permite la proliferación de contenidos, que van desde información de alta calidad hasta información de baja calidad. La patente aborda el desafío de identificar y promover contenido de alta calidad mediante la evaluación de la credibilidad de los autores del contenido. Señala la dificultad para distinguir a los autores acreditados de aquellos que pueden tergiversar sus conocimientos o su identidad en línea.

Describe cómo un motor de búsqueda puede clasificar documentos bajo la influencia de un factor de credibilidad y la puntuación de reputación del autor.

En esta patente hay nuevamente una referencia a los enlaces como un posible factor para una calificación EEAT. Por lo tanto, la puntuación de reputación de un autor puede verse influenciada por la cantidad de enlaces del contenido publicado.

Se mencionan las siguientes posibles señales para una puntuación de reputación:

Más información interesante sobre la puntuación de reputación de la patente:

Además, la patente analiza un factor de credibilidad para los autores. Para ello es relevante información verificada sobre la profesión o el rol del autor en una empresa. La relevancia de la profesión con respecto a los temas del contenido publicado también es decisiva para la credibilidad del autor. El nivel de educación y formación del autor también puede influir aquí.

La información verificada sobre el autor puede incluir el número de otras publicaciones del autor que son relevantes para el contenido en línea del autor. La información verificada sobre el autor puede incluir el número de citas del contenido en línea del autor que se realizan en otras publicaciones de uno o más autores diferentes. La información verificada sobre el autor puede incluir información sobre premios y reconocimientos del autor en uno o más campos. El factor de credibilidad puede basarse además en la relevancia de uno o más campos para el contenido en línea del autor. La información verificada sobre el autor puede incluir comentarios recibidos sobre el autor o el contenido en línea del autor de una o más organizaciones. El factor de credibilidad puede basarse además en la relevancia de una o más organizaciones para el contenido en línea del autor y la retroalimentación recibida. La información verificada sobre el autor puede incluir información de ingresos sobre el contenido en línea del autor.

Otros factores mencionados son:

Si el contenido en línea del autor es publicado por un editor que publica regularmente obras de autores que han recibido premios u otro reconocimiento público, aumentando así la credibilidad del propio editor, la puntuación de credibilidad del autor puede verse influenciada.

Además, las menciones en las listas de los más vendidos pueden influir en la medición de la credibilidad.

El nivel de éxito del autor, ya sea en relación con un contenido en línea en particular o en general, puede medirse hasta cierto punto por el éxito de las obras publicadas del autor, por ejemplo, si una o más han llegado a las listas de los más vendidos o por ingresos generados por una o más publicaciones. Si esta información está disponible e indica un éxito relativo del autor en un campo particular, esto puede influir positivamente en el factor de credibilidad del autor.

Implicaciones para el SEO

Detección de sentimiento como señal de clasificación para entidades revisables

La patente de Google Detección de sentimientos como señal de clasificación para entidades revisables describe cómo se puede utilizar el análisis de sentimientos para identificar sentimientos en torno a entidades revisables en documentos. Los resultados se pueden utilizar luego para clasificar entidades y documentos relacionados.

Las entidades evaluables incluyen personas, lugares o cosas sobre las cuales se pueden expresar sentimientos, como restaurantes, hoteles, productos de consumo como electrónica, películas, libros y presentaciones en vivo.

Los datos estructurados y no estructurados se pueden utilizar como fuente. Las reseñas estructuradas se recopilan de sitios web de reseñas populares como Google Maps, TripAdvisor, Citysearch o Yelp.

Las entidades almacenadas en la base de datos de Sentiment están representadas por tuplas en forma de ID de entidad, tipo de entidad y una o más reseñas. A las reseñas se les asignan diferentes puntuaciones, que se calculan en el motor de análisis de clasificación.

En el motor de análisis de clasificación, se determinan las puntuaciones de opinión relativas a las respectivas reseñas, incluida información adicional como el autor.

Esta patente también analiza el uso de señales de interacción para complementar el sentimiento en términos de clasificación como factor.

Para determinar una puntuación de interacción del usuario, se abordan señales del usuario como SERP CTR y duración de la estadía.

Sistemas y métodos para reclasificar los resultados de búsqueda clasificados

La patente US20190188207A1 está publicada para Estados Unidos y la OMPI. La última fecha de publicación de la solicitud es el 20 de junio de 2019 y se concedió como US10503740B2 el 10 de diciembre de 2019. La fecha de vencimiento prevista de la patente es el 17 de mayo de 2033. Los inventores enumerados para esta patente son Chung Tin Kwok, Lei Zhong y Zhihuan Qiu. El cesionario actual es Google LLC.

Cuando un usuario envía una consulta de búsqueda, el motor de búsqueda identifica y clasifica los resultados de la búsqueda en función de varios factores, incluida la relevancia de los resultados de la búsqueda para la consulta. Sin embargo, este proceso puede dar lugar a situaciones en las que los resultados de búsqueda con contenido similar o sustancialmente idéntico se clasifiquen de forma diferente. Esta discrepancia surge a menudo porque algunas entidades conocidas por el motor de búsqueda no producen contenido original; en cambio, redistribuyen contenido escrito por otros. Por el contrario, otras entidades son reconocidas por producir contenido original.

La patente destaca un problema específico en el que los documentos asociados con entidades no conocidas por su autoría original podrían recibir puntuaciones de relevancia más altas y, en consecuencia, clasificaciones más altas en los resultados de búsqueda. Esta situación es problemática porque puede priorizar el contenido de entidades que simplemente redistribuyen el trabajo original de otros sobre el contenido de entidades que son los autores originales. Los antecedentes preparan el escenario para la invención al subrayar la necesidad de un método para reclasificar los resultados de búsqueda de una manera que refleje mejor la originalidad del contenido y la autoría detrás de él, con el objetivo de mejorar la calidad y relevancia de los resultados de búsqueda presentados. usuarios.

Reclamos

  1. Metodología de reclasificación : las reclamaciones detallan un método implementado por computadora para reclasificar los resultados de búsqueda donde se clasifican inicialmente los documentos que satisfacen una consulta de búsqueda. Si dos documentos son similares y la entidad asociada con el documento de menor clasificación cumple con un criterio de autoría predefinido que indica una mayor originalidad o calidad de autoría, las clasificaciones de estos documentos se intercambian.
  2. Configuración del sistema : las reivindicaciones describen un sistema equipado con al menos un procesador y programas de almacenamiento de memoria para ejecutar el proceso de reclasificación. Este sistema es capaz de obtener resultados de búsqueda clasificados, evaluar la similitud de documentos, evaluar la calidad de la autoría y ajustar la clasificación de los resultados de búsqueda en consecuencia.
  3. Medio legible por computadora : las reclamaciones incluyen un medio legible por computadora que almacena programas que, cuando se ejecutan mediante un procesador, realizan el método de reclasificar los resultados de búsqueda según criterios de similitud y autoría.
  4. Solicitudes de prioridad e indexación : algunas reclamaciones se centran en emitir solicitudes de alta prioridad para rastrear e indexar contenido considerado original o de alta calidad de autoría, garantizando que dicho contenido se agregue rápidamente al índice del motor de búsqueda.
  5. Evaluación de contenido : las reclamaciones detallan métodos para evaluar si el contenido es nuevo en relación con el contenido conocido en el índice, incluidas técnicas para comparar tejas de contenido (conjuntos de tokens) para determinar la singularidad y originalidad del contenido.
  6. Determinación de la autoría : varias afirmaciones describen métodos para determinar si una entidad es autora de contenido original, basándose en la evaluación del contenido enviado frente al contenido conocido y la identificación de contribuciones de contenido únicas o de primera instancia.
  7. Registro y verificación de autores : las reclamaciones también cubren el proceso de registro de entidades como autores de contenido, incluida la verificación de la autoría a través de diversos mecanismos y la actualización del índice del motor de búsqueda para reflejar el estado de autoría verificada.

La patente describe cómo los motores de búsqueda pueden tener en cuenta no sólo las referencias al contenido del autor, sino también la parte que éste ha contribuido a un corpus de documentos temáticos en una puntuación de autor.

La patente presenta un sistema, un medio de almacenamiento legible por computadora que almacena al menos un programa y un método implementado por computadora para reclasificar los resultados de búsqueda que ya han sido clasificados en respuesta a una consulta de búsqueda. La esencia de la patente es ajustar la clasificación de los resultados de búsqueda en función de la autoría y la originalidad del contenido, en lugar de basarse únicamente en las métricas de relevancia tradicionales.

“En algunas realizaciones, determinar la puntuación del autor original para la entidad respectiva incluye: identificar una pluralidad de porciones de contenido en el índice de contenido conocido identificado como asociado con la entidad respectiva, representando cada porción en la pluralidad de porciones una cantidad predeterminada de datos en el índice de contenido conocido; y calcular un porcentaje de la pluralidad de las porciones que son primeras instancias de las porciones de contenido en el índice de contenido conocido”.

Esta patente de Google se obtuvo en agosto de 2018. Describe el refinamiento de los resultados de búsqueda según la puntuación del autor, incluida la puntuación de las citas. La puntuación de citas se basa en la cantidad de referencias a los documentos de un autor. Otro criterio para la puntuación del autor es la proporción de contenido que un autor ha aportado a un corpus de documentos.

en el que determinar la puntuación del autor para una entidad respectiva incluye: determinar una puntuación de citación para la entidad respectiva, en el que la puntuación de citación corresponde a una frecuencia con la que se cita el contenido asociado con la entidad respectiva; determinar una puntuación del autor original para la entidad respectiva, en donde la puntuación del autor original corresponde a un porcentaje del contenido asociado con la entidad respectiva que es una primera instancia del contenido en un índice de contenido conocido; y combinar la puntuación de citación y la puntuación del autor original usando una función predeterminada para producir la puntuación del autor;

Implicaciones para el SEO

  1. Énfasis en el contenido original : la patente subraya la importancia de crear y publicar contenido original. Es probable que los sitios web y los creadores de contenido que producen contenido único y de alta calidad se beneficien de mejores clasificaciones de búsqueda, ya que los motores de búsqueda priorizan la originalidad y la calidad de la autoría. Esto cambia el enfoque hacia el valor de la singularidad del contenido en lugar de simplemente optimizarlo para palabras clave o vínculos de retroceso.
  2. La autoría como factor de clasificación : el concepto de calidad de la autoría y su impacto en la clasificación del contenido sugiere que los motores de búsqueda pueden considerar la reputación y credibilidad de los creadores de contenido como parte de sus algoritmos de clasificación. Esto podría conducir al desarrollo de estrategias destinadas a establecer y resaltar la experiencia y la autoridad de los autores en sus respectivos campos.
  3. Distribución y redistribución de contenido : para los sitios web que dependen de la distribución o redistribución de contenido de otras fuentes, esta patente indica una posible necesidad de reevaluar sus estrategias. Si bien el contenido sindicado puede seguir siendo valioso, los motores de búsqueda pueden priorizar el contenido de la fuente original, lo que afecta la visibilidad de las versiones sindicadas.
  4. Estrategias de SEO para editores : es posible que los editores y creadores de contenido deban adoptar nuevas estrategias de SEO que se centren en demostrar la originalidad y la calidad de la autoría de su contenido. Esto podría implicar aprovechar metadatos, datos estructurados u otros medios para señalar a los motores de búsqueda la fuente original del contenido y la credibilidad de los autores.
  5. Impacto en el marketing de contenidos : Es posible que las estrategias de marketing de contenidos deban evolucionar para poner aún mayor énfasis en la creación de contenido original y de alta calidad que proporcione valor real a los usuarios. Las marcas y los especialistas en marketing podrían invertir más en liderazgo intelectual e investigación original para destacar en los resultados de búsqueda.
  6. Monitoreo y protección de contenido : podría haber una mayor necesidad de herramientas y estrategias para monitorear la web en busca de contenido duplicado y proteger el contenido original para que no se copie sin atribución. Es posible que los creadores de contenido deban estar más atentos a la hora de hacer valer sus derechos y garantizar que su contenido esté correctamente indexado como fuente original.

Confianza basada en el conocimiento: estimación de la confiabilidad de las fuentes web

El artículo científico Knowledge-Based Trust: Estimating the Trustworthiness of Web Sources de Google trata sobre la determinación algorítmica de la credibilidad de los sitios web.

Este artículo científico trata sobre cómo determinar la confiabilidad de las fuentes en línea. Además del análisis de enlaces, se presenta un nuevo método que se basa en la verificación de la exactitud de la información publicada.

Proponemos un nuevo enfoque que se basa en señales endógenas, es decir, la exactitud de la información fáctica proporcionada por la fuente. Una fuente que tiene pocos datos falsos se considera confiable.

Para ello se utilizan métodos de minería de datos, que ya he comentado detalladamente en los artículos ¿ Cómo puede Google identificar e interpretar entidades a partir de contenido no estructurado? Procesamiento del lenguaje natural para construir una base de datos semántica .

A la puntuación de confiabilidad que calculamos la llamamos Confianza basada en el conocimiento (KBT). Sobre datos sintéticos, mostramos que nuestro método puede calcular de manera confiable los verdaderos niveles de confiabilidad de las fuentes.

El método anterior de evaluar la confiabilidad de las fuentes basándose en enlaces y datos del navegador sobre el comportamiento de uso del sitio web tiene debilidades, ya que las fuentes menos populares reciben una puntuación más baja y son injustamente menospreciadas, a pesar de que proporcionan muy buena información.

Con este enfoque, las fuentes se pueden calificar con una “puntuación de confiabilidad” sin incluir el factor de popularidad. Los sitios web que frecuentemente proporcionan información incorrecta están devaluados. Se premian los sitios web que publican información de acuerdo con el consenso general. Esto también reduce la probabilidad de que los sitios web que llaman la atención a través de noticias falsas ganen visibilidad en Google.

Vector de representación del sitio web

La patente de Google «Vectores de representación de sitios web» se utiliza para clasificar sitios web según su experiencia y autoridad.

Aquí hay un resumen de los puntos clave de la patente:

Google podría utilizar estos vectores de representación de sitios web para clasificar sitios según las características que se encuentran en esos sitios. Las clasificaciones pueden ser más diversas que representar categorías de sitios web dentro de dominios de conocimiento, desglosando las categorías mucho más.

Generando vectores de autor

Esta patente trata de la generación de vectores de autor mediante redes neuronales. Específicamente, la patente describe la obtención de un conjunto de secuencias de palabras, donde estas secuencias se clasifican como escritas por un autor específico. Estas secuencias incluyen una pluralidad de primeras secuencias de palabras, y para cada primera secuencia, una segunda secuencia respectiva de palabras que sigue a la primera secuencia. El sistema de red neuronal se entrena con esta primera y segunda secuencia de palabras para determinar un vector de autor que caracterice al autor.

Una vez que se ha calculado un vector de autor, se puede utilizar para determinar el grupo al que pertenece el vector de autor de un usuario. La respuesta generada por un sistema de respuesta automática puede luego condicionarse al vector de autor representativo de ese grupo.

Google podría utilizar las dos últimas patentes mencionadas para clasificar y evaluar entidades fuente como autores o empresas y dominios en áreas de actualidad. Esto podría utilizarse mediante incrustaciones y análisis de espacios vectoriales. Más sobre este tema en mi publicación ¿Cómo puede Google identificar y clasificar documentos relevantes mediante entidades, PNL y análisis de espacio vectorial?

Cómo lucha Google contra la desinformación

En este documento técnico que Google presenta en 2019 en la conferencia de seguridad de Munich hay muchas referencias interesantes al concepto EEAT. Resumí el documento técnico en mi publicación » Perspectivas del documento técnico» Cómo Google combate la desinformación «sobre EAT y clasificación».

Pautas para el evaluador de calidad de búsqueda

Las pautas para evaluadores de calidad de búsqueda se publican para los miles de evaluadores de calidad de todo el mundo que califican la calidad de los resultados de búsqueda. La retroalimentación tiene un impacto en el desarrollo de los algoritmos de clasificación. En las directrices, Google introdujo EAT por primera vez y puede encontrar información detallada sobre cómo debe calificar el evaluador de calidad en términos de EEAT. Por lo tanto, es el recurso más importante para adquirir conocimientos sobre EEAT.

Documentación de Google sobre Panda

No existe una relación oficialmente comunicada entre Panda ahora Coati y EEAT, pero la relación es obvia. Puede encontrar varios indicios en las declaraciones de Google de que Coati (ex Panda) también es parte de EEAT. Por lo tanto, debe verificar la información de Google sobre la calidad del contenido y Coati.

Google enfatiza la importancia de los sitios web de alta calidad en los resultados de búsqueda y brinda orientación sobre lo que constituye un sitio de alta calidad.

Resumen de la documentación:

Google sobre la creación de contenido útil, confiable y centrado en las personas

Los sistemas de clasificación de Google priorizan el contenido que sea útil y confiable para las personas, en lugar de centrarse únicamente en la clasificación de los motores de búsqueda.

Resumen de la documentación de Google:

En general, el mensaje clave es priorizar la creación de contenido útil y confiable que satisfaga las necesidades de las personas y se alinee con los principios de clasificación de Google.

Google sobre cómo comprender la autoridad de los temas de noticias

Google ha desarrollado un sistema llamado «autoridad de tema» para ayudar a determinar la experiencia de las publicaciones en áreas temáticas específicas, como salud, política o finanzas, con el fin de mostrar mejor contenido relevante y experto en la Búsqueda y Noticias de Google.

Resumen de la documentación:

El sistema de autoridad de temas analiza una variedad de señales para comprender el grado de experiencia que tiene una publicación en áreas particulares. Algunas de las señales más destacadas son:

. Leer artículo completo en Frikipandi EEAT: recursos de Google, patentes y artículos científicos para mejorar en SEO.

Entradas recientes para EEAT: recursos de Google, patentes y artículos científicos para mejorar en SEO

  1. Grandes juegos, grandes descuentos llega a PlayStation Store con una selección de más de 1.700 títulos para PlayStation 4 y PlayStation 5
  2. Videojuegos PlayStation Indies mayo 2024
  3. Lando Norris prueba el próximo EA SPORTS F1 24
  4. HONOR anuncia el lanzamiento del nuevo PORSCHE DESIGN HONOR Magic6 RSR en España
  5. GUNDAM BREAKER 4 aterriza en consolas y PC el 29 de agosto de 2024
Salir de la versión móvil