¿Cómo dejar a Google indexar o no parte de tu contenido? Nuevas especificacion de la metaetiqueta robots




¿Cómo dejar a Google indexar o no parte de tu contenido? Nuevas especificacion de la metaetiqueta robots
¿Cómo dejar a Google indexar o no parte de tu contenido? Nuevas especificacion de la metaetiqueta robots

¿Cómo dejar a Google indexar o no parte de tu contenido? Nuevas especificacion de la metaetiqueta robots. Google usa vistas previas de contenido, incluyendo fragmentos de texto y otros contenidos, para ayudar a los usuarios a decidir si un resultado es relevante para su búsqueda y hacer clik dentro de Google. El tipo de vista previa que se muestra depende de muchos factores, incluido el tipo de contenido que busca una persona y el tipo de dispositivo en el que lo está viendo. Por ejemplo en bñusquedas mñoviles se premia AMP.

Por ejemplo, si buscas resultados de recetas o noticias en Google, es posible que veas imágenes en miniatura y calificaciones de los usuarios, cosas que pueden ser más útiles que los fragmentos de texto a la hora de decidir qué quieres comer. En otro ejemplo, si estás buscando un concierto cerca de ti, puedes ver todos los detalles del evento directamente en los resultados de búsqueda. Todo esto es posible gracias a los editores que marcan sus páginas con datos estructurados.

¿Cómo dejar a Google indexar o no parte de tu contenido? Nuevas especificacion de la metaetiqueta robots, nosnippet de datos y X-Robots-Tag

Google genera automáticamente las vistas previas con el objetivo de ayudar al usuario a comprender por qué los resultados mostrados son relevantes.Las metaetiquetas de robots controlan la cantidad de contenido que Google extrae automáticamente de las páginas web para mostrar como resultados de búsqueda.

Os detallamos cómo se pueden usar las configuraciones de nivel de página y texto para ajustar cómo Google presenta su contenido en los resultados de búsqueda. Puede especificar la configuración a nivel de página incluyendo una metaetiqueta en páginas HTML o en un encabezado HTTP. Puede especificar configuraciones de nivel de texto con el data- nosnippetatributo en elementos HTML dentro de una página.

Usando la metaetiqueta robots

Antes solo era posible permitir o no el uso de un fragmento de texto. Ahora presentamos un conjunto de métodos que permiten una configuración más detallada del contenido como la logitud a mostrar

La metaetiqueta robots le permite utilizar un enfoque granular específico de la página para controlar cómo una página individual debe indexarse ​​y servirse a los usuarios en los resultados de la Búsqueda de Google. Coloque la metaetiqueta de robots en la <head>sección de una página determinada, así:

<! DOCTYPE html>
<html> <head>
<meta name = "robots" content = "noindex" /> 
(...)
</head>
<body> (...) </body>
</html>

La metaetiqueta robots en el ejemplo anterior indica a los motores de búsqueda que no muestren la página en los resultados de búsqueda. El valor del nameatributo ( robots) especifica que la directiva se aplica a todos los rastreadores. Para abordar un rastreador específico, reemplace el robots valor del nameatributo con el nombre del rastreador al que se dirige. Los rastreadores específicos también se conocen como agentes de usuario (un rastreador usa su agente de usuario para solicitar una página). El rastreador web estándar de Google tiene el nombre de agente de usuario Googlebot. Para evitar que solo Googlebot rastree su página, actualice la etiqueta de la siguiente manera:

<meta name = "googlebot" content = "noindex" />

Esta etiqueta ahora le indica a Google específicamente que no muestre esta página en sus resultados de búsqueda. Tanto el namey los contentatributos no son sensibles al caso.

Los motores de búsqueda pueden tener diferentes rastreadores para diferentes propiedades o propósitos. Vea la lista completa de los rastreadores de Google . Por ejemplo, para mostrar una página en los resultados de búsqueda web de Google, pero no en Google Noticias, use la siguiente metaetiqueta:

<meta name = "googlebot-news" content = "noindex" />

Para especificar múltiples rastreadores individualmente, use múltiples metaetiquetas de robots:

<meta name = "googlebot" content = "noindex">
<meta name = "googlebot-news" content = "nosnippet">

Usando el X-Robots-Tagencabezado HTTP

Se X-Robots-Tagpuede usar como un elemento de la respuesta del encabezado HTTP para una URL determinada. Cualquier directiva que se pueda utilizar en una metaetiqueta de robots también se puede especificar como un X-Robots-Tag. Aquí hay un ejemplo de una respuesta HTTP con un X-Robots-Tagrastreador que indica que no indexe una página:

HTTP / 1.1 200 OK
Fecha: martes 25 de mayo de 2010 21:42:43 GMT
(...) 
X-Robots-Tag: noindex 
(...)

Se X-Robots-Tagpueden combinar varios encabezados dentro de la respuesta HTTP, o puede especificar una lista de directivas separadas por comas. Aquí hay un ejemplo de una respuesta de encabezado HTTP que tiene un noarchive X-Robots-Tagcombinado con un unavailable_after X-Robots-Tag.

HTTP / 1.1 200 OK
Fecha: martes 25 de mayo de 2010 21:42:43 GMT
(...) 
X-Robots-Tag: noarchive
X-Robots-Tag: unavailable_after: 25 de junio de 2010 15:00:00 PST 
(...)

El X-Robots-Tagpuede especificar opcionalmente un agente de usuario antes de las directivas. Por ejemplo, el siguiente conjunto de X-Robots-Tagencabezados HTTP se puede usar para permitir condicionalmente mostrar una página en los resultados de búsqueda para diferentes motores de búsqueda:

HTTP / 1.1 200 OK
Fecha: martes 25 de mayo de 2010 21:42:43 GMT
(...) 
X-Robots-Tag: googlebot: nofollow
X-Robots-Tag: otrobot: noindex, nofollow 
(...)

Las directivas especificadas sin un agente de usuario son válidas para todos los rastreadores. El encabezado HTTP, el nombre del agente de usuario y los valores especificados no distinguen entre mayúsculas y minúsculas.

Directivas válidas de indexación y publicación

Las metaetiquetas robots que especifican el contenido de la vista previa de una página son:

  • «nosnippet»

Esta es una opción existente que permite especificar que no deseas que se muestre un fragmento de texto para esa página.

  • «max-snippet:[número]»

¡Nuevo! Te permite especificar la longitud máxima del texto, en caracteres, de un fragmento para tu página.

  • «max-video-preview:[número]»

¡Nuevo! Especifica una duración máxima en segundos para una vista previa de video animado.

  • «max-image-preview:[parámetro]»

¡Nuevo! Te permite especificar un tamaño máximo de vista previa que se mostrará para las imágenes en esa página, utilizando el parámetro «none», «standard» o «large».

Se pueden combinar, por ejemplo:
<meta name=»robots» content=»max-snippet:50, max-image-preview:large»>

Las preferencias de vista previa a partir de estas metaetiquetas entrarán en efecto a mediados o finales de octubre de 2019Las siguientes directivas se pueden usar para controlar la indexación y el servicio con la metaetiqueta de robots y la X-Robots-Tag. Cada valor representa una directiva específica. La siguiente tabla muestra todas las directivas que Google cumple y su significado. Se pueden combinar varias directivas en una lista separada por comas . Estas directivas no distinguen entre mayúsculas y minúsculas. Dentro de los resultados de búsqueda, un fragmento es un breve extracto de texto utilizado para demostrar la relevancia de un documento para la consulta de un usuario.

Directivas

all
No hay restricciones para indexar o servir. Esta directiva es el valor predeterminado y no tiene efecto si se enumera explícitamente.
noindex
No mostrar esta página en los resultados de búsqueda.
nofollow
No siga los enlaces en esta página.
none
Equivalente a noindex, nofollow.
noarchive
No mostrar un enlace en caché en los resultados de búsqueda.
nosnippet
No muestre un fragmento de texto o una vista previa de video en los resultados de búsqueda de esta página. Una miniatura de imagen estática (si está disponible) aún puede ser visible, cuando resulta en una mejor experiencia de usuario. Esto se aplica a todas las formas de resultados de búsqueda (en Google: búsqueda web, Google Images, Discover).
max-snippet:[number]
Use un máximo de [number]caracteres como fragmento de texto para este resultado de búsqueda. (Tenga en cuenta que una URL puede aparecer como múltiples resultados de búsqueda dentro de una página de resultados de búsqueda). Esto no afecta las vistas previas de imágenes o videos. Esto se aplica a todas las formas de resultados de búsqueda (como la búsqueda web de Google, Google Images, Discover, Assistant). Sin embargo, este límite no se aplica en los casos en que un editor ha otorgado permiso por separado para el uso de contenido. Por ejemplo, si el editor proporciona contenido en forma de datos estructurados in-page o tiene un acuerdo de licencia con Google, esta configuración no interrumpe esos usos permitidos más específicos. Esta directiva se ignora si no [number]se especifica el análisis .

Valores especiales:

  • 0: No se muestra ningún fragmento. Equivalente a nosnippet.
  • -1: No hay límite de longitud de fragmento.

max-snippet es efectivo a partir de finales de octubre de 2019.

Ejemplo:

<meta name = "robots" content = "max-snippet: 160">
max-image-preview:[setting]
Establezca el tamaño máximo de una vista previa de la imagen para esta página en los resultados de búsqueda.

settingValores aceptados :

  • none: No se mostrará ninguna vista previa de la imagen.
  • standard: Se puede mostrar una vista previa de imagen predeterminada.
  • large: Se puede mostrar una vista previa de la imagen más grande, hasta el ancho de la ventana gráfica.

Esto se aplica a todas las formas de resultados de búsqueda (como la búsqueda web de Google, Google Images, Discover, Assistant). Sin embargo, este límite no se aplica en los casos en que un editor ha otorgado permiso por separado para el uso de contenido. Por ejemplo, si el editor proporciona contenido en forma de datos estructurados in-page o tiene un acuerdo de licencia con Google, esta configuración no interrumpirá esos usos permitidos más específicos.

max-image-preview es efectivo a partir de finales de octubre de 2019.

Ejemplo:

<meta name = "robots" content = "max-image-preview: standard">
max-video-preview:[number]
Use un máximo de [number]segundos como fragmento de video para los videos de esta página en los resultados de búsqueda.

Otros valores admitidos:

  • 0: Como máximo, se puede usar una imagen estática, de acuerdo con la configuración max-image-preview.
  • -1: No hay límite.

Esto se aplica a todas las formas de resultados de búsqueda (en Google: búsqueda web, Google Images, Google Videos, Discover, Assistant). Esta directiva se ignora si no [number]se especifica el análisis .

max-video-preview es efectivo a partir de finales de octubre de 2019.

Ejemplo:

<meta name = "robots" content = "max-video-preview: -1">
notranslate
No ofrezca la traducción de esta página en los resultados de búsqueda.
noimageindex
No indexe imágenes en esta página.
unavailable_after: [RFC-850 date/time]
No muestre esta página en los resultados de búsqueda después de la fecha / hora especificada. La fecha / hora debe especificarse en el formato RFC 850 . La directiva se ignora si no [date/time]se especifica ninguna válida . Por defecto no hay fecha de vencimiento para el contenido.

Ejemplo:

<meta name = "robots" content = "unavailable_after: domingo, 01-sep-24 01:00:00 PDT">

Manejo de directivas combinadas de indexación y publicación

Puede crear una instrucción multidireccional combinando directivas de metaetiquetas de robots con comas. Aquí hay un ejemplo de una metaetiqueta de robots que indica a los rastreadores web que no indexen la página y que no rastreen ninguno de los enlaces de la página:

<meta name = "robots" content = "noindex, nofollow">

Aquí hay un ejemplo que limita el fragmento de texto a 20 caracteres y permite una vista previa de la imagen grande:

<meta name = "robots" content = "max-snippet: 20, max-image-preview: large">

Para situaciones en las que se especifican varios rastreadores junto con diferentes directivas, el motor de búsqueda utilizará la suma de las directivas negativas. Por ejemplo:

<meta name = "robots" content = "nofollow">
<meta name = "googlebot" content = "noindex">

La página que contiene estas metaetiquetas se interpretará como una noindex, nofollowdirectiva cuando Googlebot la rastree.

Usar el atributo HTML de nosnippet de datos

Una nueva forma de ayudar a limitar qué parte de una página es elegible para mostrarse como un fragmento es el atributo HTML «data-nosnippet» en los elementos span, div y section. El data-nosnippetatributo es efectivo a partir de 2019.

Puede designar partes textuales de una página HTML para que no se usen como un fragmento. Esto se puede hacer a nivel de elementos HTML con el data-nosnippetatributo HTML en spandivsectionelementos. El data-nosnippetse considera un atributo booleano , es válido con o sin un valor. Para garantizar la legibilidad de la máquina, la sección HTML debe ser HTML válido y todas las etiquetas apropiadas deben cerrarse en consecuencia.

Ejemplos:

<p> Este texto se puede mostrar en un fragmento
 <span data-nosnippet> y esta parte no se mostraría </span>. </p>

<div data-nosnippet> no en el fragmento </div>
<div data-nosnippet = "true"> tampoco está en el fragmento </div>

<div data-nosnippet> algún texto </html>
<! - "div" no cerrado incluirá todo el contenido después ->

<mytag data-nosnippet> algún texto </mytag>
<! - NO VÁLIDO: no es un span, div o sección ->

Google normalmente representa páginas para indexarlas, sin embargo, no se garantiza la representación. Debido a esto, la extracción de data-nosnippetpuede ocurrir tanto antes como después del renderizado. Para evitar la incertidumbre de la representación, no agregue ni elimine el data-nosnippet atributo de los nodos existentes a través de JavaScript. Al agregar elementos DOM a través de JavaScript, incluya el data-nosnippetatributo según sea necesario al agregar inicialmente el elemento al DOM de la página. Si se utilizan elementos personalizados, envuelva o hacerlas con divspansectionelementos si es necesario utilizar data- nosnippet.

Algunas características especiales de la Búsqueda dependen de la disponibilidad del contenido de vista previa, por lo que limitar tus vistas previas puede evitar que tu contenido aparezca en estas áreas, asi que como buen SEO usaa estos valores con cuidad.

Usando datos estructurados

Las metaetiquetas de robots controlan la cantidad de contenido que Google extrae automáticamente de las páginas web para mostrar como resultados de búsqueda. Pero muchos editores también usan datos estructurados de schema.org para poner a disposición información específica para la presentación de búsqueda . Las limitaciones de metaetiquetas de robots no afectan el uso de esos datos estructurados. Para administrar el uso de datos estructurados para sus páginas web, simplemente puede modificar los tipos y valores de datos estructurados, agregando o eliminando información para proporcionar solo los datos que desea poner a disposición. También tenga en cuenta que los datos estructurados siguen siendo utilizables para los resultados de búsqueda cuando se declaran dentro de un data-nosnippetelemento.

Implementación práctica de X-Robots-Tag

Puede agregar las X-Robots-Tagrespuestas HTTP a un sitio a través de los archivos de configuración del software del servidor web de su sitio. Por ejemplo, en los servidores web basados ​​en Apache puede usar archivos .htaccess y httpd.conf. El beneficio de usar un X-Robots-Tagcon respuestas HTTP es que puede especificar directivas de rastreo que se aplican globalmente en un sitio. El soporte de expresiones regulares permite un alto nivel de flexibilidad.

Por ejemplo, para agregar una noindex, nofollow X-Robots-Tagrespuesta HTTP a todos los archivos .PDF en todo un sitio, agregue el siguiente fragmento al archivo raíz .htaccess del sitio o al archivo httpd.conf en Apache, o al archivo .conf del sitio en NGINX

Apache:

<Archivos ~ "\ .pdf $">
  Conjunto de encabezado X-Robots-Tag "noindex, nofollow"
</Files>

NGINX:

ubicación ~ * \ .pdf $ {
  add_header X-Robots-Tag "noindex, nofollow";
}

Puede utilizar X-Robots-Tagarchivos no HTML como archivos de imagen donde no es posible el uso de metaetiquetas de robots en HTML. Aquí hay un ejemplo de cómo agregar una noindex X-Robots-Tagdirectiva para archivos de imágenes (.png, .jpeg, .jpg, .gif) en todo un sitio:

Apache:

<Archivos ~ "\. (Png | jpe? G | gif) $">
  Conjunto de encabezado X-Robots-Tag "noindex"
</Files>

NGINX:

ubicación ~ * \. (png | jpe? g | gif) $ {
  add_header X-Robots-Tag "noindex";
}

Combinación de rastreo con directivas de indexación / publicación

Las metaetiquetas de robots y los X-Robots-Tagencabezados HTTP se descubren cuando se rastrea una URL. Si no se permite que una página se rastree a través del archivo robots.txt, no se encontrará ninguna información sobre las directivas de indexación o publicación y, por lo tanto, se ignorará. Si se deben seguir las directivas de indexación o publicación, no se puede rechazar el rastreo de las URL que contienen esas directivas.

El formato AMP

El formato AMP conlleva ciertos beneficios, incluyendo la elegibilidad para una presentación más destacada de imágenes en miniatura en los resultados de búsqueda y en el feed de Google Discover. Se ha demostrado que estas características generan más tráfico a los artículos de los editores. Sin embargo, los editores que no desean que Google use imágenes en miniatura más grandes cuando se presentan sus páginas AMP en la búsqueda y en Discover, pueden usar las preferencias de meta robots anteriores para establecer la metaetiqueta max-image-preview como «standard» o «none».

Estas nuevas opciones están disponibles para los propietarios de contenido en todo el mundo y funcionarán del mismo modo para los resultados que mostramos a nivel mundial. Esperamos que te ayuden a optimizar el valor que obtienes de la Búsqueda y a alcanzar tus objetivos comerciales. Para obtener más información, consulta nuestra documentación para desarrolladores sobre metaetiquetas. Si tienes alguna pregunta visita los foros de ayuda para webmasters.

. Leer artículo completo en Frikipandi ¿Cómo dejar a Google indexar o no parte de tu contenido? Nuevas especificacion de la metaetiqueta robots.

Te interesa

Los 10 principales modelos de lenguaje grande (LLM) en redes sociales

Los 10 principales modelos de lenguaje grande (LLM) en redes sociales

GlobalData revela lista de los 10 principales modelos de lenguaje grande (LLM) en redes sociales …

Últimas noticias de Frikipandi.com

Las noticias se actualizan cada 15 minutos.