Monitorizar GoogleBot usando Google Analytics Presentación Slideshare

¿Por qué es importante saber lo que el robot de Google hace en tu site y cómo verlo? Debemos monitorizar GoogleBot usando Google Analytics. Es muy importante tener visibilidad sobre qué y cómo crawlean los robots GoogleBot, BingBot nuestro site.

Nos interesa conocer información de nuestro site para mejorarlo y limpiar cosas inútiles. Es interesante saber las URLs más frecuentadas por cada Bot. Medir a los bots en las paginaciones o con con parámetros. Medir los accesos a páginas con error 404 hace cada Bot. Tener más accesos no quiere decir que tengamos más tráfico. Es muy importante saber que urls tienen muchos accesos y muy pocas visitas.

Os dejo una presentación en Slideshare de Lino Uruñuela uno de los mejores SEO con los que he trabajado en ABC.es. Lino eres muy grande lo que aprendí de tí.

Monitorizar GoogleBot usando Google Analytics Presentación Slideshare

¿Por qué es importante conocer cómo Google crawlea tu site y cómo hacerlo paso a paso?

Al final es la foma que tien Google de llegar a nuestro contenido. A parte de los sitemap Gogole recorre nuestros sitios con una cierta frecuencia .Leen el contenido y lo guardan y sigue buscando enlaces para continuar. Si sabemos lo que hacen podremos mejorar nuestro sitio.

¿Qué no le gusta a GoogleBot?

Si recibe información confusa, errónea o le engañamos su comportamiento será peor en nuestro site. Si ve demasiada información irrelevante. Contenido pequeño o parámetros.
Los errores 404
Dejarle perdido en paginaciones inútiles
Las redirecciones 301 en cadena.

¿Cómo podemos saber lo que ve Google?
Search Console, pero no nos permite filtrar por url. Pero no sabemos si se está volviendo loco en alguna paginación.
Nos gustaría saber las urls que más visita para mejorarlas y las que menos. A lo mejor a parte de nuestro site ni llega por fallo en la AI.
No sabemos cuántas de esas urls llevan canonical, o noindex

Aparte de Search Console con Google Analytics y una nueva propiedad de Google Analytics podemos tener esa información. Además es muy sencilla de implementar y nos permite filtrar por url, segmentar por secciones, saber que filtros está rastreando y con que frecuencia. Al final nos permite tener un historial mucho mayor que el de Search Console. Además de crear fácilmente segmentos personalizados Segmentos por Response Status ¿Cuántas URLs dan 404?

¿Cómo se hace Monitorizar GoogleBot usando Google Analytics?

Lo primero Configuración de Google Analytics

1.Crea una nueva propiedad, o cuenta en Google Analytics para no romper la que usamos.
2.Añadir dos dimensiones personalizadas desde la zona de administración de la cuenta de Google Analytics. La podemos llamar como queramos, lo importante es el número de dimensión que es Obtener número de la dimensión. Recomiendo HTTPstatus y HTTPuserAgent
3.Usar el código de Abcjo cambiando el número de dimensión (solo si corresponde, si es una cuenta nueva será la cd1 y cd2) y el identificador de Google Analytics UA-XXXXX-XX
4.Poner el código PHP al final de la carga en cada url de tu site
5. En la página de error 404. Llamar a la clase con BotTracker::track($_SERVER, array(“page_title”=>$titulo_Pagina, “http_code”=> “404”));

Lo segundo es añadir el código a incluir en todas las páginas de tu site como un include analyticsgooglebot.php

<?php
class BotTracker {

static function track($s, $params){

if(preg_match("/googlebot|bingbot/i", $s['HTTP_USER_AGENT'], $matches)){

$bot = $matches[0];

$data = array(
'v' => 1,
'tid' => 'UA-XXXXX-XX',
'cid' => self::generate_uuid(),
't' => 'pageview',
'dh' => $s['HTTP_HOST'],
'dl' => $s['REQUEST_URI'],
'dr' => $s['HTTP_REFERER'],
'dp' => $s['REQUEST_URI'],
'dt' => $params['page_title'],
'cs' => $bot,
'cm' => 'direct',
'cn' => '',
'ck' => $s['HTTP_USER_AGENT'],
'cc' => '',
'uip' => $s['REMOTE_ADDR'],
'cd1' => $s['HTTP_USER_AGENT'],
'cd2' => $params['http_code'],
);

$url = 'http://www.google-analytics.com/collect';
$content = http_build_query($data);

$ch = curl_init();
curl_setopt($ch, CURLOPT_USERAGENT, $s['HTTP_USER_AGENT']);
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 0);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT_MS, 0);
curl_setopt($ch, CURLOPT_TIMEOUT_MS, 0);
curl_setopt($ch, CURLOPT_HTTPHEADER, array('Content-type: application/x-www-form-urlencoded'));
curl_setopt($ch, CURLOPT_HTTP_VERSION, CURL_HTTP_VERSION_1_1);
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch,CURLOPT_ENCODING , "gzip");
curl_setopt($ch, CURLOPT_POSTFIELDS, $content);
$result = curl_exec($ch);
$info= curl_getinfo($ch);
curl_close($ch);
}

}
static private function generate_uuid() {

return sprintf( '%04x%04x-%04x-%04x-%04x-%04x%04x%04x',
mt_rand( 0, 0xffff ), mt_rand( 0, 0xffff ),
mt_rand( 0, 0xffff ),
mt_rand( 0, 0x0fff ) | 0x4000,
mt_rand( 0, 0x3fff ) | 0x8000,
mt_rand( 0, 0xffff ), mt_rand( 0, 0xffff ), mt_rand( 0, 0xffff )
);
}

}
BotTracker::track($_SERVER, array("page_title"=>$titulo_Pagina, "http_code"=> "200"));
?>

Espero que os guste la presentación del Gran SEO Lino Uruñuela http://www.mecagoenlos.com/Posicionamiento/monotorizar-googlebot-con-google.php

Te interesa

YouTube Rewind 2017: video resumen con los momentos y creadores más virales del año #YoutubeRewind2017

YouTube Rewind 2017: video resumen con los momentos y creadores más virales del año. #YoutubeRewind2017 …

  • Un autentico honor!!!!
    Pues si vieras lo que hago con los logs 😉
    ¿Todo bien?

  • Juan Cascón

    Todo bien. Me puedo imaginar algo de lo que hacemos con los logs

Últimas noticias de Frikipandi.com

Las noticias se actualizan cada 15 minutos.