{"id":4091,"date":"2022-05-09T12:16:39","date_gmt":"2022-05-09T12:16:39","guid":{"rendered":"https:\/\/klawter.com\/blog\/?p=4091\/"},"modified":"2024-09-27T10:09:14","modified_gmt":"2024-09-27T10:09:14","slug":"rastreo-e-indexacion-como-funcionan-los-motores-de-busqueda","status":"publish","type":"post","link":"https:\/\/klawter.com\/blog\/rastreo-e-indexacion-como-funcionan-los-motores-de-busqueda\/","title":{"rendered":"Rastreo e indexaci\u00f3n: \u00bfC\u00f3mo funcionan los motores de b\u00fasqueda?"},"content":{"rendered":"\n

Hoy en d\u00eda, existen numerosos motores de b\u00fasqueda disponibles en internet que utilizamos diariamente para hacer miles de consultas y es realmente abrumadora la gran cantidad de informaci\u00f3n que estos nos proporcionan.<\/p>\n\n\n\n

Buscadores como Google, Yahoo, Bing, Baidu, etc son ejemplo de ello, cada uno con sus propias capacidades y caracter\u00edsticas, pero, actualmente hay un rey en cuanto a motores de b\u00fasqueda se refiere y ese es Google, el buscador m\u00e1s popular y utilizado  actualmente en todo el mundo.<\/p>\n\n\n\n

Pero, ahora que ya hemos puesto en pie su importancia, \u00bfRealmente te has preguntado c\u00f3mo funciona un buscador para dar respuesta a las preguntas de los usuarios? \u00bfC\u00f3mo es posible que Google encuentre lo que est\u00e1s buscando con tanta velocidad y precisi\u00f3n?<\/strong><\/p>\n\n\n\n

Para entenderlo, nos centraremos en explicarte c\u00f3mo funciona el buscador Google en detalle.<\/p>\n\n\n\n

\u00bfC\u00f3mo funcionan los motores de b\u00fasqueda?<\/strong><\/h2>\n\n\n\n

Todo comienza cuando introducimos una palabra o frase en el buscador, que, tras darle a buscar, Google nos muestra millones de p\u00e1ginas web al momento que contienen o pueden contener informaci\u00f3n para dar respuesta a nuestra consulta.<\/p>\n\n\n\n

El principal objetivo de Google es ofrecerle al usuario la informaci\u00f3n que este necesita, es decir, informaci\u00f3n relevante, y para ello selecciona que resultados mostrarte primero y los ordena seg\u00fan la prioridad que crea adecuada para tu b\u00fasqueda.<\/p>\n\n\n\n

El funcionamiento de buscador Google puede dividirse en tres fases: Rastreo, indexaci\u00f3n y devoluci\u00f3n de resultados de b\u00fasqueda.<\/p>\n\n\n\n

1. Rastreo en Google<\/strong><\/h3>\n\n\n\n

El primer paso que lleva a cabo el buscador es el rastreo de los millones de p\u00e1ginas web que hay en internet ya que continuamente se est\u00e1n creando nuevas p\u00e1ginas o se actualizan las que ya est\u00e1n creadas.<\/p>\n\n\n\n

Para ello, lo primero que debe hacer Google es averiguar que p\u00e1ginas hay dentro de una web, pero \u00bfC\u00f3mo lo hace?<\/p>\n\n\n\n

Este rastreo comienza a partir de una lista de direcciones web que Google ha obtenido de anteriores rastreos o tambi\u00e9n de los archivos Sitemaps que han sido elaborados por los propietarios de los sitios web. Un sitemap es un archivo XML que contiene una lista con todas las URL que queremos que indexe Google y con este listado le comunicas a Google las actualizaciones que has hecho en tu web, las p\u00e1ginas que quieres que indexe y con qu\u00e9 frecuencia se actualiza tu web.<\/p>\n\n\n\n

Para crawlear o rastrear estas webs Google se ayuda de los Googlebot<\/em><\/strong> o llamado de forma m\u00e1s coloquial las \u201cara\u00f1as de Google\u201d o \u201cCrawler de Google\u201d que entran, leen el c\u00f3digo fuente de tu p\u00e1gina y analizan el contenido para ver que ha cambiado con respecto a versiones anteriores o van siguiendo los enlaces que contienen estas p\u00e1ginas para descubrir nuevas.  <\/strong><\/p>\n\n\n\n

Toda esta informaci\u00f3n se lleva al servidor para que se procese, clasifique y pondere las optimizaciones seo que tiene esa p\u00e1gina web. Posteriormente hablaremos de ello en la fase de indexaci\u00f3n.<\/p>\n\n\n\n

Por otro lado, as\u00ed como hay p\u00e1ginas que quieres que Google rastree, hay otras muchas que deseas que no se visiten<\/strong>, por ejemplo, aquellas p\u00e1ginas que son irrelevantes para el negocio como las p\u00e1ginas legales o bloquear partes de la web que generan contenido duplicado por ejemplo las categor\u00edas del sitio web, y para ello debes decirle a Google que no te las rastree y esto se hace con un archivo robots<\/strong>.txt<\/strong>. Estos archivos robots.txt tambi\u00e9n sirven para gestionar el tr\u00e1fico de los rastreadores al sitio web.<\/p>\n\n\n\n

Todo este proceso de rastreo tiene un<\/strong> tiempo finito<\/strong>, es lo que se conoce como Crawl Budget<\/strong>, es decir, que tienes un n\u00famero de milisegundos asignado para que los bots paseen por tu web para rastrearla. Google asigna seg\u00fan la autoridad, accesibilidad, velocidad y calidad m\u00e1s o menos tiempo de rastreo, y este Crawl Budget puede optimizarse.<\/strong><\/p>\n\n\n\n

\"Rastreo<\/figure>\n\n\n\n

<\/p>\n\n\n\n

 <\/h4>\n\n\n\n

Problemas de rastreo<\/strong><\/h4>\n\n\n\n

Puede haber casos que las ara\u00f1as de Google no puedan rastrear bien la p\u00e1gina web. Los problemas pueden ser los siguientes:<\/p>\n\n\n\n