El presupuesto de rastreo es el número de páginas que un motor de búsqueda rastreará en tu sitio en un periodo de tiempo dado. Conoce cómo funciona, quién lo necesita y cómo optimizarlo en 2026.

El presupuesto de rastreo describe cuánta atención de rastreo asigna un motor de búsqueda a tu sitio web. Googlebot no rastrea cada página de internet por igual ni de forma constante; toma decisiones económicas sobre dónde gastar sus recursos finitos. El presupuesto de rastreo es el resultado práctico de esas decisiones para tu dominio concreto: el conjunto de URLs que Google puede obtener y quiere obtener en una ventana de tiempo.
Google no publica un número para tu presupuesto de rastreo ni te deja fijar uno manualmente. En su lugar, la documentación de Google sobre el presupuesto de rastreo explica que surge de dos factores subyacentes. Entender esos factores es la clave para influir en lo a fondo y con qué frecuencia se rastrean tus páginas, sobre todo a medida que los rastreadores de IA añaden nueva presión sobre los recursos del servidor en 2026.
El límite de capacidad de rastreo es el número máximo de conexiones simultáneas que Googlebot usará para rastrear tu sitio, más el retardo entre obtenciones. Lo rige la salud de tu servidor. Si tu sitio responde rápido y sin errores, Google eleva el límite y rastrea de forma más agresiva. Si tu servidor se ralentiza o devuelve errores 5xx, Google se retira para evitar sobrecargarte.
La demanda de rastreo es cuánto quiere Google rastrear tus páginas en primer lugar. Aumenta con la popularidad (URLs que atraen tráfico y enlaces), el inventario percibido (cuántas páginas útiles cree Google que tienes) y la obsolescencia (páginas que Google cree que necesitan actualizarse). Un sitio grande, actualizado con frecuencia y con autoridad genera una alta demanda de rastreo; un sitio pequeño y estático genera una demanda baja.
Tu presupuesto de rastreo efectivo es el punto de encuentro de estos dos. Una capacidad alta con una demanda baja aún significa un rastreo ligero, y una demanda alta frenada por un servidor lento significa páginas que se quedan sin rastrear. Ambas palancas importan, e interactúan con tu huella global de rastreo.
La mayoría de los sitios web no necesitan pensar en absoluto en el presupuesto de rastreo. Si tienes unos cientos o unos pocos miles de páginas y tu servidor es razonablemente rápido, Google rastreará todo lo importante sin dificultad. Dedicar energía a optimizar el presupuesto de rastreo en un sitio pequeño suele ser un esfuerzo desperdiciado.
Google dirige explícitamente sus recomendaciones a tres grupos: sitios grandes con un millón o más de páginas únicas que cambian al menos semanalmente, sitios de medianos a grandes de 10.000 o más páginas únicas que cambian a diario, y cualquier sitio en el que una gran parte de las URLs aparezca como descubierta pero actualmente sin indexar en Search Console. Si encajas en uno de estos grupos, el presupuesto de rastreo se convierte en una limitación real que controla directamente qué páginas se indexan y lo frescas que se mantienen.
La señal más clara vive en Google Search Console. Abre el informe de estadísticas de rastreo para ver cuántas peticiones hace Googlebot al día, el tiempo de respuesta medio y cualquier error de disponibilidad. Un alto número de peticiones gastado en URLs de poco valor, o unos tiempos de respuesta crecientes, apunta a una ineficiencia.
Vigila el informe de páginas para el estado de descubierta pero actualmente sin indexar. Cuando Google ha encontrado una URL pero no la ha rastreado, tus páginas importantes pueden estar esperando detrás de una cola de basura. El análisis de los registros del servidor es el método más preciso: muestra exactamente qué URLs obtiene Googlebot y con qué frecuencia, revelando adónde va realmente tu presupuesto frente a adónde quieres que vaya.
Las mayores fugas son predecibles. La navegación por facetas y los parámetros de URL pueden generar combinaciones casi infinitas de páginas filtradas y ordenadas, cada una una URL única que Googlebot puede intentar rastrear. Los identificadores de sesión en las URLs crean la misma explosión de duplicados. Cada una de estas obtenciones desperdiciadas es una obtención no dedicada a una página real.
Otros desperdiciadores comunes incluyen las cadenas largas de redirecciones, las páginas soft 404 que devuelven un estado 200 para contenido inexistente, el contenido duplicado en múltiples URLs, las páginas de desplazamiento infinito o de calendario que generan enlaces sin fin y los sitemaps obsoletos que apuntan a URLs muertas. Cada uno de estos consume capacidad de rastreo que debería ir hacia tu producto, artículo o página de aterrizaje más reciente y hacia una mejor indexación de las páginas que te importan.
Empieza bloqueando lo que Google no debería rastrear. Usa tu archivo robots.txt para impedir el rastreo de parámetros de facetas, resultados de búsqueda internos y otros patrones de URL de poco valor. Google señala que robots.txt, no noindex, es la herramienta adecuada aquí: una página con noindex aún tiene que rastrearse para leerse, lo que gasta presupuesto, mientras que una ruta impedida se omite.
A continuación, ordena tus códigos de estado. Devuelve un 404 o un 410 para las páginas que has eliminado de forma permanente para que Google deje de solicitarlas. Consolida el contenido duplicado tras etiquetas canónicas y elimina las cadenas de redirecciones apuntando los enlaces directamente a la URL final. Cada arreglo recupera obtenciones para las páginas que las merecen.
Por último, mantén tu sitemap XML preciso con fechas lastmod honestas, y mejora la velocidad del servidor para que Google eleve tu límite de capacidad de rastreo. Un sitio más rápido es un sitio rastreado más a fondo, en igualdad de condiciones.
Googlebot ya no es el único rastreador que compite por la atención de tu servidor. Los motores de IA despliegan sus propios bots, incluidos GPTBot y OAI-SearchBot de OpenAI, ClaudeBot de Anthropic y PerplexityBot, para reunir y actualizar el contenido que citan en sus respuestas. Estos rastreadores consumen ancho de banda y ciclos de servidor reales.
Los datos de servidor de 2025 mostraron que el tráfico de rastreadores de IA y de búsqueda subía con fuerza, con varios bots creciendo cientos por ciento de un año a otro. El efecto práctico es que el mismo trabajo de salud del sitio y de eficiencia que protege tu presupuesto de rastreo de Google también protege el rendimiento para los rastreadores de IA. Un servidor rápido y una estructura de URL limpia ayudan a cada bot, desde Googlebot hasta los motores que impulsan la búsqueda con IA, a invertir su limitado rastreo en páginas que vale la pena obtener.
El rastreo y la indexación son pasos distintos, y confundirlos lleva a un esfuerzo desperdiciado. El presupuesto de rastreo rige si Google obtiene una URL y con qué frecuencia. La indexación es la decisión separada sobre si una página rastreada merece almacenarse y servirse en los resultados. Una página puede rastrearse y luego dejarse deliberadamente sin indexar porque Google la juzgó de poco valor.
Esto importa para el diagnóstico. Si una página está descubierta pero no rastreada, eso es un problema de presupuesto de rastreo o de descubrimiento, y se aplican los arreglos anteriores. Si una página está rastreada pero no indexada, el problema suele ser la calidad del contenido, el contenido escaso o la duplicación, y ninguna cantidad de optimización de rastreo lo arreglará. Identifica qué etapa está fallando antes de actuar.
El presupuesto de rastreo es el número de URLs que un motor de búsqueda puede y quiere rastrear en tu sitio en un periodo de tiempo dado, establecido por el límite de capacidad de rastreo (la salud de tu servidor) y la demanda de rastreo (tu popularidad, inventario y frescura). Es una preocupación genuina para los sitios grandes de 10.000 o más páginas y para cualquier sitio con muchas URLs descubiertas pero sin indexar, y en gran medida un no problema para los pequeños. Para optimizarlo, bloquea las URLs de poco valor con robots.txt, corrige los códigos de estado y las cadenas de redirecciones, elimina los duplicados, mantén tu sitemap preciso y acelera tu servidor. En 2026, esa misma higiene también mantiene eficientes a los rastreadores de IA. Ejecuta una auditoría GEO SEO de Sorank para encontrar el desperdicio de rastreo que perjudica tu indexación.
No hay un único número objetivo, y Google no lo publica ni te deja fijar uno. El presupuesto de rastreo es el resultado práctico de la salud de tu servidor y de cuánto quiere Google tus páginas. Para la mayoría de los sitios pequeños y medianos, Google rastrea todo lo importante sin ninguna intervención, así que no hay ningún número que perseguir. El presupuesto de rastreo se convierte en un factor real solo a partir de decenas de miles de URLs o cuando muchas páginas aparecen como descubiertas pero actualmente sin indexar.
Influyes en él a través de los dos factores que usa Google. Eleva la capacidad de rastreo haciendo que tu servidor sea rápido y fiable, ya que Google rastrea más cuando las respuestas son rápidas y sin errores. Eleva la demanda de rastreo publicando contenido útil que gane enlaces y tráfico, y actualizando páginas para que Google las vea como dignas de actualizarse. Igual de importante, deja de desperdiciar el presupuesto que tienes bloqueando las URLs de poco valor y corrigiendo los duplicados, lo que libera obtenciones para las páginas que importan.
No, son etapas separadas. El presupuesto de rastreo controla si Google obtiene una URL y con qué frecuencia, mientras que la indexación es la decisión posterior sobre si almacenar y servir esa página en los resultados de búsqueda. Una página puede rastrearse y luego dejarse sin indexar porque Google la juzgó de poco valor. Esta distinción importa para el diagnóstico: una página descubierta pero no rastreada es un problema de rastreo, mientras que una página rastreada pero no indexada suele ser un problema de calidad del contenido.