El Validador de llms.txt analiza el archivo llms.txt de cualquier dominio e informa si está correctamente formateado para los crawlers de IA. Pega tu URL o dominio en la herramienta de arriba para obtener un diagnóstico instantáneo.
¿Qué es llms.txt y por qué importa?
llms.txt es una convención en texto plano, análoga a robots.txt, que indica a los grandes modelos de lenguaje y a los motores de búsqueda de IA cómo navegar un sitio web. Colocado en la raíz del dominio (p.ej., ejemplo.com/llms.txt), lista las páginas, secciones y archivos clave que un crawler de IA debe priorizar. Sin él, los sistemas de IA tienen que adivinar qué contenido es autoritativo, y a menudo se equivocan.
A medida que los AI Overviews de Google, ChatGPT y Perplexity impulsan cada vez más el descubrimiento, tener un llms.txt bien formado es una de las mejoras técnicas más rápidas disponibles para la Generative Engine Optimization (GEO).
¿Qué comprueba la herramienta de arriba?
- Presencia del archivo: ¿es llms.txt accesible en la ruta esperada?
- Validez de sintaxis: estructura de encabezados Markdown correcta, sin enlaces malformados.
- Secciones requeridas: un archivo válido debe incluir un título del sitio, una descripción breve y al menos una sección de URLs.
- Accesibilidad de enlaces: el validador muestrea las URLs listadas y marca las que devuelven errores 4xx o 5xx.
- Codificación: el archivo debe servirse como texto plano UTF-8; los tipos MIME incorrectos bloquean los parsers de IA.
- Tamaño del archivo: un llms.txt demasiado grande puede ser truncado por los crawlers; la herramienta avisa si el archivo supera los límites recomendados.
Cómo interpretar los resultados y actuar
- Un estado verde significa que el archivo es accesible y está bien formado. Verifica que las URLs listadas sean realmente tus páginas más importantes.
- Un error 404 en el propio archivo indica que aún no existe un llms.txt. Crea uno siguiendo la especificación oficial en llmstxt.org y despliégalo en la raíz.
- Los enlaces rotos dentro del archivo reducen la confianza: corrige las redirecciones o elimina las URLs desactualizadas de inmediato.
- Tipo MIME incorrecto (p.ej., text/html en lugar de text/plain): actualiza las cabeceras de tu servidor o CDN.
- Después de cualquier corrección, vuelve a ejecutar la herramienta de arriba para confirmar que el problema está resuelto antes de solicitar la re-indexación.
Referencia: la visibilidad en IA empieza con el acceso al rastreo
Los estudios muestran que los AI Overviews aparecen en aproximadamente el 31% de las búsquedas de Google (2025). Un sitio que bloquea o confunde a los crawlers de IA es invisible en esta parte creciente de la búsqueda. Un llms.txt correcto elimina una de las barreras técnicas más comunes para la visibilidad GEO.
Para un seguimiento continuo de tu presencia en las búsquedas de IA a través de ChatGPT, Perplexity y Gemini, Sorank rastrea automáticamente las citas y la visibilidad.
























