Il Validatore llms.txt analizza il file llms.txt di qualsiasi dominio e segnala se è correttamente formattato per i crawler IA. Incolla il tuo URL o dominio nello strumento qui sopra per ottenere una diagnosi immediata.
Cos'è llms.txt e perché è importante?
llms.txt è una convenzione in testo normale, analoga a robots.txt, che spiega ai grandi modelli linguistici e ai motori di ricerca IA come navigare un sito web. Posizionato nella root del dominio (es. esempio.it/llms.txt), elenca le pagine, le sezioni e i file chiave che un crawler IA deve prioritizzare. Senza di esso, i sistemi IA devono indovinare quali contenuti sono autorevoli -- e spesso sbagliano.
Con la crescita degli AI Overview di Google, ChatGPT e Perplexity, avere un llms.txt ben formato è uno dei guadagni tecnici più rapidi disponibili per la Generative Engine Optimization (GEO).
Cosa controlla lo strumento qui sopra
- Presenza del file: llms.txt è accessibile al percorso previsto?
- Validità della sintassi: struttura di intestazioni Markdown corretta, nessun link malformato.
- Sezioni richieste: un file valido include tipicamente un titolo del sito, una breve descrizione e almeno una sezione di URL.
- Raggiungibilità dei link: il validatore campiona gli URL elencati e segnala quelli che restituiscono errori 4xx o 5xx.
- Codifica: il file deve essere servito come testo normale UTF-8; i tipi MIME errati bloccano i parser IA.
- Dimensione del file: un llms.txt troppo grande può essere troncato dai crawler; lo strumento avvisa se il file supera i limiti raccomandati.
Come interpretare i risultati e agire
- Uno stato verde significa che il file è raggiungibile e ben formato. Verifica che gli URL elencati siano davvero le tue pagine più importanti.
- Un errore 404 sul file stesso indica che non esiste ancora un llms.txt. Creane uno seguendo la specifica ufficiale su llmstxt.org e deployalo nella root.
- I link interrotti all'interno del file riducono la fiducia: correggi i redirect o rimuovi immediatamente gli URL non aggiornati.
- Tipo MIME errato (es. text/html invece di text/plain): aggiorna gli header del tuo server o CDN.
- Dopo ogni correzione, riesegui lo strumento qui sopra per confermare che il problema è risolto prima di richiedere una ri-indicizzazione.
Riferimento: la visibilità IA inizia dall'accesso al crawl
Gli studi mostrano che gli AI Overview compaiono in circa il 31% delle ricerche Google (2025). Un sito che blocca o confonde i crawler IA è invisibile in questa fetta crescente della ricerca. Un llms.txt corretto elimina una delle barriere tecniche più comuni alla visibilità GEO.
Per un monitoraggio continuo della tua presenza nelle ricerche IA su ChatGPT, Perplexity e Gemini, Sorank traccia automaticamente citazioni e visibilità.
























