llms.txt serve davvero? Cosa dice l'evidenza (e cosa farne)

Enrico Parizzi

•

pubblicato il 8 giugno 2026

llms.txt è un file di testo in formato Markdown che un sito pubblica nella propria root per elencare, in modo ordinato e leggibile da una macchina, i contenuti che vuole rendere comprensibili ai modelli di intelligenza artificiale. È una proposta del 2024, e da allora se ne parla molto. Ma a oggi nessuno dei grandi motori generativi lo usa per decidere chi citare: prima di dedicargli tempo, conviene capire cosa fa davvero e cosa no.

Cos'è, in concreto

L'idea di partenza è semplice. Un sito moderno è pieno di codice, menu, script e markup che servono al browser ma confondono una macchina che prova a capire di cosa parla una pagina. llms.txt propone una scorciatoia: un unico file, scritto in Markdown, che presenta in chiaro l'identità del sito e un indice ragionato dei suoi contenuti più importanti, con un collegamento a ciascuno. In testa un titolo e una descrizione sintetica dell'organizzazione; sotto, sezioni tematiche con i link alle pagine chiave. La proposta è di Jeremy Howard, di Answer.AI, e nella forma ricalca file come robots.txt o la sitemap — ma con uno scopo diverso: non regolare l'accesso dei crawler, bensì offrire ai modelli una versione pulita e curata di ciò che conta.

Ne esiste anche una variante più estesa, llms-full.txt, che incorpora direttamente il testo integrale dei contenuti invece dei soli collegamenti.

A cosa servirebbe

Sulla carta il vantaggio è chiaro: dare ai sistemi di AI un punto d'ingresso ordinato, così che non debbano ricostruire il senso di un sito spulciando l'HTML pagina per pagina. Per una documentazione tecnica, per un catalogo, per un sito con moltissime pagine, un indice curato è un'idea ragionevole. Il problema non è l'idea in sé: è che, perché funzioni, qualcuno dall'altra parte deve leggerlo.

Cosa dice l'evidenza, oggi

È qui che la teoria incontra i fatti. Nessuna delle grandi aziende di AI — OpenAI, Google, Anthropic, Meta, Mistral — si è impegnata a leggere o usare llms.txt nei propri sistemi di produzione. Google è stata esplicita: a luglio 2025 Gary Illyes ha confermato che il motore non lo supporta e non intende farlo, e John Mueller lo ha paragonato al vecchio meta tag keywords, abbandonato anni fa proprio perché si prestava agli abusi.

I dati sul traffico raccontano la stessa cosa. Chi monitora i log dei crawler osserva che i bot delle AI — da GPTBot a ClaudeBot, da PerplexityBot a Google-Extended — saltano quasi sempre il file e leggono direttamente l'HTML: in un'analisi su centinaia di milioni di visite di bot nell'arco di tre mesi, le richieste dirette a llms.txt erano poche centinaia, una quota trascurabile. E sui risultati concreti, una rilevazione ripresa da Search Engine Land ha trovato che otto siti su nove non hanno visto alcun cambiamento di traffico dopo averlo implementato. L'adozione, intanto, resta bassa: uno studio di SE Ranking su 300.000 domini l'ha riscontrato su circa un sito su dieci.

In sintesi: oggi llms.txt non è un fattore di posizionamento, non aumenta le probabilità di essere citati e non è raccomandato da Google.

Allora è inutile?

Non esattamente — ma va inquadrato per quello che è. Venduto come leva per "farsi citare dall'AI", è una promessa che l'evidenza non sostiene. Ha però un senso diverso: è un primo modo standardizzato di pubblicare una superficie leggibile dagli agenti software, e per chi ha tra i propri lettori sviluppatori che usano assistenti AI dentro l'editor di codice può migliorare il modo in cui quegli strumenti interpretano il sito. Il costo è quasi nullo, e c'è un margine di opzionalità: se un domani qualche motore decidesse di onorarlo, trovarsi già a posto sarebbe un'assicurazione a buon mercato.

Tradotto: non è una priorità e non sostituisce nulla. Se decidi di pubblicarlo, fallo come gesto a basso costo, senza aspettarti che sposti la visibilità.

L'errore da evitare

C'è un modo sbagliato di farlo, ed è anche il più diffuso: generare automaticamente una copia in Markdown di ogni pagina del sito e renderla indicizzabile. È la strada che propongono diversi plugin, ed è proprio quella che crea problemi — pagine duplicate su larga scala, che disperdono il crawl budget e possono indebolire il posizionamento delle versioni originali. Un file llms.txt curato, con poche pagine cardine scelte a mano, è innocuo; la generazione automatica di copie integrali dell'intero sito no.

Cosa conta davvero per farsi citare

La citabilità da parte dei motori generativi non passa da un file in root, ma dalle stesse cose che rendono un sito autorevole per chiunque. Contano contenuti chiari, scritti per rispondere a domande reali e organizzati in modo che un paragrafo si capisca anche estratto dal suo contesto. Contano i dati strutturati corretti, che dichiarano senza ambiguità chi sei, chi firma e come le tue entità sono collegate. Conta un'autorevolezza dimostrabile — è il terreno dell'E-E-A-T — fatt a di esperienza diretta, fonti citate e identità coerente. E sul piano dell'accesso, il file che davvero governa il comportamento dei crawler resta il robots.txt, l'unico standard che riconoscono per davvero.

Sono questi i segnali che decidono se un sistema generativo ti sceglierà come fonte. llms.txt, nella migliore delle ipotesi, è un dettaglio in più: il lavoro vero è altrove.

In E-Motion Web costruiamo siti pensati per essere capiti e citati: contenuti autocontenuti, dati strutturati e ottimizzazione per i motori generativi e i knowledge graph che agiscono sui segnali che i motori usano davvero. Se v uoi che il tuo sito diventi una fonte riconosciuta — con o senza llms.txt — realizziamo siti web pensati per questo. Per capire da dove partire, parliamone.