Questa è una guida operativa: nessuna teoria, solo i passi concreti per rendere un sito visibile ai motori AI principali — ChatGPT, Perplexity, Claude, Google AI Overviews, Microsoft Copilot. Pensata per chi vuole capire cosa va fatto, in che ordine e con che criterio decidere se delegarlo o farlo internamente.
1. Verifica come l'AI vede il sito oggi
Prima di toccare qualunque cosa, fare un audit di partenza. Aprire ChatGPT, Perplexity e Google AI Overviews e fare 6-10 query rilevanti per il business: nome del brand, descrizione del servizio, comparativi nel settore, query geo-localizzate se ha senso. Annotare quando il brand viene citato, quando viene ignorato, e — quando viene citato — se la descrizione è corretta.
Questo è il baseline misurabile. Tutto quello che si farà nei mesi successivi va confrontato con questo punto di partenza.
2. Implementare lo Schema markup completo
Schema.org è il vocabolario strutturato che gli LLM leggono per capire chi sei e cosa offri. È la cosa con il rapporto sforzo/risultato più alto in assoluto nella GEO.
Tipi prioritari da implementare:
- Organization (o LocalBusiness se hai sede fisica) sulla home: nome, descrizione, logo, contatti, social, P.IVA.
- Service su ogni pagina servizio: titolo, descrizione, areaServed, provider.
- FAQPage su ogni pagina che contiene FAQ (servizi, landing, blog tematici).
- BreadcrumbList su tutte le pagine interne: aiuta gli LLM a capire la struttura.
- Person sulla pagina chi-siamo o sul founder: nome, ruolo, expertise.
- Article sui post del blog: headline, datePublished, author, image, articleBody.
3. Configurare i crawler AI in robots.txt
Per default, alcuni crawler AI sono bloccati o ambigui nei robots.txt standard. Bisogna permetterli esplicitamente. I principali oggi:
- GPTBot — il crawler di OpenAI per addestramento e ChatGPT Search.
- OAI-SearchBot e ChatGPT-User — usati da ChatGPT in fase di browsing in tempo reale.
- PerplexityBot e Perplexity-User — Perplexity AI.
- ClaudeBot, Claude-Web e anthropic-ai — Anthropic / Claude.
- Google-Extended — Google per addestramento Gemini e AI Overviews.
- Applebot-Extended — Apple Intelligence.
- Meta-ExternalAgent — Meta AI.
Ognuno va listato con 'Allow: /' (o regole più strette se hai sezioni sensibili). Bloccarli — magari per paura del 'training senza consenso' — significa scomparire da quei motori. Decisione legittima ma con conseguenze concrete da pesare.
4. Creare un file llms.txt
llms.txt è una convenzione recente: un file di testo in /llms.txt nella root del sito che dà un sommario strutturato del progetto, pensato esplicitamente per essere letto dai modelli linguistici. Non è ancora uno standard ufficiale ma molti LLM lo leggono già e lo usano per costruire un'idea iniziale del sito.
Struttura minima utile:
- Titolo del sito + 1-2 frasi che spiegano cosa fa.
- Sezione 'Pagine principali' con elenco strutturato delle url chiave e cosa contengono.
- Sezione 'Servizi offerti' con descrizione breve di ognuno.
- Sezione 'Casi studio' se ne hai.
- Sezione 'Contatti' con email/form.
5. Riscrivere i contenuti in formato citation-ready
Questo è il punto che richiede più tempo ma fa la differenza maggiore nel medio termine. Un LLM cita più volentieri contenuti che ha facile da estrarre. Significa:
- Paragrafi autoportanti, comprensibili anche estratti dal contesto.
- Definizioni esplicite ('X è...') invece di descrizioni vaghe.
- FAQ con domande in forma naturale e risposte complete in 2-4 frasi.
- Liste numerate e bulleted per i procedimenti o le enumerazioni.
- Date, numeri, nomi propri sempre espliciti — niente 'di recente' o 'molti studi dimostrano'.
“Scrivi per essere citato. Ogni paragrafo dovrebbe poter essere copiato e incollato in una risposta come fonte standalone.”
6. Monitorare le citazioni nel tempo
Senza monitoraggio non si sa cosa funziona. La routine minima: una volta al mese, rifare le 6-10 query del baseline iniziale e annotare cosa cambia. Strumenti dedicati al tracciamento delle citazioni AI stanno iniziando a esistere ma sono ancora giovani; il monitoraggio manuale ben fatto costa poco tempo e dà segnali più affidabili.
Cosa fare internamente, cosa delegare
Il monitoraggio mensile può starci tutto internamente se c'è qualcuno con 30 minuti al mese. Tutto il resto — Schema, llms.txt, riscrittura contenuti, configurazione crawler — è lavoro tecnico/editoriale che richiede esperienza specifica. Farlo male è peggio di non farlo: Schema malformato confonde gli LLM, e contenuti riscritti male possono ridurre la chiarezza per gli utenti umani.

