Sitemap XML: definizione chiara e perché aiuta davvero
Sitemap XML è un file che elenca gli URL che vuoi far scoprire ai motori di ricerca. Non garantisce il posizionamento né sostituisce i link interni, ma aiuta i crawler a trovare più in fretta pagine nuove o aggiornate, specie in siti estesi, eCommerce, portali editoriali o progetti con aree profonde.
Il protocollo è pubblico (sitemaps.org) e supportato dai principali motori. Google consiglia di includere solo URL canonici, in risposta 200 e realmente utili per la ricerca.
Dove si mette, come si chiama e come si serve
Il percorso standard è /sitemap.xml alla radice del dominio. Puoi usare più file (es. per sezione o tipo di contenuto) e un sitemap index che li elenca. Il file può essere compresso (.gz) per risparmiare banda, purché rispetti i limiti di protocollo: massimo 50.000 URL per file o 50MB non compressi.
Ogni host (dominio o sottodominio) richiede la sua sitemap e, se serve, il suo index. Esempio: www.esempio.it, blog.esempio.it, shop.esempio.it.
Struttura base: tag, namespace e campi utili
Una sitemap è un XML che rispetta uno schema (namespace) e contiene una lista di <url>. I campi più comuni sono:
<loc>: URL canonico assoluto, <lastmod>: data ultima modifica in ISO 8601 (es. 2025-08-23). I tag <changefreq> e <priority> sono facoltativi e non influenzano direttamente Google: usali solo se li puoi mantenere coerenti.
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.esempio.it/</loc>
<lastmod>2025-08-23</lastmod>
</url>
<url>
<loc>https://www.esempio.it/servizi/seo</loc>
<lastmod>2025-08-20</lastmod>
</url>
</urlset>
Sitemap index: quando serve e come scriverlo
Usa un sitemap index quando superi i limiti o vuoi ordinare per sezione (news, prodotti, categorie, blog). Ogni voce del sommario è una sitemap a sé.
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://www.esempio.it/sitemap-pagine.xml</loc>
<lastmod>2025-08-22</lastmod>
</sitemap>
<sitemap>
<loc>https://www.esempio.it/sitemap-articoli.xml</loc>
<lastmod>2025-08-23</lastmod>
</sitemap>
</sitemapindex>
Varianti speciali: immagini, video e Google News
Per contenuti ricchi puoi estendere la sitemap con namespace dedicati:
Image sitemap: aggiunge info su immagini rilevanti della pagina (es. caption, title). Utile per eCommerce e guide illustrate.
Video sitemap: indica titolo, descrizione, durata, anteprima; aiuta a far capire il contesto dei video incorporati.
News sitemap: per editori registrati; elenca contenuti degli ultimi 48 ore rispettando i requisiti di Google News.
Specifica i namespace corretti e valida con i test ufficiali. Vedi la documentazione di Google sui tipi di sitemap e le estensioni sitemaps.org.
Hreflang in sitemap: un’alternativa al markup HTML
In siti multilingua puoi dichiarare le relazioni hreflang dentro la sitemap XML, riducendo errori rispetto ai tag in pagina. Ogni URL elenca le sue versioni di lingua/Paese con lo stesso set per tutti i corrispondenti.
<url xmlns:xhtml="http://www.w3.org/1999/xhtml">
<loc>https://www.esempio.it/servizi/seo</loc>
<xhtml:link rel="alternate" hreflang="it" href="https://www.esempio.it/servizi/seo"/>
<xhtml:link rel="alternate" hreflang="en" href="https://www.example.com/services/seo"/>
<xhtml:link rel="alternate" hreflang="x-default" href="https://www.example.com/services/seo"/>
<lastmod>2025-08-21</lastmod>
</url>
Quali URL inserire: qualità prima della quantità
La sitemap deve elencare solo URL che vuoi posizionare: niente duplicati, parametri di filtro, pagine 3xx/4xx/5xx, varianti non canoniche o risorse inutili per la ricerca. Aggiorna <lastmod> solo quando cambia il contenuto principale (non per micro-edit o data automatica), altrimenti i segnali diventano rumorosi.
Per eCommerce: crea sitemap distinte per prodotti (solo quelli disponibili), categorie e, se serve, pagine brand. Per magazine: separa articoli, pagine statiche e, se molto prolifico, usa index giornalieri o settimanali.
Sitemap e robots.txt: come collegarli
Indicare la sitemap nel robots.txt facilita la scoperta iniziale:
Sitemap: https://www.esempio.it/sitemap.xml
Sitemap: https://www.esempio.it/sitemap-prodotti.xmlQuesto non sostituisce l’invio tramite Google Search Console, che resta il canale migliore per monitorare stato e copertura.
Invio e monitoraggio in Google Search Console
Dopo aver verificato la proprietà del sito, vai in “Sitemap” e invia l’URL della sitemap o del sitemap index. La pagina mostra lo stato di lettura, l’ultima scansione e gli eventuali errori. Incrocia il report “Pagine”/“Copertura” per capire quante URL inviate risultano indicizzate, escluse o scoperte ma non indicizzate.
Se cambi la struttura o aggiungi nuove sitemap, aggiorna l’index e invialo di nuovo. Annota la modifica: ti aiuterà a leggere gli effetti nelle settimane successive.
Generazione: CMS, plugin e feed custom
Molti CMS generano la sitemap in automatico (WordPress, Shopify, Magento, PrestaShop). Controlla che rispettino i requisiti: URL canonici, codifica UTF-8, lastmod attendibile. Se hai un framework custom, produci la sitemap da database con una routine pianificata (es. cron) che aggiorni solo ciò che cambia, evitando rigenerazioni massive quotidiane su migliaia di URL.
Per siti news o cataloghi in continuo movimento, valuta sitemap incrementali (più file, aggiornati in tempi diversi) invece di un unico file monolitico.
Checklist pratica per una sitemap solida
- Includi solo URL 200, canoniche, raggiungibili e utili alla ricerca.
- Mantieni
lastmodreale (aggiorna quando cambia il contenuto principale). - Spezza in più sitemap e usa un index se superi soglie/volumi.
- Comprimi i file grandi e servi via HTTPS.
- Dichiara la sitemap in
robots.txte inviala in Search Console. - Per immagini/video/news usa i namespace dedicati e valida l’XML.
- Elimina presto le URL non più valide; aggiorna con nuovi contenuti.
- Allinea la sitemap alla tua architettura e all’interlinking interno.
Errori comuni da evitare
- Inserire URL con redirect, 404 o pagine
noindex. - Includere parametri di filtro e varianti non canoniche.
- Aggiornare
lastmoda ogni deploy anche senza modifiche reali. - Usare un unico file enorme: rallenta gestione e debug.
- Dimenticare sottodomini con sitemap separate.
- Confondere la sitemap con una garanzia di indicizzazione (non lo è).
- Non validare il file: errori di namespace o encoding bloccano la lettura.
Domande frequenti sulla Sitemap XML
La sitemap fa indicizzare automaticamente le pagine?
No. La sitemap accelera la scoperta e aiuta a comunicare priorità e aggiornamenti, ma l’indicizzazione dipende dalla qualità della pagina, dai link interni/esterni e dall’utilità percepita per gli utenti.
Quante sitemap posso avere e quanto devono pesare?
Ogni file può contenere fino a 50.000 URL o 50MB non compressi. Puoi creare molte sitemap e un index che le elenca. Per siti grandi, suddividere per sezione migliora manutenzione e lettura dei log.
Devo usare changefreq e priority?
Sono opzionali e oggi hanno scarso peso per Google. Se li usi, mantieni coerenza con la realtà; altrimenti concentrati su lastmod accurato e su una selezione pulita degli URL.
Meglio inviare la sitemap in Search Console o bastano i link nel robots.txt?
Fai entrambe le cose: Sitemap: in robots.txt aiuta la scoperta automatica, l’invio in Search Console consente monitoraggio, storico e notifiche di errore.
Come gestisco prodotti esauriti, pagine rimosse o contenuti archiviati?
Se una pagina non è più utile, rimuovila dalla sitemap e valuta un redirect verso l’alternativa più vicina. Per prodotti temporaneamente non disponibili, mantieni l’URL e aggiorna contenuto e lastmod quando torna in stock.
Risorse ufficiali e test utili
Approfondisci la guida di Google sulla creazione della sitemap, i tipi supportati e le specifiche del protocollo. Valida il tuo XML con tool di validazione e monitora regolarmente lo stato in Search Console.
