Wil je dat jouw nieuwe pagina’s sneller door de zoekmachines worden opgepikt? Wil je dat meer van jou enorme website door Google wordt geïndexeerd? Wil je dat zoekmachines vooral aandacht besteden aan de pagina’s die er toe doen? Zorg dan dat jouw website de perfecte sitemap heeft. Een sitemap die bij updates dat ook gelijk aan de zoekmachines meldt. Hier lees je hoe je de perfecte sitemap voor SEO ontwikkeld.
Wat is een sitemap.xml?
Een sitemap.xml en is textbestand waarin alle URL’s van pagina’s, afbeeldingen, nieuws en/of video van een website zijn geplaatst. Het is daarmee een adresboek voor zoekmachines, die makkelijk alle content op de site kunnen vinden.
Waar is een sitemap.xml voor?
Een sitemap.xml is bedoeld voor zoekmachines. Die daarmee snel een overzicht van de pagina’s op een site krijgen, met idealiter de publicatiedatum erbij. Je content wordt dan sneller in de zoekresultaten zichtbaar. De doorsnee websitebezoeker zal de sitemap.xml nooit zien. Daarvoor kan eventueel in sitemap in HTML worden gemaakt.
Een van de belangrijkste website optimalisaties voor zoekmachine optimalisatie, is het leveren van een correcte sitemap.xml. Die zijn eigenlijk vrij eenvoudig van opzet. Toch gaat het heel vaak mis. Zorg ervoor dat het aan de eisen voldoet.
Hoe zit een correcte sitemap.xml in elkaar?
De sitemap.xml is een overzicht van URL’s gestructureerd in XML. Het bevat in ieder geval de urlset, locatie en lastmod van elk type content met een eigen adres. De voorschriften, die vind je hier. Je kunt hier precies lezen hoe de sitemap opgebouwd moet worden. Het format ziet er als volgt uit:
http://www.daarom.com/
2024-05-08
Zoals je ziet, zijn de changefreq en priority verwijderd. Google heeft aangegeven, dat dit niet meer door zoekmachines wordt gelezen. Het heeft dan ook niet veel zin om die te vermelden.
url en lastmod onderdelen
De lastmod is zeer belangrijk. Daarmee geef je zoekmachines door wanneer de content geplaatst of vernieuwd is. Het format dat je hiervoor moet gebruiken is vastgelegd door de W3C. Zorg dat deze gedetailleerd genoeg is, dus bijvoorbeeld: YYYY-MM-DDThh:mmTZD ofwel 2021-08-01T19:20+01:00
De URL, die vermeld wordt met zijn locatie (loc) is vrij envoudig, gewoon de volledige URL van de pagina die je wilt laten indexeren. In dat laatste zit dan wel een afweging die je bewust moet invullen. Wat je wilt hier alleen pagina’s opnemen die correct zijn.
Welke pagina’s moeten er in een sitemap.xml?
Neem de volgende afwegingen voor de pagina’s die je in de sitemap.xml wilt plaatsen:
- Alle pagina’s die correct zijn en een 200 – OK code afgeven
- Alle pagina’s die niet meer bestaan (code 404 of 410) horen niet in de sitemap thuis
- Alle pagina’s die redirecten (code 301 of 302) horen niet in de sitemap. Gebruik hier de pagina’s waar naar toe is verwezen.
Idealiter sorteer je de zoekmachines bij het aanmaken automatisch op deze datum. Alternatief heb je logica om de sitemap te sorteren op pagina’s die jij het belangrijkste vindt.
Sitemap.xml met afbeeldingen
Zijn afbeeldingen belangrijk in de vindbaarheid van jouw website? Zorg dan dat ze in de JSON-LD markup van elke pagina worden gedeclareerd. Heb je nog geen structured data op de pagina’s, dan kun je de afbeeldingen ook in je sitemap.xml opnemen. Heb je ‘responsive images’ en daarmee meerdere formaten van een afbeelding? Plaats dan het adres van de grootste, of het origineel, in de sitemap. Google laat zien hoe je een image sitemap.xml opbouwt. Onderstaand de syntax hiervoor. Nu is Google niet altijd compleet in zijn informatievoorziening naar SEO’s…
want de last-mod datum ontbreekt. Terwijl die juist belangrijk is om Google, Bing en anderen te informeren over de updates op jouw website. Let ook even op de genoemde mogelijkheden voor de image tag, je kunt hier ook caption, title en andere zaken meegeven. Haal er het maximale uit!
Soortgelijk kun je ook ‘video sitemaps‘ beschikbaar maken.
De index sitemap voor grote websites
Heb je een heel grote website, dan kun je meerdere sitemaps inzetten om al je pagina’s bereikbaar te maken. Heb je meer dan 50.000 pagina’s dan moet je namelijk een tweede sitemap gebruiken. Meer pagina’s gaan er namelijk niet in een enkele sitemap.xml. Ook kun je overwegen sitemaps voor specifieke delen van je website in te zetten. Heb je een e-commerce website dan kun je al je producten in een sitemap zetten en al je andere content in een andere sitemap.
Om meerdere sitemaps beschikbaar te maken, kun je een ‘index sitemap’ inzetten. Deze index geeft een overzicht van de sitemaps die je hebt, mochten het er meerdere zijn. Een voorbeeld van een index sitemap.xml vind je hier. En bijgaand een afbeelding ervan:
Internationale sites & alternate URL’s
Voor internationale sites, waarbij er meerdere taalvarianten zijn, kun je gebruik maken van de ‘alternate URL’ vermelding in je sitemap. Heb je meerdere domeinen; .nl / .com / .es bijvoorbeeld. Dan zet je op elk domein als normaal de sitemap.xml. In deze sitemap geef je alle relevante URL’s op. Daaraan voeg je, aan elke URL de alternatieve varianten van de website toe. Dus heb je een .com in het Engels, dan geef je als variant van de .nl de .com website op met als toewijzing de taal ‘Engels’. De Spaanstalige variant voeg je ook toe als .es variant.
Het kan zijn, dat je een taal voor een specifieke regio in wilt zetten. Dus de .es website voor Spanje, maar voor Peru is er de spaanse variant .com/en-pe/. Dergelijke toewijzingen kun je netjes in de sitemap.xml opgeven. De markup daarvoor ziet er als volgt uit:
Meer informatie over gelocaliseerde sitemaps vind je hier. Meer informatie over ‘taal en language’ codes vind je hier. Naast de standaard pagina vermeld als <loc>, voeg je de talen en locaties toe als rel=”alternate”, let er op dat je ook een ‘x-default’ vermelding toevoegd. Daar landen allen bezoekers die je niet specifiek hebt genoemd.
Internationale SEO, de bijhorende sitemaps en allerlei ‘onpage’ markup is erg complex. Waarbij het afbreukrisico heel groot kan zijn, als je het verkeerd implementeert. Het advies is dan ook; haar er in deze situatie altijd een expert bij!
Een specifieke Sitemap.xml voor nieuwspagina’s
Is nieuws een belangrijk onderdeel van jouw website? Zorg dan dat je een ‘nieuws sitemap’ beschikbaar maakt. Hier is specifieke syntax voor. Houdt je daarbij ook aan de voorschriften. Alleen nieuws van de laatste 2 dagen moet je in deze sitemap opnemen. Lees hier meer over nieuws sitemaps.
Versnel de laadtijd van je sitemaps met gZip compressie
Heb je grote sitemaps of vind je het gewoon leuk om je site in alle opzichten zo snel mogelijk te maken. Gebruik van gZip compressie om je sitemap te comprimeren. De bestandsgrootte neemt daar flink van af, waardoor zoekmachines deze veel sneller kunnen downloaden. Voor de meeste programmeurs is het activeren van gZip compressie niet heel uitdagend. Test wel altijd of je gecomprimeerde sitemap goed functioneert in bijvoorbeeld Google Webmaster Tools.
Maak de locatie van de sitemap.xml bekend in de robots.txt
Heb je de perfecte sitemap.xml beschikbaar? Zorg dan dat zoekmachines ze kunnen vinden. Allereerst is het handig ze op de meest voor de handliggende plaats te zetten; in de root.
Daarnaast is er een file met informatie voor bezoekende crawlers; de robots.txt. Die is een simpel text bestandje waarop je crawlers kunt informeren waar ze wel en niet moeten komen. Maar ook waar de sitemap.xml is te vinden. Een simpele robots.txt ziet er als volgt uit:
Let even op, het kan zijn dat jouw robots.txt allerlei informatie heeft staan die je in bovenstaand voorbeeld niet ziet. Gebruik het als voorbeeld van hoe de sitemap.xml vermelding aan jouw robots.txt toegevoegd kan worden. Deze robots.txt kun je prima statisch aanmaken. Oftewel een txt bestandje maken met bovenstaande info en in de root van je website plaatsen. Wil je meer weten over hoe je dit bestand maakt, kijk dan even hier.
De robots.txt is een perfecte plek om je sitemap.xml bekend te maken.
Hoe ping je website updates naar Google en Bing?
Voor SEO is het gunstig nieuwe content en een bijgewerkte sitemap.xml direct bekend te maken bij de belangrijkste zoekmachines Google en Bing. Dat kun je doen met een HTTP GET requests. Dit is een URL, die je oproept, waardoor de zoekmachine weten dat er nieuwe content is gepubliceerd. Hier een voorbeeld…
Meer informatie over deze URL’s kun je hier bij Google vinden.
Benut webmaster tools voor maximale SEO prestaties
Zowel Google als Bing hebben online ‘Google Search Console‘ en ‘Bing webmaster tools‘ beschikbaar voor SEO. Deze tools geven je veel inzicht in de indexatie, ranking en SEO technische status van jouw website. Je kunt hier je sitemap.xml aanmelden. Dan worden ze opgepakt en krijg je snel inzicht in of ze correct zijn, wat ervan wel en niet wordt geindexeerd en welke problemen er eventueel mee zijn. Zeker doen dus!
Met bovenstaande informatie bouw je de perfecte sitemap.xml voor SEO. Op naar betere resultaten. Wat we dagelijks voor veel opdrachtgevers doen. Is betere vindbaarheid voor jou ook belangrijk? Wil je jouw website technische laten optimaliseren voor SEO? Neem dan nu contact op, dan brengen we je naar de beste posities voor maximaal resultaat.
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut elit tellus, luctus nec ullamcorper mattis, pulvinar dapibus leo.