Toegegeven: het is een lastig woord om uit te spreken maar praktisch is het begrip lang niet zo moeilijk als het lijkt. Wat zijn canonical url’s, hoe gaan zoekmachines er mee om en wat kun je zelf doen om je zoekresultaten zo ‘schoon’ mogelijk te houden?

Soms is precies dezelfde content via verschillende url’s opvraagbaar. Als je bijvoorbeeld www.voorbeeld.nl intypt, kom je op precies dezelfde webpagina terecht als wanneer je voorbeeld.nl intikt (dus zonder www ervoor). Bij blogs zie je het ook vaak. Eén artikel wordt dan in meerdere categorieën geplaatst waardoor je het artikel terugvindt onder de url www.voorbeeld.nl/canonical of onder www.voorbeeld.nl/canonical?categorie=online.

Er kunnen dus meerdere url’s zijn die precies dezelfde content bevatten.

Google begrijpt dat niet zo goed. Althans: Google weet niet uit zichzelf welke versie van de pagina het moet indexeren. Het kan dus zijn dat dezelfde content meerdere keren geïndexeerd wordt hetgeen leidt tot zogenaamde duplicate content. Google zal een van de pagina’s als origineel kiezen en de andere pagina’s links laten liggen. Deze worden als duplicate content aangemerkt en worden een stuk lager of zelfs helemaal niet in de zoekresultaten opgenomen.

Oplossingen

Ik geef je een paar oplossingen om met het probleem van canonical url’s en duplicate content om te gaan:

  1. Google, Microsoft en Yahoo hebben een speciale tag ontwikkeld die je in de broncode van je site op kunt nemen. Als je deze tag opneemt in het ‘head’-gedeelte van je site, dan zeg je daarmee eigenlijk welke pagina voortaan geïndexeerd moet worden. Zoekmachines weten daarmee wat de originele url is.
    De code die je hiervoor kunt opnemen is <link rel=”canonical” href=”http://www.denaamvanjesite/originele-url” />
  2. Google biedt een pakket tools aan onder de naam Google Webmaster Tools (www.google.com/webmasters/tools/) Als je je hebt aangemeld voor deze tools kun je zien hoe Google jouw site bekijkt. Je kunt Google vertellen welke pagina’s van je site niet geïndexeerd moeten worden en je kunt aangeven welke versie van je site (met of zonder www) de voorkeur heeft.
  3. Als je WordPress gebruikt als blogsite of CMS dan kun je in je WP-instellingen ook het een en ander aanpassen. Onderstaande punten 1 tot en met 4 beschrijven wat je in de WordPress Admin moet doen en de punten 5 tot en met 9 zeggen je wat je in de Google Webmastertools kunt aanpassen:
    1. Log in in het Admin gedeelte van je site
    2. Ga naar Instellingen (Settings) en vervolgens naar Algemeen (General)
    3. typ in het veldWordPress-adres (of Blogadres) de gewenste url
    4. Bewaar deze instellingen
    5. Ga vervolgens naar de genoemde Google Webmastertools
    6. Klik op het plusje bij Siteconfiguratie
    7. Klik op Instellingen
    8. Kies voor de gewenste domeinnaam (met of zonder www dus en hetzelfde als de instelling in de WordPress Admin)
    9. Bewaar je instellingen.