VicKuP

Domeinnaam met of zonder www: 301, 302,… 404?

NS doet het met en zonder www.To www, or not to www. That is the question. Wat is je website adres: Domein.nl of www.Domein.nl? Heb je daar wel eens over nagedacht? Dat zou wel moeten, want het kan een hoop bezoekers uit zoekmachines kosten. Wat nog belangrijker is dan de keuze voor met of zonder “www.” is de manier waarop je deze keuze technisch op je webserver inricht. Er is zelfs een website gewijd aan dit onderwerp, waarop het gebruik van www. wordt verafschuwd: no-www.org.

Waarom is dat dan belangrijk? Zoekmachines behandelen elke URL (elk webadres) als een uniek adres. Er is immers ook maar 1 adres + postcode combinatie voor elk huis in Nederland. Maar heel veel webpagina’s zijn op meerdere adressen bereikbaar. Zo kun je bijvoorbeeld naar Wehkamp.nl surfen, maar ook naar www.Wehkamp.nl. En naar http://ns.nl/pages/overns.html of http://www.ns.nl/pages/overns.html. Een op het oog klein verschil, maar met potentieel grote gevolgen.

Ik zal in dit artikel uitleggen waarom de www.-keuze veel bezoekers kan kosten, hoe 60% van de Nederlandse top 100 websites dit verkeerd aanpakken, en natuurlijk hoe ze het wel goed zouden kunnen doen.

Autoriteit moet je niet delen…

de variant zonder www. snoept een hoop autoriteit van de www. variant af…Rankings van zoekmachines zijn voor een groot deel gebaseerd op autoriteit: Hoe “belangrijk” is een bepaald webadres? Die autoriteit wordt bepaald door het aantal links dat naar een pagina wijst. En dat is waar het probleem met of zonder www. ontstaat. Door beide varianten te gebruiken, wordt de autoriteit over ook beiden verdeeld. Geen van beide bereikt dus zijn potentiële waarde. Ook is er een kleine straf die zoekmachines uitdelen voor “duplicate content”, wanneer verschillende pagina’s dezelfde content hebben, en dat is altijd het geval bij de twee varianten.

Als je zowel met als zonder www. bereikbare pagina’s hebt, zullen beide varianten dus ook in zoekmachines verschijnen. Dat komt doordat links die naar je pagina’s wijzen, soms met en soms zonder www. gemaakt zullen worden, waardoor beide varianten geïndexeerd worden door zoekmachines. Bij Wehkamp zijn er bijvoorbeeld in Google meer dan 300 pagina’s ook zonder www. geindexeerd (Yahoo! vindt er zelfs 1.300 en waarschijnlijk zijn het er nog meer). De homepage van NS.nl heeft met www. een PageRank van 7, en zonder www. een PageRank van 4. Daaruit kun je afleiden dat de variant zonder www. een hoop autoriteit van de www. variant afsnoept…

En het kan nog fouter: sommige websites werken zelfs niet zonder www. ervoor. Dit was tot enkele weken geleden nog het geval bij ABNAmro.nl, maar dat probleem is recent opgelost.

De oplossing: 301 is de enige juiste

De enige goede oplossing is om te kiezen voor een van beide varianten, en de pagina’s alleen beschikbaar te maken op die variant. Op die manier ben je ervan verzekerd dat elke webpagina slechts op 1 adres bereikbaar is, en dus de volle autoriteit scoort. Op Usarchy heb ik ooit gekozen voor www.Usarchy.com, dus als je naar Usarchy.com surft, wordt je doorverwezen naar www.Usarchy.com. Datzelfde gebeurt met alle andere URL’s op het domein, zodat links altijd de totale autoriteit scoren, zelfs als iemand een link naar een www.-loze URL aanmaakt.

Dat doorverwijzen mag maar op 1 manier gebeuren: met een “301 - Moved Permanently” redirect. Die 301 code wordt meegegeven wanneer een pagina wordt opgevraagd. Net zoals een 404 code betekent dat een pagina niet gevonden kan worden, en een 200 code dat de pagina juist wel gevonden is.

Als iemand dus op de “verkeerde” variant terecht komt, wordt hij door die 301 redirect doorverwezen naar de correcte. De zoekmachine ziet dat ook en slaat slechts de correcte URL op, met de bijbehorende autoriteit.

Wie doet het goed, wie niet?

Ik heb van de top 100 van Nederlandse websites (met dank aan de STIR) de HTTP response code gecontroleerd van de domeinnaam zonder www. Niet met de hand gelukkig, waarvoor ik collega Johan dank voor zijn scripting skills :) Dit is het resultaat:

HTTP responses van top 100 Nederlandse domeinnamen

De verschillende codes betekenen het volgende:

  • 301 - De groene websites zijn de enigen die het goed doen met een 301 redirect. Door deze 301 redirect zal de zoekmachine de autoriteit van de verwijzende URL overzetten naar de doorverwezen URL. Daarom kun je ook bij het veranderen van CMS je rankings behouden, je “migreert” met 301 redirects immers je URL’s en daarmee de autoriteit van je URL’s (iets wat de Rabobank dus was vergeten).
  • 302 - De oranje gemarkeerde websites maken de fout dat er een “302 - Moved Temporary” code wordt meegezonden. Dat betekent officieel dat de pagina slechts tijdelijk op een ander adres te bereiken is, terwijl het bij de www.-varianten natuurlijk een permanente verplaatsing betreft. De 302 wordt door zoekmachines niet hetzelfde behandeld als een 301, en geeft de waarde van de URL dus niet goed door.
  • 200 - De websites die dit hebben, zijn dus direct op het www-loze domein te benaderen. In sommige gevallen is dit overigens niet verkeerd. Tweakers.net geeft een 200 code terug, maar dat komt omdat zij kiezen voor de variant zonder www. Op http://www.tweakers.net word je keurig met een 301 doorgestuurd naar http://tweakers.net.
  • 404 - Dit betekent dat de opgevraagde URL niet gevonden kan worden. In bovenstaand overzicht doet alleen ABNAmro dit nog verkeerd. Op zich is het niet eens slecht om een 404 terug te geven bij een www-loos domein, want misschien is dat gewoon je keuze. Veel mensen gebruiken echter de URL zonder www uit gemak, en krijgen dan een foutmelding. Ook wordt in communicatie uitingen vaak de URL zonder www geroepen, dus dan kun je maar beter zorgen dat die ook werkt.
  • 0 - Geen bestaand domein. Ook consequent maar erg ongebruiksvriendelijk als mensen dit toevallig intypen.

Google.nl heeft een goede 301 redirect.In sommige gevallen is bovenstaande lijst trouwens niet helemaal eerlijk. De ANWB geeft wel een 301 terug, maar die verwijst helaas niet naar de correcte domeinvariant, maar naar een lange URL binnen het CMS. Daarbij zijn zowel de www. als de www.-loze variant beschikbaar. Dubbel fout van de ANWB dus, die hiermee laten zien bepaald niet voor zoekmachines geoptimaliseerd te zijn.

Bij Planet.nl is het ook een rommeltje. Daar zijn alle URL’s op beide varianten bereikbaar, maar worden de links in de website ook nog eens verkeerd weergegeven. Als je surft naar planet.nl, zie je dus alle nieuwsberichten op planet.nl/… staan, maar als je naar www.planet.nl surft, wijzen alle links ook naar www.planet.nl/… Hier wordt dus voor enorm veel URL’s de autoriteit gedeeld, waardoor Planet niet zo hoog in zoekmachines staat als mogelijk.

Dus, wat hebben we geleerd?

  1. Maak een keuze: gebruiken we www. of geen www.? Denk hierbij ook aan het feit dat je op dit moment waarschijnlijk het best scoort op www.domein.nl, dus dat is in de meeste gevallen de beste keuze.
  2. Check vervolgens wat er gebeurt als je je domein met of zonder www. intikt. Krijg je gewoon de website te zien, veranderd het webadres nog? Bedenk dat je hier eigenlijk altijd op exact hetzelfde webadres uitkomen.
  3. Check vervolgens met een HTTP header viewer welke HTTP code er wordt teruggegeven. Online kun je dat bijvoorbeeld bij Rex Swain doen. Firefox heeft er echter ook een plugin voor: LiveHTTPHeaders. Hier moet dus een 301 worden weergegeven als je naar de “verkeerde” variant gaat, waarna je wordt geredirect naar de correcte variant.
  4. Check dit vervolgens ook eens van diepere URL’s op de website. Idealiter verwijzen ook die allemaal naar de correcte variant.

Het aardige van dit hele verhaal is dat het eigenlijk common sense is. Natuurlijk is welke webpagina maar op 1 URL te bereiken. Natuurlijk weten wij welke URL de goede is. En natuurlijk gebruiken de webbouwer en webhoster de correcte standaarden om de wens van de opdrachtgever te implementeren. Maar in de praktijk gaat het dus in de meeste gevallen net verkeerd. Terwijl de correcte oplossing meestal een paar minuten werk vereist.

Online marketing kan zo simpel zijn… :)


(via VicKuP’s shared items in Google Reader)
More Information