Het is al wat ouder nieuws, maar het brengt wel een aardig beveiligingslekje boven in veel websites. Google Sitemaps verifieert of je de eigenaar bent van een website door te checken of je een bestand kan aanmaken. Websites die geen goede 404 implementatie hebben, zijn hierdoor kwetsbaar.
Het bestand dat aangemaakt moet worden (bijvoorbeeld google-2375ybhjefwbf8.html) wordt opgevraagd door Google als check. Als je het bestand niet kan aanmaken, bestaat het bestand dus niet en laat je website zijn 404 pagina zien. Bij sommige websites geeft de 404 pagina echter een 200 HTTP response code terug. Google Sitemaps denkt dan dat het bestand gevonden is, en dus bestaat.
Degene die dit proces in gang zet, kan dan de site toevoegen in zijn Google Sitemaps interface. Vervolgens kun diegene de statistieken van Google Sitemaps van die website bekijken. Onder andere op welke keywords de site wordt gevonden, hoeveel daarop wordt geklikt, welke pagina’s zijn geïndexeerd en wat de globale PageRank verdeling over de pagina’s is. David Naylor deed dat bij o.a. ebay.com, about.com en aol.com.
Een aardige ontdekking, die inmiddels lijkt verholpen. Zie de screenshot van de verkeerde 404 implementatie op Marketingfacts.