Ik zocht bij Google op Yahoo.nl en kwam een vreemd zoekresultaat tegen. Een 404 pagina met daarbij de veelzeggende Zweedse titel “Yahoo! Sverige – Sidan finns inte”. Dat ziet er dan zo uit:
In de cache, de kopie die Google bewaart van een webpagina, ziet dat er zo uit:
Grappig, want dit staat er al een paar dagen in. Ook MSN heeft die Zweedse 404 pagina opgeslagen. Kennelijk wordt Yahoo.nl zo weinig gespiderd dat dit even duurt. Ik kan me niet voorstellen dat deze situatie zich lang heeft voorgedaan. Dan zou er wel enige ophef over geweest moeten zijn lijkt me. Of misschien krijgen zoekmachine robots een andere pagina te zien dan gewone stervelingen?
Interessant is het om te zien dat http://yahoo.nl met een (goede) 301 redirect wordt doorgestuurd naar http://nl.yahoo.com. Maar http://www.yahoo.nl wordt met een 302 doorgestuurd. Misschien dat de MSN en Google daar wat mee over hun nek zijn gegaan. Google heeft de laatste tijd (sinds Big Daddy) sowieso problemen met 302 redirects, al is het heel erg fijne me daar niet van duidelijk.
Iemand nog goede Y-Files suggesties voor dit kleine mysterie?
Stel je user-agentstring in als googlebot, en bezoek http://www.yahoo.nl.
Je wordt nog steeds naar http://nl.docs.yahoo.com/notfound.html doorgestuurd, incl. zweedse titel.
LikeLike
Jos, thanks! Dat was wat ik zelf ook nog wilde gaan proberen. Heb gisteren eindelijk die user agent switcher geinstalleerd. Aardig dat Yahoo! Nederland z’n homepage (of alles) “cloakt”, bij andere landen zie je dat niet. Zal wel gewoon een foutje zijn.
Maar je vraagt je toch af waarom dat mechanisme erin zit, I guess dat ze bepaakde delen wel of niet willen kunnen late spideren?
LikeLike
ik zag vanmorgen dit ook op Hyped… weet niet of het er iets mee te maken heeft, heb het zelf ook niet gezien… wilde het toch ff plaatsen
http://www.hyped.nl/hyped/archives/00001914.htm
LikeLike
Ervan uitgaande dat Yahoo-redacteuren niet bijbeunen bij Google, Erwin, moeten dit toch ongerelateerde verschijnselen zijn.
LikeLike
Klopt Jos..
Weet niet of het er iets mee te maken heeft was ook eigenlijk meer zo bedoeld van… beetje offtopic..
Maar goed, artikel ging over zweedse teksten in de adsense interface…
In dat oogopzicht bij Google een soortgelijke fout??
LikeLike
Pingback: Tramadol.