Onestat website teller is zoekmachine spam (maar Google is on it)

Onestat zoekmachine spamHet was me bij veel gratis website statistieken tellers al opgevallen. Om hun weggeef business model waar te kunnen maken, verplichten ze de afnemer een link te maken naar hun website. Je moet dan meestal een klein plaatje van de statistieken provider op je site zetten, dat plaatje linkt dan door naar hun website. Het idee daarachter is dat Google (en natuurlijk andere zoekmachines, maar die hebben we in Nederland eigenlijk niet) die statistieken provider hogere ranking geeft in de zoekresultaten. Er wijzen immers ontzettend veel links naar die website, van al die gratis tellers die op elke pagina van de website moeten staan.

Bij Onestat hebben ze deze methode nog wat verder geperfectioneerd. Ongetwijfeld doen veel kleinere tellers het ook, maar Onestat is een van de grotere merken op dit gebied. In de HTML die je verplicht bent te plaatsen op je website, staat deze code:

Hierin vind je dus om te beginnen een plaatje met de alt-tekst “site stats”. Dat plaatje is direct een link naar http://www.onestat.com, waardoor Onestat dan ook op nummer 3 staat als je in Google op site stats zoekt. So far echter niets illegaals, het plaatje is gewoon zicthbaar en de alt-tekst is slim gekozen.
Direct onder het plaatje staat echter een gewone link om de tekst “website tellers”. De div om deze link heen wordt verborgen door de CSS “display:none”, waardoor gebruikers de link niet te zien krijgen. En omdat de gebruiker iets anders te zien krijgt dan de zoekmachine, is dit spam. Overigens gebruikt Onestat (nog slimmer!) verschillende anchor teksten in de links. Bij Medicalfacts.nl zie je bijvoorbeeld staan:

Google zegt: verborgen layers? Hah!

Nu is er overigens een kleine complicatie. Als je bijvoorbeeld naar de text cache van Medicalfacts.nl kijkt, zie je daar ook geen “counter” staan. Terwijl de code er wel in staat. Why?
Google indexeert display:none en visibility:hidden niet meer. Dus het gebruiken van deze CSS techniek om elementen te verbergen maar wel door Google te laten indexeren, werkt niet meer. Tenzij je natuurlijk netjes je CSS in een extern stylesheet zet en die niet laat spideren door dat in robots.txt te verbieden.

Dus dan is de hamvraag, zou Google nog wel ranking toekennen aan al die eerdere indexeringen van Onestat’s spam? Of scoort Onestat toevallig zo goed door andere manieren van optimalisatie?

Zie ook de zoekmachine keyword referrers van juni 2006.

28 gedachten over “Onestat website teller is zoekmachine spam (maar Google is on it)

  1. Tobi

    Veel tellergebruikers maakten zich hier onbewust ook al schuldig aan door de afbeelding te verkleinen tot 1×1 pixel o.i.d. Volgens de toen geldende (NedStat) voorwaarden mocht dit ook niet. Nu waarschijnlijk nog steeds niet.

    Het zou toch wat zijn als zoekmachines pagina’s als een browser kunnen ‘bekijken’, dus inclusief style sheets en javascript. Volgens mij moet dat een groot deel van dit soort acties kunnen ondermijnen.

    Like

  2. Pingback: Outofthequestion.nl » Blog Archive » Onestat tellers spam?

  3. Sander

    Als Google, of een andere zoekmachine, elementen indexeerd(e) die als eigenschap display:none; hebben dan is dat een fout in de spider en geen spam. Dergelijke elementen behoren namelijk niet gerenderd te worden door een browser. En als je niet wilt dat pagina’s anders in de zoekmachine-db terechtkomen dan dat normale bezoekers ze zien zul je dus je spider moeten laten renderen zoals een browser dat doet (lees: hoort te doen). Bij visibility:hidden; ligt dat anders, dergelijke elementen moeten namelijk wel gerenderd worden.

    Door display:none; als spam te beschouwen kunnen vrijwel alle sites met uitklapmenu’s in de ban. Lijkt me niet de bedoeling.

    Like

  4. Ulco

    Ah, dus hier komen al mijn bezoekers vandaag vandaan, leuk 🙂
    @Sander: Deels heb je natuurlijk wel gelijk, aan de andere kant: Ten eerste horen stijlelementen sowieso niet in de HTML. In veel gevallen kan je er denk ik wel vanuit gaan dat een in de html toegevoegd stijlelement wat ook nog de property display:none of visibility:hidden heeft er om een dubieuse reden staan.
    Er zijn veel voorbeelden te noemen waarmee is aan te tonen dat Google deze inderdaad niet meer indexeert.

    In het geval van uitklap menu’s, daar zal het zelden om in-page stijlelementen gaan en waarschijnlijk ook vaker om hover effecten (suckerfish menu’s). Dus voor zoekmachines daar geen problemen.

    Like

  5. Sander

    Of je het nu met een CSS-hover doet of met JavaScript (in IE kun je nog steeds niet zonder), in beide gevallen gebruik je display:none; Dat maakt dus helemaal niets uit. Hover is geen eigenschap die je toekent, maar een event-selector, waaraan je vervolgens eigenschappen zoals display kunt koppelen.

    Zowel in HTML 4 als in XHTML 1 is het inline style-attribuut overigens gewoon toegestaan. Het is misschien niet zo netjes, maar het is gewoon valide code als je het wel doet. Soms kan dat nodig zijn om voor een vervelende browser wat stijlkenmerken te overschrijven. In CSS zijn er slechts zeer beperkte middelen om browser-afhankelijke stijlkenmerken te defini?´ren, terwijl browsers lang niet in alle gevallen pagina’s op dezelfde manier renderen. Dan kan een correctie achteraf (in de header van het HTML-bestand of inline) eventueel uitkomst bieden.

    Overigens zijn er ook zat uitklapmenu’s die niet geheel door Javascript opgebouwd worden, maar alleen d.m.v. JavaScript ‘aan’ of ‘uit’ gezet worden. De menu’s zelf staan dan gewoon al klaar in de HTML-code maar worden d.m.v. display:none; alleen niet direct getoond. Of dit stijlkenmerk nu extern, intern of inline gedefinieerd wordt doet er feitelijk helemaal niet toe.

    Als een bedrijf code aanlevert zodat mensen die in hun site kunnen invoegen, zoals tellers of een zoekvenster, dan zal zo’n bedrijf er eerder voor kiezen om deze code compact te houden (indien mogelijk) in plaats van deze uit te smeren over verschillende bestanden. Inline style-attributen lijken me in zo’n dan ook voor de hand liggen. Personen die weten dat je dat soort zaken beter gescheiden kunt houden vissen het er dan zelf wel uit.

    Like

  6. Sander

    Het afschermen van je CSS d.m.v. robots.txt zou wat mij betreft trouwens wel als zoekmachine-spam gezien kunnen worden. Je biedt spiders namelijk iets anders aan dan je normale bezoekers.

    Like

  7. Ulco

    Jullie zijn mij kwijt in ieder geval… Er zit nog steeds geen enkele logica achter het indexeren van display:none etc. Denk dat het belangrijk is het verschil te zien tussen spideren/crawlen en indexeren.

    Het zien van afgeschermde robots.txt als se-spam gaat natuurlijk helemaal nergens over. Ook dat heeft te maken met indexeren en je biedt spiders helemaal niets anders dan normale bezoekers :s

    Like

  8. Sander

    Aangezien een normale browser elementen met de eigenschap display:none; niet hoort te renderen zou een spider dit ook niet moeten doen. Links die op deze manier niet getoond worden zijn dan ook geen SE-spam, de zoekmachine krijgt immers geen andere content aangeboden dan de bezoeker.

    Het gebruik van robots.txt zelf staat in principe los van SE-spam, tenzij je het dus bewust inzet om zaken aan SE-spiders te tonen die je voor je bezoekers verborgen houdt. Met enkel robots.txt kan dat ook niet, maar in combinatie met CSS dus wel, mits de spider zich aan de standaarden houdt die voor browsers gelden.

    Like

  9. Sander

    Door de SEs geen toegang te geven tot het bestand (CSS) waarin beschreven staat dat je bepaalde elementen niet aan bezoekers getoond moeten worden. Standaard worden elementen als links e.d. wel getoond, dus de spider zal ervan uitgaan dat dat het geval is. Er wordt hem immers informatie achtergehouden waarin staat dat dat niet zo is.

    Met alleen robots.txt kun je spiders inderdaad niks voorschotelen wat bezoekers niet kunnen zien, maar in combinatie met CSS is dat dus wel mogelijk.

    Like

  10. Wolter

    Om dit gelijk als zoekmachinespam te betitelen gaat inderdaad wat ver, en ben daar erg kritisch in als zoekmachinemarketingspecialist. Sluit me wat dat betreft aan bij Sander, maar vind de discussie wel interessant. Immers: wat te doen als niet OneStat, maar de gebruiker van OneStat de tag verbergt omdat hij/zij dit simpelweg lelijk vindt?

    Bots uitsluiten van stylesheets neigt al erg snel naar het opzettelijk verbergen van zaken die expliciet bedoeld zijn de zoekmachines te misleiden. Dat is en blijft gewoon spam natuurlijk.

    Like

  11. Luc Franken

    Stel nou dat ik een site heb met een Flash menu. Ik maak dan iets als:

    menuitem1
    enz

    //het flash object

    Vervolgens is het met CSS heel simpel om de Flash over de te laten vallen zonder een display: none. Gewoon absoluut positioneren op 0,0.

    Maak ik me dan schuldig aan zoekmachine spam? Ik heb het gedaan omdat ik altijd mijn sites zo maak dat je ze ook tekst-based kunt bekijken. Ik zou het danook vreemd vinden als dit als spam geld aangezien ik *dezelfde* informatie toon aan de zoekmachine.

    Like

  12. Ruben Timmerman Berichtauteur

    Just to be duidelijk: ik zeg niet dat alle gebruik van display:none of visibility:hidden, spam is. Wat Onestat doet, is echter wel spam. De link is immers niet nodig, want gebruikers kunnen hem nooit zien en bevat bovendien verschillende keywords. Het is duus puur gedaan voor optimalisatie.

    @Wolter: ik kaats even terug; vind jij deze link van Onestat dan geen spam?

    Like

  13. Sander

    Ruben, je stelt de vraag hier aan Wolter, maar ik kruip er even tussen. De code van OneStat zoals die in je bericht staat houdt zich volgens mij volledig aan de voor browsers geldende webstandaarden. Iedere spider die een dergelijke link volgt doet dat niet. Een dergelijke spider spammed dus feitelijk zichzelf.

    @Luc: Dat lijkt me geen spam, je biedt immers zowel aan spiders als browsers dezelfde content aan. Bezoekers die niet over de juiste Flash plugin beschikken zien dan ook hetzelfde als de spider.
    Indien de links in het Flash-menu en het HTML-menu hetzelfde zijn zou er natuurlijk al helemaal geen probleem moeten zijn. Ik zou me echter voor kunnen stellen dat niet alle zoekmachines deze methode erg op prijs stellen aangezien je zo je links natuurlijk ook achter een ander element weg kunt moffelen waarin niet dezelfde links worden aangeboden.

    Like

  14. Erwin

    ik neig toch meer naar Ruben’s kant van het verhaal.
    Je laat dan misschien wel dezelfde content zien, maar waar is die link voor nodig als je hem niet laat zien, of in andere woorden verbergt.
    Aan de ene kant is het een html-link…. maar deze verberg je vervolgens weer.
    Waarom zou je dat doen??

    Like

  15. Tobi

    Robots.txt inzetten als spamgereedschap lijkt me niet zinvol. Je kunt een css-bestand excluden maar volgens mij kijken Google en anderen niet naar css-bestanden. Met ‘Allow’ in je robots.txt kun je misschien nog wat hints geven maar spam lijkt me dan ook een te groot woord.

    Ik ben het eens met o.a. Sander dat display: none gewoon niet ge?Øndexeerd moet worden. Dat google anders (helemaal niet?) rendert dan een moderne browser kun je moeilijk de webbouwer/aanbieder verwijten.

    Zoals Ruben zegt ligt het spam-gehalte eerder aan het doel waarmee je iets verbergt dan aan het verbergen op zich en de daarvoor gebruikte techniek. Bij een inline display: none ligt het wel erg voor de hand natuurlijk maar ik kan me situaties voorstellen waarbij je bijvoorbeeld dingen verbergt op het scherm maar w?©l laat zien op het printje.

    Dan ga ik nu mijn ‘display: none’ ombouwen naar ‘height: 0; overflow: hidden’ 😉

    Like

  16. Erwin

    Klopt…
    Maar puur kijkend naar die links van Onestat…
    Geen gebruiker ziet ze…

    Als je zeker weet dat je geen auto gaat rijden koop je toch ook geen auto?

    Like

  17. Sander

    Klopt…
    Het is ook idioot, maar als deze links gevolgt worden door de spider ligt dat niet aan OneStat. Dat zal wellicht ook de gedacht erachter zijn: “wij houden ons aan de regels, als een spider dat niet doet en toch de link volgt dan is dat mooi meegenomen.”

    Overigens kom je wel vaker links tegen die niet getoond worden d.m.v. display:none; maar die niks met spam te maken hebben. Als een site bv. een extra functionaliteit heeft ingebouwd die afhankelijk is van JavaScript (bv. “sluit venster”), dan is het wel zo netjes om de link die deze functionaliteit aanroept ook alleen te tonen als JavaScript ondersteund wordt. Door de eigenschap ‘display’ in eerst instantie de waarde ‘none’ te geven en deze vervolgens door JavaScript te wijzigen in ‘block’ of ‘inline’ weet je zeker dat de link alleen te zien als JavaScript ondersteund wordt.
    In het geval van de OneStat-links lijkt me dit echter niet het geval.

    Like

  18. Ruben Timmerman Berichtauteur

    Ja uhh… ho es effe. Dit is een heel leuke discussie, maar met wat Onestat doet heeft het weinig meer te maken. Mijn point was in ieder geval niet dat al het gebruik van display:none spam is.

    De point is dat Onestat die links er niet voor gebruikers inzet, want gebuikers hebben Javascript. Bovendien staat er op de link vaak iets anders, maar het zijn altijd toevallig de belangrijkste keywords van Onestat, en nooit de naam “Onestat”.

    Je kunt volhouden dat er gebruikers zijn die geen Javascript hebben, maar dat is schijnheilig en onzinnig. Ik kan me niet voorstellen dat iemand (zelfs jij, Sander, oh puritein ;)) echt gelooft dat Onestat een andere reden heeft voor de links dan zoekmachine optimalisatie, over de rug van webmasters die niet precies weten wat ze copy/pasten.

    Als ik overdrijf, let me know 🙂

    Like

  19. Sander

    Waarschijnlijk overdrijf je niet en doen ze het inderdaad voor de zoekmachines. Mijn punt is echter dat ze (indien dit werkt) gebruik maken van een fout in de spider die zo’n link volgt. Die hoort dat namelijk niet te doen. Het zijn de zoekmachines die niet gespamd willen worden en het zijn ook hun spiders die dit op deze manier blijkbaar mogelijk maken. OneStat houdt zich qua code aan de webstandaarden en biedt spiders en browsers dezelfde content. De verantwoordelijkheid voor deze ‘spam’ ligt dus gewoon bij de zoekmachines zelf. En die zouden toch beter moeten weten dan een willekeurige webmasters, beter ook dan OneStat. Ze spammen feitelijk zichzelf en OneStat maakt gebruik van die mogelijkheid.

    Mijn JavaScript-verhaal ging ook niet over deze specifieke OneStat-links (zie laatste regel), maar had meer betrekking op enkele opmerkingen van andere posters (mensen, geen grote foto’s boven je bed) die stelden dat een link met als eigenschap display:none; eigenlijk alleen maar op spam kan duiden.

    Like

  20. Erwin

    OneStat houdt zich qua code aan de webstandaarden en biedt spiders en browsers dezelfde content.

    Qua browsers inderdaad wel… maar als je kijkt naar spiders en gebruikers niet… En bij Google staat in de guidelines ook users, en geen spiders

    Nr. 1 bij Google’s Quality Guidelines:
    Make pages for users, not for search engines. Don’t deceive your users or present different content to search engines than you display to users, which is commonly referred to as “cloaking.”

    Even een ander punt tussendoor wat me opviel in Google:
    Gisteren kwam ik op een andere pagina met webmasterinfo, hierin stond dat je geen websites hoefde aan te melden en de optie om dit te doen was ook niet meer beschikbaar. Er stond een stuk tekst bij dat het aanmelden niet hoeft omdat google via links van en naar andere sites zelf de pagina vindt en opneemt in de resultaten.
    Vandaag is deze pagina weer weg en zie ik weer de oude webmaster-info…

    Like

  21. Sander

    Een spider is voor een zoekmachine wat een browser is voor een gebruiker. Zowel de spider als de browser krijgen de OneStat-link voorgeschoteld (dus dezelfde code). De browsers renderen deze link niet (zoals het hoort gezien de toegevoegde style-kenmerken) en spiders zouden dat dus ook niet moeten doen. Op die manier zien zowel de bezoeker als de zoekmachine deze links niet (dus dezelfde content).

    Waar slaat de eis op dat je spiders dezelfde content/code aan moet bieden als browsers als die content vervolgens in beide gevallen totaal verschillend wordt ge?Ønterpreteerd?

    Like

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit /  Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit /  Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit /  Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit /  Bijwerken )

Verbinden met %s