SPAM-Verweise in Google Analytics

Als ich vor ein paar Wochen einen Blick in die Google Analytics-Statistiken von Wunderdogs warf, war ich zunächst verwundert. Mir völlig unbekannte Seiten, u.a.

  • *.darodar.com
  • blackhatworth.com
  • *.iloveitaly.co und *.iloveitaly.com
  • priceg.com
  • econom.co

schienen auf wunderdogs zu verlinken. „Hey, toll!“, dachte ich zunächst. Doch wenn man die verlinkenden Seiten besuchen wollte, wurde man immer nur zur Startseite oder eine 404-Fehlerseite weitergeleitet.

Eine Google Suche später, war ich ein wenig schlauer. Es las sich so, als würden Bösewichte unser kleines Projekt mit schlechten Links verunglimpfen wollen. Also passte ich die htaccess nach den Vorgaben an und wartete eine Woche. Die Zahl der eingehenden Besucher von diesen Seiten ging tatsächlich schlagartig gegen null.

Ursache erkannt, Problem gelöst?

Ein Gedanke ließ mich allerdings nicht los: Wer und warum macht sich jemand die Mühe Wunderdogs mit schlechten Links zu „beschießen“? Schließlich sind wir ja noch ganz am Anfang und keine wirklich ernstzunehmende Konkurrenz. Ich googelte erneut und fand dann noch diesen Eintrag: Removing Referral Spam from Google Analytics.

Ergebnis: Es geht also scheinbar doch nicht darum, Wunderdogs schlecht dastehen zu lassen. Stattdessen wird (mal wieder) versucht, Google auszutricksen, zugunsten der genannten Seiten. Evtl. sind wir auch Teil eines größer angelegten SEO-Experiments.

Wer diese nervigen Ghost Referrals von iloveitaly.co(m) und Co satt hat, dem wird in dem Artikel auch erklärt, wie man seine Statistiken entsprechend filtern kann. Das ist für uns jetzt erstmal nicht so wichtig. Die Anpassungen in der htaccess werde ich allerdings trotzdem drin behalten, auch wenn in dem Artikel geschrieben wurde, dass das eigentlich nichts bringt.

Falls ihr mit diesen oder ähnlichen Problemen zu kämpfen habt, schreibt sie gerne in die Kommentare.

Ich bin Steuermann bei Erdmann & Freunde, einem Netzwerk für Contao-Webworker, und schreibe hier über Themen aus dem Bereich Webdesign und Webentwicklung.

4 Kommentare

  1. Gaby sagt:

    Hi Dennis, da steig ich doch gerne ein in das Thema.
    Ich hatte vor kurzem das gleiche Thema mit *.semalt. Laut google eine Firma für SEO und Webmaster Analytics Tools. Sehr vertrauenserweckend. Mit Änderungen in der .htaccess konnte ich sie bisher auch aussperren.

    Auf einer anderen Domain erhalte ich regelmäßig Besuch von Chinesen und Amerikanern, die Backendlogins suchen in
    http://www.domain.de/Fckeditor/...
    http://www.domain.de/Editor/...
    http://www.domain.de/Admin/...
    Natürlich immer von anderen IP-Adressen. Finde ich auch nicht so nett.
    Lösung Verzeichnisschutz? http://www.domain.de/contao umbenennen? Wie löst ihr das.

    Und wenn wir schon dabei sind:
    Auf einer Domain nervt mich der bingbot. Ständig sucht er nach
    http://www.domain.de/ueber-uns...
    http://www.domain.de/konta.html usw.
    Die Seiten haben nie existiert.

    Ich bin sehr gespannt auf eure Antworten.
    Liebe Grüße Gaby

  2. Carolina sagt:

    Rauswerfen über den Request-String ist ganz hilfreich:

    RewriteEngine On
    RewriteCond %{QUERY_STRING} ^.*(localhost|loopback|127\.0\.0\.1).* [NC,OR]
    RewriteCond %{QUERY_STRING} ^.*(\.|\*|;||’|“|\)|%0A|%0D|%22|%27|%3C|%3E|%00).* [NC,OR]
    RewriteCond %{QUERY_STRING} ^.*(md5|benchmark|union|select|insert|cast|set|declare|drop|update|admin|Fckeditor|Editor).* [NC]
    RewriteRule ^(.*)$ http://%{REMOTE_ADDR}/ [F,L]

    LG, Carolina.

  3. Dennis Erdmann sagt:

    @Carolina: Vielen Dank für die Lösung.
    @ Gaby: Mit den Zeilen von Carolina solltest du eigentlich die Amerikaner und Chinesen in den Griff bekommen (habe es selbst nicht getestet). Was den Bing-Bot betrifft, da würde ich es mal versuchen ihn auf den richtigen Inhalt zu verweisen, z.B. in etwa so:

    RewriteRule ^ueber-uns/?$ /unternehmen.html [R=301]

    Selbst wenn die Seite nie existierte, kann es ja sinnvoll sein, den Bing-Bot per Weiterleitung auf die richtige Seite zu lotsen. Aussperren halte ich für keine gute Idee.

    Generell muss ich sagen, dass ich den meisten Bots Zugriff gewähre. Nur, wenn ich, so wie im Beitrag beschrieben wirklich verdächtige Beobachtungen in den Statistiken sehen (die dadurch auch massiv verfälscht werden), unternehme ich was. Semalt und Co. dürfen bei meinen Projekten also ruhig erstmal weiter spionieren.

  4. Gaby sagt:

    Carolinas Empfehlung werden ich auf jeden Fall ausprobieren. Danke dafür.

    Gegen Bots habe ich normalerweise nichts, aber der Bing-Bot nervt, da er ständig auftaucht und die ganze Statistik verfälscht. Wenn er wenigstens lernfähig wäre, er erhält einen sauberen 404-Status 😉
    Ein Redirect habe ich bisher noch nicht eingefügt, die Liste wäre inzwischen ziemlich lang. Außerdem fallen ihm ständig neue Begriffe ein.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *