nofollow = nospam?

17. April 2005 | Tim Springer

Weil Kommentar-Spam in Weblogs zunehmend zu einem Problem für die Suchmaschinen wird, schlägt Google eine Lösung in Form des nofollow-Attributs vor. Für Google mag das interessant sein – für den Weblog-Betreiber eher weniger.

Worum geht es? Wenn Spammer in Weblog-Kommentaren für eine andere Website werben, dann haben sie zwei Absichten: Zunächst hoffen sie ganz einfach darauf, dass Weblog-Leser auf den angegebenen Link klicken. Vor allem aber wollen sie die Positionierung der beworbenen Website in den Suchmaschinen verbessern – weil nämlich Google & Co. darauf achten, wie oft eine Website von anderen verlinkt wird. Dieses demokratische Bewertungsverfahren wird natürlich zur Farce, wenn man selbst auf seine Website verlinken kann – beispielsweise in einem Forum oder eben in einem Weblog-Kommentar. Und wenn man dies nicht nur manuell, sondern automatisiert über Robots (Bots) tut, dann kann man seine Verlinkungsrate ziemlich rasch ziemlich massiv in die Höhe treiben.

Google möchte nun, dass Weblogs so modifiziert werden, dass sie Links in Kommentaren mit einem nofollow-Attribut kennzeichnen. Spammer-Links wären dann für Goolge sehr einfach zu erkennen und würden nicht indiziert: <a href="http://www.allfree.com" rel="nofollow">Viagra for free!</a>. Leider würden auf diese Weise unterschiedlos alle Kommentar-Links ignoriert – auch wenn sie nicht von Spammern stammen.

Was allerdings noch schwerer wiegt: Die vorgeschlagene Methode hilft zwar Google (weil es Spammer nicht in den Suchmaschinen-Index schaffen), nicht aber dem Website-Betreiber (weil Spammer natürlich nicht so freundlich sind, mit dem nofollow-Attribut arbeitende Weblogs mit Kommtar-Spam zu verschonen.

Wesentlich effektiver sind da Spam-Filter-Plugins. Für WordPress sehr empfehlenswert: Dr. Dave’s Spam Karma. Einmal installiert filtert es zuverlässig alle Empfehlungen für Glücksspiele oder Potenzmittel und ist praktisch wartungsfrei. False Positives sind minimal, False Negatives selten – wer ganz sicher sein will, kann sich zudem eine Liste mit den gefilterten Kommentaren mailen lassen und bei Bedarf korrigierend eingreifen.

Was man sich bewusst sein muss: Spam Karma verhindert zwar, dass Kommentar-Spam publiziert wird – gestoppt werden die Spam-Bots damit aber nicht, und so werden sie weiterhin zu Besuch kommen, den Server belasten und die Datenbank füllen. Will man das Übel an der Wurzel packen, so muss man verhindern, dass ein Bot das Kommentarformular überhaupt abschicken kann. Falls man die Kommentarfunktion nicht ganz abschalten will, braucht man einen Mechanismus, der einen menschlichen Leser von einem Spam-Bot unterscheidet.

Ein solcher Mechanismus heisst Captcha (Completely Automated Public Turing Test to Tell Computers and Humans Apart). Beliebt sind in diesem Zusammenhang Zufallscodes, welche in Form eines Bildes angezeigt werden und dann in ein Eingabefeld übertragen werden müssen. Verzerrt man die Zeichen und benutzt man einen unruhigen Hintergrund, so stossen die Bots mit ihrer Zeichenerkennung rasch an ihre Grenzen, während ein Mensch auch einen stark verfremdeten Code noch gut lesen kann.

Für WordPress gibt es hierfür das Botcheck-Plugin von Brian Schneider Es ist seit heute auch auf Weitblick installiert, und ich bin sehr gespannt, ob Spam Karma weiterhin so viel zu tun hat wie bisher…