Duplicate Content Checker

Aus Online Marketing Wiki
Wechseln zu: Navigation, Suche


Duplicate Content Checker sind Softwares, deren Zweck es ist, nach Duplicate Content (doppelten Inhalten) im Web zu suchen. Dabei wird der Text von Webseiten mit den Inhalten aus dem Web verglichen, um zu prüfen, ob dort identische oder ähnliche Inhalte, also Duplikate, existieren. Im Falle eines positiven Ergebnisses greift das Warnsystem des Duplicate Content Checkers ein und informiert, welche Textstellen in einer gleichen oder ähnlichen Form andernorts im Web vorhanden sind, die regelmäßig farblich markiert oder auf sonstige Weise hervorgehoben werden, und nennt die konkrete URL, unter der Duplicate Content abrufbar ist.

Duplicate Content Checker und SEO

Für Webseitenbetreiber ist es in vielerlei Hinsicht sinnvoll, auf einen Duplicate Content Checker zurückzugreifen. Werden auf der eigenen Webseite Duplikate veröffentlicht, kann dies nicht nur einen Verstoß gegen das Urheberrecht mit sich bringen. Viele Suchmaschinen, darunter vor allem auch Google, gehen massiv gegen Duplicate Content im Internet vor, um ihren Nutzern qualitativ hochwertige Suchergebnisse anbieten zu können. Duplicate Content wird aus diesem Grund entweder von vornherein nicht in den Suchindex aufgenommen oder es erfolgt eine Abstrafung, sofern es später zur Feststellung der Existenz eines Duplikats auf einer Webseite kommt. Um Risiken in dieser Hinsicht gänzlich auszuschließen, sollten deswegen nicht nur die eigens verfassten Inhalt wiederholt auf Duplicate Content geprüft werden, sondern auch Content, der unter Inanspruchnahme externer Dienstleister, in Auftrag gegeben wird.

Probleme

Die Nutzung eines Duplicate Content Checkers wirft jedoch in zweierlei Hinsicht Probleme auf. Zum einen wegen des erheblichen Prüf- und Korrekturaufwands, der erforderlich ist, wenn man eine möglichst umfangreiche Plagiatsprüfung wünscht. Je nach Sensibilität der verwendeten Software werden oft unzählige Meldungen über doppelte Inhalte ausgegeben, die jeweils einzeln zu überprüfen und gegebenenfalls zu korrigieren sind. Wird auf eine weniger sensible Software zurückgegriffen oder wird die Sensibilität bei variabel wählbaren Sensibilitätsstufen verringert, geht dies möglicherweise auf Kosten der Prüfung und es besteht die Gefahr, dass etwaige Plagiate nicht aufgedeckt werden. Zum anderen ist der Prüfungsumfang von vielen Softwares beschränkt. Zieht ein Duplicate Content Checker beispielsweise den Suchindex von Google oder einer anderen Suchmaschine heran, die naturgemäß nicht alle Webseiten indexieren, kann es vorkommen, dass eine Duplikatsprüfung negativ ausfällt, obwohl doppelte Inhalte auf den (nicht indexierten "Noindex") Webseiten existieren. Schließlich beschränkt sich die Prüfung ausschließlich auf Inhalte aus dem Web und erfasst damit keine Inhalte, die möglicherweise aus anderen Quellen (z.B. Büchern) kopiert und nicht ausreichend durch eine entsprechende Quellenangabe belegt wurden.