Gibberish Scores

Aus Online Marketing Wiki
Wechseln zu: Navigation, Suche


Der "Gibberish Score" ist ein Maß für die "Schwafel-Dichte" einer Textes, der als Content auf einer Webseite stehen kann. Tatsächlich bemüht sich Google darum, zu erkennen, ob viel Geschwafel auf einer Webseite vorkommt und hat sogar die damit verbundenen Heuristiken und Algorithmen als Patent angemeldet. Gegenwärtig ist noch unklar, ob und wie das Patent bzw. der Gibberish Score für die Rangberechnung von Webseiten wirksam werden kann. Während selbsternannten Experten für Suchmaschinenoptimierung wieder einmal das Ende der Optimierung voraussagen, winken professionelle Experten für Suchmaschinen ab: Google wird noch lange brauchen, um seine Algorithmen darauf zu trimmen, echtes Geschwafel vom schwierig zu verstehenden, aber kompetenten Texten unterscheiden zu können.

Die Theorie hinter dem Gibberish Score

Den Gibberish Score gibt es bereits seit 2009 als Patent. Gibberish ist als Geschwätz oder Kauderwelsch (unverständliche Gaunersprache) bestimmt. Prinzipiell kann jeder Text auch Elemente von Geschwätz haben oder bewusst unverständlich formuliert sein, um zentrale Aussagen zu verbergen. Man kann diese Textstücke hinsichtlich ihres prozentualen Anteils bestimmen und berechnet damit eine Zahl, die den Score darstellen kann. Ähnlich geht die Schufa vor, wenn sie die Kreditwürdigkeit einer Person bestimmen will. Hier werden Einzelaussagen zu niedriger Bonität ins Verhältnis zur Gesamtzahl aller Aussagen gesetzt.

Kompetente Sprecher oder Leser können recht gut entsprechende Gibberish- oder Geschwätz-Anteile in Texten auszählen, doch Google muss deren Vorgehensweisen in sehr allgemeiner Form formulieren, so dass auch ein Computer dies umsetzen kann; ein ehrgeiziges Ziel, wenn man bedenkt, dass Computer Sprache nur syntaktisch aber nicht semantisch verarbeiten können.

Ansatzpunkte für den Gibberish Score

Googles Algorithmen versuchen eine Sprachbewertung über Vergleiche herzustellen. Ein Webseitentext wird in Einheiten von wenigen Worten zerlegt und anschließend wird geprüft, ob diese Wortteile schon in anderen Texten vorkommen, von denen man den Gibberish Score schon bestimmt hat. Das impliziert eigentlich, dass Google zunächst für sehr viele Texte den Gibberish Score manuell bestimmen muss. Ergänzend zu diesen Vorgehen geht aber Google auch hin und ordnet bestimmten Webseiten, die schon länger ein gutes Ranking haben und auch gut von reputationsstarken Webseiten verlinkt werden, automatisiert einen niedrigen Gibberish Score zu. Das ist aber sicherlich in vielen Fällen problematisch, weil sich Webseiten mit hohem Schwafel-Anteil auch ziemlich weit vorne im Ranking befinden können. Man denke nur an viele langatmige Wikipedia-Webseiten aus dem Bereich von Philosophie und Sozialwissenschaften. Google achtet allerdings bei sogenannten Money- Keywords besonders auf die Art der Verlinkung und die Länge Textes und die Häufigkeit von Wiederholungen, um recht schnell mit dem Schwafel-Verdacht ein Abwertung vornehmen zu können.