Wie kann ich WDF*IDF für meine Inhalte nutzen

WDF*IDF ist eine Formel aus dem wissenschaftlichen Bereich des Information Retrieval (Details unten im Text). Kurz gesagt dient sie dazu, den Wert eines Textes inmitten einer Sammlung von Texten zu ermitteln. Dazu wird das Verhältnis bestimmter Begriffe in einem Text mit dem Verhältnis dieses Begriffs in allen potentiell möglichen Texten bestimmt. Das kann sowohl für wissenschaftliche Arbeiten in einer Bibliothek gelten als eben auch für Webseiten im Internet – auch wenn hier die Größe der Sammlung nahezu unendlich ist. So kann die Relevanz einer Seite zu einem bestimmten Thema bestimmt werden, ohne dass es dabei allein auf die Keyword-Dichte ankommt. Aber nutzt Google das? Was bringt uns das?

Inwiefern Google die Formel tatsächlich zur Webseitenbewertung nutzt ist umstritten. Allerdings verwenden Suchmaschinen natürlich irgendwelche Algorithmen, um Webseiten zu bewerten und kategorisch Themen zuzuordnen. Mit online verfügbaren Tools (z.B. WDF*IDF Tool von Onpage.org oder wdfidf-tool.com) lassen sich die eigenen Texte mit anderen relevanten Seiten im Internet vergleichen. Das zweite angesprochene Tool analysiert beispielsweise das Vorkommen relevanter Begriffe auf den Top 15 Seiten des aktuellen Google-Rankings zu diesem Suchbegriff. Zusätzlich lässt sich das Verhältnis zur eigenen Seite darstellen.

Wie soll ich meine Webseite damit optimieren?

Prinzipiell sind die Tools mit Vorsicht zu genießen. Allein aufgrund der WDF*IDF-Verteilung von Begriffen auf ein Suchmaschinenranking zu schließen ist natürlich zu einfach gedacht, denn dazu kommen bekannterweise noch hunderte andere Faktoren. Außerdem ist die automatisierte Auswahl der Begriffe in den Tools oft mangelhaft. Was man aber tun kann und meines Ermessens auch sollte: Die Ergebnisse der WDF*IDF Analyse als Input nehmen, um die eigenen Texte zu ergänzen. Denn oft tauchen im Ergebnis themenrelevante Begriffe auf, die man vielleicht noch nicht im Kopf hatte und eventuell ebenfalls weiter behandeln möchte. Schaden wird das sicher nicht und neben der Keyword-Dichte hat man so noch mehr Input, anhand dessen man seine Texte optimieren kann.

Wie funktioniert WDF*IDF genau?

WDF steht für „within document frequency“, d.h. wie oft ein Begriff (einzelnes Wort oder Kombination von Wörtern) in einem Text vorkommt. Dieser Wert wird neben seinem Vorkommen logarithmisch ins Verhältnis zum relativen Vorkommen aller Begriffe im Text gesetzt – dieser Wert ist also auch stark abhängig von der Gesamtlänge des Textes.

Formel zur Berechnung der within document frequency (WDF)
Formel zur Berechnung der within document frequency (WDF)

IDF dagegen berechnet die „inverse document frequency“, d.h. die Anzahl aller Dokumente, in denen der Begriff vorkommt, wird zur Berechnung hinzugezogen und ins Verhältnis zur Anzahl aller Texte gesetzt. Auch diese Berechnung erfolgt logarithmisch, um die Ergebnisse klein und verrechenbar zu halten.

Formel zur Berechnung der inverse document frequency (IDF)
Formel zur Berechnung der inverse document frequency (IDF)

Die Multiplikation beider Werte (also WDF * IDF) ergeben so die relative Gewichtung eines Begriffs innerhalb der potentiell möglichen Dokumentensammlung (also bei Webseiten das gesamte Internet). Die Größe des Internets ist dabei gut für die Formel, denn das Ergebnis wird präziser, je größer die Gesamtsammlung ist. Für ein sinnvolles Ergebnis muss die Formel für alle wichtigen Begriffe in einem Text angewandt werden.

4.5/5 - (2 votes)

Über Martin Weigert

Martin Weigert hat Medieninformatik und Kommunikationswissenschaften in München studiert und ist seit 2007 in den Bereichen Web-Entwicklung, Online-Marketing und Suchmaschinenoptimierung tätig.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert