Textoptimierung nach der WDF*IDF Methode
WDF*IDF Verfahren, auch Termgewichtung, bezeichnet ein Verfahren der Suchmaschinenoptimierung (SEO), mit dem sich wirkungsvolle Berechnungen bezüglich der Art und Anzahl bestimmter Schlagwörter (Keywords) in Online-Texten anstellen lassen.
Von der Keyword-Dichte zur Within Document Density
Als Grundlage dient die Keyword-Dichte, in der engl. Literatur Density, die den Anteil zuvor z.B. über den Google Keyword Planner ermittelter häufig verwendeter Suchbegriffe, im Verhältnis zur gesamten Wortzahl des Textes wiedergibt. Auch wenn absolute Zahlen oder Werte hierzu zum Teil umstritten sind, liegt man mit einem Wert von 2-4 Prozent in der Regel ganz richtig.
Formel für die Keyword-Density Berechnung:

(Quelle: https://karlkratz.de/onlinemarketing-blog)
Mit Hilfe dieser Formel kann die Keyword Density eines gegebenen Dokuments berechnet werden: kd steht für die Keyword Density. Die Keyword Density wird als Quotienten aus der Termfrequenz tf und der Termanzahl l berechnet. Die Termfrequenz tf(u,v) gibt an, wie oft der Term u im gegebenen Dokument v vorkommt. Die Termanzahl l(u) gibt an, wieviele Terme insgesamt im Dokument v vorkommen.
Zumeist versucht man die Keywords in einem Text mit 300-350 Wörtern unterzubringen, damit es auch für den menschlichen Leser noch zu einem interessanten Inhalt kommt. Schließlich sollte man bei aller Optimierung für die Suchmaschinen auch lesenswerte Inhalte schaffen, damit die Besucher der eigenen Seite auch wieder kommen und sich angesprochen fühlen.
Within Document Frequency WDF
WDF (Within-document Frequency) bedeutet die dokumentspezifische Gewichtung eines Wortes und ermittelt zuerst die Gewichtung der Worte, die in einem Text vorkommen.
Dieser Wert, der über eine Formel mit zwei ins Verhältnis gesetzten Logarithmen berechnet wird, berechnet nun das relative Vorkommen eines gegebenen Wortes im Verhältnis zum relativen Vorkommen aller anderen Wörter in einem Dokument. Durch den Logarithmus wird der Wert „gestaucht“, was gegen den Effekt wirken soll, dass eine unendliche Erhöhung der Keywordanzahl automatisch einen immer besser werdenden Wert erzeugt.
Formel für die WDF Berechnung:

(Quelle: www.karlkratz.de/onlinemarketing-blog)
Inverse Document Frequency IDF
Im Gegensatz zu WDF, das sich auf den eigenen Text bezieht, stellt IDF ein Verhältnis zu allen anderen im Internet vorhandenen Texten, in Bezug auf ein bestimmtes Keyword her. Je mehr Dokumente es zu einem Schlüsselwort gibt, umso “schwieriger” wird die Erzeugung von Relevanz.
Formel zur Berechnung des IDF Wertes:

(Quelle: www.karlkratz.de/onlinemarketing-blog)
Nd = Anzahl aller Dokumente
ft = Anzahl aller Dokumente, die das Wort enthalten
Da die Anzahl aller Dokumente, die im Internet enthalten sind, durch die Anzahl aller Dokumente, die das Wort tatsächlich enthalten, dividiert wird, bedeutet ein großer Ergebniswert ein dementsprechend gutes Resultat.
Karl Kratz zur praktischen Anwendung seiner Formel:
„In der Praxis verwendet man als N(D) nicht den Dokumenten-Inhalt der gesamten Datenbank, sondern berechnet einen dynamischen Dokument-Korpus auf Basis der Summe der Suchmaschinenresultate für die in den analysierten Dokumenten gefundenen Terme bzw. Termkombinationen.
Das sorgt zwar für eine gewisse Unschärfe, stellt jedoch auch mit Blick auf die auszuwertende Datenmenge einen guten Kompromiss dar.“
Grundlegend lässt sich zusammenfassen, dass neben den Werten des eigenen Dokumentes (WDF) besonders auch das Umfeld (IDF) bei einer Betrachtung wichtig ist. Ein Dokument/Text kann für die eigenen Vorstellungen noch so perfekt aufgebaut sein, wenn das relevante Umfeld (Top 10 bei Google) einfach komplett anders aussieht.
Vorgehen WDF IDF Optimierung
Wie kann man nun praktisch die Optimierung der eigenen Seite angehen?
- Finden und identifizieren Sie die relevanten Keywords für ihr Projekt, mit denen Sie bei Google gefunden werden möchten.
- Untersuchen Sie für jedes einzelne Keyword das Umfeld der Suchergebnisse SERP sehr genau. Hierzu können die folgenden Fragen helfen:
- Wie viel Content stellen die Top 10 auf ihren Seiten zur Verfügung?
- Welche Keywords abseits des Hauptkeys werden von vielen Konkurrenten verwendet?
- Wie häufig kommen die unterschiedlichen Keywords in Bezug auf den Umfang des Inhalts vor? Das Mittel hierfür ist das vorgestellte WDP*p*IDF Verfahren!
Erst wenn Sie diese Recherchen und Analysen fertig gestellt haben, geht es an das eigentliche Texten und die Inhalte. Erstellen Sie nun Content, welcher im Umfang und Häufigkeit der verwendeten Keywords möglichst nahe an die Top-10-Konkurrenten angelehnt ist.