seo-nerd® GmbH - digital success
Akazienstraße 3a, 10823, Berlin, Berlin, Deutschland

WDF*IDF

Ermittle, was Deinen Texten fehlt
Ein Mann mit irrem Blick jongliert einen Basketball, darüber der Spruch - gekonnt mit Keywords jonglieren dank WDF*IDF Formel

WDF*IDF ist eine in SEO-Kreisen gerne gehandelte Formel, mit der nachgeprüft werden soll, ob Texte ein ausreichend großes Spektrum an relevanten Begriffen bedienen, ohne das eigentliche Keyword zu vernachlässigen oder umgekehrt, dieses Fokus-Keyword zu häufig zu verwenden. Ursprünglich stammt die Formel aus der Informationswissenschaft.

Ob Google sie anwendet (und wenn ja in welcher Art und welchem Umfang), ist unklar. Dennoch können Texter und SEOs aus den WDF*IDF-Werten ihrer Texte wichtige Rückschlüsse ziehen. Die Formel hilft vor allem dabei, besser zu verstehen, welche Begriffe andere Texte zum gleichen Thema im Netz häufig verwenden. Im einfachsten Fall gibt die Formel Hinweise darauf, welche Begriffe Du in einem Text noch verwenden könntest, damit er besser rankt.

WDF*IDF als Kampfansage an die Keyword-Dichte

Die WDF*IDF Formel wurde lange Zeit in SEO-Kreisen wie eine Zauberformel behandelt. Obwohl kaum jemand verstand (oder Lust hatte, wirklich nachzuvollziehen), wie sie wirklich zu berechnen war, machte sie rasch SEO-Karriere. Ihr Heilsversprechen lag vor allem darin, einen Text berechenbar zu machen. Bevor die WDF*IDF-Formel die SEO-Bühne betrat, wurden Texte nahezu ausschließlich nach der Keyword-Dichte (Keyword Density) berechnet. Das Wort oder der Begriff, für den man ranken wollte, sollte häufig, jedoch nicht zu häufig im Text vorkommen. Als ideales Verhältnis zur Gesamtmenge an Worten galten 2 bis 3 Prozent. Für manche waren sogar bis zu 5 Prozent akzeptabel.

Die Schwankungen der Prozentangabe ergeben sich bei der Keyword-Dichte aus der stark vereinfachten (um nicht zu sagen: primitiven) Berechnung. Gezählt wird auf der Grundlage aller im Text vorkommenden Wörter. Eingerechnet werden also auch Stoppwörter wie „der, die, ein, und, oder …“ usw. Diese Wörter kommen jedoch in nahezu allen Texten vor. Schon vor der Einführung des Hummingbird-Algorithmus und der Umstellung der Suchmaschine hin zu einer semantisch-holistischen Suche griff die reine Zählerei von Keywords in Texten zu kurz, um ihren wahren Wert für User und die Suchmaschine zu erfassen.

Die Keyword-Dichte kann immer nur ein allererster Anhaltspunkt sein, um zu prüfen, ob der Text überhaupt das Keyword berücksichtigt. Es gibt unzählige Texte im Netz, die mit einer Keyword-Dichte von 1% auskommen (das gilt vor allem für längere Texte). Prüft man diese Texte mit einem WDF*IDF-Tool erkennt man meist recht schnell, woran das liegen könnte: sie bedienen themenrelevante sowie auch sinnverwandte Begriffe zum gewählten Keyword. Sie behandeln ihr Thema also umfassender und sind vermutlich genau deshalb für User interessanter. Die Annahme der WDF*IDF-Jünger ist, dass Google das genauso sehen könnte.

Was sind denn überhaupt WDF und IDF?

WDF = Within Document Frequency

Mit WDF wird eine Formel bezeichnet, die die Häufigkeit der Schlagwörter zur Grundlage nimmt, diese jedoch relativiert, in dem sie mittels Logarithmus diese Häufigkeit staucht und so verhindert, dass ein Begriff zu stark gewichtet wird, wenn er sehr häufig verwendet wird. Diese Berechnung wird im WDF nicht nur für ein Keyword, sondern für jedes sinntragende Wort des Textes vorgenommen.

IDF = Inverse Document Frequency

Da mit dem WDF die verwendeten Terme (Begriffe) eines Textes bereits gewichtet vorliegen, liegt es nahe, diese Gewichtung mit der anderer Texte zu vergleichen – interessant sind dabei natürlich vor allem Texte im Netz, die das gleiche Keyword gewählt haben. Genau diesen Abgleich ermöglicht die IDF-Formel. Sie gewichtet Terme nicht auf der Grundlage eines Textes, sondern auf der Grundlage aller indexierten Texte im Web.

WDF*IDF – die geheimnisvolle Kombination

Werden WDF und IDF miteinander in Verbindung gebracht, erfährt man, welche Begriffe in erfolgreich rankenden Texten besonders häufig verwendet werden. Die Empfehlung der Formel ist, diese Begriffe im eigenen Text ebenfalls mit der relativen Häufigkeit der anderen Texte zu verwenden – nicht seltener als der Durchschnitt der Texte, aber auch nicht häufiger. Nahezu jede WDF*IDF Analyse fördert dabei Terme zu Tage, die bislang im Text nicht berücksichtigt wurden. SEO-Texter können so entscheiden, ob diese Begriffe dem Text noch hinzugefügt werden können, um ihn so noch relevanter erscheinen zu lassen.

Hilfreich, aber kein Selbst-Denk-Ersatz!

Wirklich hilfreich ist die Analyse des Textes jedoch nur, wenn eine ausreichende Anzahl von Vergleichstexten zur Verfügung steht. Hierfür empfehlen sich u.a. diese Seo-Tools:

http://www.wdfidf-tool.com/
http://www.xovi.de/
oder http://www.searchmetrics.com/de/

WDF*IDF-Kritik

Anwendbar ist die Formel längst nicht bei jedem Text: Produktbeschreibungen in einem Onlineshop folgen bekanntlich anderen Regeln als ein informativer Ratgeber in einem Onlinemagazin und müssen entsprechend der angedachten Informationsdichte individuell angepasst werden. Gerade im redaktionellen Bereich sind die von den WDF*IDF-Tools ermittelten Keywords oft nicht zu verarbeiten. Häufig werden etwa Konkurrenz-Marken genannt, die im eigenen Text keine Rolle spielen dürfen. Zudem erkennt die Formel nicht, welche Schwerpunkte die einzelnen Texte legen.

Die WDF*IDF-Formel liefert daher bestenfalls Anhaltspunkte, welche Begriffe in einem Text noch fehlen könnten. Es muss jedoch stets im Einzelfall entschieden werden, ob diese Begriffe tatsächlich für den Schwerpunkt des Textes relevant sind. Sie einfach nur „irgendwie“ hinzuzufügen, ist sicherlich keine gute Idee. Zumal Google mittlerweile offenbar weniger mit Termgewichtungen arbeitet (wie sie durch WDF*IDF ermittelt werden), sondern mit Termvektoren. Vektoren ermöglichen es, Verbindungen zwischen Begriffen herzustellen, die miteinander zusammenhängen. Fallen in einem Text etwa Begriffe wie „Stockholm“, „Paris“ und „Berlin“ kann ein Termvektor zu „Hauptstadt“ und „Europa“ gezogen werden, selbst wenn diese Begriffe im Text selbst nicht genannt werden.

Genau dieses Verfahren ist im selbstlernenden RankBrain verankert, den Google seit 2015 einsetzt und der aus dem Stand zu einem der wichtigsten Rankingfaktoren überhaupt wurde. Je weiter Google, sich in Richtung einer semantisch-holistischen Suchmaschine entwickelt, desto geringer dürfte der Wert einer Formel wie WDF*IDF für SEOs sein. Als Inspirationsquelle für wichtige, relevante Begriffe taugen die entsprechenden Tools jedoch allemal.

Das könnte Dich auch interessieren