TF-IDF: Een relatief onbekende SEO tactiek

Blucactus - TF-IDF seo - title

TF-IDF SEO: Een relatief onbekende SEO tactiek. De SEO wereld verandert snel. Wat vorig jaar populair was, hoeft nu lang niet meer zo populair te zijn. Nieuwe technieken worden telkens weer opnieuw gecreëerd, terwijl oudere methodes langzaam maar zeker verdwijnen. TF-IDF is daar een uitzondering op. Deze wiskundige formule komt nog steeds van pas op de hedendaagse SEO-technieken.

 

TF-IDF staat voor “Term Frequency – Inverse Document Frequency”. Het is een formule, die uitrekent hoe belangrijk een bepaald woord voor een bepaalde tekst is. Berekeningen worden gedaan aan de hand van vergelijkingen van woorden in artikelen op het internet. Het gaat in dit geval over hoe vaak dat specifieke woord in de tekst voorkomt.

 

TF-IDF SEO: Een relatief onbekende SEO tactiek

 

De formule

 

De formule begint dus met TF, oftewel term frequency, het aantal keren dat een bepaald woord in een stuk tekst voorkomt. Een woord dat vaker in de tekst voorkomt heeft dus een hogere TF dan een woord dat slechts één keer voorkomt. Voor het tweede gedeelte van de formule hebben wij IDF(inverse document frequency) nodig. Hiermee wordt uitgerekend hoe belangrijk een bepaald woord is wanneer het aankomt op meerdere online teksten. De samenvatting van deze meerdere losstaande teksten noemt men de corpus.

 

Blucactus-Aan-de-slag-met-TF-IDFDe inhoud van de corpus zorgt ervoor dat wij  kunnen zien welke waarde een woord heeft binnenin die tekst. Belangrijk om te weten is dat lidwoorden en andere veelvoorkomende woorden niet worden meegenomen in de resultaten. Zoals gezegd komen die woorden veel voor, maar hebben ze tegelijkertijd weinig betekenis voor een tekst.

 

Wanneer een corpus bestaat uit honderd sportartikelen, waarvan er 95 artikelen over voetbal gaan en vijf artikelen over andere sporten, dan zult u zien dat in een tennis gerelateerd artikel woorden als forehand, backhand, smash, maar ook namen van spelers erg belangrijk zijn voor dat artikel.

 

In de 95 voetbal artikelen zullen er per artikel ook woorden bij zitten die veel belangrijker zijn voor het ene artikel dan voor het andere. Gaat een artikel over een specifieke club, dan zal de naam van die club enorm belangrijk zijn voor dat artikel. Echter wanneer een competitie beschreven wordt, zijn de namen van de clubs minder van belang, maar zal de nadruk wellicht meer liggen op woorden die met de regelgeving binnen die competitie te maken hebben.

 

Hoe wordt TF-IDF gebruikt?

 

Blucactus - TF-IDF seo - Hoe wordt gebruikt

Zoekmachines maken het meest gebruik van TF-IDF. De grootste zoekmachines zoals Google en Bing, maar ook het Russische Yandex maken hier volop gebruik van. Door TF-IDF te gebruiken op teksten die de zoekmachines op het internet vinden kunnen ze veel beter inschatten wat de in het artikel besproken onderwerpen zijn.

 

Wanneer u naar het woord “bloem” zoekt kunt u zoekresultaten verwachten die met mooie bloemen te maken hebben, maar ook het ingrediënt wat men gebruikt tijdens het bakken van bijvoorbeeld een taart. Zoekmachines combineren woorden met andere woorden die vaak met het zoekwoord worden geassocieerd en bepalen op die manier waar een artikel over gaat.

 

Waar zoekmachines dus volop gebruik maken van TF-IDF seo doen webmasters dat over het algemeen veel minder vaak, terwijl het enorm nuttig kan zijn.

 

Blucactus-TF-IDF- Een-relatief-onbekende-SEO-tactiek-

Webmasters kunnen zich met behulp van TF-IDF laten inspireren door sleutelwoorden te vinden die aansluiten bij het originele sleutelwoord. Met behulp van dit soort suggesties, kunnen webmasters een tekst unieker maken, met als gevolg een hogere rangschikking bij de zoekmachines, wat uiteraard een grotere kans geeft  op bezoekers.

 

Een goede tactiek zou kunnen zijn om websites van concurrenten te analyseren. TF-IDF: Een relatief onbekende SEO tactiek. U kan daarmee een hele verzameling sleutelwoorden bij elkaar rapen waarvan het verstandig zou zijn dat u die woorden opneemt in uw website, om dus uw ranking te verbeteren.

 

Wanneer concurrenten bepaalde woorden veelvuldig gebruiken en u geen gebruik maakt van dat woord, is het dus verstandig om het te implementeren. Dit is de voornaamste kracht van TF-IDF seo voor webmasters. De meeste SEO pakketten bevatten om die reden ook wel een TF-IDF seo  concurrentie analyse module.

 

Aan de slag met TF-IDF SEO

 

Het lastige aan TF-IDF is dat het niet makkelijk is om deze formule zelf uit te rekenen. Handmatig een corpus opstellen is al nauwelijks te doen.

 

Blucactus - FormuleDe formule is dus erg complex en het is daarom beter om hiervoor een hulpmiddel te gebruiken. Inmiddels zijn er diverse websites die zo een hulpmiddel aanbieden, uiteraard ook allemaal te gebruiken tegen bepaalde kosten. Dit verhoogt de SEO kosten, maar goed, tijd is ook geld.

 

Gek genoeg zijn er ook kenners die TF-IDF min of meer dood hebben verklaard, omdat de theorie te oud zou zijn en niet meer zou passen in de hedendaagse wereld van SEO.

 

Het tegendeel is echter waar. De techniek werkt en zal ook in de toekomst blijven werken, of er nu aanvullende en andere technieken bijkomen of niet.  Het is dus niet voor iedereen weggelegd, maar voor diegenen die het een kans willen geven is het zeer waarschijnlijk een mooie opening in een zeer interessante wereld.

 

Zoals een bekend voetballer ooit zei, elk voordeel heeft ook zijn nadeel. Ook TF-IDF heeft zo zijn nadelen. Bij het indexeren van een website wordt elk woord opgenomen in de corpus. Dat wil zeggen niet alleen de tekst van de artikelen, maar ook woorden die voorkomen in de menubalken bijvoorbeeld. Dit kan voor een iets minder gebalanceerd resultaat zorgen. Over het algemeen is dit verschil overigens minimaal.

Gast Auteur: Romano Groenewoud

Bio: Romano zijn bijnaam is ‘SEO Geek’. Dit is wat hij is: Romano leeft, eet, drinkt, slaapt en ademt zoekmachine optimalisatie. Zijn voornaamste drijfveer is topposities behalen in de organische zoekresultaten van Google. Voor hem geeft niets een grotere kick dan grote corporaties aftroeven voor competitieve zoekwoorden. Deze SEO campagnes voert hij overigens samen met een team van freelancers geheel locatie onafhankelijk uit als zijnde digitale nomade vanuit tropische oorden variërend van de Filipijnen tot aan Peru. Zijn missie is om hoogwaardige zoekmachine marketing ondersteuning betaalbaar te maken voor ZZP en MKB Nederland door de scherpste SEO tarieven te hanteren van Nederland.

Wilt u ook gastbloggen? Meld u dan hier aan.

0 antwoorden

Plaats een Reactie

Meepraten?
Draag gerust bij!

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.