TF-IDF算法是搜索引擎排序过程中一种词频和逆文档频率统计算法,而且在乐天SEO培训网也运用了这种算法,这也可以说是本人对TF-IDF算法在SEO优化中的实战应用。网上虽然有很多关于文章对TF-IDF算法解读,但是都晦涩难懂。
什么是TF-IDF算法?
TF是词频(Term Frequency),指在一个词语在文章中出现的次数。IDF是逆文本频率(Inverse Document Frequency),是指总文件数目除以包含该词语之文件的数目。TF-IDF是一种统计算法,用土话说就是一个词语在一篇文章中出现次数越多, 同时在所有文档中出现次数越少, 越有辨识度,该关键词越能够代表该文章。
TF-IDF在实战SEO过程中有用吗?
可以确定的说是有效的,比如开头本人就说了这个网站在实际SEO优化过程中运用到了TF-IDF算法。目前搜索引擎算法的相关性还是以TF-IDF为基础的,虽然现在又有TF-IWF算法,会更复杂一些,但是搜索引擎算法相关性的甚而算法还是TF-IDF,只是改进算法会复杂得多。
TF-IDF算法的优点是简单,相对容易理解。TF-IDF算法的缺点也很明显,就是算法的精度不高。TF-IDF在计算文件与查询词相关性时,词频越高,相关性越高,越常见的词,对相关性贡献越小。所以在做SEO优化时要考虑TF-IDF,但也不能太过在意,正常写作大多都会符合内容相关性要求了。
最后要说的是,虽然我的网站使用TF-IDF算法暂时排名是在首页,但是过一段时间排名就很难说了,一方面这些SEO词是很多SEOer的追求竞争较大,另一方面有很多SEO大佬在做这个词,我这个网站从建站之后就没管过,所以排名会被慢慢压制下去。
本人在这里胡侃一番,建议大家可以利于TF-IDF算法去进行大量的长尾关键词优化和扩展,如果研究透了这个算法,在SEO实战过程中再配合数据分析和实验测试,你会发现更多奥秘!
文章转自公众号:SEO实战营(ID:ilottecn),原文地址:https://mp.weixin.qq.com/s/kJ-WRF7C28semJVzGa7prA
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!