长期以来,不断有人问我,为什么有的网站被收录的页面多,有的网站收录得少。为什么某个关键词有的网站会排第一,有的网站会排在几十页以后。。。等等,这些问题看似简单又有着复杂的算法,于是不知道某位高人提出了“权重”这个说话,当然我不是反对,但是我认为,“权重”这两个字太笼统。今天我就来谈谈百度的一些算法。
今天,我首先在这里高调地提出“百度积分”一说。
无论是技术上还是人性化管理上,搜索引擎对网站的收录数量和排名,都是通过积分来管理的。也就是说,谁的积分多,谁的权重就高。
积分的大概算法是:原创文章加分,采集扣分,关键词堆砌扣分,色情、反动内容都扣分。
具体加多少,扣多少,我想只有他们内部几个人知道了。
下面我就来模拟一下百度的积分制度:
1、做一个新站,通过采集的方式在短时间内发布1万篇文章,当百度蜘蛛程序来访时,会把所有内容都收录入存,每篇文章加一分,于是site时,会发现收录了大量页面。
2、在接下来的几天里,百度就会将该站的内容在百度数据里进行分析对比(一个有着N个网站N条内容的庞大数据库)。如果某些(内容)文章在数据库里已经存在,那么就扣分,为了鼓励原创和惩罚采集,扣的分比加的分要多,我们就假设扣2分。
3、当这个站的数量为0或者少于0时,那么在百度里就SITE不到这个站了,这就是我们常说的被K。
======================================
现在我们就来论证一下上面的模拟(假设)
1、百度数据库的存在: 我们经常发现,搜索某个关键词时,显示的页面内容与实际可能不相同,那是因为百度收录后,该页面又进行了修改,那么搜索结果肯定来自百度的数据库了。
2、加分、扣分,一个小的网站(内容不多)被K后,能在短的时间同让他重新收录,因为可以通过发表原创文章不断加分,当积分大于0时,又能SITE到了。 如果是一个大的站(几万以上的采集内容)被K后,解封可能要一年甚至好几年的时间。相信这样的经历大部分站长都有过吧。
当大家看到这里时,先停下来,仔细回忆一下自己的经历和经验,结合我的“百度积分制”,是不是明白了很多?
现在说说百度的关键词积分了。
关键词的积分制和收录积分制是不一样的。但是关键词的排名肯定也需要通过一个积分公式来进行排名,积分高的排前面,积分低的排后面。
影响这个积分的因素主要有域名(URL)、关键词密度、页面结构、内容质量等。
域名(URL):比如在搜索“电影”时,URL或域名中包含“dianying”“movie”的就会排前一些。
页面结构:搜索引擎在抓取页面时,是按从上到下,从左到右的顺序来的,如果他抓了大半天,还没有抓到关键词,那估计排名也就很靠后了(提示:现在知道为什么图王会在admin5的最左上方放着“站长必上的网站”几个字了吧)。
关键词密度和内容质量更不用多说了,网上相关的介绍有一大堆,我就不重要这些。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!