搜索引擎反作弊的三个模型

　阿里云优惠券先领券再下单

诸如链接农场、内容农场、关键词堆砌等都是十分常见的作弊方式，为了维持良好的搜索展现结果，搜索引擎自然就会有反作弊进行应对。

那么，搜索引擎会通过怎样的方式进行反作弊处理呢?

总的来说，会有以下三种思路：

1、信任传播模型

前段时间同事A跟我说了一件事儿，他的姐姐B在国外留学，然后一天B在qq上跟A说洗衣服把手机，银行卡什么的全部洗了，让A给B的老妈打电话寄点钱来，A立刻执行，B的老妈也深信不疑，在即将打出的那一刻，B的一个电话，挽救了即将发生的损失。

细思恐极。

其实，这也是一个信任传播模型，直接在QQ上跟B的妈妈说，B的妈妈必然不会完全相信，但是经由A的口一传，就立刻不一般。因为，A在B的妈妈的信任名单中。

OK，由此而来，就是一种反作弊的思路。

在海量的网页数据中，通过技术或人工的手段，获取值得完全值得信任的网页设置为白名单。白名单中网页的信任值由链接顺着向外扩散而递减或者衰减。然后，设定一个值，高于此值，是OK的网页，低于此值，不好意思，你作弊了。

2、不信任传播模型

这个，其实跟第一种思路是及其类似的，找到一群作弊的网页，然后通过链接关系分析不信任分值。

唯一一点需要注意的是，信任分值，是通过链接正向传递的，不信任分值是通过链接反向传递的。举个例子：

A为垃圾页面，则指向A的链接B是垃圾页面的概率比A指向的链接C的概率要大的多。

3、异常发现模型

所谓异常，可以是作弊页面的特征，也可以是正常页面的特征。

集合了这些特征，再由此来判定一个页面是否作弊或者是否正常，也是蛮OK的一件事情。

来个简单的识别链接农场的小例子：

链接农场中的链接关系，是由设计者精心布置的，由此一来，必然会有些违背自然的特征，诸如：

1)、出链与入链的统计分布规律：正常的页面出链与入链满足Power-law分布，作弊的链接违反该分布;

2)、作弊的链接的Url网址往往过长，包含较多的点画线及数字等;

3)、诸如入链及出链的增长率等，正常网页和作弊网页在这些变化模式上是不同的。

转载请注明链接地址。

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

震惊！百度搜索地位崩塌，微软Bing和俄罗斯Yandex上升

震惊！中国的搜索引擎市场正在发生巨变。百度搜索巨头地位崩塌，微软Bing和俄罗斯Yandex崛起成为中国前两大搜索引擎

标签：

搜索引擎
白杨SEO：学会GPT和SEO结合，可能让你更好的搞定全网自然搜索流量！

你好，我是白杨SEO。GPT类产品越来越多了，继去年12月初国外发布了以GPT-3.5能力的ChatGPT（付费会员已能用GPT-4）外，今年3月百度推出了文心一言，前两天阿里通义千问也公测了，360的红孩儿也即将推出。你可能会说，我好像都没有听过，这些跟我有什么关系？如果我再跟你说一个词汇AIGC

标签：

seo搜索引擎优化
ChatGPT 火了，搜索商业化的下一次进化还远吗？

ChatGPT火了，搜索商业化的下一次进化还远吗？

标签：

百度

搜索引擎
百度搜索页面质量标准及首页基础信息设置标准

百度于2022年7月27日更新了“百度搜索页面质量标准”，对“优质内容”进行了重新定义，更准确、更详细的诠释了什么是高质量页面。我大致看了一下，这次搜索引擎优化规则更新还是比较重要的。

标签：

搜索引擎
网站优化的三大标签如何优化？新手适用

title可以设置几个关键词一个网站title可以设置最多几个关键词，最少几个关键词，有限制吗。从搜索引擎快照展示方面考量：谷歌、百度、360搜索、搜狗搜索等搜索引擎能够展示的快照字数都是有限制的，title展示字数大概是25个汉字，description大概是3行文字(约莫160个字符左右)。

标签：

网站优化

搜索引擎

当前位置：首页 > 站长 > 搜索优化 > 正文

搜索引擎反作弊的三个模型

相关文章

震惊！百度搜索地位崩塌，微软Bing和俄罗斯Yandex上升

白杨SEO：学会GPT和SEO结合，可能让你更好的搞定全网自然搜索流量！

ChatGPT 火了，搜索商业化的下一次进化还远吗？

百度搜索页面质量标准及首页基础信息设置标准

网站优化的三大标签如何优化？新手适用

热门排行

信息推荐

编辑推荐

站内站外形成链轮的深度分析

如何研究行业用户数据与热点追踪

锚文本对关键词排名优化用处大吗如何操作

逆冬分享2个SEO实战干货收录+快排深度剖析结果

利用全拼域名快速排名的技巧

热门标签

当前位置：首页 > 站长 > 搜索优化 > 正文

搜索引擎反作弊的三个模型

相关文章

震惊！百度搜索地位崩塌，微软Bing和俄罗斯Yandex上升

白杨SEO：学会GPT和SEO结合，可能让你更好的搞定全网自然搜索流量！

ChatGPT 火了，搜索商业化的下一次进化还远吗？

百度搜索页面质量标准及首页基础信息设置标准

网站优化的三大标签如何优化？新手适用

热门排行

信息推荐

编辑推荐

站内站外形成链轮的深度分析

如何研究行业用户数据与热点追踪

锚文本对关键词排名优化用处大吗如何操作

逆冬 分享2个SEO实战干货 收录+快排深度剖析结果

利用全拼域名快速排名的技巧

热门标签

逆冬分享2个SEO实战干货收录+快排深度剖析结果