了解robots文件，主动告诉搜索引擎该抓取什么内容

　阿里云优惠券先领券再下单

导读：首先我们要了解什么是robots文件，比如，在安徽人才库的首页网址后面加入“/robots.txt”，即可打开该网站的robots文件，如图所示，文件里显示的内容是要告诉搜索引擎哪些网页希望被抓取，哪些不希望被抓取。因为网站中有一些无关紧要的网页，如“给我留言”或“联系方式”等网页，他们并不参与SEO排名，只是为了给用户看，此时可以利用robots文件把他们屏蔽，即告诉搜索引擎不要抓取该页面。

蜘蛛抓取网页的精力是有限的，即它每次来抓取网站，不会把网站所有文章、所有页面一次性全部抓取，尤其是当网站的内容越来越多时，它每次只能抓取一部分。那么怎样让他在有限的时间和精力下每次抓取更多希望被抓去的内容，从而提高效率呢?

这个时候我们就应该利用robots文件。小型网站没有该文件无所谓，但对于中大型网站来说，robots文件尤为重要，因为这些网站数据库非常庞大，蜘蛛来时，要像对待好朋友一样给它看最重要的东西，因为这个朋友精力有限，每次来都不能把所有的东西看一遍，所以就需要robots文件屏蔽一些无关紧要的东西。由于种种原因，某些文件不想被搜索引擎抓取，如处于隐私保护的内容，也可以用robots文件把搜索引擎屏蔽。

当然，有些人会问，如果robots文件没用好或出错了，会影响整个网站的收录，那为什么还有这个文件呢?这句话中的“出错了”是指将不该屏蔽的网址屏蔽了，导致蜘蛛不能抓取这些页面，这样搜索引擎就不会收录他们，那何谈排名呢?所以robots问价的格式一定要正确。下面我们一起来了解robots文件的用法：

1.“user-agent：*disallow：/”表示“禁止所有搜索引擎访问网站的任何部分”，这相当于该网站在搜索引擎里没有记录，也就谈不上排名。

2.“user-agent：*disallow：”表示“允许所有的robots访问”，即允许蜘蛛任意抓取并收录该网站。这里需要注意，前两条语法之间只相差一个“/”。

3.“user-agent：badbot disallow：/”表示“禁止某个搜索引擎的访问”。

4.“user-agent：baiduspider disallow：user-agent：*disallow：/”表示“允许某个搜索引擎的访问”。这里面的“baiduspider”是百度蜘蛛的名称，这条语法即是允许百度抓取该网站，而不允许其他搜索引擎抓取。

说了这么多，我们来举个例子，某个网站以前是做人才招聘的，现在要做汽车行业的，所以网站的内容要全部更换。删除有关职场资讯的文章，这样就会出现大量404页面、很多死链接，而这些链接以前已经被百度收录，但网站更换后蜘蛛再过来发现这些页面都不存在了，这就会留下很不好的印象。此时可以利用robots文件把死链接全部屏蔽，不让百度访问这些已不存在的页面即可。

最后我们来看看使用robots文件应该注意什么?首先，在不确定文件格式怎么写之前，可以先新建一个文本文档，注意robots文件名必须是robots.txt，其后缀是txt并且是小写的，不可以随便更改，否则搜索引擎识别不了。然后打开该文件，可以直接复制粘贴别人的格式，

Robots文件格式是一条命令一行，下一条命令必须换行。还有，“disallow： ”后面必须有一个空格，这是规范写法。

文章有万马奔腾原创，转载请注明。

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

震惊！百度搜索地位崩塌，微软Bing和俄罗斯Yandex上升

震惊！中国的搜索引擎市场正在发生巨变。百度搜索巨头地位崩塌，微软Bing和俄罗斯Yandex崛起成为中国前两大搜索引擎

标签：

搜索引擎
ChatGPT 火了，搜索商业化的下一次进化还远吗？

ChatGPT火了，搜索商业化的下一次进化还远吗？

标签：

百度

搜索引擎
百度搜索页面质量标准及首页基础信息设置标准

百度于2022年7月27日更新了“百度搜索页面质量标准”，对“优质内容”进行了重新定义，更准确、更详细的诠释了什么是高质量页面。我大致看了一下，这次搜索引擎优化规则更新还是比较重要的。

标签：

搜索引擎
网站优化的三大标签如何优化？新手适用

title可以设置几个关键词一个网站title可以设置最多几个关键词，最少几个关键词，有限制吗。从搜索引擎快照展示方面考量：谷歌、百度、360搜索、搜狗搜索等搜索引擎能够展示的快照字数都是有限制的，title展示字数大概是25个汉字，description大概是3行文字(约莫160个字符左右)。

标签：

网站优化

搜索引擎
百度还是企业做流量首选渠道吗？

为什么想到写这个?一是让SEO同学们了解下搜索引擎市场占比，二是让大家不要只盯着做百度SEO!希望对你有帮助或启发。1、百度搜索引擎市场占比数据

标签：

seo优化

搜索引擎

当前位置：首页 > 站长 > 搜索优化 > 正文

了解robots文件，主动告诉搜索引擎该抓取什么内容

相关文章

震惊！百度搜索地位崩塌，微软Bing和俄罗斯Yandex上升

ChatGPT 火了，搜索商业化的下一次进化还远吗？

百度搜索页面质量标准及首页基础信息设置标准

网站优化的三大标签如何优化？新手适用

百度还是企业做流量首选渠道吗？

热门排行

信息推荐

编辑推荐

站内站外形成链轮的深度分析

如何研究行业用户数据与热点追踪

锚文本对关键词排名优化用处大吗如何操作

逆冬分享2个SEO实战干货收录+快排深度剖析结果

利用全拼域名快速排名的技巧

热门标签

当前位置：首页 > 站长 > 搜索优化 > 正文

了解robots文件，主动告诉搜索引擎该抓取什么内容

相关文章

震惊！百度搜索地位崩塌，微软Bing和俄罗斯Yandex上升

ChatGPT 火了，搜索商业化的下一次进化还远吗？

百度搜索页面质量标准及首页基础信息设置标准

网站优化的三大标签如何优化？新手适用

百度还是企业做流量首选渠道吗？

热门排行

信息推荐

编辑推荐

站内站外形成链轮的深度分析

如何研究行业用户数据与热点追踪

锚文本对关键词排名优化用处大吗如何操作

逆冬 分享2个SEO实战干货 收录+快排深度剖析结果

利用全拼域名快速排名的技巧

热门标签

逆冬分享2个SEO实战干货收录+快排深度剖析结果