我是一小白,之前网站是由网站公司的人在搭理,后来自己想打理,就把源码自己拿了过来。
但是突然有一天发现我的网站www.oruifine.com的百度快照显示为2015-2-04,但是通过站长工具查询却显示快照时间为2015-2-17.然后我就site了我的网站,发现第一页是不带index.html的主域名,收录时间为2015-2-14,第二页出现了主域名带index.html的百度快照,时间是2015-2-17.而且之前权重是1,现在变为0了,关键词排名也下降了。
百度了同时收录主域名和带index.html,发现很多人都在问这个问题,有人说这种情况会导致网站首页分权,不利于优化,也有人说这个没什么关系。但是看着就是不爽,所以我就到处百度查看解决方法。
一:空间没有设置默认首页,解决方法就是把index.html设置为默认首页,我的空间是万网的,默认首页也是设置为index.html
二:在其他网站发了大量带index.html的外链,这个我也domain了我的网站,我的外链全是主域名,没有带index.html
三:网站结构问题,首页没有统一,网上大神给出的方法就是要统一首页网址,有首页的地方最好用绝对路径,直接把主域名写上去。(最开始我绕过了这条,最后折腾了几天发现还是这个问题)
四:就是直接用robots把带index.html给屏蔽掉
五:用301跳转,把index.html跳转到主域名(因为我是小白,这个方法我实在不会)
以上几条解决方法可以参考 (如何避免网站收录带index.html的首页导致权重分散)
下面我要说的是我如何查出问题,并解决的,因为网上很多方法只是说了个大概,没有详细的步骤,对于我们这种小白,我觉得还是能给出详细步骤为好。
首页我用到的工具有Xenu 死链检测工具,这个直接百度搜,到处都能下载。
前面说了,出现这种同时收录主域名和带index.html情况,网上的解决方法就那么几条,所以我们也只能一条一条去尝试。
当然我的默认首页是已经设置过了,在浏览器输入www.oruifine.com 带了index.html也会自动跳转到主域名,所以这条我直接跳过。
然后我就用Xenu查看我网站全部链接,因为是企业官网,所以内部链接不多,查找其他还是比较方便,如果你的网站很大,这个工具适不适合我就不知道了。
打开Xenu,点击 “文件” –“检查网址”,然后在弹出的输入框中输入你的主域名,再点确定,等待显示100%时就完成了。
PS:完成后会提示是否生成报告,我是选择否;另外这个工具非常好用,还可以用来整理网站链接,查询你的哪些页面被百度收录了。
然后点击“编辑”—“查找”,输入 “index.html”,点击查找下一个,这样以此查看是否有主域名带index.html,如果你查出确实有这条链接,那么你的就容易解决了。 直接右键点击这条链接,再点击属性选项,就会弹出一个对话框,它会显示你这条链接是在哪个或者哪几个页面出现,然后你找到这几个页面改掉里面的带index.html链接就可以了。(打开问题页面,然后直接右键页面内容选择查看源文件,就能显示网页代码,再搜索index.html就可以定位到问题链接)。
我反复几次搜索了我的网站所有页面,也没有发现存在主域名带index.html,当时就给懵了。后来实在没办法,我就只好robots禁止了index.html。过了几天发现有人说robots禁止可能导致主域名被禁,没办法我只好继续查找解决办法。
重点来了:一次偶然机会,我打开了一个404页面,我的404页面是网上下载的源码,当我点击回到主页时,发现出现了index.html。所以我意识到这个404页面应该就是导致百度收录我的index.html的根源(因为网站做了一个大改动,之前被百度收录的产品页面全删除,重新发布了新的页面,这样就导致了非常多的404页面,而且之前的404页面源码有问题,虽然显示是404,但是用站长工具检测返回值都是200).
PS:如果有遇到静态网404页面设置OK,显示OK,但是返回值是200的,可以查看下我的404页面,我的方法就是把404.html改成404.asp,这个方法也是偶然机会查到的,希望有机会帮助遇到同样问题的朋友。
找到问题所在后,我又把另外一个问题网站 的404页面改掉了,之前这个网站也是主域名迟迟不更新,但是我改掉404的index.html后,不到一周百度快照就更新了。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!