在GSC索引的报告中,经常能发现其会出现很多问题,其中最为特殊的就是“未编入索引”的问题,并且该问题还主要分为两种情况:“已抓取-未编入索引”、“已发现-未编入索引”等多种情况,让很多站长头疼的是,该部分数据提示的问题,到底该不该处理呢?又该怎么处理呢?
对于Google来说,其给的白皮书强调了站长没必要去处理这部分数据,并且出现这部分情况的原因主要来源于以下几点:
- 服务器错误(5xx)
- 重定向错误
- robots.txt 屏蔽
- “noindex”标记
- 软 404
- 未找到(404页面)
- 禁止访问 (403) 而被屏蔽
- 遇到其他 4xx 问题而被屏蔽
- 被GSC删除工具删除
- 已抓取 – 尚未编入索引
- 已发现 – 尚未编入索引
- 备用网页(有适当的规范标记)
- 重复网页(用户未选定规范网页)
- 重复网页(Google 选择的规范网页与用户指定的不同)
- 网页会自动重定向
这部分问题主要分为两种情况:Google系统引起的问题与网站自身出现的问题,对于Google来说,问题来源的9和10,也就是“已抓取-未编入索引”和“已发现-未编入索引“是Google系统造成的问题,虽然Google强调用户不用做出处理,但是我们还是需要按照实际情况处理的。
问题解答(Google系统引起的问题):首先当GSC提示“已发现-未编入索引“时,我们要先分析其发布的时间、站长提交的时间,若GSC提示页面已发现超过两周的时间,还是未进行抓取,我们可以再次通过sitemap进行提交,并在做一周的观察,若还是未抓取,用户可以统计这部分链接,并通过检查搜索工具进行提交。
若出现“已抓取-未编入索引”的情况,这部分数据比较特殊,用户需要做好抓取链接的统计,该部分链接可能存在已经收录过,由于季度性热度问题,从而移除Google搜索结果,这部分数据可不做修改,但出现新页面被抓取后,超过2周以上还未被编入索引,站长首要做的就是检查页面质量是否有问题,若有问题,站长可以进行微调整后,再通过GSC进行提交。
问题解答(网站自身引起的问题):该部分问题主要由上述的很多种情况,Simon就不做一一讲解,首先5XX引起的问题一定要去解决,这部分问题是一定会造成Google对网站的负面影响,也就是我们所谓的处罚,用户可以去检查服务器配置、网站加载问题(JS、Css)、页面被攻击(DDOS攻击、日志攻击等)、爬虫抓取的压力问题,而像robots文件和“noindex”标记,则需要用户自己调整网站;404问题并不会对网站造成影响,而用户使用软404,则是Google不建议的,最好改为404;使用GSC删除工具,一般可以取消,但是也会造成不可逆转的问题,其他问题这里Simon就不做多讲解了。