用户在运营网站期间,网站的js文件经常或产生大量无实际意义的页面 ,该部分页面若不清理,很容易造成网站的50X问题,所以用户最常使用的办法则是清楚缓存和该部分JS文件,但是无论是哪种办法,很容易导致搜索引擎抓取过后的网站产生404或50X的问题。
首先我们来了解一下搜索引擎对于两个状态码的看法:
页面显示404状态
网站产生404页面,虽然对于搜索引擎来说,其声明404页面并不会对网站产生负面影响,但是经过数据比对,我们主要将该问题分为两种情况:
(1)网站不需要的页面
网站的个别JS会产生大量的动态页面,该页面一般并没有实际作用,但是搜索引擎还是会将其进行收录,导致浪费了大量的抓取资源,通常我们会将此部分代码删除或将这部分页面进行删除,防止网站被黑导致产生大量的垃圾邮件,用户调整后,不仅不会受到搜索引擎限制,反而还会有积极作用。
除此之外,用户更新产品或其他页面,想要将部分过时的页面删除,该部分页面已经被Google收录,这里的问题,用户不必有任何心理负担,可以直接将该页面删除,并且设置状态为404。
(2)网站删除有用页面
网站运营的过程中,经常会遇到突发意外,导致数据丢失,这就导致很多我们所需要的页面丢失,该部分链接在搜索引擎看来不会影响到网站,但是我们从工具查看的数据还是丢失了,这是因为搜索引擎在多次抓取相关页面之后,发现该部分页面数据一直是404的状态,所以其会认为该页面,用户已经不需要,则将其从Search页面删除,这就导致已经产生的关键词和排名丢失。
还有一种情况就是我们的网站产生大量的404页面,并在前台可直观显示,例如菜单栏、新闻显示,可能会给搜索结果的人造成用户体验度,则该情况需要站长将404页面从前台移除或恢复原有的状态。
404页面也可以给用户带来好的作用,当网站不需要某些页面、不想被收录都可以使用404的方式解决。
网页显示50X状态
一般网站显示50X,主要是服务器出现短暂的影响,用户可以查验服务器使用时,是否出现过载的现象或者其他原因,如果没有,可以看看带宽或者nginx是否有问题,50X的问题,该问题带来的影响是巨大的,例如Google声明若长时间网站处于50X的状态,有极大的可能Google会将其判别为负面,从而导致网站一蹶不振。Googlebot 会降低网站的抓取速度。抓取速度下降幅度与返回服务器错误的具体网址数量成比例。 Google 的索引编制流水线会从索引网址中移除始终返回服务器错误的网址。
解决方案:排除法(按轻重排序)
1.检查服务器和带宽,是否出现异常的状态,一般goolge bot来源于美国,可能会出现加载问题导致的500.
2.检查nginx是否出现问题
3.提交GSC的“检查”搜索框,看这两个链接是否还有问题,然后提交收录。
4.在服务器错误这里验证。
备注:若以后还出现其他链接,可以考虑服务器是否过载,网站的流量过大、页面太大、js与css加载过慢等产生。