用户在使用GSC当中的sitemap工具时,经常会出现【无法获取】的问题,需要注意的是:这可能并不是一个错误问题。
首先用户需要明确的是:Googlebot每天需要处理数以万计的数据和内容,其中就包括网站的sitemap文件,由于每天有不断增加的新内容和页面调整,Google可能在工作时存在大部分数据的积压,所以这需要一定周期,才能以最佳的方式处理完成数据。
这也就造成了很多用户在sitemap文件创建,并提交GSC工具后,显示sitemap文件【无法获取】或【无法读取站点地图】。
用户可以通过一下的方式进行判断sitemap是否真的存在问题:
1. 检查网站的sitemap是否放置在网站的根目录当中或提交的链接是否准确。
2. 检查sitemap的格式和文件类型是否正确。
3. 文件无任何问题,用户可以通过富媒体工具检查相关sitemap(选择桌面端用户代理),网站可能会提示以下几种问题:
- 该文件被“noindex”阻止,这种问题通常是正常的现象,需要理解的是:noindex/X-robots-tag HTTP 标头不会阻止站点地图被处理,用于可以检查当前的链接抓取状态,返回值200为正常的现象。
- 检查sitemap抓取之后,显示的代码文件,是否有文件的部分内容。
用户也可以通过检查搜索工具提交网站的sitemap站点地图,并通过下载网站的logs文件,分析Googlebot抓取网站 sitemap的状态是否正常。
对于用户来说,Sitemap站点地图并不是唯一的链接提交给Google的方式,用户可以通过以下方式,同样实现sitemap相同的作用:
- 通过检查搜索工具提交:检查搜索工具是GSC当中使用率最高的内容之一,其可以指定部分链接给Google,并且用户可以将页面的主要链接,通过此方式进行提交,不过每日具有额度显示,一般在11条左右,每日通过太平洋时间进行更新。
- 通过Google API提交:API提交和sitemap提交是Google都推荐使用的方式,并且两者可以同时进行使用,该方式可以实时的告知Google新内容的更新和内容修改,告知Googlebot可以过来抓取。
- 通过调整网站的内部链接:该方式有两种,一种是通过网站全局模块,将页面的主要链接设置在其中,另一种是用户通过锚文本,将被编入索引的优质内容设置相关锚文本,指向未被编入索引的页面。
- 通过优质的外部链接指向网站的重要页面。
Sitemap站点地图显示错误,提交站点地图只是一个提示:它不能保证 Google 会下载站点地图或使用站点地图来抓取网站上的网址,所以不用过于着急。若出现明显的错误问题,Google Search Console会通过消息告知用户具体的错误内容,如:页面链接不一致、文件设置错误等。