网站收录之百度抓取诊断的重要性

编辑:云鸦网络 时间:2021-04-10 16:02

网站建设完成后,有时候可能因为robots设置不合理、DNS未更改及缓存未更新、IP错误等原因而影响收录。因此在网站建设完成后一定要用百度抓取诊断侦测一下。

什么是抓取异常
百度蜘蛛无法正常抓取网页,就是抓取异常。


抓取异常的原因有哪些
一、网站异常
1、dns异常
当Baiduspider无法解析您网站的IP时,会出现DNS异常。可能是您的网站IP地址错误,或者域名服务商把Baiduspider封禁。请使用WHOIS或者host查询自己网站IP地址是否正确且可解析,如果不正确或无法解析,请与域名注册商联系,更新您的IP地址。
2、连接超时
抓取请求连接超时,可能原因服务器过载,网络不稳定
3、抓取超时
抓取请求连接建立后,下载页面速度过慢,导致超时,可能原因服务器过载,带宽不足
4、连接错误
无法连接或者连接建立后对方服务器拒绝
二、链接异常
1、访问被拒绝
爬虫发起抓取,httpcode返回码是403
2、找不到页面
爬虫发起抓取,httpcode返回码是404
3、服务器错误
爬虫发起抓取,httpcode返回码是5XX
4、其他错误
爬虫发起抓取,httpcode返回码是4XX,不包括403和404
 



抓取诊断使用说明
1、抓取诊断工具,可以让站长从百度蜘蛛的视角查看抓取内容,自助诊断百度蜘蛛看到的内容和预期是否一致。
2、每个站点每周可使用70次,抓取结果只展现百度蜘蛛可见的前200KB内容。
3、抓取诊断可能受到网络影响造成抓取失败,如遇到抓取失败情况,可重新检测,并自查网站是否可正常访问。