重庆网站建设公司_重庆软件开发公司_公墓管理系统_重庆天蚕网络科技有限公司023-63612462

资讯信息

首页 > 资讯信息 > 行业动态

导致网页不被爬虫抓取的无用时间信息

2020年12月18日

        网站内容发布后几个礼拜都未曾收录,并已将这些url放入sitemap,并使用了百度统计的集成的JS推荐,但是未曾有改善。经追查,原来是因为页面上的无用时间信息——没有想到是不是?重庆软件开发公司快来看看这个案例吧。

站点求助:自查
根据反馈中心的回复,使用抓取异常工具诊断:未发现异常
站点求助:现象
一起飞网站目录内容发布后几个礼拜都未曾收录。案例如下:
我们已将这些url放入sitemap,并使用了百度统计的集成的JS推荐,但是未曾有改善。
院长出手,内部追查
工程师结论:spider抓取很及时,但因为该网站没有设置内容产出时间,网站底部却有个老旧时间日期,导致spider误以为网页内容老旧(具体策略较复杂,在此不做赘述)。建议增加页面内容产生时间,去掉没有必要的时间信息。
 
站点总结:
1、网页内容尽可能加上产出时间,也就是发布时间
2、网页上切忌勿乱加时间,这种时间是一个大忌
3、跟百度沟通的时候,一定要条例清晰,证据确凿。自身的问题一定要先排查准确。
 
4、百度site的结果时间和权重并无太多关系
 
©2006 重庆天蚕网络科技有限公司 渝ICP备09007657号-11

渝公网安备 50010302002275号

在线咨询

售前咨询

售后服务