拒绝废话,100%纯技术“网站快照异常修复方案”
很多企业和seo在查看网站收录的时候,总是会发现一些“异常快照”,但是却找不到解决方案,今天贺贵江对于这个问题做出一个纯技术贴的回答,喜欢的转发收藏关注我。
一、快照不更新
快照多久不更新算是异常?1-3天的更新都是正常的,所以这个时间内,无需担心什么,不要因为一两天不更新就上火。而一周不更新快照则表明网站近期存在一定隐患,这个时候往往是搜索引擎对站点的观察期。10天以上不更新,这个时候就要小心了,网站很容易降权。
临时解决办法:
寻找首页快照,找到网站快照进行投诉,投诉完毕后,等待机器自动对快照进行更新,如果第二天没有更新,反复3次投诉,100%得到快照的更新。
根本解决办法:到百度资源平台看一下,官方近期是否有哪些算法的上线,网站是否触及了,网站近期的服务器怎么样是否稳定,这个很重要。最后则是:站点近期是否做了较多的页面更改,这些更改很可能不利于搜索引擎优化。
二、快照抓取不全
有很多排名不理想的网站,首页都有一个共同点“快照抓取不全”,甚至快照中“空空如也”什么都没有的情况。
上图是一个最新的示例,那么产生的原因是什么呢?
第一,页面大小超过3mb,尤其是达到5mb很容易出现蜘蛛抓取不全的问题;
第二,存在大量的超长url链接:
一张图片的url长度(截图只展示了部分),这样的链接相信确实是百里挑一的,直接就把蜘蛛给吓跑了!
第三,大量的文本css或脚本:
示例站文本css文件在头部中持续了“5000行”,技术为什么不写到css文件中再进行调用呢?真的是让人莫名其妙。
所以说,如果你的网页快照抓取不全面了,这一块一定要检查一下,能写到css或者js中的数据,一定不要直接将其放到html中直接进行文本展示。
第四,整体载入太慢:
一个网站打开速度可能2秒,但是这个时候却没有完全加载完毕,我们很多时候会看到浏览器左下角一直显示正在载入,这种情况同样会造成蜘蛛抓取快照不完整的情况。贺贵江这里建议的是,大家通过键盘f12来查看一下,并使用f5按键强制刷新页面:
网站真的可以在3s之内把信息全部加载完毕吗?如果没有加载完毕,就要通过时间线来看一下,究竟是哪些东西影响到加载了,这个时候针对性的处理会更合适!
第五,首字节时间
首字节时间是什么鬼?"从发送请求到web服务器的时间+web服务器处理请求并生成响应花费的时间+web服务器生成响应到浏览器花费的时间"
有些网站下载速度分明很快,但是却总是会卡几秒然后页面才能打开,这样就导致了蜘蛛不抓取快照,或者抓取不完整的情况,这就是所谓的“首字节时间”太长造成的问题了。
那么造成这个问题的原因是什么呢?综合来看:简单的讲一下,这个问题与“程序|dns|服务器”三者有关,具体很复杂,解决方式:a,网站使用cdn;b,避免使用虚拟主机,建议使用云服务器。c;服务器分配到的cpu进行升级。
第六,带宽和峰值
前端时间诊断一个客户网站,发现在大量的页面中都出现了快照抓取不全面的问题,最终查看原因发现是:带宽不足导致的问题。
我们来简单举个例子,例如页面大小为100kb,10个人同时访问,下载量就是1000k/128k/s=7.8125 这样这10个人同时完全打开页面时间为7.8秒左右,如果页面大小是3mb呢?
所以你的网站带宽足够支撑你的网站吗?当然了现在很多时候我们可以在服务器的管理中看到流量记录,但是如果“峰值”,这样肯定是不行的,带宽经常出现峰值,那么搜索引擎快照这里也更容易出现抓取异常!
三、快照内容有误
咦,为什么url链接和快照内容不一样呢?最近有不少站长来咨询seo问我说:pc端的快照,为什么打开后是移动端的内容呢?很奇怪吧。
其实这个问题的主要原因是因为:“跳转”造成的,不少站点全站设置了“在移动端访问pc自动跳转到移动,在pc端访问移动自动跳转到pc端。”这个形式。而这恰恰是形成快照异常的根本!
针对于这个问题的解决方式:把内页的跳转取消掉就可以了,保留首页跳转就ok了!就这么简单。其实,网站真的没必要做全站跳转!
a5创业网seo总监/贺贵江,业务合作:https://www.admin5.cn/seo/zhenduan/ 我的微信公众号2567173,更多搜索引擎内容分享!
上一篇: Python3.5运算符操作实例详解
下一篇: Python对象转换为json的方法步骤