运营笔记网站收录大揭秘:网站不收录最容易忽略的原因
关于网站收录问题,一直是很多站长甚至企业头疼的问题,很多人认为网站收录不收录是看百度吃饭,也就是百度决定的,这也就导致目前在收录问题上分为两派:
一、主动推送百度,就会收录。
二、收录确实是百度决定的。
首先我们来说说第一种观点,第一种观点主动推送的意思就是各种提交,比如熊掌号提交、主动提交、自动提交(目前已失效),周级提交(目前好像也失效),mip提交,sitemap提交。
目前测试的结果,其实主动提交、熊掌号天级提交、sitemap提交是有效的,最起码在数据上能显示出来,在这种观点基础上延伸出一个观点就是,只要有足够多的蜘蛛,网站一定会收录。哪怕你文章再垃圾,再差劲,只要有蜘蛛,100%收录。
另外一个观点是提交只是收录的先决条件,提交未必100%收录,也就是说,就算蜘蛛来了,也未必收录。
那么我个人是倾向于第二种的,为什么会这么说,我拿一些证据;
我之前有一个网站,提交熊掌号一直不收录,结果一直反馈给百度,反复提交后,居然收录了几条,过一段时间又不收录了,然后又提交反馈百度,百度回复说我提交的是熊掌号是pc资源,不是移动资源,不收录是符合预期的,什么意思呢?
比如我一个文章链接是www.abc.com/123.html,那么浏览器模拟手机后,链接变成了www.abc.com/123.html#efdfd,在模拟手机浏览后,#后面变成了随机数字,这是跟我程序本身有关系。
大部分网站的格式是www.abc.com/123.html,手机是m.abc.com/123.html或者www.abc.com/123.html(pc和移动已做了自适应。)所以这种格式提交熊掌号是没有任何问题。但我那种情况是极为罕见的,所以百度不收录,哪怕文章质量再好。
但我另外一个朋友也是跟我一模一样的程序,也就是说,他的网站跟我的情况一模一样,但是他却收录了。
所以我猜测,要么我朋友说谎,要么百度忽悠我,但我个人分析后发现,我朋友既没有说谎,百度也没有忽悠我,导致这种情况,只能用一个原因解释,那就是他的站,还没有被百度针对,也就是说,百度更新一些算法的时候,还没有轮到他的网站。
为何我得出这样的结论,因为每次百度更新的时候,总会有一些网站状态没有变化,一些网站状态有变化,有变化的是可以理解为先被百度测试新算法,如果没问题,慢慢扩大到更多网站,这也符合互联网产品一个属性,先小部分测试,然后扩大。
从这点来看,我个人分析有几个细节需要说明,这是我个人的一些分析:
百度搜索后台(针对百度内部员工),应该是机器加人工审核的,网站被搜索后台应该都做了标记,比如你的网站被特别照顾(或许也就是沙盒状态?),所以好像做seo特别难搞的原因。从反复反馈百度这件事来看,他们会打开你的网站,去分析,然后符合手工点入收录库,从产品角度来说,我们来还原这个过程;
百度员工打开你提交的链接,符合收录标准,然后点加入收录库,这条链接就可以被site出来了,也就是链接的状态改变了。我用一个原型图来说明;(只是草图,别太针对。)
按道理,这些字段其实能对应的上百度站长平台后台的一些字段,这里只为了演示,所以错误字段请忽略。
如果是这个流程的话,上述一切都能解释的清楚了,我那些链接提交不收录因为链接格式应该不对,所以触发一直不收录,而我不停的提交反馈后,百度分析后加入收录库了,接着后面的百度应该发现我的站的一些问题,所以直接反馈让我整改。
那么百度反馈都是机器人的说法不准确,应该有人工参与了,只是大部分是机器人,还有百度数据那么多,出点bug是正常的,所以不要太较真。另外很多人太迷信白皮书,我只想说我个人的观点,百度是说一套做一套的,别太迷信白皮书。
以上只是自己一些凭经验分析,不代表官方表态,欢迎seo大佬一起来交流。
运营小贴士:如果网站不收录,可以用浏览器模拟手机端,看是否url起了变化。