如何让HTTPS类网页被百度收录_全站做了HTTPS百度不收录了怎么办
在谈这个问题前我们大家需要了解一下何谓Https、以及Https和Http之间有何区别
先说说何谓Https吧、简单讲是HTTP的安全版、即HTTP下加入SSL层、HTTPS的安全基础是SSL
因此加密的详细内容就需要SSL、 说白了就是加密类的网页信息
那么Https和Http之间有何区别呢?
一、https协议需要到ca申请证书、一般免费证书很少、需要交费
二、http是超文本传输协议、信息是明文传输、https 则是具有安全性的ssl加密传输协议
三、http和https使用的是完全不同的连接方式、用的端口也不一样、前者是80、后者是443
四、http的连接很简单、是无状态的;HTTPS协议是由SSL+HTTP协议构建的可进行加密传输、身份认证的网络协议、比http协议安全
因为Https类网页属于加密类的、所以百度目前不会主动去抓取此类页面、所以会导致此类页面无法被收录、也就无法被用户索引到
如果你的网站既想使用加密协议、又想让蜘蛛抓取的话、可以采用以下方法解决此问题:
一、为需要被百度搜索引擎收录的https页面制作http可访问版
二、通过user-agent判断来访者、将Baiduspider定向到http页面
普通用户通过百度搜索引擎访问该页面时、通过301重定向至相应的https页面
三、http版本不是只为首页制作、其它重要页面也需要制作http版本、且互相链接、切不要出现这种情况
首页http页面上的链接依然链向https页面、导致Baiduspider无法继续抓取——我们曾经遇到这种情况、导致整个网点我们只能收录一个首页
如下面这个做法就是错误的:http://www.dwtedx.com/ 链向https://www.dwtedx.com/bbs/
四、可以将部分不需要加密的内容、如资讯等使用二级域名承载、比如支付宝站点
核心加密内容放在https上、可以让Baiduspider直接抓取的内容都放置在二级域名上
上一篇: 程序员如何多线程工作_程序员工作总结