在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
网络协议http和https区别?网站为什么要进行HTTPS改造?HTTP是互联网上应用最为广泛的一种网络协议,是一个客户端和服务器端请求和应答的标准;HTTPS:是以安全为目标的HTTP通道,简单讲是HTTP的安全版即HTTP下加入SSL层。HTTPS是基于tls和ssl加密的HTTP协议,网络传输是加密的,因此它的安全是显而易见的,包括防窃听、篡改、劫持。
HTTP:是互联网上应用最为广泛的一种网络协议,是一个客户端和服务器端请求和应答的标准(TCP),用于从WWW服务器传输超文本到本地浏览器的传输协议,它可以使浏览器更加高效,使网络传输减少。
HTTPS:是以安全为目标的HTTP通道,简单讲是HTTP的安全版,即HTTP下加入SSL层,HTTPS的安全基础是SSL,因此加密的详细内容就需要SSL。
HTTPS协议的主要作用可以分为两种:一种是建立一个信息安全通道,来保证数据传输的安全;另一种就是确认网站的真实性。
HTTPS优势:HTTPS是基于tls和ssl加密的HTTP协议,网络传输是加密的,因此它的安全是显而易见的,包括防窃听、篡改、劫持。
HTTPS的收录机制
1、Spider如何发现HTTPS
1)、根据网页中的超链接是否是HTTPS,网络中会有一些超链,如果是HTTPS会认为是HTTPS站点。
2)根据站长平台提交入口的提交方式,例如主动提交,如果在文件当中提交的是HTTPS链接会以HTTPS的形式来发现。
3)参考前链的抓取相对路径,第一个网页是HTTPS的,网站内容里面的路径提供的是相对路径,会认为这种链接是HTTPS。
4)参考链接的历史状况,使用这种方式的原因主要是为了纠错,如果错误提取HTTPS会遇到两种情况,一种因为HTTPS不可访问会抓取失败,第二即使能抓成功可能展现出来的可能不是站长希望的,所以会有一定的纠错。
2、HTTPS链接的抓取
现在比较常见的两种,第一种是纯HTTPS抓取,就是它没有HTTP的版本,第二个是通过HTTP重定向到HTTPS,这两种都能正常的进行抓取跟http抓取的效果是一样的。
3、HTTPS的展现
对于HTTPS数据,展现端会有明显的提示
站长平台支持全站HTTPS配置
1、HTTPS配置
之前有一些站长改HTTPS,会疑问为什么站点有些链接是以HTTP的形式来抓呢?为什么没有全站都是以HTTPS的形式来抓取呢?因为以前的机制是url级的,HTTPS抓完一条替换一条,整站需要全抓完才能全部替换掉,现在大家访问站长平台可以发现,左边工具栏多了HTTPS认证的功能,站长平台已经全站支持HTTPS,点这个功能后会有提示引导我们去怎么做,需要提醒是需要全站支持HTTPS,才进行点击,如果不支持的话对站点会有一些副作用。
2、HTTPS验证
当站长在平台上做了配置以后首先会有HTTPS验证,验证确认站长是否误配,具体会检查HTTPS链接是不是可抓取的。另外会对HTTPS的证书校验,包括它的合法性、是否过期、跟它本身的域名是否一致,从这三个角度做校验。
3、HTTPS生效
校验通过后,生效方式从这三个角度进行
1)全站抓取以HTTPS的方式来抓,这会在抓取上做一定的切换
2)全站的展现样式也会直接切换成HTTPS,用了这个功能的好处是会比以前快很多,会略过已收录的网页直接到HTTPS。
常见问题:
1、站长升级HTTPS是不是会影响爬虫抓取?不会。爬虫对HTTPS的合法链接都能抓
2、站长升级HTTPS是不是会影响索引量?不会的,建库做了相应升级,HTTPS的建库是不会有延迟的。
3、站长升级HTTPS是不是会影响排名点击流量?不会,HTTPS改造是不涉及到域名切换,或者说老域名到新域名样式的转变等等这个是不涉及的,可以做到完全无损的切换。
4、站长升级的HTTPS是不是会影响移动适配?不会有这种情况。
5、站长升级HTTPS是不是会影响站长平台工具?不会,站长平台链接提交等工具已经都支持HTTPS了。
站点建议
1、建议站长从HTTP到HTTPS的301跳转,不建议只有HTTPS,而无HTTP到HTTPS的跳转关系,只用HTTPS访问对用户来说,可能会遇到问题。
2、不建议HTTPS、HTTP这两种版本并存,这种情况存在三种问题,第一个它的维护成本比较高,需要维护两个版本;第二个做不到绝对安全,HTTP访问有不安全风险;第三有不一致的可能性,随着长远的发展这两个版本可能会越来越不一致,会影响用户体验,我们建议站长做了HTTPS之后能对HTTPS做一定的跳转预设。
3、HTTPS回退到HTTP极不建议。例如线上已经展示HTTPS的链接给用户点击,如果站长回退到HTTP,用户在浏览器里面点开的时候会展现死链的样式是非常不建议的,做这个之前一定考虑。如果实在想做回退,请在站长平台提交HTTPS校验,并建议站点提前至少24小时在平台提交回退,这样能够保证站长的点击不会出现死链的形式,这点非常重要。
4、HTTPS网页没有建设完成之前不要在互联网上提供超链接,之前遇到过好几个case,本身HTTPS并没有做完,两个版本都存在,但是http是用户可访问的,或者说HTTPS的页面是一个临时性的假页面,这样站点有可能就以HTTPS的形式展现出来,会引起用户体验问题。
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
Python开发中match和search的区别是什么
Python开发中match和search的区别:match()函数只检测 RE 是不是在string的开始位置匹配,search()会扫描整个string查找匹配;也就是说 match()只有在0位置匹配成功的话才有返回,如果不是开始位置匹配成功的话,match()就返回none。
8514
2019-07-01 16:12:22
Redis和MongoDB优缺点对比
MongoDB和Redis都是NoSQL采用结构型数据存储。二者在使用场景中,存在一定的区别,这也主要由于二者在内存映射的处理过程,持久化的处理方法不同。MongoDB建议集群部署,更多的考虑到集群方案,Redis更偏重于进程顺序写入,虽然支持集群,也仅限于主-从模式。
7880
2019-07-16 17:51:21
七种反爬技术大解析
反爬虫 今天小编来和大家谈谈反爬技术。要了解反爬技术就必须要知道爬虫,所谓爬虫其实就是由计算机自动与服务器交互获取数据的工具。目前常见而好用的反爬技术有七种,它们分别是:user-agent,验证码,封IP,滑块验证,关联请求上下文,JavaScript 参与运算以及提高数据获取成本。下面就来仔细分析一下这七种反爬技术吧。
9657
2019-07-26 15:27:12
数据分析工具Pandas简介
随着大数据和人工智能的发展,数据分析行业迎来了历史最高人才需求点。在当下这个大数据广泛应用于各个行业的时代,要想成为企业争抢的人才精英,掌握数据分析能力显得尤为重要。简单来说,数据分析的能力也包括了对数据分析工具的掌握。Pandas就是很好的数据分析工具,可以说学会了Pandas就开启了数据科学的大门。下面来看一下数据分析工具Pandas的简介。
5893
2019-11-15 10:29:11
CSS是什么?起什么作用?
CSS是(Cascading Style Sheets)层叠样式表的缩写简称样式表。网页设计者使用CSS可以定义元素的样式包括字体,颜色及其它的高级样式。做前端页面开发必须要知道CSS的作用及使用方法。
5477
2021-12-07 16:10:29