在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
本文为大家整理总结了Zookeeper的基本知识,主要内容有Zookeeper概述、ZooKeeper特性、ZooKeeper集群角色以及ZooKeeper集群搭建。下面一起来看看大数据学习中的干货知识吧~
1、Zookeeper概述
Zookeeper是一个分布式协调服务的开源框架,主要用来解决分布式集群中应用系统的一致性问题。ZooKeeper 本质上是一个分布式的小文件存储系统。提供基于类似于文件系统的目录树方式的数据存储,并且可以对树中的节点进行有效管理。从而用来维护和监控你存储的数据的状态变化。通过监控这些数据状态的变化,从而可以达到基于数据的集群管理。
2、ZooKeeper特性
(1)全局数据一致:集群中每个服务器保存一份相同的数据副本,client 无论连接到哪个服务器,展示的数据都是一致的,这是最重要的特征。
(2)可靠性:如果消息被其中一台服务器接受,那么将被所有的服务器接受。
(3)顺序性:包括全局有序和偏序两种:全局有序是指如果在一台服务器上消息 a 在消息 b 前发布,则在所有 Server 上消息 a 都将在消息 b 前被发布;偏序是指如果一个消息 b 在消息 a 后被同一个发送者发布,a 必将排在 b 前面。
(4)数据更新原子性:一次数据更新要么成功(半数以上节点成功),要么失败,不存在中间状态;。
(5)实时性:Zookeeper 保证客户端将在一个时间间隔范围内获得服务器的更新信息,或者服务器失效的信息。
3、ZooKeeper集群角色
(1)Leader:Zookeeper 集群工作的核心。事务请求(写操作)的唯一调度和处理者,保证集群事务处理的顺序性;集群内部各个服务器的调度者。 对于 create,setData,delete 等有写操作的请求,则需要统一转发给leader 处理,leader 需要决定编号、执行操作,这个过程称为一个事务。
(2)Follower: 处理客户端非事务(读操作)请求,转发事务请求给 Leader; 参与集群 Leader 选举投票。此外,针对访问量比较大的 zookeeper 集群,还可新增观察者角色。
(3)Observer:观察者角色,观察 Zookeeper 集群的最新状态变化并将这些状态同步过来,其对于非事务请求可以进行独立处理,对于事务请求,则会转发给 Leader 服务器进行处理。不会参与任何形式的投票只提供非事务服务,通常用于在不影响集群事务处理能力的前提下提升集群的非事务处理能力。
4、ZooKeeper集群搭建
Zookeeper 集群搭建指的是 ZooKeeper 分布式模式安装。通常由 2n+1 台 servers 组成。这是因为为了保证 Leader 选举(基于 Paxos 算法的实现)能过得到多数的支持,所以 ZooKeeper 集群的数量一般为奇数。 Zookeeper 运行需要 Java 环境,所以需要提前安装 jdk。对于安装leader+follower 模式的集群,大致过程如下:
配置主机名称到 IP 地址映射配置;
修改 ZooKeeper 配置文件;
远程复制分发安装文件;
设置 myid;
启动 ZooKeeper 集群。
如果要想使用 Observer 模式,可在对应节点的配置文件添加如下配置:
peerType=observer
其次,必须在配置文件指定哪些节点被指定为 Observer,如:
server.1:node-1:2181:3181:observer
以上就是Zookeeper基本知识的总结,大家都掌握其中的精华了吗?如果觉得本文的干货太多,不妨收藏起来,慢慢学习和理解。欢迎大家关注博学谷资讯,更多精彩内容等着你!
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
2019年大数据在各行业的应用 深度解析
如今,我们都生活在一个数字化的世界里,大数据的应用也变得越来越广泛,它深度改变着我们的生产生活方式。本文小编就来深度解析一下,2019年大数据在各行业的应用。这些行业都从大数据中获取了当下真正有价值的信息,从而极大地提高了生产效率。
8298
2019-07-22 18:00:56
大数据技术应用专业有哪些?主要做什么?
大数据概念持续火爆,其核心价值并非仅仅是数据量大,更重要的是在海量的数据背后所体现出来的应用价值。如果把大数据比作一种产业链的话,那么这个产业最终实现价值的关键在于,通过对数据的“加工处理”实现数据的“增值”。因此围绕大数据技术衍生出来大量的应用专业方向。都有哪些大数据技术应用专业呢?他们主要做什么工作呢?下面我们一起来看一下。
12786
2019-09-11 18:29:17
大数据开发常用的工具介绍
Java语言和 Linux操作系统,它们是学习大数据的基础。java:只需了解一些基本知识,不需要用很深的 Java技术来做大数据,学习 java SE等于学习大数据基础。与大数据有关的软件都在 Linux上运行,所以 Linux要学扎实一点,学好Linux对你快速掌握与大数据有关的技术,能让你更好地了解 hadoop, hive, hbase, spark等大数据软件的运行环境和网络环境配置。
5742
2020-07-02 13:49:48
Pandas如何分块处理大文件?
在处理快手的用户数据时,碰到600M的txt文本,用sublime打开蹦了,用pandas.read_table()去读竟然花了小2分钟,打开有3千万行数据。仅仅是打开,要处理的话不知得多费劲。解决方法:读取文件的函数有两个参数:chunksize、iterator。原理分多次不一次性把文件数据读入内存中。
5927
2020-08-14 16:16:47
大数据智能交通未来会是怎样的交通状况?
大数据智能交通未来会是怎样的交通状况?智能交通也是智慧城市的一个重要组成部分将会改变我们的交通,交通少不了大数据的处理,人工智能自动驾驶离不开大数据的支撑。
2968
2022-03-08 10:44:04