当前位置: 首页 > >

Zookeeper面试题

发布时间:

主题链接
Java基础知识面试题
Java集合容器面试题
Java并发编程面试题
Java底层知识面试题
Java常用框架面试题
计算机网络面试题
数据库面试题
RabbitMQ面试题
Redis面试题
Elasticsearch面试题
Zookeeper面试题
系统设计面试题



文章目录
ZooKeeper 是什么?Zookeeper 文件系统四种类型的数据节点 ZnodeZookeeper Watcher 机制Zookeeper 工作原理?Zookeeper 下 Server 工作状态zookeeper zab算法zookeeper 的选主算法zookeeper 是如何保证事务的顺序一致性的?zk 节点宕机如何处理?zookeeper 负载均衡和 nginx 负载均衡区别集群最少要几台机器,集群规则是怎样的?集群中有 3 台服务器,其中一个节点宕机,这个时候 Zookeeper 还可以使用吗?ZAB 和 Paxos 算法的联系与区别?Zookeeper 的典型应用场景Zookeeper 都有哪些功能?Zookeeper 和 Dubbo 的关系?



ZooKeeper 是什么?

ZooKeeper 是一个开源的分布式协调服务。它是一个为分布式应用提供一致性服务的软件,分布式应用程序可以基于 Zookeeper 实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master 选举、分布式锁和分布式队列等功能。


Zookeeper 保证了如下分布式一致性特性:


    顺序一致性原子性单一视图可靠性实时性(最终一致性)

Zookeeper 文件系统

Zookeeper 提供一个多层级的节点命名空间(节点称为 znode)。与文件系统不同的是,这些节点都可以设置关联的数据,而文件系统中只有文件节点可以存放数据而目录节点不行。


Zookeeper 为了保证高吞吐和低延迟,在内存中维护了这个树状的目录结构,这种特性使得 Zookeeper 不能用于存放大量的数据,每个节点的存放数据上限为1M。


四种类型的数据节点 Znode

1)PERSISTENT-持久节点


除非手动删除,否则节点一直存在于 Zookeeper 上


(2)EPHEMERAL-临时节点


临时节点的生命周期与客户端会话绑定,一旦客户端会话失效(客户端与zookeeper 连接断开不一定会话失效),那么这个客户端创建的所有临时节点都会被移除。


(3)PERSISTENT_SEQUENTIAL-持久顺序节点


基本特性同持久节点,只是增加了顺序属性,节点名后边会追加一个由父节点维护的自增整型数字。


(4)EPHEMERAL_SEQUENTIAL-临时顺序节点


基本特性同临时节点,增加了顺序属性,节点名后边会追加一个由父节点维护的自增整型数字


Zookeeper Watcher 机制

Watcher 机制:Zookeeper 允许客户端向服务端的某个 Znode 注册一个 Watcher 监听,当服务端的一些指定事件触发了这个 Watcher,服务端会向指定客户端发送一个事件通知来实现分布式的通知功能,然后客户端根据 Watcher 通知状态和事件类型做出业务上的改变。


工作机制:(1)客户端注册 watcher(2)服务端处理 watcher(3)客户端回调 watcher


Zookeeper 工作原理?

Zookeeper 的核心是原子广播机制,这个机制保证了各个 server 之间的同步。实现这个机制的协议叫做 Zab 协议。Zab 协议有两种模式,它们分别是恢复模式和广播模式。


恢复模式
当服务启动或者在领导者崩溃后,Zab就进入了恢复模式,当领导者被选举出来,且大多数 server 完成了和 leader 的状态同步以后,恢复模式就结束了。状态同步保证了 leader 和 server 具有相同的系统状态。


广播模式
一旦 leader 已经和多数的 follower 进行了状态同步后,它就可以开始广播消息了,即进入广播状态。这时候当一个 server 加入 ZooKeeper 服务中,它会在恢复模式下启动,发现 leader,并和 leader 进行状态同步。待到同步结束,它也参与消息广播。ZooKeeper 服务一直维持在 Broadcast 状态,直到 leader 崩溃了或者 leader 失去了大部分的 followers 支持。


Zookeeper 下 Server 工作状态

Leader


(1)事务请求的唯一调度和处理者,保证集群事务处理的顺序性


(2)集群内部各服务的调度者


Follower


(1)处理客户端的非事务请求,转发事务请求给 Leader 服务器


(2)参与事务请求 Proposal 的投票


(3)参与 Leader 选举投票


Observer


(1)3.0 版本以后引入的一个服务器角色,在不影响集群事务处理能力的基础上提升集群的非事务处理能力


(2)处理客户端的非事务请求,转发事务请求给 Leader 服务器


(3)不参与任何形式的投票


服务器具有四种状态,分别是 LOOKING、FOLLOWING、LEADING、OBSERVING。


(1)LOOKING:寻 找 Leader 状态。当服务器处于该状态时,它会认为当前集群中没有 Leader,因此需要进入 Leader 选举状态。


(2)FOLLOWING:跟随者状态。表明当前服务器角色是 Follower。


(3)LEADING:领导者状态。表明当前服务器角色是 Leader。


(4)OBSERVING:观察者状态。表明当前服务器角色是 Observer。


zookeeper zab算法

什么是ZAB
在做分布式系统时,我们常常需要维护管理集群的配置信息、服务的注册发现、共享锁等功能,而ZooKeeper正是解决这些问题的一把好手。ZAB(ZooKeeper Atomic Broadcast)则是为ZooKeeper设计的一种支持崩溃恢复的原子广播协议。


ZAB特性
只要大多数(法定数量)节点启动,系统就行正常运行;当节点下线后*簦匦氡Vつ芑指吹降鼻罢谥葱械氖挛瘢灰恢滦员Vぃ


可靠提交(Reliable delivery) -如果一个事务 A被一个server提交(committed)了,那么它最终一定会被所有的server提交全局有序(Total order) - 假设有A、B两个事务,有一台server先执行A再执行B,那么可保证所有server上A始终都被在B之前执行因果有序(Causal order) - 如果发送者在事务A提交之后再发送B,那么B必将在A之后执行

可靠提交由ZAB的事务一致性协议保证
全局有序由TCP协议保证
因果有序由follower的历史队列(history queue)保证


ZAB的具体实现
ZooKeeper由client、server两部分构成
client可以在任何一个server节点上进行读操作
client可以在任何一个server节点上发起写请求,非leader节点会把此次写请求转发到leader节点上。由leader节点执行
ZooKeeper使用改编的两阶段提交协议来保证server节点的事务一致性


ZXID
ZooKeeper会为每一个事务生成一个唯一且递增长度为64位的ZXID,ZXID由两部分组成:低32位表示计数器(counter)和高32位的纪元号(epoch)。epoch为当前leader在成为leader的时候生成的,且保证会比前一个leader的epoch大


实际上当新的leader选举成功后,会拿到当前集群中最大的一个ZXID,并去除这个ZXID的epoch,并将此epoch进行加1操作,作为自己的epoch。


历史队列(history queue)
每一个follower节点都会有一个先进先出(FIFO)的队列用来存放收到的事务请求,保证执行事务的顺序


ZAB工作模式
广播(broadcast)模式
恢复(recovery)模式


广播(broadcast)模式


    leader从客户端收到一个写请求leader生成一个新的事务并为这个事务生成一个唯一的ZXID,leader将这个事务发送给所有的follows节点follower节点将收到的事务请求加入到历史队列(history queue)中,并发送ack给ack给leader当leader收到大多数follower(超过法定数量)的ack消息,leader会发送commit请求当follower收到commit请求时,会判断该事务的ZXID是不是比历史队列中的任何事务的ZXID都小,如果是则提交,如果不是则等待比它更小的事务的commit

恢复模式
恢复模式大致可以分为四个阶段


选举,当leader崩溃后,集群进入选举阶段,开始选举出潜在的新leader(一般为集群中拥有最大ZXID的节点)发现,进入发现阶段,follower与潜在的新leader进行沟通,如果发现超过法定人数的follower同意,则潜在的新leader将epoch加1,进入新的纪元。新的leader产生同步,集群间进行数据同步,保证集群中各个节点的事务一致广播,集群恢复到广播模式,开始接受客户端的写请求
zookeeper 的选主算法

参考链接


zookeeper 是如何保证事务的顺序一致性的?

zookeeper 采用了全局递增的事务 Id 来标识,所有的 proposal(提议)都在被提出的时候加上了 zxid,zxid 实际上是一个 64 位的数字,高 32 位是 epoch( 时期; 纪元; 世; 新时代)用来标识 leader 周期,如果有新的 leader 产生出来,epoch会自增,低 32 位用来递增计数。当新产生 proposal 的时候,会依据数据库的两阶段过程,首先会向其他的 server 发出事务执行请求,如果超过半数的机器都能执行并且能够成功,那么就会开始执行。


zk 节点宕机如何处理?

Zookeeper 本身也是集群,推荐配置不少于 3 个服务器。Zookeeper 自身也要保证当一个节点宕机时,其他节点会继续提供服务。


如果是一个 Follower 宕机,还有 2 台服务器提供访问,因为 Zookeeper 上的数据是有多个副本的,数据并不会丢失;


如果是一个 Leader 宕机,Zookeeper 会选举出新的 Leader。


ZK 集群的机制是只要超过半数的节点正常,集群就能正常提供服务。只有在 ZK节点挂得太多,只剩一半或不到一半节点能工作,集群才失效。


所以


3 个节点的 cluster 可以挂掉 1 个节点(leader 可以得到 2 票>1.5)


2 个节点的 cluster 就不能挂掉任何 1 个节点了(leader 可以得到 1 票<=1)


zookeeper 负载均衡和 nginx 负载均衡区别

zk 的负载均衡是可以调控,nginx 只是能调权重,其他需要可控的都需要自己写插件;但是 nginx 的吞吐量比 zk 大很多,应该说按业务选择用哪种方式。


集群最少要几台机器,集群规则是怎样的?集群中有 3 台服务器,其中一个节点宕机,这个时候 Zookeeper 还可以使用吗?

集群规则为 2N+1 台,N>0,即 3 台。可以继续使用,单数服务器只要没超过一半的服务器宕机就可以继续使用。


ZAB 和 Paxos 算法的联系与区别?

相同点:


(1)两者都存在一个类似于 Leader 进程的角色,由其负责协调多个 Follower 进程的运行


(2)Leader 进程都会等待超过半数的 Follower 做出正确的反馈后,才会将一个提案进行提交


(3)ZAB 协议中,每个 Proposal 中都包含一个 epoch 值来代表当前的 Leader周期,Paxos 中名字为 Ballot


不同点:


ZAB 用来构建高可用的分布式数据主备系统(Zookeeper),Paxos 是用来构建分布式一致性状态机系统。


Zookeeper 的典型应用场景

(1)数据发布/订阅


(2)负载均衡


(3)命名服务


(4)分布式协调/通知


(5)集群管理


(6)Master 选举


(7)分布式锁


(8)分布式队列


Zookeeper 都有哪些功能?

集群管理:监控节点存活状态、运行请求等;


主节点选举:主节点挂掉了之后可以从备用的节点开始新一轮选主,主节点选举说的就是这个选举的过程,使用 Zookeeper 可以协助完成这个过程;


分布式锁:Zookeeper 提供两种锁:独占锁、共享锁。独占锁即一次只能有一个线程使用资源,共享锁是读锁共享,读写互斥,即可以有多线线程同时读同一个资源,如果要使用写锁也只能有一个线程使用。Zookeeper 可以对分布式锁进行控制。


命名服务:在分布式系统中,通过使用命名服务,客户端应用能够根据指定名字来获取资源或服务的地址,提供者等信息。


Zookeeper 和 Dubbo 的关系?

Zookeeper的作用:


zookeeper用来注册服务和进行负载均衡,哪一个服务由哪一个机器来提供必需让调用者知道,简单来说就是ip地址和服务名称的对应关系。当然也可以通过硬编码的方式把这种对应关系在调用方业务代码中实现,但是如果提供服务的机器挂掉调用者无法知晓,如果不更改代码会继续请求挂掉的机器提供服务。zookeeper通过心跳机制可以检测挂掉的机器并将挂掉机器的ip和服务对应关系从列表中删除。至于支持高并发,简单来说就是横向扩展,在不更改代码的情况通过添加机器来提高运算能力。通过添加新的机器向zookeeper注册服务,服务的提供者多了能服务的客户就多了。


dubbo:


是管理中间层的工具,在业务层到数据仓库间有非常多服务的接入和服务提供者需要调度,dubbo提供一个框架解决这个问题。
注意这里的dubbo只是一个框架,至于你架子上放什么是完全取决于你的,就像一个汽车骨架,你需要配你的轮子引擎。这个框架中要完成调度必须要有一个分布式的注册中心,储存所有服务的元数据,你可以用zk,也可以用别的,只是大家都用zk。


zookeeper和dubbo的关系:


Dubbo 的将注册中心进行抽象,它可以外接不同的存储媒介给注册中心提供服务,有 ZooKeeper,Memcached,Redis 等。


引入了 ZooKeeper 作为存储媒介,也就把 ZooKeeper 的特性引进来。首先是负载均衡,单注册中心的承载能力是有限的,在流量达到一定程度的时 候就需要分流,负载均衡就是为了分流而存在的,一个 ZooKeeper 群配合相应的 Web 应用就可以很容易达到负载均衡;资源同步,单单有负载均衡还不 够,节点之间的数据和资源需要同步,ZooKeeper 集群就天然具备有这样的功能;命名服务,将树状结构用于维护全局的服务地址列表,服务提供者在启动 的时候,向 ZooKeeper 上的指定节点 /dubbo/${serviceName}/providers 目录下写入自己的 URL 地址,这个操作就完成了服务的发布。 其他特性还有 Mast 选举,分布式锁等。



友情链接: