ZooKeeper

Caption

Apache ZooKeeper™ is a centralized service for maintaining configuration information, naming, providing distributed synchronization, and providing group services.

Apache ZooKeeper is an effort to develop and maintain an open-source server which enables highly reliable distributed coordination.

ZK 致力于开发和维护开源服务器，以实现高度可靠的分布式协调
发布/订阅模式的分布式数据管理与协调框架

ZK是Apache开源提供的一个分布式协调服务框架，主要用来解决分布式集群中应用系统的一致性问题，例如怎样避免同时操作同一数据造成脏读的问题。ZK 本质上是一个分布式的小文件存储系统。提供基于类似于文件系统的目录树方式的数据存储，并且可以对树中的节点进行有效管理。从而用来维护和监控你存储的数据的状态变化。通过监控这些数据状态的变化，从而可以达到基于数据的集群管理。诸如：统一命名服务(dubbo)、分布式配置管理(solr的配置集中管理)、分布式消息队列（sub/pub）、分布式锁、分布式协调等功能。

zk当中的基本特性

全局数据一致性：所有的节点，看到的数据都是一模一样的
可靠性：如果消息被其中一台服务器接受，那么将被所有的服务器接受
顺序性：包括全局有序和偏序两种：全局有序是指如果在一台服务器上消息 a 在消息 b 前发布，则在所有 Server 上消息 a 都将在消息 b 前被发布；偏序是指如果一个消息 b 在消息 a 后被同一个发送者发布， a 必将排在 b 前面
数据更新的原子性：一次数据更新要么成功（半数以上节点成功），要么失败，不存在中间状态
实时性：在一段时间之内，zk当中的消息，必定会送达每一个节点

架构

Leader

事务请求的唯一调度和处理者，保证集群事务处理的顺序性
集群内部各服务的调度者
管理投票工作 🗳️

如果leader死掉了之后，zk会冲洗投票选举，从follower当中重新选举一个主节点出来

Follower

处理客户端的非事务请求（读操作），转发事务（写请求）请求给Leader服务器
参与Leader选举投票

Observer

处理客户端的非事务请求，转发事务请求给Leader服务器
不参与任何形式的投票
3.3.0版本以后引入的一个服务器角色，在不影响集群事务处理能力的基础上提升集群的非事务处理能力

Client

都保存同一份相同的数据副本，区别在于该请求是处理事物的还是非事物的

服务器工作状态

LOOKING：寻找Leader状态。当服务器处于该状态时，它会认为当前集群中没有Leader，因此需要进入Leader选举状态
FOLLOWING：跟随者状态。表明当前服务器角色是Follower
LEADING：领导者状态。表明当前服务器角色是Leader
OBSERVING：观察者状态。表明当前服务器角色是Observer

选举机制

ZK的默认的选举算法是FastLeaderElection，即投票过半则胜出

参选指标

服务器ID：被推举的Leader的SID
数据ID（zxid）：被推举的Leader事务ID
逻辑时钟（electionEpoch）：逻辑时钟，用来判断多个投票是否在同一轮选举周期中，该值在服务端是一个自增序列，每次进入新一轮的投票后，都会对该值进行加1操作

启动时选举

集群Down机后选举

数据模型

采用的是树形的结构,每一个节点，称之为一个znode，每一个znode兼具有文件和文件夹的特性

文件：可以存储数据
文件夹：下面可以有子文件或者子文件夹

Warning

znode存储的数据的大小有限制，不超过1M。小文件存储系统

znode的访问，必须使用绝对路径 /开头的路径

znode的类型

永久节点

普通的永久节点
序列化的永久节点

临时节点

普通的临时节点
序列化的临时节点

应用场景

数据发布/订阅
负载均衡
命名服务
分布式协调/通知
集群管理
Master选举
分布式锁
分布式队列

ZK与CP

ZK遵循的是CP原则，即一致性和分区容错性，牺牲了可用性

当Leader宕机以后，集群机器马上会进去到新的Leader选举中，但是选举时长在30s — 120s之间，这个选取Leader期间，是不提供服务的，不满足可用性，所以牺牲了可用性

部署模式

集群规则为2N+1台，N>0，即3台

单机模式
伪集群模式
集群模式

大数据生态中的ZooKeeper应用

Apache Hadoop生态系统

HDFS (Hadoop Distributed File System)

使用ZooKeeper进行NameNode HA (高可用)配置
管理Active/Standby NameNode的状态切换
集群元数据同步和协调

Hive

Hive Metastore服务的高可用配置
表结构和元数据管理
分布式查询协调

HBase

RegionServer管理
集群状态监控
Master选举和故障恢复

Yarn (Yet Another Resource Negotiator)

ResourceManager的高可用配置
集群资源分配和调度协调
NodeManager状态管理

Spark

Spark Master的高可用配置
集群任务调度和协调
应用程序状态管理

Flink

JobManager的高可用
TaskManager状态协调
检查点(Checkpoint)协调

Kafka生态系统

v3.9 版本弃用

Kafka Cluster Management

Broker元数据管理
Topic分区分配
消息生产者和消费者协调
集群成员管理

Kafka Connect

Connector状态管理
分布式协调
任务分配和监控

Kafka Streams

应用程序状态管理
实时处理协调

其他大数据组件

Solr/Elasticsearch

分布式索引管理
集群状态协调
配置中心管理

Druid

查询节点管理
集群元数据存储
负载均衡协调

[Cassandra]

集群元数据管理
分环状态协调
节点间通信协调

企业级大数据平台

Cloudera CDH (Cloudera Distribution including Hadoop)

统一的集群管理平台
Hadoop生态组件协调
监控和管理工具集成

Hortonworks Data Platform (HDP)

Ambari管理平台集成
组件生命周期管理
集群配置管理

阿里云大数据平台

MaxCompute组件协调
E-MapReduce集群管理
大数据服务集成

腾讯云大数据平台

TDSQL协调服务
大数据组件集成
云原生大数据管理

实际应用场景

金融行业

银行核心系统分布式协调
交易系统一致性保证
风控系统实时协调

电商平台

交易系统高可用保障
库存管理分布式协调
秒杀系统流量控制

物联网平台

设备状态管理
数据流处理协调
实时数据分析

ZooKeeper在大数据中的核心价值

高可用性保障
- 实现组件的自动故障切换
- 集群状态实时监控
- 服务持续可用
一致性保证
- 分布式数据同步
- 状态一致性维护
- 数据一致性检查
分布式协调
- 资源分配和调度
- 任务协调和同步
- 负载均衡管理
配置管理
- 集中化配置管理
- 配置同步和分发
- 动态配置更新
服务发现
- 服务注册和发现
- 健康状态监控
- 故障自动转移

ZooKeeper作为大数据生态的"协调中心"，几乎所有重要的分布式大数据组件都依赖它来实现集群管理和协调功能。

启动zookeeper服务

#!/bin/bash
 
case $1 in
"start"){
    for i in bigdata101 bigdata102 bigdata103
    do
        echo "------------- $i -------------"
        ssh $i "/opt/apps/zookeeper/bin/zkServer.sh start"
    done
};;
"stop"){
    for i in bigdata101 bigdata102 bigdata103
    do
        echo "------------- $i -------------"
        ssh $i "/opt/apps/zookeeper/bin/zkServer.sh stop"
    done
};;
"status"){
    for i in bigdata101 bigdata102 bigdata103
    do
        echo "------------- $i -------------"
        ssh $i "/opt/apps/zookeeper/bin/zkServer.sh status"
    done
};;
esac

ZooKeeper

zk当中的基本特性

架构

Leader

Follower

Observer

Client

服务器工作状态

选举机制

参选指标

启动时选举

集群Down机后选举

数据模型

znode的类型

应用场景

ZK与CP

部署模式

大数据生态中的ZooKeeper应用

Apache Hadoop生态系统

Kafka生态系统

其他大数据组件

企业级大数据平台

实际应用场景

ZooKeeper在大数据中的核心价值

启动zookeeper服务

Reference