08 | 服务发现：到底是要CP还是AP？

我们为什么需要“服务发现”？

从高可用的角度出发，在生产环境中，服务提供方通常会以集群的方式对外提供服务，集群中的IP地址随时可能发生变化，因此我们需要一本“通讯录”来及时获取对应的服务节点信息，维护“通讯录”以及或者节点信息的过程，我们称之为“服务发现”。

服务发现包括2个核心模块：

我们为什么不采用基于DNS的服务发现机制？

我们来看一下DNS查询流程。

它存在的两个主要问题：

为什么VIP方案也不能用于服务发现？

VIP方案如下所示。

它主要有以下几个问题：

基于ZooKeeper的服务发现机制的工作流程是怎样的？

基于ZooKeeper的服务发现结构图如下。

它的工作流程如下：

基于ZooKeeper的服务发现有什么问题？

当有超大批量的服务节点在同时发起注册操作，ZooKeeper集群的CPU使用率会飙升，导致ZooKeeper集群无法工作。

这本身就是ZooKeeper的性能问题，当连接到ZooKeeper的节点数量特别多，对ZooKeeper的读写操作会特别频繁，而且当ZooKeeper存储的目录达到一定数量时，ZooKeeper就会变得不稳定，CPU使用率持续升高，直到宕机。

ZooKeeper的一大特点就是强一致性，集群中的每个节点的数据每次发生变更操作时，都会通知其他节点同时执行跟新，这样它就要求每个节点的数据能够实时的完全一致，从而导致了ZooKeeper集群性能的下降。

基于消息总线的服务发现机制的工作流程是怎样的？

基于消息总线的服务发现流程图如下：

它的工作流程如下：

当有服务上线，注册中心节点收到注册请求，服务列表数据发生变化，会生成一个消息，推送给消息总线，每个消息都有一个整体递增版本。
消息总线会主动推送消息到各个注册中心，同时注册中心也会定期拉取消息。对于获取到消息的在消息回放模块里面回放只接受大于本地版本号的消息，小于本地版本号的消息直接丢弃，从而实现最终一致性。
消费者定于可以从注册中心内存拿到指定接口的全部服务实例，并缓存到消费者的内存中。
采取推拉模式，消费者可以及时地拿到服务实例增量变化情况，并和内存中的混存数据进行合并。

通过消息总线的方式，我们就可以完成注册中心集群间数据变更的通知，保证数据的最终一致性，并能及时地触发注册中心的服务下发操作。

服务发现的特性是允许我们在设计超大规模集群服务发现系统的时候，舍弃一致性，更多的考虑系统的健壮性，因此，在实际工作中，最终一致性是更为常用的策略。

标签 PC, 原理, 学习

《RPC实战与核心原理》学习笔记Day7