分布式锁

什么是分布式锁？

为了实现分布式互斥，我们需要在某个地方做个标记，这个标记是每个线程都可以看到，当标记不存在时可以设置该标记，当标记被设置后，其他线程只能等待拥有该标记的线程执行完成，并释放该标记后，才能去设置该标记和访问共享资源。这里的标记就是我们讨论的锁。

锁就是在多线程同时访问同一资源的场景下，为了让线程互不干扰地访问共享资源，从而保证操作的有效性和正确性的一种标记。

分布式锁是指在分布式环境下，系统部署在多个机器中，实现多进程分布式互斥的一种锁。为了保证多个进程都可以看到锁，锁需要通过公共存储来管理，这样才能实现多个进程并发访问同一个临界资源，同一个时刻只有一个进程可访问共享资源，确保数据的一致性。

我们在设计分布式锁时要考虑的因素有哪些？

以下几点需要考虑：

常见的分布式锁实现方法有哪些？

实现分布式锁有3种主流的方法：

基于数据库实现分布式锁

基于数据库实现分布式锁比较简单，主要在于创建一张锁表，为申请者在锁表中建立一条记录，记录建立成功则获得锁，消除记录则释放锁。

因为需要频繁访问磁盘，IO开销会比较大，因此这种方式适用于并发量低、对性能要求低的场景。

这种方式有两个缺点：

单点故障问题，一旦数据库不可用，会导致整个系统崩溃。
死锁问题，数据库锁没有失效时间，未获得锁的进程只能一致等待已获得锁的进程主动释放锁，如果已获得共享资源访问权限的进程忽然挂了，或者解锁操作失败，那么锁记录会一直存储在数据库中，无法删除，而其他进程也无法获得锁，从而造成死锁。

基于缓存实现分布式锁

所谓基于缓存，也就是说把数据存放在计算机内存中，不需要写入磁盘，减少IO读写。

我们经常使用Redis来作为缓存方案，使用setnx(key, value)函数实现分布式锁。key和value就是基于缓存的分布式锁的两个属性，其中key表示锁id，value=currentTime + timeOut，表示当前时间+超时时间。

setnx函数的返回值有0和1：

Redis通过碎裂来维持进程访问共享资源的先后顺序，Redis锁主要基于setnx函数实现分布式锁，当进程通过setnx<key,value>函数返回1时，表示已经获得锁。排在后面的进程只能等待前面的进程主动释放锁，或者等到时间超时才能获得锁。

这种方案的优点在于：

这种方案的缺点是通过超时时间来控制锁的失效时间并不是十分可靠，因为一个进程执行时间可能比较长，或受系统进程做内存回收等影响，导致时间超时，从而不正确的释放了锁。

这种方案适用于高并发、对性能要求高的场景。

基于ZooKeeper的分布式锁

ZooKeeper的树形数据存储结构主要由4种节点构成：

ZooKeeper基于临时顺序节点实现了分布锁。

ZooKeeper实现分布式锁的流程：

在持久节点shared_lock目录下，为每个进程创建一个临时顺序节点。
每个进程获取shared_lock目录下的所有临时节点列表，注册Watcher，用于监听子节点变更的信息。当监听到自己的临时节点是顺序最小的，则可以使用共享资源。
每个节点确定自己的编号是否是shared_lock下所有子节点中最小的，如果是最小的，就能获得锁。
如果进程对应的临时节点编号不是最小的，那么有两种情况：
- 本进程为读请求，如果比自己序号小的节点中有写请求，则等待。
- 本进程为写请求，如果比自己序号小的节点中有请求，则等待。

使用ZooKeeper实现的分布式锁，可以解决前两种方法提到的各种问题，比如单点故障、不可重入、死锁等，但是该方法实现比较复杂，且需要频繁的添加和删除节点，所以性能不如基于缓存实现的分布式锁。

这种方案适用于大部分分布式场景，但是不适用于对性能要求极高的场景。

三种不同的分布式锁，详细的区别如下表所示。

分布式锁中的羊群效应

所谓羊群效应，就是在整个ZooKeeper分布式锁的竞争过程中，大量的进程都想要获得锁去使用共享资源。每个进程都有自己的Watcher来通知节点消息，都会获取整个子节点列表，使得信息冗余，资源浪费。

当共享资源被解锁后，ZooKeeper会通知所有监听的进程，这些进程都会尝试争取锁，但最终只能有一个进程获得锁，使得其他进程产生了大量的不必要的请求，造成了巨大的通信开销，造成网络阻塞，性能下降。

如何解决？分为三步：

《分布式技术原理与算法解析》学习笔记Day07