高并发下如何保证接口的幂等性

176次阅读  |  发布于3年以前

前言

接口幂等性问题,对于开发人员来说,是一个跟语言无关的公共问题。本文分享了一些 ,绝大部分内容我在项目中实践过的,给有需要的小伙伴一个参考。

不知道你有没有遇到过这些场景:

  1. 有时我们在填写某些 form 表单时,保存按钮不小心快速点了两次,表中竟然产生了两条重复的数据,只是 id 不一样;
  2. 我们在项目中为了解决接口超时问题,通常会引入了重试机制。第一次请求接口超时了,请求方没能及时获取返回结果(此时有可能已经成功了),为了避免返回错误的结果(这种情况不可能直接返回失败吧?),于是会对该请求重试几次,这样也会产生重复的数据;
  3. MQ 消费者在读取消息时,有时候会读取到重复消息,如果处理不好也会产生重复的数据。

没错,这些都是幂等性问题。

接口幂等性是指用户对于同一操作发起的一次请求或者多次请求的结果是一致的,不会因为多次点击而产生了副作用。

这类问题多发于接口的:

那么我们要如何保证接口幂等性?本文将会告诉你答案。

1. insert 前先 select

通常情况下,在保存数据的接口中,我们为了防止产生重复数据,一般会在 insert 前先根据 name 或 code 字段 select 一下数据。

如果该数据已存在,则执行 update 操作,如果不存在,才执行 insert 操作。

该方案可能是我们平时在防止产生重复数据时,使用最多的方案。但是该方案不适用于并发场景

在并发场景中,要配合其他方案一起使用,否则同样会产生重复数据。我在这里提一下,是为了避免大家踩坑。

2. 加悲观锁

在支付场景中,用户 A 的账号余额有 150 元,想转出 100 元,正常情况下用户 A 的余额只剩 50 元。一般情况下,SQL 是这样的:

update user amount = amount-100 where id=123;

如果出现多次相同的请求,可能会导致用户 A 的余额变成负数。这种情况,用户 A 来可能要哭了。于此同时,系统开发人员可能也要哭了,因为这是很严重的系统 bug。

为了解决这个问题,可以加悲观锁,将用户 A 的那行数据锁住,在同一时刻只允许一个请求获得锁,更新数据,其他的请求则等待。

通常情况下通过如下 SQL 锁住单行数据:

select * from user id=123 for update;

具体流程如下:

具体步骤:

  1. 多个请求同时根据 id 查询用户信息;
  2. 判断余额是否不足 100,如果余额不足,则直接返回余额不足;
  3. 如果余额充足,则通过 for update 再次查询用户信息,并且尝试获取锁;
  4. 只有第一个请求能获取到行锁,其余没有获取锁的请求,则等待下一次获取锁的机会;
  5. 第一个请求获取到锁之后,判断余额是否不足 100,如果余额足够,则进行 update 操作;
  6. 如果余额不足,说明是重复请求,则直接返回成功。

需要特别注意的是:如果使用的是 MySQL 数据库,存储引擎必须用 innodb。因为它才支持事务。此外,这里 id 字段一定要是主键或者唯一索引,不然会锁住整张表。

悲观锁需要在同一个事务操作过程中锁住一行数据,如果事务耗时比较长,会造成大量的请求等待,影响接口性能。

此外,每次请求接口很难保证都有相同的返回值,所以不适合幂等性设计场景,但是在防重场景中是可以的使用的。

在这里顺便说一下,防重设计幂等设计其实是有区别的:防重设计主要为了避免产生重复数据,对接口返回没有太多要求;而幂等设计除了避免产生重复数据之外,还要求每次请求都返回一样的结果。

3. 加乐观锁

既然悲观锁有性能问题,为了提升接口性能,我们可以使用乐观锁。需要在表中增加一个 timestamp 或者 version 字段,这里以 version 字段为例。

在更新数据之前先查询一下数据:

select id, amount, version from user id=123;

如果数据存在,假设查到的 version 等于 1,再使用 id 和 version 字段作为查询条件更新数据:

update user set amount=amount+100, version=version+1 where id=123 and version=1;

更新数据的同时 version+1。然后判断本次 update 操作的影响行数,如果大于 0,则说明本次更新成功,如果等于 0,则说明本次更新没有让数据变更。

由于第一次请求 version 等于 1 是可以成功的,操作成功后 version 变成 2 了。这时如果并发的请求过来,再执行相同的 SQL:

update user set amount=amount+100, version=version+1 where id=123 and version=1;

该 update 操作不会真正更新数据,最终 SQL 的执行结果影响行数是 0。因为 version 已经变成 2 了,where 中的 version=1 肯定无法满足条件。但为了保证接口幂等性,接口可以直接返回成功,因为 version 值已经修改了,那么前面必定已经成功过一次,后面都是重复的请求。

具体流程如下:

具体步骤:

  1. 先根据 id 查询用户信息,包含 version 字段;
  2. 根据 id 和 version 字段值作为 where 条件的参数,更新用户信息,同时version+1;
  3. 判断操作影响行数,如果影响 1 行,则说明是一次请求,可以做其他数据操作;
  4. 如果影响 0 行,说明是重复请求,则直接返回成功。

4. 加唯一索引

绝大数情况下,为了防止重复数据的产生,我们都会在表中加唯一索引,这是一个非常简单,并且有效的方案。

alter table `order` add UNIQUE KEY `un_code` (`code`);

加了唯一索引之后,第一次请求数据可以插入成功。但后面的相同请求,插入数据时会报 Duplicate entry '002' for key 'order.un_code 异常,表示唯一索引有冲突。

虽说抛异常对数据来说没有影响,不会造成错误数据。但是为了保证接口幂等性,我们需要对该异常进行捕获,然后返回成功。

如果是 Java 程序需要捕获:DuplicateKeyException 异常,如果使用了 Spring 框架还需要捕获:MySQLIntegrityConstraintViolationException 异常。

具体流程图如下:

具体步骤:

  1. 用户通过浏览器发起请求,服务端收集数据;
  2. 将该数据插入 MySQL;
  3. 判断是否执行成功,如果成功,则操作其他数据(可能还有其他的业务逻辑);
  4. 如果执行失败,捕获唯一索引冲突异常,直接返回成功。

5. 建防重表

有时候表中并非所有的场景都不允许产生重复的数据,只有某些特定场景才不允许。这时候,直接在表中加唯一索引,显然是不太合适的。

针对这种情况,我们可以通过建防重表来解决问题。

该表可以只包含两个字段:id唯一索引。唯一索引可以是多个字段比如:name、code 等组合起来的唯一标识,例如:susan_0001。

具体流程图如下:

具体步骤:

  1. 用户通过浏览器发起请求,服务端收集数据;
  2. 将该数据插入 MySQL 防重表;
  3. 判断是否执行成功,如果成功,则做 MySQL 其他的数据操作(可能还有其他的业务逻辑);
  4. 如果执行失败,捕获唯一索引冲突异常,直接返回成功。

需要特别注意的是:防重表和业务表必须在同一个数据库中,并且操作要在同一个事务中。

6. 根据状态机

很多时候业务表是有状态的,比如订单表中有:1-下单、2-已支付、3-完成、4-撤销等状态。如果这些状态的值是有规律的,按照业务节点正好是从小到大,我们就能通过它来保证接口的幂等性。

假如 id=123 的订单状态是已支付,现在要变成完成状态。

update `order` set status=3 where id=123 and status=2;

第一次请求时,该订单的状态是已支付,值是2。所以该 update 语句可以正常更新数据,SQL 执行结果的影响行数是 1,订单状态变成了 3。

后面有相同的请求过来,再执行相同的 SQL 时,由于订单状态变成了 3。再用 status=2 作为条件,无法查询出需要更新的数据,所以最终 SQL 执行结果的影响行数是 0,即不会真正的更新数据。但为了保证接口幂等性,影响行数是 0 时,接口也可以直接返回成功。

具体流程图如下:

具体步骤:

  1. 用户通过浏览器发起请求,服务端收集数据;
  2. 根据id和当前状态作为条件,更新成下一个状态;
  3. 判断操作影响行数,如果影响了 1 行,说明当前操作成功,可以进行其他数据操作;
  4. 如果影响了 0 行,说明是重复请求,直接返回成功。

主要特别注意的是,该方案仅限于要更新的表有状态字段,并且刚好要更新状态字段的这种特殊情况,并非所有场景都适用。

7. 加分布式锁

其实前面介绍过的加唯一索引或者加防重表,本质是使用了数据库的分布式锁,也属于分布式锁的一种。但由于数据库分布式锁的性能不太好,我们可以改用:Redis 或 ZooKeeper。

鉴于现在很多公司分布式配置中心改用 Apollo 或 Nacos,已经很少用 ZooKeeper 了,我们以 Redis 为例介绍分布式锁。

目前主要有三种方式实现 Redis 的分布式锁:

  1. setNx 命令;
  2. set 命令;
  3. Redission 框架。

每种方案各有利弊,具体实现细节暂不展开。具体流程图如下:

具体步骤:

  1. 用户通过浏览器发起请求,服务端会收集数据,并且生成订单号 code 作为唯一业务字段;
  2. 使用 redis 的 set 命令,将该订单 code 设置到 Redis 中,同时设置超时时间;
  3. 判断是否设置成功,如果设置成功,说明是第一次请求,则进行数据操作;
  4. 如果设置失败,说明是重复请求,则直接返回成功。

需要特别注意的是:分布式锁一定要设置一个合理的过期时间,如果设置过短,无法有效的防止重复请求。如果设置过长,可能会浪费redis的存储空间,需要根据实际业务情况而定。

8. 获取 token

除了上述方案之外,还有最后一种使用 token 的方案。该方案跟之前的所有方案都有点不一样,需要两次请求才能完成一次业务操作。

  1. 第一次请求获取 token;
  2. 第二次请求带着这个 token,完成业务操作。

具体流程图如下:

第一步,先获取token。

第二步,做具体业务操作。

具体步骤:

  1. 用户访问页面时,浏览器自动发起获取 token 请求;
  2. 服务端生成 token,保存到 Redis 中,然后返回给浏览器;
  3. 用户通过浏览器发起请求时,携带该 token;
  4. 在 Redis 中查询该 token 是否存在,如果不存在,说明是第一次请求,有则后续的数据操作;
  5. 如果存在,说明是重复请求,则直接返回成功;
  6. 在 Redis 中 token 会在过期时间之后,被自动删除。

以上方案是针对幂等设计的。如果是防重设计,流程图要改改:

需要特别注意的是:token 必须是全局唯一。

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8