分布式事务、CAP理论、BASE理论

发布时间 2023-06-26 22:02:02作者: 渺阴丶

分布式事务、CAP理论、BASE理论

什么是分布式事务?

首先理解什么是本地事务?

  平常我们在程序中控制事务是利用数据库本身的事务特性来实现的,比如spring中的@Transactional注解,因此叫数据库事务。由于应用主要靠关系数据库来控制事务,此数据库只属于该应用,所以基于本应用自己的关系型数据库的事务又被称为本地事务

  本地事务具有ACID四大特性,数据库事务在实现时会将一次事务涉及的所有操作全部纳入到一个不可分割的执行单元,该执行单元中的所有操作 要么都成功,要么都失败,只要其中任一操作执行失败,都将导致整个事务的回滚。

理解了本地事务,什么是分布式事务?

  现在的需求是课程发布操作后将数据写入数据库、redis、elasticsearch、MinIO四个地方,这四个地方已经不限制在一个数据库内,是由四个分散的服务去提供,与这四个服务去通信需要网络通信,而网络存在不可到达性,这种分布式系统环境下,通过与不同的服务进行网络通信去完成事务称之为分布式事务。

什么是CAP理论

​ 控制分布式事务首先需要理解CAP理论,什么是CAP理论?

CAPConsistencyAvailabilityPartition tolerance三个词语的缩写,分别表示一致性可用性分区容忍性(分区容错性)

一致性是指用户不管访问哪一个结点拿到的数据都是最新的,比如查询小明的信息,不能出现在数据没有改变的情况下两次查询结果不一样。

可用性是指任何时候查询用户信息都可以查询到结果,但不保证查询到最新的数据。

分区容忍性也叫分区容错性,当系统采用分布式架构时由于网络通信异常导致请求中断、消息丢失,但系统依然对外提供服务。

​ CAP理论要强调的是在分布式系统中这三点不可能全部满足,因为服务之间难免出现网络异常,不能因为局部网络异常导致整个系统不可用,所以分布式系统必须要满足分区容错性

  综上所述,分布式系统中进行分布式事务控制,要么保证CP、要么保证AP。

学习了CAP理论该如何控制分布式事务呢?

​ 学习了CAP理论我们知道进行分布式事务控制要在C和A中作出取舍,保证一致性就不要保证可用性,保证可用性就不能保证一致性,首先你确认是要CP还是AP,具体要根据应用场景进行判断。

  1. CP的场景:满足C舍弃A,强调一致性。
  2. 跨行转账:一次转账请求要等待双方银行系统都完成整个事务才算完成,只要其中一个失败另一方执行回滚操作。
  3. 开户操作:在业务系统开户同时要在运营商开户,任何一方开户失败该用户都不可使用,所以要满足CP。
  4. AP的场景:满足A舍弃C,强调可用性。
  5. 订单退款,今日退款成功,明日账户到账,只要用户可以接受在一定时间内到账即可。
  6. 注册送积分,注册成功积分在24分到账。
  7. 支付短信通信,支付成功发短信,短信发送可以有延迟,甚至没有发送成功。

​ 在实际应用中符合AP的场景较多,其实虽然AP舍弃C一致性,实际上最终数据还是达到了一致,也就满足了最终一致性,所以业界定义了BASE理论。

什么是BASE理论?

​ BASE 是 Basically Available(基本可用)、Soft state(软状态)和 Eventually consistent (最终一致性)三个短语的缩写。

​ 基本可用:当系统无法满足全部可用时保证核心服务可用即可,比如一个外卖系统,每到中午12点左右系统并发量很高,此时要保证下单流程涉及的服务可用,其它服务暂时不可用。

​ 软状态:是指可以存在中间状态,比如:打印自己的社保统计情况,该操作不会立即出现结果,而是提示你打印中,请在XXX时间后查收。虽然出现了中间状态,但最终状态是正确的。

​ 最终一致性:退款操作后没有及时到账,经过一定的时间后账户到账,舍弃强一致性,满足最终一致性。

  BASE 理论在很大程度上,解决了事务型系统在性能、容错、可用性等方面痛点。BASE 理论在 NoSQL 中应用广泛,是 NoSQL 系统设计的事实上的理论支撑。

分布式事务控制有哪些常用的技术方案?

​ 实现CP就是要实现强一致性:

  • 使用Seata框架基于AT模式实现

  • 使用Seata框架基于TCC模式实现。

    实现AP则要保证最终数据一致性:

  • 使用消息队列通知的方式去实现,通知失败自动重试,达到最大失败次数需要人工处理;

  • 使用任务调度的方案,启动任务调度将课程信息由数据库同步到elasticsearch、MinIO、redis中。