为您推荐:
精华内容
最热下载
问答
  • 5星
    2.59MB qq_21193587 2021-06-02 21:09:00
  • 5星
    46KB qq_41934573 2021-04-25 14:50:41
  • 5星
    89KB qq_43490991 2021-03-28 12:32:58
  • 5星
    27.54MB qq_35698714 2021-03-27 15:59:59
  • 5星
    15.9MB Yao__Shun__Yu 2021-01-26 09:52:27
  • 5星
    28KB admin_maxin 2021-09-01 23:09:43
  • 5星
    1.06MB admin_maxin 2021-09-01 23:08:17
  • 5星
    144KB qq_41359358 2021-01-15 15:46:20
  • 5星
    8.2MB Yao__Shun__Yu 2021-08-11 16:32:43
  • 1 分布式事务面试题 现在Java面试,分布式系统、分布式事务几乎是标配。而分布式系统、分布式事务本身比较复杂,大家学起来也非常头疼。 最为常见的面试题: 问:分布式事务了解吗?你们是如何解决分布式事务问题...

     

    1 分布式事务面试题

    现在Java面试,分布式系统、分布式事务几乎是标配。而分布式系统、分布式事务本身比较复杂,大家学起来也非常头疼。

    最为常见的面试题:

    问:分布式事务了解吗?你们是如何解决分布式事务问题的?

    (标准答案:见末尾)

    问题1、分布式事务产生的背景?

    在传统的单体项目中,多个不同的业务逻辑使用的都是同一个数据源,使用的都是同一个事务管理器,所以不会存在事务问题。
    在分布式或者微服务架构中,每个服务都有自己的数据源,使用不同事务管理器,如果A服务去调用B服务,B服务执行失败了,A服务的事务和B服务的事务都会回滚,这时候是不存在事务问题的,但是如果A服务B服务执行成功之后出现异常,A服务的事务会回滚,但是B服务的事务不会回滚,此时就存在分布式事务问题。
    (在单体的项目中,有多个不同的数据源,每个数据源中都有自己独立的事务管理器,互不影响,那么这时候也会存在多数据源事务管理:解决方案jta+ atominc)

    问题2、常见的分布式事务解决方案?

    1、使用MQ
    2、使用LCN
    3、使用Seata
    4、2PC、3PC

    问题3、什么是Seata?

    Seata是阿里巴巴退出的一款用来解决分布式事务问题的框架,他经过天猫双十一的考验,很有可能成为解决分布式事务问题的主流框架

    问题4、Seata分布式事务框架实现原理?

    Seata有三个组成部分:事务协调器TC:协调者、事务管理器TM:发起方、资源管理器RM:参与方
    (1)发起方会向协调者申请一个全局事务id,并保存到ThreadLocal中(为什么要保存到ThreadLocal中?弱引用,线程之间不会发生数据冲突)
    (2)Seata数据源代理发起方和参与方的数据源,将前置镜像和后置镜像写入到undo_log表中,方便后期回滚使用
    (3)发起方获取全局事务id,通过改写Feign客户端请求头传入全局事务id。
    (4)参与方从请求头中获取全局事务id保存到ThreadLocal中,并把该分支注册到SeataServer中。
    (5)如果没有出现异常,发起方会通知协调者,协调者通知所有分支,通过全局事务id和本地事务id删除undo_log数据,如果出现异常,通过undo_log逆向生成sql语句并执行,然后删除undo_log语句。如果处理业务逻辑代码超时,也会回滚。

    问题5、SpringBoot如何整合Seata?

    一般情况下,学一个知识不需要去学API,学的主要是思想,API会发生变化,思想几乎是不会变的
    第一步:引入依赖
    第二步:bin下的file文件和registry文件放入到每个项目中,并修改,分组名称要保持一致
    第三步:yml配置seata
    第四步:引入DataSourceProxy配置文件

    问题6、Seata和LCN的区别?

    Seata和LCN的思想是一样的,只不过LCN中采用的是假关闭,不会提交或者回滚事务,而Seata中是直接插入数据。两者的区别就是当发起方突然宕机了,LCN会发生死锁,而Seata不会,但是Seata会引起脏读。
    LCN实现分布式事务三种方案(模式):LCN、TCC、TXC
    Seata实现分布式事务四种方案(模式):AT(几乎等于LCN)TCC、SA、GAXA

    系列问题: 分布式事务相关的概念介绍?

    概念说明
    分布式事务横跨多个服务,操作多个数据库;跨库、分库分表、分服务
    DTP 模型DTP模型的5个基本元素:应用程序 AP 资源管理器 RM 事务管理器 TM通信资源管理器 CRM 通信协议 CP
    XA规范定义了RM-TM的交互接口
    两阶段提交协议 2PCimg两阶段提交协议存在问题:1、同步阻塞问题。 2、单点故障。 3、数据不一致。
    三阶段提交协议 3PC协调者、参与者都引入了超时机制;三阶段 CanCommit、PreCommit(其中一个超时或者执行失败,则TM发起中断)和doCommit 3PC :优点 :引入超时机制,降低了协调者与参与者之间的阻塞范围;缺点:在参与者接收到preCommit之后,如果出现网络分区,那么该参与者节点会继续执行事务的提交,而其他节点会执行中断事务,最终会造成数据的不一致。
    CAP 定理BASE理论CAP : 大规模的分布式系统时会遇到三个特性:一致性(consistency)、可用性(Availability)、分区容错(partition-tolerance )最多只能满足其中的2项 BASE理论 : 基本可用、软状态、最终一致
    刚性事务、柔性事务刚性事务–强一致性 两阶段提交协议(2PC) 柔性事务–最终一致性 TCC(两阶段型、补偿型)、最大努力通知、可靠消息最终一致
    TCC(两阶段型、补偿型)Try阶段: 完成所有业务检查(一致性),预留业务资源(准隔离性)**Confirm阶段:**确认执行业务操作,不做任何业务检查, 只使用Try阶段预留的业务资源。Cancel阶段: 取消Try阶段预留的业务资源。
    TCC 与 XAXA是资源层面的分布式事务,强一致性 ,一直会持有资源的锁;TCC是业务层面的分布式事务,最终一致性,不会一直持有资源的锁 TCC :优点:避免了XA两阶段提交占用资源锁时间过长导致的性能低下问题缺点:主业务服务和从业务服务都需要进行改造,从业务方改造成本更
    最大努力通知型如银行通知、商户通知等最简单的一种柔性事务 1、不可靠消息:业务活动主动方,在完成业务处理之后,向业务活动的被动方发送消息,直到通知N次后不再通知,允许消息丢失(不可靠消息)。 2、定期校对:业务活动的被动方,根据定时策略,向业务活动主动方查询(主动方提供查询接口),恢复丢失的业务消息。
    可靠消息最终一致RocketMQ的事务消息机制img

    2 事务简介

    事务(Transaction)是操作数据库中某个数据项的一个程序执行单元(unit)。事务应该具有4个属性:原子性、一致性、隔离性、持久性。这四个属性通常称为ACID特性。

    (1)原子性(atomicity):个事务是一个不可分割的工作单位,事务中包括的诸操作要么都做,要么都不做。

    事务在执行过程中发生错误,会被回滚(Rollback)到事务开始前的状态,就像这个事务从来没有执行过一样。

    比方说:买东西要么交钱收货一起都执行,要么发不出货,就退钱

    (2)一致性(consistency):事务必须是使数据库从一个一致性状态变到另一个一致性状态。一个事务查看数据时,数据所处的状态要么是另一事务修改它之前的状态,要么是另一事务修改它之后的状态,事务不会查看到中间状态的数据。

    如果事务成功地完成,那么系统中所有变化将正确地应用,系统处于有效状态。

    如果在事务中出现错误,那么系统中的所有变化将自动地回滚,系统返回到原始状态。

    (3)隔离性(isolation):一个事务的执行不能被其他事务干扰。即一个事务内部的操作及使用的数据对并发的其他事务是隔离的,并发执行的各个事务之间不能互相干扰。

    比方说:一个人买东西这个事情,是不影响其他人买东西。

    隔离性又分为四个级别:读未提交(read uncommitted)、读已提交(read committed,解决脏读)、可重复读(repeatable read,解决虚读)、串行化(serializable,解决幻读)。

    (4)持久性(durability):持久性也称永久性(permanence),指一个事务一旦提交,它对数据库中数据的改变就应该是永久性的。接下来的其他操作或故障不应该对其有任何影响。即使发生系统崩溃,重新启动数据库系统后,数据库还能恢复到事务成功结束时的状态。

    比方说:一个人买东西的时候需要记录在账本上,即使老板忘记了那也有据可查。

    1.1.2 MySQL的事务实现方案

    大多数场景下,我们的应用都只需要操作单一的数据库,这种情况下的事务称之为本地事务(Local Transaction)。本地事务的ACID特性是数据库直接提供支持。

    大部分人对 MySQL 都比较熟悉,以MySQL 的InnoDB (InnoDB 是 MySQL 的一个存储引擎)为例,介绍一下单一数据库的事务实现原理。

    InnoDB 是通过 日志和锁 来保证的事务的 ACID特性,具体如下:

    (1)通过数据库锁的机制,保障事务的隔离性;

    (2)通过 Redo Log(重做日志)来,保障事务的持久性;

    (3)通过 Undo Log (撤销日志)来,保障事务的原子性;

    (4)通过 Undo Log (撤销日志)来,保障事务的一致性;

    Undo Log 如何保障事务的原子性呢?

    具体的方式为:在操作任何数据之前,首先将数据备份到一个地方(这个存储数据备份的地方称为 Undo Log),然后进行数据的修改。如果出现了错误或者用户执行了 Rollback 语句,系统可以利用 Undo Log 中的备份将数据恢复到事务开始之前的状态。

    Redo Log如何保障事务的持久性呢?

    具体的方式为:Redo Log 记录的是新数据的备份(和 Undo Log 相反)。在事务提交前,只要将 Redo Log 持久化即可,不需要将数据持久化。当系统崩溃时,虽然数据没有持久化,但是 Redo Log 已经持久化。系统可以根据 Redo Log 的内容,将所有数据恢复到崩溃之前的状态。

    1.1.3 什么是分布式事务?

    对于分布式系统而言,需要保证分布式系统中的数据一致性,保证数据在子系统中始终保持一致,避免业务出现问题。分布式系统中对数要么一起成功,要么一起失败,必须是一个整体性的事务。

    分布式事务指事务的参与者、支持事务的服务器、资源服务器以及事务管理器分别位于不同的分布式系统的不同节点之上。

    简单的说,在分布式系统上一次大的操作由不同的小操作组成,这些小的操作分布在不同的服务节点上,且属于不同的应用,分布式事务需要保证这些小操作要么全部成功,要么全部失败。

    举个例子:在电商网站中,用户对商品进行下单,需要在订单表中创建一条订单数据,同时需要在库存表中修改当前商品的剩余库存数量,两步操作一个添加,一个修改,我们一定要保证这两步操作一定同时操作成功或失败,否则业务就会出现问题。

    任何事务机制在实现时,都应该考虑事务的ACID特性,包括:本地事务、分布式事务。对于分布式事务而言,即使不能都很好的满足,也要考虑支持到什么程度。

    典型的分布式事务场景:

    1. 跨库事务

    跨库事务指的是,一个应用某个功能需要操作多个库,不同的库中存储不同的业务数据。笔者见过一个相对比较复杂的业务,一个业务中同时操作了9个库。下图演示了一个服务同时操作2个库的情况:
    在这里插入图片描述

    2. 分库分表

    通常一个库数据量比较大或者预期未来的数据量比较大,都会进行水平拆分,也就是分库分表。如下图,将数据库B拆分成了2个库:

    在这里插入图片描述

    对于分库分表的情况,一般开发人员都会使用一些数据库中间件来降低sql操作的复杂性。如,对于sql:insert into user(id,name) values (1,“tianshouzhi”),(2,“wangxiaoxiao”)。这条sql是操作单库的语法,单库情况下,可以保证事务的一致性。

    但是由于现在进行了分库分表,开发人员希望将1号记录插入分库1,2号记录插入分库2。所以数据库中间件要将其改写为2条sql,分别插入两个不同的分库,此时要保证两个库要不都成功,要不都失败,因此基本上所有的数据库中间件都面临着分布式事务的问题。

    3. 服务化(SOA)

    微服务架构是目前一个比较一个比较火的概念。例如上面笔者提到的一个案例,某个应用同时操作了9个库,这样的应用业务逻辑必然非常复杂,对于开发人员是极大的挑战,应该拆分成不同的独立服务,以简化业务逻辑。拆分后,独立服务之间通过RPC框架来进行远程调用,实现彼此的通信。下图演示了一个3个服务之间彼此调用的架构:

    在这里插入图片描述

    Service A完成某个功能需要直接操作数据库,同时需要调用Service B和Service C,而Service B又同时操作了2个数据库,Service C也操作了一个库。需要保证这些跨服务的对多个数据库的操作要不都成功,要不都失败,实际上这可能是最典型的分布式事务场景。

    分布式事务实现方案必须要考虑性能的问题,如果为了严格保证ACID特性,导致性能严重下降,那么对于一些要求快速响应的业务,是无法接受的。

    3 分布式事务的理论基础

    数据库事务ACID 四大特性,无法满足分布式事务的实际需求,这个时候又有一些新的大牛提出一些新的理论。

    1.2.1 CAP定理

    CAP定理是由加州大学伯克利分校Eric Brewer教授提出来的,他指出WEB服务无法同时满足一下3个属性:

    • 一致性(Consistency) : 客户端知道一系列的操作都会同时发生(生效)

    • 可用性(Availability) : 每个操作都必须以可预期的响应结束

    • 分区容错性(Partition tolerance) : 即使出现单个组件无法可用,操作依然可以完成

    具体地讲在分布式系统中,一个Web应用至多只能同时支持上面的两个属性。因此,设计人员必须在一致性与可用性之间做出选择。

    2000年7月Eric Brewer教授仅仅提出来的是一个猜想,2年后,麻省理工学院的Seth Gilbert和Nancy Lynch从理论上证明了CAP理论,并且而一个分布式系统最多只能满足CAP中的2项。之后,CAP理论正式成为分布式计算领域的公认定理。

    在这里插入图片描述

    所以,CAP定理在迄今为止的分布式系统中都是适用的!

    CAP的一致性、可用性、分区容错性 具体如下:

    1. 数据一致性

    数据一致性指“all nodes see the same data at the same time”,即更新操作成功并返回客户端完成后,所有节点在同一时间的数据完全一致,不能存在中间状态。

    例如对于电商系统用户下单操作,库存减少、用户资金账户扣减、积分增加等操作必须在用户下单操作完成后必须是一致的。不能出现类似于库存已经减少,而用户资金账户尚未扣减,积分也未增加的情况。如果出现了这种情况,那么就认为是不一致的。

    数据一致性分为强一致性、弱一致性、最终一致性

    • 如果的确能像上面描述的那样时刻保证客户端看到的数据都是一致的,那么称之为强一致性。

    • 如果允许存在中间状态,只要求经过一段时间后,数据最终是一致的,则称之为最终一致性。

    • 此外,如果允许存在部分数据不一致,那么就称之为弱一致性。

    面试题:什么是数据一致性?
    
    现在知道怎么回答了吧!
    
     
    • 1
    • 2
    • 3

    2. 可用性

    可用性是指系统提供的服务必须一直处于可用的状态,对于用户的每一个操作请求总是能够在有限的时间内返回结果。“有限的时间内”是指,对于用户的一个操作请求,系统必须能够在指定的时间内返回对应的处理结果,如果超过了这个时间范围,那么系统就被认为是不可用的。

    试想,如果一个下单操作,为了保证分布式事务的一致性,需要10分钟才能处理完,那么用户显然是无法忍受的。“返回结果”是可用性的另一个非常重要的指标,它要求系统在完成对用户请求的处理后,返回一个正常的响应结果,不论这个结果是成功还是失败。

    3. 分区容错性

    分布式系统在遇到任何网络分区故障的时候,仍然需要能够保证对外提供满足一致性和可用性的服务,除非是整个网络环境都发生了故障。

    CAP理论已经被证明:一个分布式系统无法同时满足一致性、可用性、分区容错性三个特点,我们就需要抛弃一个。

    但分区容错性是不能被抛弃的那个,为什么呢?对于一个分布式系统而言,分区容错性是一个最基本的要求。因为既然是一个分布式系统,那么分布式系统中的组件必然需要被部署到不同的节点,否则也就无所谓分布式系统了。而对于分布式系统而言,网络问题又是一个必定会出现的异常情况,因此分区容错性也就成为了一个分布式系统必然需要面对和解决的问题。

    既然分区容错性不能抛弃,那么,只能在一致性、可用性寻找平衡。因此系统架构师往往需要把精力花在如何根据业务特点在C(一致性)和A(可用性)之间做取舍。

    而前面我们提到的X/Open XA 两阶段提交协议的分布式事务方案,强调的就是一致性;由于可用性较低,实际应用的并不多。而基于BASE理论的柔性事务,强调的是可用性,目前大行其道,大部分互联网公司采可能会优先采用这种方案。

    1.2.2 BASE理论

    eBay的架构师Dan Pritchett源于对大规模分布式系统的实践总结,在ACM上发表文章提出BASE理论。文章链接:https://queue.acm.org/detail.cfm?id=1394128

    BASE理论是对CAP理论的延伸,核心思想是即使无法做到强一致性(Strong Consistency),但应用可以采用适合的方式达到最终一致性(Eventual Consitency)。

    BASE是Basically Available(基本可用)、Soft state(软状态)和Eventually consistent(最终一致性)三个短语的缩写。

    1. 基本可用(Basically Available)

    指分布式系统在出现不可预知故障的时候,允许损失部分可用性。

    1. 软状态( Soft State)

    指允许系统中的数据存在中间状态,并认为该中间状态的存在不会影响系统的整体可用性。

    1. 最终一致( Eventual Consistency)

    强调的是所有的数据更新操作,在经过一段时间的同步之后,最终都能够达到一个一致的状态。因此,最终一致性的本质是需要系统保证最终数据能够达到一致,而不需要实时保证系统数据的强一致性。

    BASE理论面向的是大型高可用可扩展的分布式系统,和传统的事物ACID特性是相反的。它完全不同于ACID的强一致性模型,而是通过牺牲强一致性来获得可用性,并允许数据在一段时间内是不一致的,但最终达到一致状态。但同时,在实际的分布式场景中,不同业务单元和组件对数据一致性的要求是不同的,因此在具体的分布式系统架构设计过程中,ACID特性和BASE理论往往又会结合在一起。

    4 分布式事务的主要方案

    分布式事务的实现主要有以下 5 种方案:

    • 两阶段提交方案XA 方案

    • TCC 方案

    • 本地消息表

    • 可靠消息最终一致性方案

    • 最大努力通知方案

    分为两个大类:

    1. CAP理论的事务方案:

    • 两阶段提交方案/XA方案

    2. BAS柔性事务方案:

    • TCC(两阶段型、补偿型)

    • 本地消息表

    • 可靠消息最终一致性(异步确保型)

    • 最大努力通知(非可靠消息、定期校对)

    1.3.3 两阶段提交模式(2PC)的XA 方案

    2PC(2 phase commit)是一种分布式事务进行两段事务提交的简称,JavaEE的JTA/XA是2PC一种实现。2PC适合有多个数据源情况下统一按照ACID原则完成操作,比如一个操作涉及三个数据库的三个表a b c,如何保证这三个表的数据同时操作完成,保证在同一逻辑下的一致性,这是2PC关注所在,如果没有2PC,有可能a表修改成功,b表和c表没有修改成功,那么就出现不一致性。

    对数据库分布式事务有了解的同学一定知道数据库支持的两阶段提交(2PC),又叫做 XA Transactions。MySQL从5.5版本开始支持,SQL Server 2005 开始支持,Oracle 7 开始支持。

    其中,XA 是一个两阶段提交协议,该协议分为以下两个阶段:

    第一阶段:事务协调器要求每个涉及到事务的数据库预提交(precommit)此操作,并反映是否可以提交.
    在这里插入图片描述

    第二阶段:事务协调器要求每个数据库提交数据。

    其中,如果有任何一个数据库否决此次提交,那么所有数据库都会被要求回滚它们在此事务中的那部分信息。这样做的缺陷是什么呢? 咋看之下我们可以在数据库分区之间获得一致性。

    XA 的失败处理:
    在这里插入图片描述

    XA 方案中,有一个事务管理器的角色,负责协调多个数据库(资源管理器)的事务,事务管理器先问问各个数据库你准备好了吗?如果每个数据库都回复 ok,那么就正式提交事务,在各个数据库上执行操作;如果任何其中一个数据库回答不 ok,那么就回滚事务。

    在这里插入图片描述

    XA 方案比较适合单体应用里,跨多个库的分布式事务,而且因为严重依赖于数据库层面来搞定复杂的事务,效率很低,绝对不适合高并发的场景。如果要玩儿,那么基于 spring + JTA 就可以搞定,自己随便搜个 demo 看看就知道了。

    XA 方案实际很少用,一般来说某个系统内部如果出现跨多个库的这么一个操作,是不合规的。我可以给大家介绍一下, 现在微服务,一个大的系统分成几百个服务,几十个服务。一般来说,我们的规定和规范,是要求每个服务只能操作自己对应的一个数据库。

    如果你要操作别的服务对应的库,不允许直连别的服务的库,违反微服务架构的规范,你随便交叉胡乱访问,几百个服务的话,全体乱套,这样的一套服务是没法管理的,没法治理的,可能会出现数据被别人改错,自己的库被别人写挂等情况。

    如果你要操作别人的服务的库,你必须是通过调用别的服务的接口来实现,绝对不允许交叉访问别人的数据库。

    1.3.4 TCC 方案

    TCC 方案的全称是:Try、Confirm、Cancel。

    l Try 阶段:对各个服务的资源做检测以及对资源进行锁定或者预留。

    l Confirm 阶段:在各个服务中执行实际的操作。

    l Cancel 阶段:如果任何一个服务的业务方法执行出错,那么这里就需要进行补偿动作。补偿动作具体来说,就是对已经执行成功的业务逻辑的回滚操作。

    TCC 方案严重依赖回滚和补偿代码,最终的结果是:回滚代码逻辑复杂,业务代码很难维护。所以,TCC 方案的使用场景较少,但是也有使用的场景。

    比如说跟钱打交道的,支付、交易相关的场景,大家会用 TCC方案,严格保证分布式事务要么全部成功,要么全部自动回滚,严格保证资金的正确性,保证在资金上不会出现问题。

    在这里插入图片描述

    更加详细的流程如下:在这里插入图片描述

    1.3.5 本地消息表

    本地消息表其实是国外的 ebay 搞出来的这么一套思想。

    这个大概意思是这样的:

    (1)A 系统在自己本地一个事务里操作同时,插入一条数据到消息表;

    (2)接着 A 系统将这个消息发送到 MQ 中去;

    (3)B 系统接收到消息之后,在一个事务里,往自己本地消息表里插入一条数据,同时执行其他的业务操作,如果这个消息已经被处理过了,那么此时这个事务会回滚,这样保证不会重复处理消息;

    (4)B 系统执行成功之后,就会更新自己本地消息表的状态以及 A 系统消息表的状态;

    (5)如果 B 系统处理失败了,那么就不会更新消息表状态,那么此时 A 系统会定时扫描自己的消息表,如果有未处理的消息,会再次发送到 MQ 中去,让 B 再次处理;

    (6)这个方案保证了最终一致性,哪怕 B 事务失败了,但是 A 会不断重发消息,直到 B 那边成功为止。

    这个方案说实话最大的问题就在于严重依赖于数据库的消息表来管理事务啥的,会导致如果是高并发场景咋办呢?咋扩展呢?所以一般确实很少用。

    在这里插入图片描述

    一个类似的流程如下:
    在这里插入图片描述

    一个类似的流程如下:

    在这里插入图片描述

    1.3.6 可靠消息最终一致性方案

    这个的意思,就是干脆不要用本地的消息表了,直接基于 MQ 来实现事务。比如阿里的 RocketMQ 就支持消息事务。
    在这里插入图片描述

    大概的意思就是:

    (1)A 系统先发送一个 prepared 消息到 mq,如果这个 prepared 消息发送失败那么就直接取消操作别执行了;

    (2)如果这个消息发送成功过了,那么接着执行本地事务,如果成功就告诉 mq 发送确认消息,如果失败就告诉 mq 回滚消息;

    (3)如果发送了确认消息,那么此时 B 系统会接收到确认消息,然后执行本地的事务;

    (4)mq 会自动定时轮询所有 prepared 消息回调你的接口,问你,这个消息是不是本地事务处理失败了,所有没发送确认的消息,是继续重试还是回滚?一般来说这里你就可以查下数据库看之前本地事务是否执行,如果回滚了,那么这里也回滚吧。这个就是避免可能本地事务执行成功了,而确认消息却发送失败了。

    (5)这个方案里,要是系统 B 的事务失败了咋办?重试咯,自动不断重试直到成功,如果实在是不行,要么就是针对重要的资金类业务进行回滚,比如 B 系统本地回滚后,想办法通知系统 A 也回滚;或者是发送报警由人工来手工回滚和补偿。

    这个还是比较合适的,目前国内互联网公司大都是这么玩儿的,要不你举用 RocketMQ 支持的,要不你就自己基于类似 ActiveMQ?RabbitMQ?自己封装一套类似的逻辑出来,总之思路就是这样子的。

    1.3.7 最大努力通知方案

    这个方案的大致意思就是:

    (1)系统 A 本地事务执行完之后,发送个消息到 MQ;

    (2)这里会有个专门消费 MQ 的最大努力通知服务,这个服务会消费 MQ 然后写入数据库中记录下来,或者是放入个内存队列也可以,接着调用系统 B 的接口;

    (3)要是系统 B 执行成功就 ok 了;要是系统 B 执行失败了,那么最大努力通知服务就定时尝试重新调用系统 B,反复 N 次,最后还是不行就放弃。

    1.4 面试中如何应答?

    TCC和可靠消息最终一致性方案是在生产中最常用。

    一个要求强一致,一个要求最终一致。

    TCC用于强一致主要用于核心模块,例如交易/订单等。最终一致方案一般用于边缘模块例如库存,通过mq去通知,保证最终一致性,也可以业务解耦。

    面试中如果你真的被问到,可以分场景回答:

    (1)对于那些特别严格的场景,用的是 TCC 来保证强一致性;

    准备好例子:你找一个严格要求数据绝对不能错的场景(如电商交易交易中的资金),可以回答使用成熟的如中间件如阿里分布式事务seata组件。

     阿里开源了分布式事务框架,fescar,seata。seata类似TCC事务,
     经历过阿里生产环境大量考验的框架。
     seata支持Dubbo,Spring Cloud。
    
     
    • 1
    • 2
    • 3

    (2)对于数据一致性要求没有那些特别严格的场景,可以回答使用可靠消息最终一致性方案,如果基于 RocketMQ 来实现了分布式事务框架,也
    基于ActiveMQ,RabbitMQ, RocketMQ等,自己开发一个可靠消息服务,收到消息之后,尝试投递到MQ,如果投递失败,重试投递。

    准备好例子:你找一个严格对数据一致性要求没有那么严格的场景,如电商订单插入之后要调用库存服务更新库存,库存数据没有那么严格,比如少一点点也行,只需要保障最终一致性即可。

    现在大量用RocketMQ,作为MQ中间件,
    RocketMQ提供了分布式事务支持,已经把可靠消息服务需要实现的功能逻辑已经做好了。
    
     
    • 1
    • 2

    参考文献:
    1 http://www.tianshouzhi.com/api/tutorials/distributed_transaction
    2 https://www.cnblogs.com/savorboard/p/distributed-system-transaction-consistency.html
    3 https://zhuanlan.zhihu.com/p/25933039
    4 https://www.cnblogs.com/savorboard/p/distributed-system-transaction-consistency.html

    展开全文
    Pastxu 2021-04-15 17:02:47
  • 阿里巴巴Java岗面试题分享 1.HashMap 的内部结构?内部原理?和 HashTable 的区别,假如发⽣了 hash 碰撞,如何设计能让遍历效率⾼? 2.讲一讲讲讲 ConcurrentHashMap吧。 3.讲一下JVM虚拟机内存结构,以及它们的作...

    阿里巴巴Java岗面试题分享

    1.HashMap 的内部结构?内部原理?和 HashTable 的区别,假如发⽣了 hash 碰撞,如何设计能让遍历效率⾼?

    2.讲一讲讲讲 ConcurrentHashMap吧。

    3.讲一下JVM虚拟机内存结构,以及它们的作⽤。

    4.讲讲JVM的类加载过程&&双亲委派模型。

    5.谈谈Java的垃圾回收算法。

    6.谈谈Java垃圾回收的触发条件。

    7.synchronized和Lock的区别。

    8.volatile的作⽤,为什么会出现变量读取不⼀致的情况,与 synchronized 的区别?

    9.++i 在多线程环境下是否存在问题,怎么解决?

    10.讲一讲Thread.sleep() 和 Thread.yield() 区别?

    11.讲讲常⽤的容器类?

    12.如何去除 ArrayList 的重复元素?

    • 直接采⽤ HashSet 即可。作为它的参数,然后再 addAll。但这种⽅式不能保证原来的顺序,如果要求顺序,可以使⽤ LinkedHashSet 即可。

    13.讲讲 Java 的泛型擦除,泛型主要是为了解决什么问题?如何⽤泛型做 Json 的解析的?

    14.谈谈 Java 的 Error 和 Exception 的区别联系。

    • Error 和 Exception 均集成⾃ Throwable,但 Error ⼀般指的是和虚拟机相关的问题,⽐如系统崩溃,虚拟机错误,OOM 等,遇到这样的错误,程序应该被终⽌。⽽ Exception 表示程序可以处理的异常,可以捕获并且可能恢复。

    15.说一下软引⽤和弱引⽤的区别?

    16.成员变量和静态⽅法可以被重写么?重写的规则是怎样的?

    17.内部类访问局部变量的时候,为什么变量必须加上fifinal修饰符?

    • 因为⽣命周期不同。

    18.什么情况会造成内存泄漏?

    19.什么是线程死锁,如何解决?

    20.十亿条淘宝购买记录,怎么获取出现最多的前十个 ?

    • 这是一道典型的有限内存的海量数据处理的题目。一般这类题目的解答无非是以下几种:
    • 分治,hash映射,堆排序,双层桶划分,Bloom Filter,bitmap,数据库索引,mapreduce等。
    • 具体情形都有很多不同的方案。这类题目可以到网上搜索一下,了解下套路,后面就基本都会了。

    21.说一下Innodb和MySIAM的区别

    22.说一下jvm内存模型,介绍一下你了解的垃圾收集器

    • 其实并没有jvm内存模型的概念。应该是Java内存模型或者jvm内存结构,这里面试者一定要听清楚问的是哪个,再回答。

    23.如何访问链表中间节点

    • 对于这个问题,我们首先能够想到的就是先遍历一遍整个的链表,然后计算出链表的长度,进而遍历第二遍找出中间位置的数据。这种方式非常简单。
    • 若题目要求只能遍历一次链表,那又当如何解决问题?
    • 可以采取建立两个指针,一个指针一次遍历两个节点,另一个节点一次遍历一个节点,当快指针遍历到空节点时,慢指针指向的位置为链表的中间位置,这种解决问题的方法称为快慢指针方法。

    23.HR问

    • 从技术角度来说,你觉得你跟前同事比怎么样?
    • 说一下自己的个人优势。
    • 工作中觉得哪方面欠缺?
    • 为什么想来阿里?阿里的什么方面吸引了你?

    总结

    这个月马上就又要过去了,还在找工作的小伙伴要做好准备了,小编整理了大厂java程序员面试涉及到的绝大部分面试题及答案免费分享给大家,希望能帮助到大家,有需要的朋友可以看下面的免费领取方式

    资料领取方式:狂戳这里

    在这里插入图片描述

    在这里插入图片描述

    片转存中…(img-QMkK86PN-1625419721103)]

    [外链图片转存中…(img-MYMLSx5o-1625419721106)]

    展开全文
    jixuczy 2021-07-05 01:28:53
  • 分布式事务: 逻辑上的一组操作,组成这组操作的各个逻辑单元在不同的服务中,不同的服务器上,要么都成功,要么都失败。 场景。 场景: 不同服务,不同数据库 相同服务,不同数据库 不同服务,相同数据库 ...

    分布式事务:

    • 逻辑上的一组操作,组成这组操作的各个逻辑单元在不同的服务中,不同的服务器上,要么都成功,要么都失败。
      场景。

    • 场景:
      不同服务,不同数据库
      相同服务,不同数据库
      不同服务,相同数据库

    • 情况:除了本地事务的程序异常之外,网络异常、服务器宕机

    • 分布式事务基础理论:
      CAP:C:一致性。写完之后立马可以读取到最新数据;A:可用性。挂掉一台服务器依然可用;P:分区容忍性。分区通信失败是无法避免;
      BASE:妥协的方案,本质就是一个追求AP的方案。Ba:基本可用。保证核心功能可用;S:软状态,中间状态。允许一定时间内的数据不一致;E:最终一致性。

    • 没有完美的方案,强一致性和弱一致性。

    • 3种解决方案:
      两阶段提交2PC:2是指两个阶段,P:Prepared phrase,预提交阶段,C:Commit,提交阶段;
      主流的商业数据库都已经支持了两阶段提交:XA协议,免费开源的数据库支持的还不够完善,优点是实现简单,缺点是1.开源数据库会存在支持问题2.经过多次网络传输,导致性能存在问题3.总的访问时间变长,导致总的锁定时间变长。
      TCC补偿性事务:编程式解决方案。T:Try,预检资源并锁定资源;
      C:Confirm,执行业务流程;C:Cancel,如果try失败则取消事务,如果confirm执行失败,要进行补偿。
      MQ最终一致性
      如果追求一致性:2PC,追求性能MQ最终一致性。

    Seata:一站式分布式事务解决方案。默认AT模式
    概念:

    • 全局事务:全局事务由一系列的分支事务组成
    • 分支事务:就是一个本地事务
    • TC:事务协调器,负责维护全局事务的运行状态,并且可以驱动全局事务的提交或者回滚
    • TM:事务管理器,负责控制全局事务的边界,开启全局事务,并且发起全局事务的提交或者回滚的决议
    • RM:资源管理器,负责控制本地事务,维护本地事务的状态,接受提交或者回滚的指令,执行本地事务的提交或者回滚

    Seata的执行流程、生命周期?

    • TM向TC申请开启一个全局事务,全局事务开启成功并生成一个全局唯一的XID
    • XID在微服务调用链路的上下文中传播
    • RM向TC注册分支事务,TC把分支事务纳入XID对应全局事务的范围中
    • TM向TC发起全局事物的提交或者回滚的决议
    • TC协调RM执行分支事务的提交或者回滚
      注意:RM在第一阶段就完成了本地事务的提交或者回滚,Seata为每个RM维护了一张undo_log表,其中保存了每一次本地事物的回滚数据,因此第二阶段回滚是依赖这张表,将数据库数据更新为这张表数据,若是二阶段提交命令,则RM并不会二次提交,而是发起一个异步请求删除undo_log中的记录。

    传播行为:一个service方法调用另一个service的方法时,事务之间的影响(注意是不同service)
    回滚策略:默认回滚策略:受检异常(编译时异常)都不会回滚,不受检异常都会回滚
    超时事务:timeout设置超时时间。
    只读事务:readOnly=true,只能操作查询

    Seata的四种模式?
    Seata有四种分布式事务模式,默认是AT模式,每种模式都有它的适用场景。

    AT 模式是无侵入的分布式事务解决方案,适用于不希望对业务进行改造的场景,几乎0学习成本。

    TCC 模式是高性能分布式事务解决方案,适用于核心系统等对性能有很高要求的场景。

    Saga 模式是长事务解决方案,适用于业务流程长且需要保证事务最终一致性的业务系统,Saga 模式一阶段就会提交本地事务,无锁,长流程情况下可以保证性能,多用于渠道层、集成层业务系统。事务参与者可能是其它公司的服务或者是遗留系统的服务,无法进行改造和提供 TCC 要求的接口,也可以使用 Saga 模式。

    XA模式是分布式强一致性的解决方案,但性能低而使用较少。

    Seata的2PC与传统2PC区别?
    ​ 架构层次方面,传统2PC方案的 RM 实际上是在数据库层,RM 本质上就是数据库自身,通过 XA 协议实现,而 Seata的 RM 是以jar包的形式作为中间件层部署在应用程序这一侧的。
    ​ 两阶段提交方面,传统2PC无论第二阶段的决议是commit还是rollback,事务性资源的锁都要保持到Phase2完成才释放。而Seata的做法是在Phase1 就将本地事务提交,这样就可以省去Phase2持锁的时间,整体提高效率。

    展开全文
    weixin_49118892 2021-04-20 23:52:17
  • 对于一个分布式系统,系统容错、网络延迟、分布式事务等都会带来巨大的挑战。 接口调整成本高:微服务之间通过接口进行通信。如果修改某一个微服务的API,可能所有使用了该接口的微服务都需要做调整。 重复劳动:很...

    一. 什么是架构和架构本质

    在软件行业,对于什么是架构,都有很多的争论,每个人都有自己的理解。 此君说的架构和彼君理解的架构未必是一回事。因此我们在讨论架构之前,我们先讨论架构的概念定义,概念是人认识这个世界的基础,并用来沟通的手段,如果对架构概念理解不一样,那沟通起来自然不顺畅。

    Linux有架构,MySQL有架构,JVM也有架构,使用Java开发、MySQL存储、跑在Linux上的业务系统也有架构,应该关注哪一个?想要清楚以上问题需要梳理几个有关系又相似的概念:系统与子系统、模块与组建、框架与架构:

    1. 系统与子系统

    系统:泛指由一群有关联的个体组成,根据某种规则运作,能完成个别元件不能独立完成的工作能力的群体。

    子系统:也是由一群关联的个体组成的系统,多半是在更大的系统中的一部分。

    2. 模块与组件

    都是系统的组成部分,从不同角度拆分系统而已。模块是逻辑单元,组件是物理单元。

    模块就是从逻辑上将系统分解, 即分而治之, 将复杂问题简单化。模块的粒度可大可小, 可以是系统,几个子系统、某个服务,函数, 类,方法、 功能块等等。

    组件可以包括应用服务、数据库、网络、物理机、还可以包括MQ、容器、Nginx等技术组件。

    3. 框架与架构

    框架是组件实现的规范,例如:MVC、MVP、MVVM等,是提供基础功能的产品,例如开源框架:Ruby on Rails、Spring、Laravel、Django等,这是可以拿来直接使用或者在此基础上二次开发。

    框架是规范,架构是结构。

    我在这重新定义架构:软件架构指软件系统的顶层结构。

    架构是经过系统性地思考, 权衡利弊之后在现有资源约束下的最合理决策, 最终明确的系统骨架: 包括子系统, 模块, 组件. 以及他们之间协作关系, 约束规范, 指导原则.并由它来指导团队中的每个人思想层面上的一致。涉及四方面:

    1. 系统性思考的合理决策:比如技术选型、解决方案等。
    2. 明确的系统骨架:明确系统有哪些部分组成。
    3. 系统协作关系:各个组成部分如何协作来实现业务请求。
    4. 约束规范和指导原则:保证系统有序,高效、稳定运行。

    因此架构师具备能力:理解业务,全局把控,选择合适技术,解决关键问题、指导研发落地实施

    架构的本质就是对系统进行有序化地重构以致符合当前业务的发展,并可以快速扩展。

    那什么样的系统要考虑做架构设计 技术不会平白无故的出和自驱动发展起来,而架构的发展和需求是基于业务的驱动。

    架构设计完全是为了业务,

    1. 需求相对复杂.
    2. 非功能性需求在整个系统占据重要位置.
    3. 系统生命周期长,有扩展性需求.
    4. 系统基于组件或者集成的需要.
    5. 业务流程再造的需要.

    二. 架构分层和分类

    架构分类可细分为业务架构、应用架构、技术架构, 代码架构, 部署架构

    业务架构是战略,应用架构是战术,技术架构是装备。其中应用架构承上启下,一方面承接业务架构的落地,另一方面影响技术选型。

    熟悉业务,形成业务架构,根据业务架构,做出相应的应用架构,最后技术架构落地实施。

    如何针对当前需求,选择合适的应用架构,如何面向未来,保证架构平滑过渡,这个是软件开发者,特别是架构师,都需要深入思考的问题。

    1. 业务架构(俯视架构)

    包括业务规划,业务模块、业务流程,对整个系统的业务进行拆分,对领域模型进行设计,把现实的业务转化成抽象对象。

    没有最优的架构,只有最合适的架构,一切系统设计原则都要以解决业务问题为最终目标,脱离实际业务的技术情怀架构往往会给系统带入大坑,任何不基于业务做异想天开的架构都是耍流氓。

    所有问题的前提要搞清楚我们今天面临的业务量有多大,增长走势是什么样,而且解决高并发的过程,一定是一个循序渐进逐步的过程。合理的架构能够提前预见业务发展1~2年为宜。这样可以付出较为合理的代价换来真正达到技术引领业务成长的效果。

    看看京东业务架构(网上分享图):

    2. 应用架构(剖面架构,也叫逻辑架构图)

    硬件到应用的抽象,包括抽象层和编程接口。应用架构和业务架构是相辅相成的关系。业务架构的每一部分都有应用架构。

    类似:

    应用架构:应用作为独立可部署的单元,为系统划分了明确的边界,深刻影响系统功能组织、代码开发、部署和运维等各方面. 应用架构定义系统有哪些应用、以及应用之间如何分工和合作。这里所谓应用就是各个逻辑模块或者子系统。

    应用架构图关键有2点:

    ①. 职责划分: 明确应用(各个逻辑模块或者子系统)边界

    • 逻辑分层
    • 子系统、模块定义。
    • 关键类。

    ②. 职责之间的协作:

    • 接口协议:应用对外输出的接口。
    • 协作关系:应用之间的调用关系。

    应用分层有两种方式:

    • 一种是水平分(横向),按照功能处理顺序划分应用,比如把系统分为web前端/中间服务/后台任务,这是面向业务深度的划分。
    • 另一种是垂直分(纵向),按照不同的业务类型划分应用,比如进销存系统可以划分为三个独立的应用,这是面向业务广度的划分。

    应用的合反映应用之间如何协作,共同完成复杂的业务case,主要体现在应用之间的通讯机制和数据格式,通讯机制可以是同步调用/异步消息/共享DB访问等,数据格式可以是文本/XML/JSON/二进制等。

    应用的分偏向于业务,反映业务架构,应用的合偏向于技术,影响技术架构。分降低了业务复杂度,系统更有序,合增加了技术复杂度,系统更无序。

    应用架构的本质是通过系统拆分,平衡业务和技术复杂性,保证系统形散神不散。

    系统采用什么样的应用架构,受业务复杂性影响,包括企业发展阶段和业务特点;同时受技术复杂性影响,包括IT技术发展阶段和内部技术人员水平。业务复杂性(包括业务量大)必然带来技术复杂性,应用架构目标是解决业务复杂性的同时,避免技术太复杂,确保业务架构落地。

    3. 数据架构

    数据架构指导数据库的设计. 不仅仅要考虑开发中涉及到的数据库,实体模型,也要考虑物理架构中数据存储的设计。

    4. 代码架构(也叫开发架构)

    子系统代码架构主要为开发人员提供切实可行的指导,如果代码架构设计不足,就会造成影响全局的架构设计。比如公司内不同的开发团队使用不同的技术栈或者组件,结果公司整体架构设计就会失控。

    代码架构主要定义:

    ①. 代码单元:

    • 配置设计
    • 框架、类库。

    ②. 代码单元组织:

    • 编码规范,编码的惯例。
    • 项目模块划分
    • 顶层文件结构设计,比如mvc设计。
    • 依赖关系

    5. 技术架构

    技术架构:确定组成应用系统的实际运行组件(lvs,nginx,tomcat,php-fpm等),这些运行组件之间的关系,以及部署到硬件的策略。

    技术架构主要考虑系统的非功能性特征,对系统的高可用、高性能、扩展、安全、伸缩性、简洁等做系统级的把握。

    系统架构的设计要求架构师具备软件和硬件的功能和性能的过硬知识,这也是架构设计工作中最为困难的工作。

    6. 部署拓扑架构图(实际物理架构图)

    拓扑架构,包括架构部署了几个节点,节点之间的关系,服务器的高可用,网路接口和协议等,决定了应用如何运行,运行的性能,可维护性,可扩展性,是所有架构的基础。这个图主要是运维工程师主要关注的对象。

    物理架构主要考虑硬件选择和拓扑结构,软件到硬件的映射,软硬件的相互影响。

    三. 架构级别

    我们使用金字塔的架构级别来说明,上层级别包含下层:

    • 系统级:即整个系统内各部分的关系以及如何治理:分层
    • 应用级:即单个应用的整体架构,及其与系统内单个应用的关系等。
    • 模块级:即应用内部的模块架构,如代码的模块化、数据和状态的管理等。
    • 代码级:即从代码级别保障架构实施。

    战略设计与战术设计

    基于架构金字塔,我们有了系统架构的战略设计与战术设计的完美结合:

    • 战略设计:业务架构用于指导架构师如何进行系统架构设计。
    • 战术设计:应用架构要根据业务架构来设计。
    • 战术实施:应用架构确定以后,就是技术选型。

    四. 应用架构演进

    业务架构是生产力,应用架构是生产关系,技术架构是生产工具。业务架构决定应用架构,应用架构需要适配业务架构,并随着业务架构不断进化,同时应用架构依托技术架构最终落地。

    架构演进路程:单体应用→分布式应用服务化→微服务

    1. 单体应用

    企业一开始业务比较简单,只应用某个简单场景,应用服务支持数据增删改查和简单的逻辑即可,单体应用可以满足要求。

    典型的三级架构,前端(Web/手机端)+中间业务逻辑层+数据库层。这是一种典型的Java Spring MVC或者Python Django框架的应用。其架构图如下所示:

    针对单体应用,非功能性需求的做法:

    1. 性能需求:使用缓存改善性能
    2. 并发需求:使用集群改善并发
    3. 读写分离:数据库地读写分离
    4. 使用反向代理和cdn加速
    5. 使用分布式文件和分布式数据库

    单体架构的应用比较容易部署、测试, 在项目的初期,单体应用可以很好地运行。然而,随着需求的不断增加, 越来越多的人加入开发团队,代码库也在飞速地膨胀。慢慢地,单体应用变得越来越臃肿,可维护性、灵活性逐渐降低,维护成本越来越高。下面是单体架构应用的一些缺点:

    • 复杂性高:以一个百万行级别的单体应用为例,整个项目包含的模块非常多、模块的边界模糊、 依赖关系不清晰、 代码质量参差不齐、 混乱地堆砌在一起。可想而知整个项目非常复杂。 每次修改代码都心惊胆战, 甚至添加一个简单的功能, 或者修改一个Bug都会带来隐含的缺陷。
    • 技术债务: 随着时间推移、需求变更和人员更迭,会逐渐形成应用程序的技术债务, 并且越积 越多。“ 不坏不修”, 这在软件开发中非常常见, 在单体应用中这种思想更甚。 已使用的系统设计或代码难以被修改,因为应用程序中的其他模块可能会以意料之外的方式使用它。
    • 部署频率低: 随着代码的增多,构建和部署的时间也会增加。而在单体应用中, 每次功能的变更或缺陷的修复都会导致需要重新部署整个应用。全量部署的方式耗时长、 影响范围大、 风险高, 这使得单体应用项目上线部署的频率较低。 而部署频率低又导致两次发布之间会有大量的功能变更和缺陷修复,出错率比较高。
    • 可靠性差: 某个应用Bug,例如死循环、内存溢出等, 可能会导致整个应用的崩溃。
    • 扩展能力受限: 单体应用只能作为一个整体进行扩展,无法根据业务模块的需要进行伸缩。例如,应用中有的模块是计算密集型的,它需要强劲的CPU; 有的模块则是IO密集型的,需要更大的内存。 由于这些模块部署在一起,不得不在硬件的选择上做出妥协。
    • 阻碍技术创新: 单体应用往往使用统一的技术平台或方案解决所有的问题, 团队中的每个成员 都必须使用相同的开发语言和框架,要想引入新框架或新技术平台会非常困难。

    2. 分布式

    随着业务深入,业务要求的产品功能越来越多,每个业务模块逻辑也都变得更加复杂,业务的深度和广度都增加,使得单体应用变得越来越臃肿,可维护性、灵活性逐渐降低,增加新功能开发周期越来越长,维护成本越来越高。

    这时需要对系统按照业务功能模块拆分,将各个模块服务化,变成一个分布式系统。业务模块分别部署在不同的服务器上,各个业务模块之间通过接口进行数据交互。

    该架构相对于单体架构来说,这种架构提供了负载均衡的能力,大大提高了系统负载能力,解决了网站高并发的需求。另外还有以下特点:

    • 降低了耦合度:把模块拆分,使用接口通信,降低模块之间的耦合度。
    • 责任清晰:把项目拆分成若干个子项目,不同的团队负责不同的子项目。
    • 扩展方便:增加功能时只需要再增加一个子项目,调用其他系统的接口就可以。
    • 部署方便:可以灵活的进行分布式部署。
    • 提高代码的复用性:比如Service层,如果不采用分布式rest服务方式架构就会在手机Wap商城,微信商城,PC,Android,iOS每个端都要写一个Service层逻辑,开发量大,难以维护一起升级,这时候就可以采用分布式rest服务方式,公用一个service层。
    • 缺点:系统之间的交互要使用远程通信,接口开发增大工作量,但是利大于弊。

    3. 微服务

    紧接着业务模式越来越复杂,订单、商品、库存、价格等各个模块都很深入,比如价格区分会员等级,访问渠道(app还是PC),销售方式(团购还是普通)等,还有大量的价格促销,这些规则很复杂,容易相互冲突,需要把分散到各个业务的价格逻辑进行统一管理,以基础价格服务的方式透明地提供给上层应用,变成一个微内核的服务化架构,即微服务。

    微服务的特点:

    • 易于开发和维护: 一个微服务只会关注一个特定的业务功能,所以它业务清晰、代码量较少。 开发和维护单个微服务相对简单。而整个应用是由若干个微服务构建而成的,所以整个应用也会被维持在一个可控状态。
    • 单个微服务启动较快: 单个微服务代码量较少, 所以启动会比较快。
    • 局部修改容易部署: 单体应用只要有修改,就得重新部署整个应用,微服务解决了这样的问题。 一般来说,对某个微服务进行修改,只需要重新部署这个服务即可。
    • 技术栈不受限:在微服务架构中,可以结合项目业务及团队的特点,合理地选择技术栈。例如某些服务可使用关系型数据库MySQL;某些微服务有图形计算的需求,可以使用Neo4j;甚至可根据需要,部分微服务使用Java开发,部分微服务使用Node.js开发。

    微服务虽然有很多吸引人的地方,但它并不是免费的午餐,使用它是有代价的。使用微服务架构面临的挑战。

    • 运维要求较高:更多的服务意味着更多的运维投入。在单体架构中,只需要保证一个应用的正常运行。而在微服务中,需要保证几十甚至几百个服务服务的正常运行与协作,这给运维带来了很大的挑战。
    • 分布式固有的复杂性:使用微服务构建的是分布式系统。对于一个分布式系统,系统容错、网络延迟、分布式事务等都会带来巨大的挑战。
    • 接口调整成本高:微服务之间通过接口进行通信。如果修改某一个微服务的API,可能所有使用了该接口的微服务都需要做调整。
    • 重复劳动:很多服务可能都会使用到相同的功能,而这个功能并没有达到分解为一个微服务的程度,这个时候,可能各个服务都会开发这一功能,从而导致代码重复。尽管可以使用共享库来解决这个问题(例如可以将这个功能封装成公共组件,需要该功能的微服务引用该组件),但共享库在多语言环境下就不一定行得通了。

    五. 衡量架构的合理性

    架构为业务服务,没有最优的架构,只有最合适的架构,架构始终以高效,稳定,安全为目标来衡量其合理性。

    合理的架构设计:

    1. 业务需求角度

    • 能解决当下业务需求和问题
    • 高效完成业务需求: 能以优雅且可复用的方式解决当下所有业务问题
    • 前瞻性设计: 能在未来一段时间都能以第2种方式满足业务,从而不会每次当业务进行演变时,导致架构翻天覆地的变化。

    2. 非业务需求角度

    ①. 稳定性。指标:

    • 高可用:要尽可能的提高软件的可用性,我想每个操作人都不愿意看到自己的工作无法正常进行。黑盒白盒测试、单元测试、自动化测试、故障注入测试、提高测试覆盖率等方式来一步一步推进。

    ②. 高效指标:

    • 文档化:不管是整体还是部分的整个生命周期内都必须做好文档化,变动的来源包括但不限于BUG,需求。
    • 可扩展:软件的设计秉承着低耦合的理念去做,注意在合理的地方抽象。方便功能更改、新增和运用技术的迭代,并且支持在适时对架构做出重构。
    • 高复用:为了避免重复劳动,为了降低成本,我们希望能够重用之前的代码、之前的设计。这点对于架构环境的依赖是最大的。

    ③. 安全指标

    • 安全:组织的运作过程中产生的数据都是具有商业价值的,保证数据的安全也是刻不容缓的一部分。以免出现XX门之类丑闻。加密、https等为普遍手段

    六. 常见架构误区

    开高走落不到实处

    • 遗漏关键性约束与非功能需求
    • 为虚无的未来埋单而过度设计
    • 过早做出关键性决策
    • 客户说啥就是啥成为传话筒
    • 埋头干活儿缺乏前瞻性
    • 架构设计还要考虑系统可测性
    • 架构设计不要企图一步到位

    常见误区

    • 误区1——架构专门由架构师来做,业务开发人员无需关注:架构的再好,最终还是需要代码来落地,并且组织越大这个落地的难度越大。不单单是系统架构,每个解决方案每个项目也由自己的架构,如分层、设计模式等。如果每一块砖瓦不够坚固,那么整个系统还是会由崩塌的风险。所谓“千里之堤,溃于蚁穴”。
    • 误区2——架构师确定了架构蓝图之后任务就结束了:架构不是“空中楼阁”,最终还是要落地的,但是架构师完全不去深入到第一线怎么知道“地”在哪?怎么才能落的稳稳当当。
    • 误区3——不做出完美的架构设计不开工:世上没有最好架构,只有最合适的架构,不要企图一步到位。我们需要的不是一下子造出一辆汽车,而是从单轮车→自行车→摩托车,最后再到汽车。想象一下2年后才能造出的产品,当初市场还存在吗?
    • 误区4—— 为虚无的未来埋单而过度设计:在创业公司初期,业务场景和需求边界很难把握,产品需要快速迭代和变现,需求频繁更新,这个时候需要的是快速实现。不要过多考虑未来的扩展,说不定功能做完,效果不好就无用了。如果业务模式和应用场景边界都已经比较清晰,是应该适当的考虑未来的扩展性设计。
    • 误区5——一味追随大公司的解决方案:由于大公司巨大成功的光环效应,再加上从大公司挖来的技术高手的影响,网站在讨论架构决策时,最有说服力的一句话就成了“淘宝就是这么搞的”或者“腾讯 就是这么搞的”。大公司的经验和成功模式固然重要,值得学习借鉴,但如果因此而变得盲从,就失去了坚持自我的勇气,在架构演化的道路上迟早会迷路。
    • 误区6——为了技术而技术:技术是为业务而存在的,除此毫无意义。在技术选型和架构设计中,脱离网站业务发展的实际,一味追求时髦的新技术,可能会将技术发展引入崎岖小道,架构之路越走越难。考虑实现成本、时间、人员等各方面都要综合考虑,理想与现实需要折中。

    七. 架构知识体系

    1. 架构演进

    • 初始阶段:LAMP,部署在一台服务器
    • 应用服务器和数据服务器分离
    • 使用缓存改善性能
    • 使用集群改善并发
    • 数据库地读写分离
    • 使用反向代理和cdn加速
    • 使用分布式文件和分布式数据库
    • 业务拆分
    • 分布式服务

    2. 架构模式

    分层:横向分层:应用层,服务层,数据层

    分割:纵向分割:拆分功能和服务

    分布式

    • 分布式应用和服务
    • 分布式静态资源
    • 分布式数据和存储
    • 分布式计算

    集群:提高并发和可用性

    缓存:优化系统性能

    • cdn
    • 方向代理访问资源
    • 本地缓存
    • 分布式缓存

    异步:降低系统的耦合性

    • 提供系统的可用性
    • 加快响应速度

    冗余:冷备和热备,保证系统的可用性

    自动化:发布,测试,部署,监控,报警,失效转移,故障恢复

    安全:

    3. 架构核心要素

    高性能:网站的灵魂

    • 性能测试
    • 前端优化
    • 应用优化
    • 数据库优化

    可用性:保证服务器不宕机,一般通过冗余部署备份服务器来完成

    • 负载均衡
    • 数据备份
    • 自动发布
    • 灰度发布
    • 监控报警

    伸缩性:建集群,是否快速应对大规模增长的流量,容易添加新的机器

    集群

    • 负载均衡
    • 缓存负载均衡

    可扩展性:主要关注功能需求,应对业务的扩展,快速响应业务的变化。是否做法开闭原则,系统耦合依赖

    • 分布式消息
    • 服务化

    安全性:网站的各种攻击,各种漏洞是否堵住,架构是否可以做到限流作用,防止ddos攻击。

    • xss攻击
    • sql注入
    • csr攻击
    • web防火墙漏洞
    • 安全漏洞
    • ssl

    八. 架构书籍推荐

    1. 《大型网站技术架构:核心原理与案例分析》

    这是比较早,比较系统介绍大型网站技术架构的书,通俗易懂又充满智慧,即便你之前完全没接触过网站开发,通读前几章,也能快速获取到常见的网站技术架构及其应用场景。非常赞。

    2. 《亿级流量网站架构核心技术》

    相比《大型网站技术架构》的高屋建瓴,开涛的这本《亿级流量网站架构核心技术》则落实到细节,网站架构中常见的各种技术,比如缓存、队列、线程池、代理……,统统都讲到了,而且配有核心代码。甚至连 Nginx 的配置都有!

    如果你想在实现大流量网站时找参考技术和代码,这本书最合适啦。

    3. 《架构即未来》

    这是一本“神书”啦,超越具体技术层面,着重剖析架构问题的根源,帮助我们弄清楚应该以何种方式管理、领导、组织和配置团队。

    4. 《分布式服务架构:原理、设计与实战》

    这本书全面介绍了分布式服务架构的原理与设计,并结合作者在实施微服务架构过程中的实践经验,总结了保障线上服务健康、可靠的最佳方案,是一本架构级、实战型的重量级著作。

    5. 《聊聊架构》

    这算是架构方面的一本神书了,从架构的原初谈起,从业务的拆分谈起,谈到架构的目的,架构师的角色,架构师如何将架构落地……强烈推荐。

    不过,对于没有架构实践经验的小伙伴来讲,可能会觉得这本书比较虚,概念多,实战少。但如果你有过一两个项目的架构经验,就会深深认同书中追本溯源探讨的架构理念。

    6. 《软件架构师的12项修炼》

    大多数时候所谓的“技术之玻璃天花板”其实只是缺乏软技能而已。这些技能可以学到,缺乏的知识可以通过决定改变的努力来弥补。

    最后

    针对以上面试题,小编已经把面试题+答案整理好了,想要获取这份面试题+答案的朋友帮忙点赞后,戳这里免费领取就可以了

    最新大厂必问微服务面试题汇总:SpringCloud、Boot、Dubbo

    最新大厂必问微服务面试题汇总:SpringCloud、Boot、Dubbo

    最新大厂必问微服务面试题汇总:SpringCloud、Boot、Dubbo

    面试专题

    image

    除了以上面试题+答案,小编同时还整理了微服务相关的实战文档也可以分享给大家学习

    image

    image

    以上面试题,小编已经把面试题+答案整理好了,想要获取这份面试题+答案的朋友帮忙点赞后,戳这里免费领取就可以了**

    [外链图片转存中…(img-bUDsjJCE-1625591947885)]

    [外链图片转存中…(img-AHV8zZzc-1625591947886)]

    [外链图片转存中…(img-gPoWHokC-1625591947887)]

    面试专题

    [外链图片转存中…(img-dFSjT1P2-1625591947887)]

    除了以上面试题+答案,小编同时还整理了微服务相关的实战文档也可以分享给大家学习

    [外链图片转存中…(img-mC4wIzcl-1625591947888)]

    [外链图片转存中…(img-i3LzhaQH-1625591947889)]

    image

    展开全文
    m0_56169789 2021-07-07 01:19:16
  • qq_61084993 2021-10-21 18:51:28
  • qq_40980826 2021-12-01 11:44:51
  • crazymakercircle 2021-02-04 22:48:14
  • o9109003234 2021-06-02 00:31:55
  • weixin_42505246 2021-03-10 06:49:21
  • weixin_42353053 2021-03-10 08:11:15
  • qq_45065241 2021-06-26 01:08:32
  • itfly8 2021-04-20 00:23:43
  • m0_57286472 2021-05-19 16:55:34
  • weixin_38405253 2021-04-09 10:42:01
  • weixin_29107819 2021-01-19 16:25:06
  • sinat_42410314 2021-03-07 22:30:39
  • m0_56175058 2021-07-07 01:30:21
  • xiaoxiaole0313 2021-01-19 07:24:00
  • SUNXIOAJIE 2021-03-26 11:31:44
  • weixin_42446705 2021-03-13 13:16:38
  • emprere 2021-09-04 00:35:28
  • weixin_39835158 2020-12-19 05:25:03
  • github_38592071 2021-07-10 00:30:28
  • alex_yangchuansheng 2021-03-12 15:14:51
  • weixin_57907028 2021-05-15 15:10:10
  • qq_42914528 2021-03-24 00:13:37
  • weixin_44196561 2021-09-13 14:25:45
  • mingongge 2021-06-20 00:11:43
  • ZGL_cyy 2021-01-08 21:40:06

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 39,804
精华内容 15,921
关键字:

分布式事务面试题