笔记:分布式相关的各种概念性问题_active standby和master slave-程序员宅基地

技术标签: 笔记  分布式  

1、节点(node):

一个实体服务器(计算机)的抽象名称。

2、网络分区(network partitions ):

用网络连接的两个节点不再连通(如:断网)时,节点被分成了多个独立区域。

3、分布式(distributed)XXX:

相较于普通的XXX分散在同一个节点而言,分布式XXX分指XXX散在不同的节点上,节点间通常用网络连接在一起实现原有的XXX功能。

4、分布式CAP定理:

在发生分区的分布式系统中,分散的两个节点间进行读写时,仅能保证CAP中的两个,其中之一必须牺牲。

一致性(Consistency):对某个指定的客户端来说,读操作保证能够返回最新的写操作结果。
可用性(Availability):非故障节点将在合理的时间内返回合理的响应(不是错误或超时)。
分区容错性(Partition tolerance):当网络分区发生时,系统将继续正常运作。

定理理解如下:

  1. 若要满足分区容错性,则必然需要副本节点(避免单点故障)。
  2. 在原节点和副本节点刚发生分区时,系统并未感知分区(故障节点)的存在:
  3. 若选择一致性,则原节点的写会被同步更新到副本节点,但由于分区存在,会使同步被卡住,写也就被卡住,后续新到的读写操作都会被卡住,系统丧失可用性。
  4. 若选择可用性,由于写操作因数据同步被卡住而卡住,后续新到的读会返回未被更新的值,使得系统一致性不满足。
    综上:满足分区容错性时,一致性和可用性只能二选一。

5、分布式一致性(Distributed Consistency)分类:

强一致性(Strong Consistency):指CAP定理中的一致性。关系型数据库通常采用强一致性。
弱一致性(Weak consistency):与强一致性相反,允许读到错误的数据,即:写入的数据可能丢失。
最终一致性(Eventual Consistency):写入数据后,允许中间读到的数据不一致,但经过一定时间后,读到的数据都会变成之前写入的,通常为异步备份。如:因果一致性、读己之所写、会话一致性、单调读一致性和单调写一致性。

6、分布式BASE理论:

虽然CAP定理已经指出CAP三者不可兼得,但BASE理论是在保证P的情况下,可适当降低A来改善C。

基本可用(Basically Available):基本可用指的是系统仍然可以正常使用,只是效率变低了或是核心功能仍然可用。
软状态(Soft state):原节点和副本节点之间的数据同步允许存在一定时延。
最终一致性(Eventual consistency):如上所述。

7、事务(transaction):

指一个完整的执行单元(unit),可以由一个或多个操作组成,具有ACID属性。

原子性(atomicity):一个事务中的操作要么都做,要么都不做。
一致性(consistency):事务执行成功时,数据正常更新,事务执行失败时,回滚到事务执行前的状态。
隔离性(isolation):事务间的执行不会相互干扰,即一个事务内部的操作及使用的数据对并发的其他事务是不可见的。
持久性(durability):持久性也称永久性(permanence),指一个事务一旦提交,数据将永久性的改变。

8、事务并发(transaction concurrency):

多个事务并发执行时,不同事务隔离级别下,可能出现如下问题:

脏读(Dirty Read):读到了因事务回滚而失效的值。
不可重读(Nonrepeatable Read):读取某一个指定行时,多次重复读取到的值不同。
幻读(Phantom Read):按照相同条件筛选行时,得到的行数发生改变。

9、事务隔离级别(transaction isolation levels):

适当牺牲事务的隔离性,以提高事务并发效率。

读未提交的(Read uncommitted):一个事务未提交时,其修改的值可以被另一个事务读取到。相当于什么都没做,脏读、不可重读、幻读问题都存在。
读已提交的(Read committed):一个事务只有提交后,其修改的值才能被其他事务读取到。读到的值不存在事务回滚,解决了脏读问题,但存在多个事务提交,导致不可重读和幻读存在。
可重复读取(Repeatable read):一个事务内多次读取同一个数据,其值不会因其他事务的修改和提交而发生改变。解决了脏读、不可重读问题,但其他事务提交仍然可以导致幻读问题。
可串行化(Serializable):事务在逻辑上的串行执行,可通过合理的并行调度来实现。属于最高的事务隔离级别,脏读、不可重读和幻读都已解决。

10、分布式计算(Distributed Computing):

计算可分为串行计算并行计算,而分布式计算仅对可以并行计算的任务才是有意义的,故:分布式计算也是一种特殊的并行计算。通过将计算拆分为多个可以并行的计算,将其分配到不同计算机上实现并行执行。
相关的概念还有:网格计算云计算

11、分布式存储(Distributed Storage):

把数据分散到不同节点上存储。

12、分布式框架Hadoop:

可应用于大数据存储和计算的分布式框架,Hadoop框架最核心的设计就是:分布式文件系统HDFS(Hadoop Distributed File System)和并行运算编程模型MapReduce。

13、集群(cluster):

  1. 解决单点数据量过大(内存不够)的问题。
  2. 通过某种规则,将一个整体的数据源分散到多个提供相同服务类型的节点上进行处理,每个节点只处理按照规则分配到的数据。
  3. 节点故障或恢复后,重新按照规则为数据分配节点。
  4. 客户端可向任意节点发起请求,然后由服务端重定向到该数据的真实所在节点。
  5. 为了保证节点故障后,数据被切换到其他节点后的一致性,不同节点通常会共享一个持久化的数据中心。

单仲裁设备集群(Single quorum device cluster ):只要有一个节点能够提供服务,集群就可以继续提供服务,是否可用仲裁由共享的数据中心决定。
多数节点集仲裁集群(Majority Node Set Quorum):指每个节点都参与仲裁,故障发生后,只有具有大多数(总数的一半+1)节点的部分可以继续运行,其余节点的必须下线,若不存在大多数节点,则集群停止服务。

14、主从(master-slave):

解决单点故障问题。
主可被读写,从仅可读,主从均在线。主从之间存在数据交换,且从的更新源于主,主从都拥有全量数据。主一旦出问题,从之间会重新选出一个主。主和从都可为多个,但由于多主的配置麻烦,通常采用一主多从的模式。

15、主备(active-standby):

主提供服务,被不提供服务,主异常后由被接管提供服务。

16、热备(hot-standby):

与主备类似。

17、主从复制(master-slave replication):

将主节点的数据同步复制到从节点。

18、读写分离(read-write separation):

读写分别在不同的网络节点上执行。目的是提高数据的访问性能。
读写节点之间的数据同步方式有:

异步:写请求的返回和数据同步并行的。
全同步:写请求同步到所有读节点后才返回写请求。
半同步:写请求同步到部分读节点后就可以返回写请求。

19、缓存(cache):

本意指存储临时数据的存储器,通常也指被临时存储而不需要持久化的数据,使用缓存的目的是提高系统性能。

20、分布式一致性(Distributed Consistency):

原节点和副本节点的数据完全相同。

21、分布式事务(Distributed transaction):

需要在多个节点间提交和回滚的事务。

两阶段提交(two-phase commit, 2PC):分为准备和提交两个阶段,需要引入一个协调者,阶段1时,协调者向所有节点发送准备请求,通常各节点会有日志记录,阶段2时,协调者向所有节点发起提交或是回滚请求。
三阶段提交(three-phase commit, 3PC):分为准备、预提交和提交三个阶段,引入了超时机制,如果节点等待预提交超时,则中断事务,如果节点等待提交超时,则提交事务。

22、分布式共识算法(Distributed consensus algorithm):

多个节点就某一件事达成共识,其中最为有效的是Paxos算法,用于领导(Leader)节点节点故障后,重新选举出新的领导节点。Raft算法Paxos算法的一种简化实现。

23、分布式一致性算法(Distributed Consistency Algorithm):

使不同网络节点之间的数据达到一致。
Gossip算法通过节点间的随机通信,类似疫情传播,能够使网络节点间的数据达到最终一致,具有去中心化、容错和指数级收敛速度的特点。

24、分布式协调功能(distributed coordination function):

跨网络节点间互斥的访问同一个资源,即:跨节点的进程或线程间同步。

25、分布式锁(Distributed Lock):

分布式协调功能的一种实现。分布式锁必须高可用,否则就失去了“锁”的意义。锁要高可用就必须在其他节点存储副本,避免单点故障。要在其他节点存储副本就必须考虑多节点的分布式一致性问题。所以高可用的分布式锁实现比较难。

基于数据库实现分布式锁;
基于缓存(Redis等)实现分布式锁;
基于Zookeeper实现分布式锁;

26、高可用集群(High Availability Cluster,简称HA Cluster):

通过集群来实现系统的高可用。

27、多实例(multiple instances):

同一个程序在一台机器上开多个。

28、单点故障(Single Point of Failure,缩写SPOF):

单个节点故障导致整个系统故障。

29、负载均衡(Load balancing):

根据某种策略将流量发送到指定节点。节点资源作为热点数据,本身不一定大,处理也不耗时,但访问访问流量很高,导致单点的耗时都在网络排队上。解决单点网络流量过高的问题。

30、高可用(High Availability):

系统在指定时间段内连续运行而不会出现故障的能力,通常用5个9来衡量,即:系统在99.999%的时间都是可用的。需要增加冗余(备份)节点解决单点故障问题,进而提高可用性。

31、持久化(Persistence):

一般指数据的持久化,将数据永久保存,如:将数据从内存保存到磁盘。

相关资料:

What are Redis master-slave and Redis clusters and the difference between them?
WHAT IS SERVER CLUSTERING AND HOW DOES IT WORK?
Model 2: Single quorum device server cluster configuration
What Is a Majority Node Set? (Server Clusters: Majority Node Set Quorum)
Motivation (Server Clusters: Majority Node Set Quorum)
Load Balancing vs Server Clustering: Understand the Difference
high availability (HA)
Basically Available, Soft State, Eventual Consistency (BASE)
CAP Theorem for Databases: Consistency, Availability & Partition Tolerance
CAP Theorem: Availability vs consistency
CAP Theorem
Ali three sides: do you understand cap and base theory? It can be said in combination with actual cases
Transaction Isolation Levels (ODBC)

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_46691179/article/details/123279272

智能推荐

while循环&CPU占用率高问题深入分析与解决方案_main函数使用while(1)循环cpu占用99-程序员宅基地

文章浏览阅读3.8k次,点赞9次,收藏28次。直接上一个工作中碰到的问题,另外一个系统开启多线程调用我这边的接口,然后我这边会开启多线程批量查询第三方接口并且返回给调用方。使用的是两三年前别人遗留下来的方法,放到线上后发现确实是可以正常取到结果,但是一旦调用,CPU占用就直接100%(部署环境是win server服务器)。因此查看了下相关的老代码并使用JProfiler查看发现是在某个while循环的时候有问题。具体项目代码就不贴了,类似于下面这段代码。​​​​​​while(flag) {//your code;}这里的flag._main函数使用while(1)循环cpu占用99

【无标题】jetbrains idea shift f6不生效_idea shift +f6快捷键不生效-程序员宅基地

文章浏览阅读347次。idea shift f6 快捷键无效_idea shift +f6快捷键不生效

node.js学习笔记之Node中的核心模块_node模块中有很多核心模块,以下不属于核心模块,使用时需下载的是-程序员宅基地

文章浏览阅读135次。Ecmacript 中没有DOM 和 BOM核心模块Node为JavaScript提供了很多服务器级别,这些API绝大多数都被包装到了一个具名和核心模块中了,例如文件操作的 fs 核心模块 ,http服务构建的http 模块 path 路径操作模块 os 操作系统信息模块// 用来获取机器信息的var os = require('os')// 用来操作路径的var path = require('path')// 获取当前机器的 CPU 信息console.log(os.cpus._node模块中有很多核心模块,以下不属于核心模块,使用时需下载的是

数学建模【SPSS 下载-安装、方差分析与回归分析的SPSS实现(软件概述、方差分析、回归分析)】_化工数学模型数据回归软件-程序员宅基地

文章浏览阅读10w+次,点赞435次,收藏3.4k次。SPSS 22 下载安装过程7.6 方差分析与回归分析的SPSS实现7.6.1 SPSS软件概述1 SPSS版本与安装2 SPSS界面3 SPSS特点4 SPSS数据7.6.2 SPSS与方差分析1 单因素方差分析2 双因素方差分析7.6.3 SPSS与回归分析SPSS回归分析过程牙膏价格问题的回归分析_化工数学模型数据回归软件

利用hutool实现邮件发送功能_hutool发送邮件-程序员宅基地

文章浏览阅读7.5k次。如何利用hutool工具包实现邮件发送功能呢?1、首先引入hutool依赖<dependency> <groupId>cn.hutool</groupId> <artifactId>hutool-all</artifactId> <version>5.7.19</version></dependency>2、编写邮件发送工具类package com.pc.c..._hutool发送邮件

docker安装elasticsearch,elasticsearch-head,kibana,ik分词器_docker安装kibana连接elasticsearch并且elasticsearch有密码-程序员宅基地

文章浏览阅读867次,点赞2次,收藏2次。docker安装elasticsearch,elasticsearch-head,kibana,ik分词器安装方式基本有两种,一种是pull的方式,一种是Dockerfile的方式,由于pull的方式pull下来后还需配置许多东西且不便于复用,个人比较喜欢使用Dockerfile的方式所有docker支持的镜像基本都在https://hub.docker.com/docker的官网上能找到合..._docker安装kibana连接elasticsearch并且elasticsearch有密码

随便推点

Python 攻克移动开发失败!_beeware-程序员宅基地

文章浏览阅读1.3w次,点赞57次,收藏92次。整理 | 郑丽媛出品 | CSDN(ID:CSDNnews)近年来,随着机器学习的兴起,有一门编程语言逐渐变得火热——Python。得益于其针对机器学习提供了大量开源框架和第三方模块,内置..._beeware

Swift4.0_Timer 的基本使用_swift timer 暂停-程序员宅基地

文章浏览阅读7.9k次。//// ViewController.swift// Day_10_Timer//// Created by dongqiangfei on 2018/10/15.// Copyright 2018年 飞飞. All rights reserved.//import UIKitclass ViewController: UIViewController { ..._swift timer 暂停

元素三大等待-程序员宅基地

文章浏览阅读986次,点赞2次,收藏2次。1.硬性等待让当前线程暂停执行,应用场景:代码执行速度太快了,但是UI元素没有立马加载出来,造成两者不同步,这时候就可以让代码等待一下,再去执行找元素的动作线程休眠,强制等待 Thread.sleep(long mills)package com.example.demo;import org.junit.jupiter.api.Test;import org.openqa.selenium.By;import org.openqa.selenium.firefox.Firefox.._元素三大等待

Java软件工程师职位分析_java岗位分析-程序员宅基地

文章浏览阅读3k次,点赞4次,收藏14次。Java软件工程师职位分析_java岗位分析

Java:Unreachable code的解决方法_java unreachable code-程序员宅基地

文章浏览阅读2k次。Java:Unreachable code的解决方法_java unreachable code

标签data-*自定义属性值和根据data属性值查找对应标签_如何根据data-*属性获取对应的标签对象-程序员宅基地

文章浏览阅读1w次。1、html中设置标签data-*的值 标题 11111 222222、点击获取当前标签的data-url的值$('dd').on('click', function() { var urlVal = $(this).data('ur_如何根据data-*属性获取对应的标签对象

推荐文章

热门文章

相关标签