Raft 协议算法简介
简介
Raft协议算法产生的结果和Paxos的效果相同,Raft算法设计较Paxos设计易懂,并且有着更好的生产环境的实现方式。
背景
事务操作的四要素ACID:原子性、一致性、隔离性、持久性、 对于一个分布式环境的服务来说,较难满足一个事务的要求。比如对于一致性来说就是一个较难处理的问题,Raft正是为了解决分布式环境中一致性而产生的一种一致性协议算法。
Raft概念
1、Follower(追随者)角色
2、Candidate(候选者)角色
3、Leader(追随者)角色
4、Term(时间阶段)
5、server(或者node 泛指服务节点,算法中指log节点)
基本背景
1、集群包含若干server(或者node),数目5是一个典型的分布式集群数目,对于这样一个系统来说,最多容忍的失败server个数为2(N>=2F+1),总的服务数N, 容忍失败的个数F。
2、所有的node在同一个时期(term)只会有以上三种角色状态的其中一种。
3、Term是一个不定的时间长度,每个term最多只会有一个leader,可能没有。成功选举后由这个leader领导cluster直到term结束。
Leader选举
选举流程
1、初始节点状态都是follower
2、收不到leader 通知或者candidate请求(超时),开始触发选举流程
3、F.增加自己的term num并转换为candidate状态(过程时间随机)
4、F.投票自己并且发送给其他人“投我”的请求
5、F.最终结果有三类:获得大多票数成为leader、其他f成为leader、无结果继续第二轮投票
状态转换
Follower->Candidate 开始选举
Candidate->Candidate 选举超时
Candidate->Leader 选举成功
Candidate->Follower 发现其他leader 或者新的term时期
Leader->Follower 发现其他leader 或者更好的term时期
Log Replication
协议针对log 副本。数据同步流程
1、client发送数据请求
2、leader接收数据请求,其他角色接收到请求转给leader
3、L.发出append请求(记录数据)
4、L.收到大多数数据回复,返回client请求状态
5、L.下个心跳把commit给到follower
6、如果传输失败,leader可以不断重试
流程约定
1、log entry数据特性:log index、term num、commond
2、log 持久化存储
3、entry被大多数存储成功则为commited
4、index和term相同那么之前的数据(entry)都是相同的
5、某个commit之前的数据都是commited的
6、append操作带上上一个的entry信息(index和term)并做检查
7、检查不匹配,leader重试前一条。采用迭代重试方式直到完成
参考资料
Raft协议特性简介
参考资料:
动画演示 http://thesecretlivesofdata.com/raft/
Raft官网 https://raft.github.io/
版权声明:本文为博主原创文章,未经允许不得转载。