BRAFT是百度开源的基于 BRPC 的Raft一致性算法和可复制状态机的工业级C++实现。最初是为了解决百度各业务线上的状态服务单点隐患,后来则帮助百度工程师独立实现支持高负载和低延迟的分布式系统。
BRAFT在百度内部被广泛用于构建高可用性系统,例如:
存储系统:Key-Value、Block、Object、File...
SQL存储:HAMySQLcluster、distributedtransactions、NewSQLsystems...
Metaservices:Variousmastermodules、Lockservices...
BRAFT有以下特点:
BRAFT是一个功能完备且经过可靠性验证的Raft实现,支持configurationchange、prevote、leadertransfer等特性。
BRAFT追求的核心目标是高性能,在实现的很多环节都进行了精细优化,比如无锁任务队列、log的批量提交和执行以及一些逻辑原地执行等;
接口简单容易理解,支持自定义扩展其中的storage,拥有比较完善的错误回调。用简单的接口实现简单的概念,BRAFT配合BRPC即使经验不丰富的工程师也可以很容易的快速构建出健壮的分布式系统。
在BRAFT中,百度主要采用了以下几点方法来提高性能:
数据流是全并发的,leader写本地磁盘和向follower复制数据是完全同步的。
尽可能的提高局部性,充分发挥不同层面的cache的作用。
尽可能隔离不同硬件的访问,通过流水线的形式提高吞吐。
尽可能的降低锁临界区大小,关键路径上采用lock-free/wait-free算法。
评论