這是一部對分布式數據庫的核心原理、架構設計以及經典分布式數據庫的實現進行深入剖析的著作,融入了作者在騰訊、Oracle等企業(yè)20余年的數據庫實踐經驗,以及數據庫領域前沿的研究成果,得到了中國人民大學杜小勇教授等多位業(yè)界知名專家的高口碑和鼎力推薦。 本書以前沿技術和工程實踐為抓手,沿著問題確認、原理闡述、架構剖析、實例分析的思路,從3個方面對分布式數據進行了講解。 分布式數據庫原理。首先提出了分布式系統面臨的典型問題,尤其是一致性問題;然后結合CAP原理和分布式事務處理技術中的ACID技術對這些問題(重點是一致性問題)的本質進行深挖;接著基于時鐘、Paxos協議、Raft算法等給出可行的解決方案;最后深度解讀事務處理技術中的MVCC、OCC、DTA等技術在近年的發(fā)展。 分布式數據庫架構。討論了影響架構的內在、外在技術因素,其中內在因素包括強一致性、高可靠性、高可用性等;外在因素包括云計算、Serveless需求等。這部分最終要解決的問題是:如何通過計算/存儲分離、智能化和新硬件技術實現系統的高可擴展性、高可靠性以及高可用性? 分布式數據庫實現。從工程實踐的角度,以Spanner、CockroachDB等多個數據庫為對象,從問題、原理、前沿技術研究成果等角度對分布式數據庫的架構、事務處理技術的實現以及在實際系統中的落地進行了詳細介紹。