《大數據存儲:鍵值、容錯與一致性》分為三篇,分別涉及大數據處理中的鍵值存儲、容錯存儲、數據一致性三個領域。每篇首先簡要介紹相關領域的基礎知識、系統(tǒng)優(yōu)化的關鍵技術以及主流的系統(tǒng)等,然后介紹作者在相關領域的部分研究成果。具體來說,在鍵值存儲方面,介紹了動態(tài)布隆過濾器設計、哈希分組與鍵值分離技術相結合的存儲結構設計、哈希索引與日志結構合并樹相結合的索引結構設計等方面的優(yōu)化方法,旨在降低讀、寫放大,提升讀、寫與范圍查詢的性能;在容錯存儲方面,介紹了糾刪碼的數據布局、故障數據恢復算法、源數據節(jié)點與恢復節(jié)點選擇以及系統(tǒng)擴容等方面的優(yōu)化方法,旨在降低I/O數據量與負載均衡,加速故障恢復;在數據一致性方面,介紹了RedBlue和PoR細粒度一致性模型及其使用方法,為在備份系統(tǒng)中安全使用低延遲的弱一致性同步、提升系統(tǒng)性能提供理論依據和實踐基礎。