【赵渝强老师】TiDB的MVCC机制
TiDB是一款开源的国产分布式关系型数据库。TiKV是TiDB的行存引擎,它支持多版本并发控制(Multi-Version Concurrency Control,MVCC)。假设有这样一种场景:某客户端A在写一个Key,另一个客户端B同时在对这个Key进行读操作。如果没有数据的多版本控制机制,那么这里的读写操作必然互斥。在分布式场景下,这种情况可能会导致性能问题和死锁问题。有了MVCC,只要客户端B执行的读操作的逻辑时间早于客户端A,那么客户端B就可以在客户端A写入的同时正确地读原有的值。即使该Key被多个写操作修改过多次,客户端B也可以按照其逻辑时间读到旧的值。
视频讲解如下 |
---|
【赵渝强老师】TiDB的MVCC机制 |
TiKV的MVCC是通过在Key后面添加版本号来实现的。没有MVCC时,可以把TiKV看作如下的Key-Value对:
Key1 -> Value
Key2 -> Value
……
KeyN -> Value
有了MVCC之后,TiKV的Key-Value排列如下:
Key1_Version3 -> Value
Key1_Version2 -> Value
Key1_Version1 -> Value
……
Key2_Version4 -> Value
Key2_Version3 -> Value
Key2_Version2 -> Value
Key2_Version1 -> Value
……
KeyN_Version2 -> Value
KeyN_Version1 -> Value
……
对于同一个Key的多个版本,版本号较大的会被放在前面,版本号小的会被放在后面,这样当用户通过一个Key+Version来获取Value的时候,可以通过Key和Version构造出MVCC的Key,也就是Key_Version。然后可以直接通过RocksDB的SeekPrefix(Key_Version)API,定位到第一个大于等于这个Key_Version的位置。