SQLite入门与分析(五)—-Page Cache之并发控制

写在前面:本节主要谈谈SQLite的锁机制,SQLite是基于锁来实现并发控制的,所以本节的内容实际上是属于事务处理的,但是SQLite的锁机制实现非常的简单而巧妙,所以在这里单独讨论一下。如果真正理解了它,对整个事务的实现也就理解了。而要真正理解SQLite的锁机制,最好方法就是阅读SQLite的源码,所以在阅读本文时,最好能结合源码。SQLite的锁机制很巧妙,尽管在本节中的源码中,我写了很多注释,也是我个人在研究时的一点心得,但是我发现仅仅用言语,似乎不能把问题说清楚,只有通过体会,才能真正理解SQLite的锁机制。好了,下面进入正题。

SQLite的并发控制机制是采用加锁的方式,实现非常简单,但也非常的巧妙,本节将对其进行一个详细的解剖。请仔细阅读下图,它可以帮助更好的理解下面的内容。 document/2015-09-15/55f7c72bec8ac

1、RESERVED LOCK

RESERVED锁意味着进程将要对数据库进行写操作。某一时刻只能有一个RESERVED Lock,但是RESERVED锁和SHARED锁可以共存,而且可以对数据库加新的SHARED锁。 为什么要用RESERVED锁? 主要是出于并发性的考虑。由于SQLite只有库级排斥锁(EXCLUSIVE LOCK),如果写事务一开始就上EXCLUSIVE锁,然后再进行实际的数据更新,写磁盘操作,这会使得并发性大大降低。而SQLite一旦得到数据库的RESERVED锁,就可以对缓存中的数据进行修改,而与此同时,其它进程可以继续进行读操作。直到真正需要写磁盘时才对数据库加EXCLUSIVE锁。

2、PENDING LOCK

PENDING LOCK意味着进程已经完成缓存中的数据修改,并想立即将更新写入磁盘。它将等待此时已经存在的读锁事务完成,但是不允许对数据库加新的SHARED LOCK(这与RESERVED LOCK相区别)。 为什么要有PENDING LOCK? 主要是为了防止出现写饿死的情况。由于写事务先要获取RESERVED LOCK,所以可能一直产生新的SHARED LOCK,使得写事务发生饿死的情况。

3、加锁机制的具体实现

SQLite在pager层获取锁的函数如下:

  1. //获取一个文件的锁,如果忙则重复该操作,
  2. //直到busy 回调用函数返回flase,或者成功获得锁
  3. static int pager_wait_on_lock(Pager *pPager, int locktype){
  4. int rc;
  5. assert( PAGER_SHARED==SHARED_LOCK );
  6. assert( PAGER_RESERVED==RESERVED_LOCK );
  7. assert( PAGER_EXCLUSIVE==EXCLUSIVE_LOCK );
  8. if( pPager->state>=locktype ){
  9. rc = SQLITE_OK;
  10. }else{
  11. //重复直到获得锁
  12. do {
  13. rc = sqlite3OsLock(pPager->fd, locktype);
  14. }while( rc==SQLITE_BUSY && sqlite3InvokeBusyHandler(pPager->pBusyHandler) );
  15. if( rc==SQLITE_OK ){
  16. //设置pager的状态
  17. pPager->state = locktype;
  18. }
  19. }
  20. return rc;
  21. }

Windows下具体的实现如下:

  1. static int winLock(OsFile *id, int locktype){
  2. int rc = SQLITE_OK; /* Return code from subroutines */
  3. int res = 1; /* Result of a windows lock call */
  4. int newLocktype; /* Set id->locktype to this value before exiting */
  5. int gotPendingLock = 0;/* True if we acquired a PENDING lock this time */
  6. winFile *pFile = (winFile*)id;
  7. assert( pFile!=0 );
  8. TRACE5("LOCK %d %d was %d(%d)\n",
  9. pFile->h, locktype, pFile->locktype, pFile->sharedLockByte);
  10. /* If there is already a lock of this type or more restrictive on the
  11. ** OsFile, do nothing. Don't use the end_lock: exit path, as
  12. ** sqlite3OsEnterMutex() hasn't been called yet.
  13. */
  14. //当前的锁>=locktype,则返回
  15. if( pFile->locktype>=locktype ){
  16. return SQLITE_OK;
  17. }
  18. /* Make sure the locking sequence is correct
  19. */
  20. assert( pFile->locktype!=NO_LOCK || locktype==SHARED_LOCK );
  21. assert( locktype!=PENDING_LOCK );
  22. assert( locktype!=RESERVED_LOCK || pFile->locktype==SHARED_LOCK );
  23. /* Lock the PENDING_LOCK byte if we need to acquire a PENDING lock or
  24. ** a SHARED lock. If we are acquiring a SHARED lock, the acquisition of
  25. ** the PENDING_LOCK byte is temporary.
  26. */
  27. newLocktype = pFile->locktype;
  28. /*两种情况: (1)如果当前文件处于无锁状态(获取读锁---读事务
  29. **和写事务在最初阶段都要经历的阶段),
  30. **(2)处于RESERVED_LOCK,且请求的锁为EXCLUSIVE_LOCK(写事务)
  31. **则对执行加PENDING_LOCK
  32. */
  33. /////////////////////(1)///////////////////
  34. if( pFile->locktype==NO_LOCK
  35. || (locktype==EXCLUSIVE_LOCK && pFile->locktype==RESERVED_LOCK)
  36. ){
  37. int cnt = 3;
  38. //加pending锁
  39. while( cnt-->0 && (res = LockFile(pFile->h, PENDING_BYTE, 0, 1, 0))==0 ){
  40. /* Try 3 times to get the pending lock. The pending lock might be
  41. ** held by another reader process who will release it momentarily.
  42. */
  43. TRACE2("could not get a PENDING lock. cnt=%d\n", cnt);
  44. Sleep(1);
  45. }
  46. //设置为gotPendingLock为1,使和在后面要释放PENDING锁
  47. gotPendingLock = res;
  48. }
  49. /* Acquire a shared lock
  50. */
  51. /*获取shared lock
  52. **此时,事务应该持有PENDING锁,而PENDING锁作为事务从UNLOCKED到
  53. **SHARED_LOCKED的一个过渡,所以事务由PENDING->SHARED
  54. **此时,实际上锁处于两个状态:PENDING和SHARED,
  55. **直到后面释放PENDING锁后,才真正处于SHARED状态
  56. */
  57. ////////////////(2)/////////////////////////////////////
  58. if( locktype==SHARED_LOCK && res ){
  59. assert( pFile->locktype==NO_LOCK );
  60. res = getReadLock(pFile);
  61. if( res ){
  62. newLocktype = SHARED_LOCK;
  63. }
  64. }
  65. /* Acquire a RESERVED lock
  66. */
  67. /*获取RESERVED
  68. **此时事务持有SHARED_LOCK,变化过程为SHARED->RESERVED。
  69. **RESERVED锁的作用就是为了提高系统的并发性能
  70. */
  71. ////////////////////////(3)/////////////////////////////////
  72. if( locktype==RESERVED_LOCK && res ){
  73. assert( pFile->locktype==SHARED_LOCK );
  74. //加RESERVED锁
  75. res = LockFile(pFile->h, RESERVED_BYTE, 0, 1, 0);
  76. if( res ){
  77. newLocktype = RESERVED_LOCK;
  78. }
  79. }
  80. /* Acquire a PENDING lock
  81. */
  82. /*获取PENDING锁
  83. **此时事务持有RESERVED_LOCK,且事务申请EXCLUSIVE_LOCK
  84. **变化过程为:RESERVED->PENDING。
  85. **PENDING状态只是唯一的作用就是防止写饿死.
  86. **读事务不会执行该代码,但是写事务会执行该代码,
  87. **执行该代码后gotPendingLock设为0,后面就不会释放PENDING锁。
  88. */
  89. //////////////////////////////(4)////////////////////////////////
  90. if( locktype==EXCLUSIVE_LOCK && res ){
  91. //这里没有实际的加锁操作,只是把锁的状态改为PENDING状态
  92. newLocktype = PENDING_LOCK;
  93. //设置了gotPendingLock,后面就不会释放PENDING锁了,
  94. //相当于加了PENDING锁,实际上是在开始处加的PENDING锁
  95. gotPendingLock = 0;
  96. }
  97. /* Acquire an EXCLUSIVE lock
  98. */
  99. /*获取EXCLUSIVE锁
  100. **当一个事务执行该代码时,它应该满足以下条件:
  101. **(1)锁的状态为:PENDING (2)是一个写事务
  102. **变化过程:PENDING->EXCLUSIVE
  103. */
  104. /////////////////////////(5)///////////////////////////////////////////
  105. if( locktype==EXCLUSIVE_LOCK && res ){
  106. assert( pFile->locktype>=SHARED_LOCK );
  107. res = unlockReadLock(pFile);
  108. TRACE2("unreadlock = %d\n", res);
  109. res = LockFile(pFile->h, SHARED_FIRST, 0, SHARED_SIZE, 0);
  110. if( res ){
  111. newLocktype = EXCLUSIVE_LOCK;
  112. }else{
  113. TRACE2("error-code = %d\n", GetLastError());
  114. }
  115. }
  116. /* If we are holding a PENDING lock that ought to be released, then
  117. ** release it now.
  118. */
  119. /*此时事务在第2步中获得PENDING锁,它将申请SHARED_LOCK(第3步,和图形相对照),
  120. **而在之前它已经获取了PENDING锁,
  121. **所以在这里它需要释放PENDING锁,此时锁的变化为:PENDING->SHARED
  122. */
  123. //////////////////////////(6)/////////////////////////////////////
  124. if( gotPendingLock && locktype==SHARED_LOCK ){
  125. UnlockFile(pFile->h, PENDING_BYTE, 0, 1, 0);
  126. }
  127. /* Update the state of the lock has held in the file descriptor then
  128. ** return the appropriate result code.
  129. */
  130. if( res ){
  131. rc = SQLITE_OK;
  132. }else{
  133. TRACE4("LOCK FAILED %d trying for %d but got %d\n", pFile->h,
  134. locktype, newLocktype);
  135. rc = SQLITE_BUSY;
  136. }
  137. //在这里设置文件锁的状态
  138. pFile->locktype = newLocktype;
  139. return rc;
  140. }

在几个关键的部位标记数字。

(I)对于一个读事务会的完整经过: 语句序列:(1)——>(2)——>(6) 相应的状态真正的变化过程为:UNLOCKED→PENDING(1)→PENDING、SHARED(2)→SHARED(6)→UNLOCKED (II)对于一个写事务完整经过: 第一阶段: 语句序列:(1)——>(2)——>(6) 状态变化:UNLOCKED→PENDING(1)→PENDING、SHARED(2)→SHARED(6)。此时事务获得SHARED LOCK。 第二个阶段: 语句序列:(3) 此时事务获得RESERVED LOCK。 第三个阶段: 事务执行修改操作。 第四个阶段: 语句序列:(1)——>(4)——>(5) 状态变化为: RESERVED→ RESERVED 、PENDING(1)→PENDING(4)→EXCLUSIVE(5)。此时事务获得排斥锁,就可以进行写磁盘操作了。

注:在上面的过程中,由于(1)的执行,使得某些时刻SQLite处于两种状态,但它持续的时间很短,从某种程度上来说可以忽略,但是为了把问题说清楚,在这里描述了这一微妙而巧妙的过程。

4、SQLite的死锁问题

SQLite的加锁机制会不会出现死锁? 这是一个很有意思的问题,对于任何采取加锁作为并发控制机制的DBMS都得考虑这个问题。有两种方式处理死锁问题:(1)死锁预防(deadlock prevention)(2)死锁检测(deadlock detection)与死锁恢复(deadlock recovery)。SQLite采取了第一种方式,如果一个事务不能获取锁,它会重试有限次(这个重试次数可以由应用程序运行预先设置,默认为1次)——这实际上是基本锁超时的机制。如果还是不能获取锁,SQLite返回SQLITE_BUSY错误给应用程序,应用程序此时应该中断,之后再重试;或者中止当前事务。虽然基于锁超时的机制简单,容易实现,但是它的缺点也是明显的——资源浪费。

5、事务类型(Transaction Types)

既然SQLite采取了这种机制,所以应用程序得处理SQLITE_BUSY 错误,先来看一个会产生SQLITE_BUSY错误的例子: document/2015-09-15/55f7c87be55f2 所以应用程序应该尽量避免产生死锁,那么应用程序如何做可以避免死锁的产生呢? 答案就是为你的程序选择正确合适的事务类型。 SQLite有三种不同的事务类型,这不同于锁的状态。事务可以从DEFERRED,IMMEDIATE或者EXCLUSIVE,一个事务的类型在BEGIN命令中指定: BEGIN [ DEFERRED | IMMEDIATE | EXCLUSIVE ] TRANSACTION; 一个deferred事务不获取任何锁,直到它需要锁的时候,而且BEGIN语句本身也不会做什么事情——它开始于UNLOCK状态;默认情况下是这样的。如果仅仅用BEGIN开始一个事务,那么事务就是DEFERRED的,同时它不会获取任何锁,当对数据库进行第一次读操作时,它会获取SHARED LOCK;同样,当进行第一次写操作时,它会获取RESERVED LOCK。 由BEGIN开始的Immediate事务会试着获取RESERVED LOCK。如果成功,BEGIN IMMEDIATE保证没有别的连接可以写数据库。但是,别的连接可以对数据库进行读操作,但是RESERVED LOCK会阻止其它的连接BEGIN IMMEDIATE或者BEGIN EXCLUSIVE命令,SQLite会返回SQLITE_BUSY错误。这时你就可以对数据库进行修改操作,但是你不能提交,当你COMMIT时,会返回SQLITE_BUSY错误,这意味着还有其它的读事务没有完成,得等它们执行完后才能提交事务。 Exclusive事务会试着获取对数据库的EXCLUSIVE锁。这与IMMEDIATE类似,但是一旦成功,EXCLUSIVE事务保证没有其它的连接,所以就可对数据库进行读写操作了。 上面那个例子的问题在于两个连接最终都想写数据库,但是他们都没有放弃各自原来的锁,最终,shared 锁导致了问题的出现。如果两个连接都以BEGIN IMMEDIATE开始事务,那么死锁就不会发生。在这种情况下,在同一时刻只能有一个连接进入BEGIN IMMEDIATE,其它的连接就得等待。BEGIN IMMEDIATE和BEGIN EXCLUSIVE通常被写事务使用。就像同步机制一样,它防止了死锁的产生。 基本的准则是:如果你在使用的数据库没有其它的连接,用BEGIN就足够了。但是,如果你使用的数据库在其它的连接也要对数据库进行写操作,就得使用BEGIN IMMEDIATE或BEGIN EXCLUSIVE开始你的事务。