MongoDB原子性和事务

在MongoDB中,写操作的原子性是在document级别上的,即使修改的是文档中的内嵌部分,写锁的级别也是document上。

当一个写操作要修改多个文档,每个文档的修改是原子性的。整个的写操作并不是原子性的,它可能和其他写操作产生交织。然而你可以使用$isolated隔离操作符来限制写操作,让它不与其他写操作交织。 不隔离性能更高,但是会产生数据的不确定性,隔离写操作,事务性更好。MongoDB把这个级别完全由用户控制。

隔离写操作

MongoDB使用$isolated操作符来隔离写操作。如果一个写操作要更新多个文档,它能防止其他进程与本次写操作交错。直到这个写操作完成,其他进程才能写。

但是,$isolated算不上一个事务,如果在写的过程中发生错误,MongoDB并不会回滚已经写的数据。$isolated也不能在分片集群上工作。

特性:

  • 隔离不支持分片集群
  • 不支持“all-or-nothing”特性
  • MongoDB2.2版本后$isolated被替换成$atomic

类事务语法

MongoDB并不支持关系型数据库中的那种事务特性,为了性能着想,它把这个特性交给程序员去实现。这就是MongoDB官方所讲的Two Phase Commits两阶段提交。这个技术虽然在一定程度上能保证数据最终的一致性,但是应用程序还是可能会读到提交或者回滚过程中的中间数据。对于这个技术如果有兴趣可以读一读原文。

并发控制

并发控制允许多个应用层程序同时访问数据库,而不引起数据不一致或冲突。

MongoDB中提到两种技术来解决这个问题。第一种是唯一索引,第二种是叫Update if Current

用唯一索引来防止多个进程重复插入或者更新导致的重复的值。
Update if Current意思是说在更新数据的时候,在更新条件里给定一个期望的值(这个值是先查询出来的),用来防止在更新之前其他进程已经将此值更新。看一个例子:

  1. var myDocument = db.products.findOne( { sku: "abc123" } );
  2. if ( myDocument ) {
  3. var oldQuantity = myDocument.quantity;
  4. var oldReordered = myDocument.reordered;
  5. var results = db.products.update(
  6. {
  7. _id: myDocument._id,
  8. quantity: oldQuantity,
  9. reordered: oldReordered
  10. },
  11. {
  12. $inc: { quantity: 50 },
  13. $set: { reordered: true }
  14. }
  15. )
  16. if ( results.hasWriteError() ) {
  17. print( "unexpected error updating document: " + tojson(results) );
  18. }
  19. else if ( results.nMatched === 0 ) {
  20. print( "No matching document for " +
  21. "{ _id: "+ myDocument._id.toString() +
  22. ", quantity: " + oldQuantity +
  23. ", reordered: " + oldReordered
  24. + " } "
  25. );
  26. }
  27. }

同样的,在findAndModify()函数中:

  1. db.people.findAndModify({
  2. query: { name: "Andy" },
  3. sort: { rating: 1 },
  4. update: { $inc: { score: 1 } },
  5. upsert: true
  6. })

如果有多个进程同时调用此函数,这些进程都完成了查询阶段,如果name字段上没有唯一索引,upsert阶段的操作,多个进程可能都会执行。导致写入重复的文档。