MySQL是原地更新记录的,事务的更新是直接作用到旧有记录,旧有记录被写到undo。同时,它又是steal的,意味着未提交的数据可以被持久化。undo有两个作用,名列前茅,必须要有办法找回旧记录以回滚事务。
一、mysql为什么需要undo log
MySQL是原地更新记录的,事务的更新是直接作用到旧有记录,旧有记录被写到undo。同时,它又是steal的,意味着未提交的数据可以被持久化。undo有两个作用,名列前茅,必须要有办法找回旧记录以回滚事务。同时,需要保存旧记录实现多版本。
当然,没有undo的数据库也有,比如PostgreSQL。它不会原地更新,更新就是插入一个新版本。当然,这样做的代价是浪费空间,失效记录太多了就会影响效率,需要定期的垃圾回收。
在InnoDB中,有三种日志跟事务的ACID关系都很大:
- undo log负责原子性,保护事务在exception或手动rollback时可以回滚到历史版本数据
- redo log负责落盘式持久性,保证事务提交后新的数据不会丢失
- binlog负责副本式持久性,可以将主节点上的数据复制到从节点,主节点crash后业务可以正常运转
可以看到,undo log只关心过去,redo log只关心未来
如果我们只记录一个历史版本数据,其它事务每次都只需要读取到最新版本的数据,的确是这样,这个就是Read Committed
但是,如果说你要备份整个数据库,整个事务可能会持续一个小时,同时有大量线上并发修改操作,我相信你一定希望读取到逻辑一致的数据。这时同一行数据就需要支持多个历史版本的数据了,这一招叫MVCC,对应Repeatable Read隔离级别,而记录多个历史版本数据的地方就叫undo log
实践中,对于面向个人业务的互联网在线业务,推荐Read Committed;对于分析性业务,推荐Repeatable Read(InnoDB的默认事务隔离级别)
InnoDB将undo log作为数据的一部分存储到了redo log中,因此很多时候不太区分它们。
延伸阅读:
二、undo log的工作原理
在更新数据之前,MySQL会提前生成undo log日志,当事务提交的时候,并不会立即删除undo log,因为后面可能需要进行回滚操作,要执行回滚(rollback)操作时,从缓存中读取数据。undo log日志的删除是通过通过后台purge线程进行回收处理的。
1、事务A执行update操作,此时事务还没提交,会将数据进行备份到对应的undo buffer,然后由undo buffer持久化到磁盘中的undo log文件中,此时undo log保存了未提交之前的操作日志,接着将操作的数据,也就是Teacher表的数据持久保存到InnoDB的数据文件IBD。
2、此时事务B进行查询操作,直接从undo buffer缓存中进行读取,这时事务A还没提交事务,如果要回滚(rollback)事务,是不读磁盘的,先直接从undo buffer缓存读取。