聊聊JDBC事务隔离级别

572 查看

摘要

事务在日常开发中是不可避免碰到的问题,JDBC中的事务隔离级别到底会如何影响事务的并发,脏读(dirty reads), 不可重复读(non-repeatable reads),幻读(phantom reads)到底是什么概念

事务

  1. 原子性(atomicity) 事务是数据库的逻辑工作单位,而且是必须是原子工作单位,对于其数据修改,要么全部执行,要么全部不执行。

  2. 一致性(consistency) 事务在完成时,必须是所有的数据都保持一致状态。在相关数据库中,所有规则都必须应用于事务的修改,以保持所有数据的完整性。

  3. 隔离性(isolation) 一个事务的执行不能被其他事务所影响。

  4. 持久性(durability) 一个事务一旦提交,事物的操作便永久性的保存在数据库中,即使此时再执行回滚操作也不能撤消所做的更改。

隔离性

以上是数据库事务-ACID原则,在JDBC的事务编程中已经为了我们解决了原子性,持久性的问题,唯一可配置的选项是事务隔离级别,根据com.mysql.jdbc.Connection的定义有5个级别:

  1. TRANSACTION_NONE(不支持事务)

  2. TRANSACTION_READ_UNCOMMITTED

  3. TRANSACTION_READ_COMMITTED

  4. TRANSACTION_REPEATABLE_READ

  5. TRANSACTION_SERIALIZABLE

读不提交(TRANSACTION_READ_UNCOMMITTED)

不能避免dirty reads,non-repeatable reads,phantom reads

读提交(TRANSACTION_READ_COMMITTED)

可以避免dirty reads,但是不能避免non-repeatable reads,phantom reads

重复读(TRANSACTION_REPEATABLE_READ)

可以避免dirty reads,non-repeatable reads,但不能避免phantom reads

序列化(TRANSACTION_SERIALIZABLE)

可以避免dirty reads,non-repeatable reads,phantom reads

创建一个简单的表来测试一下隔离性对事务的影响

CREATE TABLE `account` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `user_id` int(11) DEFAULT NULL,
  `balance` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=2 DEFAULT CHARSET=utf8;

脏读(dirty reads)

事务A修改了一个数据,但未提交,事务B读到了事务A未提交的更新结果,如果事务A提交失败,事务B读到的就是脏数据。

TEST:
事务A: update account += 1000, 然后回滚
事务B: 尝试读取 account 的值
期望结果:
当设置隔离级别为TRANSACTION_READ_UNCOMMITTED时,事务B读取到的值不一致
当设置隔离级别大于TRANSACTION_READ_UNCOMMITTED时,事务B读取到的值一致

先创建一个read任务

class ReadTask implements Runnable {
    int level = 0;
    
    public ReadTask(int level) {
        super();
        this.level = level;
    }

    @Override
    public void run() {
        Db.tx(level, new IAtom() {
            @Override
            public boolean run() throws SQLException {
                AccountService service = new AccountService();
                System.out.println(Thread.currentThread().getId() + ":" + service.audit());
                return true;
            }
        });
    }
}

其中AccountService代码(提供了读和写balance的方法)

public class AccountService {
    
    // 貌似这个方法有执行了行锁
    public void deposit(int num) throws Exception {
        int index = Db.update("update account set balance = balance + " + num + " where user_id = 1");
        if(index != 1)
            throw new Exception("Oop! deposit fail.");
    }
    
    public int audit() {
        return Db.findFirst("select balance from account where user_id = 1").getInt("balance");
    }
}

PS: 上述代码所使用的框架为JFinal(非常优秀的国产开源框架)

对于Db.findFirst和Db.update这2个方法就是对JDBC操作的一个简单的封装

然后再创建一个writer任务

class WriterTask implements Runnable {
    int level = 0;
    
    public WriterTask(int level) {
        super();
        this.level = level;
    }
    
    @Override
    public void run() {
        Db.tx(level, new IAtom() {
            @Override
            public boolean run() throws SQLException {
                AccountService service = new AccountService();
                try {
                    service.deposit(1000);
                    System.out.println("Writer 1000.");
                    Thread.sleep(1000);
                    System.out.println("Writer complete.");
                } catch (Exception e) {
                    e.printStackTrace();
                }
                return true;
            }
        });
    }
}

然后执行主线程

public static void main(String[] args) throws Exception {
    int level = Connection.TRANSACTION_READ_UNCOMMITTED;
    for(int j = 0; j < 10; j++) {
        if(j == 5) new Thread(new WriterTask(level)).start();
        try {
            Thread.sleep(200);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        new Thread(new ReadTask(level)).start();
    }    
}

上诉代码开启ReadTask和WriterTask对balance的值进行并发的写入和读取

当隔离级别为TRANSACTION_READ_UNCOMMITTED时,发现在WriterTask-commit事务前后读取到的值不一样

10:14000
12:14000
11:14000
15:14000
16:14000
Writer 1000.
18:15000
19:15000
20:15000
21:15000
22:15000
Writer complete.

然后修改代码的隔离级别为TRANSACTION_READ_COMMITTED,发现前后读取的值一致,但是这里有一个问题,在数据库中已经被更新为1600,但是2次读取的值是1500,就是WriterTask事务未提交之前的值,说明TRANSACTION_READ_COMMITTED虽然可以避免脏读,但是却不能获取到数据的强一致性,这里是需要注意的一个点,假如有需求实时的获取到balance的最新值,那么WriterTask很显然就需要lock来控制了

11:15000
10:15000
12:15000
15:15000
16:15000
Writer 1000.
18:15000
19:15000
20:15000
21:15000
22:15000
Writer complete.

不可重复读(non-repeatable reads)

在同一个事务中,对于同一份数据读取到的结果不一致。比如,事务B在事务A提交前读到的结果,和提交后读到的结果可能不同。

TEST:
事务A: update account += 1000, 然后commit
事务B: 尝试读取 account 的值(间隔2秒),再次尝试读取

为了满足不可重复读的测试对ReadTask作一些小改动

class ReadTask2 implements Runnable {
    int level = 0;
    
    public ReadTask2(int level) {
        super();
        this.level = level;
    }

    @Override
    public void run() {
        Db.tx(level, new IAtom() {
            @Override
            public boolean run() throws SQLException {
                AccountService service = new AccountService();
                System.out.println(Thread.currentThread().getId() + ":" + service.audit());
                try {
                    Thread.sleep(2000);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
                System.out.println(Thread.currentThread().getId() + ":" + service.audit());
                return true;
            }
        });
    }
}

在代码中间隔2s,然后重复访问同一个balance字段

主线程代码

public static void main(String[] args) throws Exception {
    int level = Connection.TRANSACTION_REPEATABLE_READ;
    new Thread(new ReadTask2(level)).start();
    Thread.sleep(1500);
    new Thread(new WriterTask2(level)).start();
}

设置隔离界别为TRANSACTION_READ_UNCOMMITTED

10:17000
Writer 1000.
10:18000

设置隔离界别为TRANSACTION_REPEATABLE_READ

10:18000
Writer 1000.
10:18000

和脏读一样读取到的1800是WriterTask事务未提交之前的值,假如要实时的获取balance的最新值,WriterTask很显然还是需要加lock

幻读(phantom reads)

在同一个事务中,同一个查询多次返回的结果不一致。

ReadTask和WriterTask分别进行insert的sql与select的操作(select count(*) from account)

TEST:
事务A: insert account 然后commit
事务B: 尝试读取 account 的数量(间隔2秒),再次尝试读取

设置隔离界别为TRANSACTION_REPEATABLE_READ

12:1
create account.
12:1

设置隔离界别为TRANSACTION_SERIALIZABLE

12:2
12:2
create account.

关于最高级别序列化是只有当一个事务完成后才会执行下一个事务,但是这里我测试使用TRANSACTION_REPEATABLE_READ级别是还是避免了幻读,不知道是程序的问题还是JDBC的问题,这里我可能还需要进一步的测试和研究,但是根据官方对TRANSACTION_REPEATABLE_READ的说明

A constant indicating that dirty reads, non-repeatable reads and phantom reads are prevented. This level includes the prohibitions in TRANSACTION_REPEATABLE_READ and further prohibits the situation where one transaction reads all rows that satisfy a WHERE condition, a second transaction inserts a row that satisfies that WHERE condition, and the first transaction rereads for the same condition, retrieving the additional "phantom" row in the second read.

表示幻读的定义是在同一个事务中,读取2次的值是不一样的,因为有其他事务添加了一行,并且这行数据是满足第一个事务的where查询条件的数据

总结

本次测试使用JFinal框架(它对JDBC进行了很简易的封装),使用不同的隔离级别对3种并发情况进行测试,但是在幻读的测试中TRANSACTION_REPEATABLE_READ级别同样也避免了幻读的情况,这个有待进一步测试和研究

补充说明

  1. 同一个事务: 在JDBC编程中同一个事务意味着拥有相同的Connection,也就是说如果想保证事务的原子性所有的执行必须使用同一个Connection,事务的代表就是Connection

  2. commit和rollback:在JDBC编程中一旦代码commit成功就无法rollback,所有一般rollback是发生在commit出现异常的情况下