面试官:谈谈你对ThreadLocal的理解?

400次阅读  |  发布于3年以前

ThreadLocal 作为 Java 面试的高频题,陌溪在之前面试的时候也遇到过,所以后面专门针对 ThreadLocal 写了一份笔记,让我们一起来看看~

什么是ThreadLocal?

Java 官方文档中的描述:ThreadLocal 类用来提供线程内部的局部变量。这种变量在多线程环境下访问(通过getset 方法访问)时能保证各个线程的变量相对独立于其他线程内的变量。ThreadLocal 实例通常来说都是 private static 类型的,用于关联线程和线程上下文。

我们可以得知 ThreadLocal 的作用是:提供线程内的局部变量,不同的线程之间不会相互干扰,这种变量在线程的生命周期内起作用,减少同一个线程内多个函数或组件之间一些公共变量传递的复杂度。

基本使用

在介绍 ThreadLocal 使用之前,我们首先认识几个 ThreadLocal 的常见方法

方法声明 描述
ThreadLocal() 创建ThreadLocal对象
public void set(T value 设置当前线程绑定的局部变量
public T get() 获取当前线程绑定的局部变量
public void remove() 移除当前线程绑定的局部变量

使用案例

我们来看下面这个线程不安全的案例,感受一下 ThreadLocal 线程隔离的特点。

/**
 * 需求:线程隔离
 * 在多线程并发的场景下,每个线程中的变量都是相互独立的
 * 线程A:设置变量1,获取变量2
 * 线程B:设置变量2,获取变量2
 * @author: 陌溪
 */
public class MyDemo01 {
    // 变量
    private String content;

    public String getContent() {
        return content;
    }

    public void setContent(String content) {
        this.content = content;
    }

    public static void main(String[] args) {
        MyDemo01 myDemo01 = new MyDemo01();
        for (int i = 0; i < 5; i++) {
            new Thread(() -> {
                myDemo01.setContent(Thread.currentThread().getName() + "的数据");
                System.out.println("-----------------------------------------");
                System.out.println(Thread.currentThread().getName() + "\t  " + myDemo01.getContent());
            }, String.valueOf(i)).start();
        }
    }
}

运行后的效果

-----------------------------------------
-----------------------------------------
-----------------------------------------
3      4的数据
-----------------------------------------
2      4的数据
-----------------------------------------
1      4的数据
4      4的数据
0      4的数据

从上面我们可以看到,出现了线程不隔离的问题,也就是线程1取出了线程4的内,那么如何解决呢?

这个时候就可以用到 ThreadLocal 了,我们通过 set 将变量绑定到当前线程中,然后 get 获取当前线程绑定的变量

/**
 * 需求:线程隔离
 * 在多线程并发的场景下,每个线程中的变量都是相互独立的
 * 线程A:设置变量1,获取变量2
 * 线程B:设置变量2,获取变量2
 * @author: 陌溪
 */
public class MyDemo01 {
    // 变量
    private String content;

    public String getContent() {
        return content;
    }

    public void setContent(String content) {
        this.content = content;
    }

    public static void main(String[] args) {
        MyDemo01 myDemo01 = new MyDemo01();
        ThreadLocal<String> threadLocal = new ThreadLocal<>();
        for (int i = 0; i < 5; i++) {
            new Thread(() -> {
                threadLocal.set(Thread.currentThread().getName() + "的数据");
                System.out.println("-----------------------------------------");
                System.out.println(Thread.currentThread().getName() + "\t  " + threadLocal.get());
            }, String.valueOf(i)).start();
        }
    }
}

通过引入 ThreadLocal 后,查看运行结果如下:

-----------------------------------------
-----------------------------------------
4      4的数据
-----------------------------------------
3      3的数据
-----------------------------------------
2      2的数据
-----------------------------------------
1      1的数据
0      0的数据

发现不会出现上面的情况了,也就是当前线程只能获取线程线程存储的对象

ThreadLocal类和Synchronized关键字

Synchronized同步方式

对于上述的例子,完全可以通过加锁的方式来实现这个功能,我们来看一下用 Synchronized 代码块实现的效果:

    public static void main(String[] args) {
        MyDemo03 myDemo01 = new MyDemo03();
        for (int i = 0; i < 5; i++) {
            new Thread(() -> {
                synchronized (MyDemo03.class) {
                    myDemo01.setContent(Thread.currentThread().getName() + "的数据");
                    System.out.println("-----------------------------------------");
                    System.out.println(Thread.currentThread().getName() + "\t  " + myDemo01.getContent());
                }
            }, String.valueOf(i)).start();
        }
    }

运行结果如下所示,发现通过加锁可以实现与ThreadLocal线程隔离的功能,但是并发性降低了。

-----------------------------------------
0      0的数据
-----------------------------------------
4      4的数据
-----------------------------------------
3      3的数据
-----------------------------------------
2      2的数据
-----------------------------------------
1      1的数据

ThreadLocal与Synchronized的区别

虽然 ThreadLocal 模式与 Synchronized 关键字都用于处理多线程并发访问变量的问题,不过两者处理问题的角度和思路不同。

Synchronized ThreadLocal
原理 同步机制采用以时间换空间的方式,只提供了一份变量,让不同的线程排队访问 ThreadLocal采用以空间换时间的概念,为每个线程都提供一份变量副本,从而实现同时访问而互不干扰
侧重点 多个线程之间访问资源的同步 多线程中让每个线程之间的数据相互隔离

总结:在刚刚的案例中,虽然使用 ThreadLocalSynchronized 都能解决问题,但是使用 ThreadLocal 更为合适,因为这样可以使程序拥有更高的并发性。

运用场景

通过以上的介绍,我们已经基本了解 ThreadLocal 的特点,但是它具体是运用在什么场景中的呢?接下来让我们看一个案例:事务操作

转账案例

这里们先构建一个简单的转账场景:有一个数据表 account ,里面有两个用户 jackRose,用户 Jack 给用户Rose 转账。案例的实现主要是用 mysql 数据库,JDBCC3P0 框架,以下是详细代码

这里们先构建一个简单的转账场景:有一个数据表 account ,里面有两个用户 jackRose,用户 Jack 给用户Rose 转账。案例的实现主要是用 mysql 数据库,JDBCC3P0 框架,以下是详细代码

image-20200710204941153

引入事务

案例中转账涉及两个 DML 操作:一个转出,一个转入。这些操作是需要具备原子性的,不可分割。不然有可能出现数据修改异常情况。

public class AccountService {
    public boolean transfer(String outUser, String isUser, int money) {
        AccountDao ad = new AccountDao();
        try {
            // 转出
            ad.out(outUser, money);
            // 模拟转账过程中的异常
            int i = 1/0;
            // 转入
            ad.in(inUser, money);
        } catch(Exception e) {
            e.printStackTrace();
            return false;
        }
        return true;
    }
}

所以这里就需要操作事务,来保证转入和转出具备原子性,要么成功,要么失败。

JDBC 中关于事务操作的 API

Connection接口的方法 作用
void setAutoCommit(false) 禁用事务自动提交(改为手动提交)
void commit() 提交事务
void rollbakc() 回滚事务

开启事务的注意点

常规解决方法

基于上面给出的前提,大家通常想到的解决方法

常规解决方法的弊端

这个时候就可以通过 ThreadLocal 和当前线程进行绑定,来降低代码之间的耦合

解耦

使用ThreadLocal解决

针对上面出现的情况,我们需要对原来的JDBC连接池对象进行更改

ThreadLocal<Connection> tl = new ThreadLocal();
public static Connection getConnection() {
    Connection conn = tl.get();
    if(conn == null) {
        conn = ds.getConnection();
        tl.set(conn);
    }
    return conn;
}

ThreadLocal实现的好处

从上述的案例中我们可以看到,在一些特定场景下,ThreadLocal方案有两个突出的优势:

ThreadLocal的内部结构

通过以上的学习,我们对 ThreadLocal 的作用有了一定的认识。现在我们一起来看一下 ThreadLocal 的内部结构,探究它能够实现线程数据隔离的原理。

常见误解

如果我们不去看源代码的话,可能会猜测 ThreadLocal 是这样子设计的:每个 ThreadLocal 都创建一个 Map,然后用线程作为 Mapkey,要存储的局部变量作为 Mapvalue,这样就能达到各个线程的局部变量隔离的效果。这是最简单的设计方法,JDK最早期的 ThreadLocal 确实是这样设计的,但现在早已不是了。

ThreadLocal早期内部结构

现在的设计

但是,JDK 后面优化了设计方案,在 JDK8ThreadLocal 的设计是:每个 Thread 维护一个ThreadLocalMap,这个 MapkeyThreadLocal 实例本身,value 才是真正要存储的值 object。具体的过程是这样的:

JDK8前后的设计

从上面变成 JDK8 的设计有什么好处?

ThreadLocalMap源码分析

在分析 ThreadLocal 方法的时候,我们了解到 ThreadLocal 的操作实际上是围绕 ThreadLocalMap 展开的。ThreadLocalMap 的源码相对比较复杂,我们从以下三个方面进行讨论。

基本结构

ThreadLocalMapThreadLocal 的内部类,没有实现 Map 接口,用独立的方式实现了 Map 的功能,其内部的 Entry 也是独立实现。

基本结构

成员变量

/**
* 初始容量 - 必须是2的整次幂
**/
private static final int INITIAL_CAPACITY = 16;

/**
*存放数据的table ,Entry类的定义在下面分析,同样,数组的长度必须是2的整次幂
**/
private Entry[] table;

/**
*数组里面entrys的个数,可以用于判断table当前使用量是否超过阈值
**/
private int size = 0;

/**
*进行扩容的阈值,表使用量大于它的时候进行扩容
**/
private int threshold; // Default to 0

HashMap 类似,INITIAL_CAPACITY 代表这个 Map 的初始容量;table 是一个 Entry 类型的数组,用于存储数据;size 代表表中的存储数目;threshold 代表需要扩容时对应的 size 的阈值。

存储结构 - Entry

/*
*Entry继承WeakRefefence,并且用ThreadLocal作为key.
如果key为nu11(entry.get()==nu11),意味着key不再被引用,
*因此这时候entry也可以从table中清除。
*/
static class Entry extends weakReference<ThreadLocal<?>>{

object value;Entry(ThreadLocal<?>k,object v){
    super(k);
    value = v;
}}

ThreadLocalMap 中,也是用 Entry 来保存 K-V 结构数据的。不过 Entry 中的 key 只能是 ThreadLocal 对象,这点在构造方法中已经限定死了。

另外,Entry 继承 WeakReference,也就是 **key(ThreadLocal)**是弱引用,其目的是将 ThreadLocal 对象的生命周期和线程生命周期解绑。

弱引用和内存泄漏

有些程序员在使用 ThreadLocal 的过程中会发现有内存泄漏的情况发生,就猜测这个内存泄漏跟Entry中使用了弱引用的 key 有关系。这个理解其实是不对的。

我们先来回顾这个问题中涉及的几个名词概念,再来分析问题。

内存泄漏相关概念

Memory overflow:内存溢出,没有足够的内存提供申请者使用。

Memory leak:内存泄漏是指程序中己动态分配的堆内存由于某种原因程序未释放或无法释放,造成系统内存的浪费,导致程序运行速度减慢甚至系统溃等严重后果。I内存泄漏的堆积终将导致内存溢出。

弱引用相关概念

Java中的引用有4种类型:强、软、弱、虚。当前这个问题主要涉及到强引用和弱引用:

强引用:就是我们最常见的普通对象引用,只要还有强引用指向一个对象,就能表明对象还“活着”,垃圾回收器就不会回收这种对象。

弱引用:垃圾回收器一旦发现了只具有弱引用的对象,不管当前内存空间足够与否,都会回收它的内存。

如果key使用强引用,那么会出现内存泄漏?

假设 ThreadLocalMap 中的 key 使用了强引用,那么会出现内存泄漏吗?

此时 ThreadLocal 的内存图(实线表示强引用)如下:

ThreadLocal内存图

也就是说,ThreadLocalMap 中的 key 使用了强引用,是无法完全避免内存泄漏的。

如果key使用弱引用,那么会出现内存泄漏?

ThreadLocal内存图

也就是说,ThreadLocalMap 中的 key 使用了弱引用,也有可能内存泄漏。

出现内存泄漏的真实原因

比较以上两种情况,我们就会发现,内存泄漏的发生跟 ThreadLocalMap 中的 key 是否使用弱引用是没有关系的。那么内存泄漏的的真正原因是什么呢?

细心的同学会发现,在以上两种内存泄漏的情况中,都有两个前提:

第一点很好理解,只要在使用完 ThreadLocal,调用其 remove 方法删除对应的 Entry,就能避免内存泄漏。

第二点稍微复杂一点,由于 ThreadLocalMapThread 的一个属性,被当前线程所引用,所以它的生命周期跟 Thread 一样长。那么在使用完 ThreadLocal 的使用,如果当前 Thread 也随之执行结束,ThreadLocalMap 自然也会被 gc 回收,从根源上避免了内存泄漏。

综上,ThreadLocal 内存泄漏的根源是:由于 ThreadLocalMap 的生命周期跟 Thread 一样长,如果没有手动删除对应 key 就会导致内存泄漏。

为什么要使用弱引用?

根据刚才的分析,我们知道了:无论 ThreadLocalMap 中的 key 使用哪种类型引用都无法完全避免内存泄漏,跟使用弱引用没有关系。

要避免内存泄漏有两种方式:

相对第一种方式,第二种方式显然更不好控制,特别是使用线程池的时候,线程结束是不会销毁的,而是接着放入了线程池中。

也就是说,只要记得在使用完 ThreadLocal 及时的调用 remove,无论 key 是强引用还是弱引用都不会有问题。那么为什么 key 要用弱引用呢?

事实上,在 ThreadLocalMap 中的 set / getEntry 方法中,会对 keynull(也即是 ThreadLocalnull)进行判断,如果为 null 的话,那么是会对 value 置为 null 的。

这就意味着使用完 ThreadLocalCurrentThread 依然运行的前提下,就算忘记调用 remove 方法,弱引用比强引用可以多一层保障:弱引用 的ThreadLocal 会被回收,对应的 value 在下一次 ThreadLocalMap 调用set,get,remove 中的任一方法的时候会被清除,从而避免内存泄漏。

结语

应各位小伙伴们的需求,陌溪已经把 学习笔记 已经整理成 PDF 版本啦,方便大家在手机或者电脑上阅读。 如果有需要离线阅读的小伙伴可以到下面的公众号回复 PDF ,即可获取下载地址~

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8