Java并發編程(七)深入剖析ThreadLocal
一.對ThreadLocal的理解
ThreadLocal,很多地方叫做線程本地變量,也有些地方叫做線程本地存儲,其實意思差不多。可能很多朋友都知道ThreadLocal為變量在每個線程中都創建了一個副本,那么每個線程可以訪問自己內部的副本變量。
ThreadLocal類用來提供線程內部的局部變量。這些變量在多線程環境下訪問(通過get或set方法訪問)時能保證各個線程里的變量相對獨立于其他線程內的變量,ThreadLocal實例通常來說都是private static類型。
總結:ThreadLocal不是為了解決多線程訪問共享變量,而是為每個線程創建一個單獨的變量副本,提供了保持對象的方法和避免參數傳遞的復雜性。
ThreadLocal的主要應用場景為按線程多實例(每個線程對應一個實例)的對象的訪問,并且這個對象很多地方都要用到。例如:同一個網站登錄用戶,每個用戶服務器會為其開一個線程,每個線程中創建一個ThreadLocal,里面存用戶基本信息等,在很多頁面跳轉時,會顯示用戶信息或者得到用戶的一些信息等頻繁操作,這樣多線程之間并沒有聯系而且當前線程也可以及時獲取想要的數據。
二.深入解析ThreadLocal類
ThreadLocal可以看做是一個容器,容器里面存放著屬于當前線程的變量。
ThreadLocal類的基本方法: (1) void set(Object value)設置當前線程的線程局部變量的值。 (2) public Object get()該方法返回當前線程所對應的線程局部變量。 (3) public void remove()將當前線程局部變量的值刪除,目的是為了減少內存的占用,該方法是JDK 5.0新增的方法。需要指出的是,當線程結束后,對應該線程的局部變量將自動被垃圾回收,所以顯式調用該方法清除線程的局部變量并不是必須的操作,但它可以加快內存回收的速度。 (4) protected Object initialValue()返回該線程局部變量的初始值,該方法是一個protected的方法,顯然是為了讓子類覆蓋而設計的。這個方法是一個延遲調用方法,在線程第1次調用get()或set(Object)時才執行,并且僅執行1次,ThreadLocal中的缺省實現直接返回一個null。
原理分析:
可以通過上述的幾個方法實現ThreadLocal中變量的訪問,數據設置,初始化以及刪除局部變量,那ThreadLocal內部是如何為每一個線程維護變量副本的呢? 其實在ThreadLocal類中有一個靜態內部類ThreadLocalMap(其類似于Map),用鍵值對的形式存儲每一個線程的變量副本,ThreadLocalMap中元素的key為當前ThreadLocal對象,而value對應線程的變量副本,每個線程可能存在多個ThreadLocal。 源代碼: /** Returns the value in the current thread's copy of this thread-local variable. If the variable has no value for thecurrent thread, it is first initialized to the value returned by an invocation of the {@link #initialValue} method. @return the current thread's value of this thread-local */ public T get() { Thread t = Thread.currentThread();//當前線程 ThreadLocalMap map = getMap(t);//獲取當前線程對應的ThreadLocalMap if (map != null) { ThreadLocalMap.Entry e = map.getEntry(this);//獲取對應ThreadLocal的變量值 if (e != null) { @SuppressWarnings("unchecked") T result = (T)e.value; return result; } } return setInitialValue();//若當前線程還未創建ThreadLocalMap,則返回調用此方法并在其中調用createMap方法進行創建并返回初始值。 } //設置變量的值 public void set(T value) { Thread t = Thread.currentThread(); ThreadLocalMap map = getMap(t); if (map != null) map.set(this, value); else createMap(t, value); } private T setInitialValue() { T value = initialValue(); Thread t = Thread.currentThread(); ThreadLocalMap map = getMap(t); if (map != null) map.set(this, value); else createMap(t, value); return value; } /** 為當前線程創建一個ThreadLocalMap的threadlocals,并將第一個值存入到當前map中 @param t the current thread @param firstValue value for the initial entry of the map */ void createMap(Thread t, T firstValue) { t.threadLocals = new ThreadLocalMap(this, firstValue); } //刪除當前線程中ThreadLocalMap對應的ThreadLocal public void remove() { ThreadLocalMap m = getMap(Thread.currentThread()); if (m != null) m.remove(this); } 上述是在ThreadLocal類中的幾個主要的方法,他們的核心都是對其內部類ThreadLocalMap進行操作,下面看一下該類的源代碼: static class ThreadLocalMap { //map中的每個節點Entry,其鍵key是ThreadLocal并且還是弱引用,這也導致了后續會產生內存泄漏問題的原因。 static class Entry extends WeakReference<ThreadLocal<?>> { Object value; Entry(ThreadLocal<?> k, Object v) { super(k); value = v; } /** * 初始化容量為16,以為對其擴充也必須是2的指數 */ private static final int INITIAL_CAPACITY = 16; /** * 真正用于存儲線程的每個ThreadLocal的數組,將ThreadLocal和其對應的值包裝為一個Entry。 */ private Entry[] table; ///....其他的方法和操作都和map的類似 }
總之,為不同線程創建不同的ThreadLocalMap,用線程本身為區分點,每個線程之間其實沒有任何的聯系,說是說存放了變量的副本,其實可以理解為為每個線程單獨new了一個對象。
三.ThreadLocal的應用場景
private static final ThreadLocal threadSession = new ThreadLocal();
public static Session getSession() throws InfrastructureException {
Session s = (Session) threadSession.get();
try {
if (s == null) {
s = getSessionFactory().openSession();
threadSession.set(s);
}
} catch (HibernateException ex) {
throw new InfrastructureException(ex);
}
return s;
}
四.Synchronized還是ThreadLocal?
①ThreadLocal為每一個線程都提供了變量的副本,使得每個線程在某一時間訪問到的并不是同一個對象,這樣就隔離了多個線程對數據的數據共享 。
②概括起來說,對于多線程資源共享的問題,同步機制采用了“以時間換空間”的方式,而ThreadLocal采用了“以空間換時間”的方式。前者僅提供一份變量,讓不同的線程排隊訪問,而后者為每一個線程都提供了一份變量,因此可以同時訪問而互不影響。
③ThreadLocal和Synchonized都用于解決多線程并發訪問。但是ThreadLocal與synchronized有本質的區別。synchronized是利用鎖的機制,使變量或代碼塊在某一時該只能被一個線程訪問。而ThreadLocal為每一個線程都提供了變量的副本,使得每個線程在某一時間訪問到的并不是同一個對象,這樣就隔離了多個線程對數據的數據共享。而Synchronized卻正好相反,它用于在多個線程間通信時能夠獲得數據共享。
五.內存泄漏問題
在上面提到過,每個thread中都存在一個map, map的類型是ThreadLocal.ThreadLocalMap. Map中的key為一個threadlocal實例. 這個Map的確使用了弱引用,不過弱引用只是針對key. 每個key都弱引用指向threadlocal. 當把threadlocal實例置為null以后,沒有任何強引用指向threadlocal實例,所以threadlocal將會被gc回收. 但是,我們的value卻不能回收,因為存在一條從current thread連接過來的強引用. 只有當前thread結束以后, current thread就不會存在棧中,強引用斷開, Current Thread, Map, value將全部被GC回收.
所以得出一個結論就是只要這個線程對象被gc回收,就不會出現內存泄露,但在threadLocal設為null和線程結束這段時間不會被回收的,就發生了我們認為的內存泄露。其實這是一個對概念理解的不一致,也沒什么好爭論的。最要命的是線程對象不被回收的情況,這就發生了真正意義上的內存泄露。比如使用線程池的時候,線程結束是不會銷毀的,會再次使用的。就可能出現內存泄露。
浙公網安備 33010602011771號