java虛擬機(jī)JVM
1.數(shù)據(jù)類(lèi)型
java虛擬機(jī)中,數(shù)據(jù)類(lèi)型可以分為兩類(lèi):基本類(lèi)型和引用類(lèi)型。基本類(lèi)型的變量保存原始值,即:它代表的值就是數(shù)值本身,而引用類(lèi)型的變量保存引用值。“引用值”代表了某個(gè)對(duì)象的引用,而不是對(duì)象本身,對(duì)象本身存放在這個(gè)引用值所表示的地址的位置。
基本類(lèi)型包括:byte、short、int、long、char、float、double、boolean、returnAddress??
引用類(lèi)型包括:類(lèi)類(lèi)型、接口類(lèi)型和數(shù)組
|
byte |
1B(8位) |
-128 ~ 127 |
0 |
|
short |
2B(16位) |
-215 ~ 215-1 |
0 |
|
Int |
4B(32位) |
-231 ~ 231-1 |
0 |
|
long |
8B(64位) |
-263 ~ 263-1 |
0 |
|
char |
2B(16位) |
0 ~ 216-1 |
\U0000 |
|
float |
4B(32位) |
1.4013E-45 ~3.4028E+38 |
0.0F |
|
double |
8B(64位) |
4.9E-324 ~1.7977E+308 |
0.0D |
|
boolean |
1B(8位) |
True, false |
false |
2.堆與棧
堆和棧是程序運(yùn)行的關(guān)鍵,很有必要它他們的關(guān)系說(shuō)清楚。

棧是運(yùn)行時(shí)的單位,而堆是存儲(chǔ)的單元。
棧解決程序的運(yùn)行問(wèn)題,即程序如何執(zhí)行,或者說(shuō)如何處理數(shù)據(jù),堆解決的是數(shù)據(jù)存儲(chǔ)的問(wèn)題,即數(shù)據(jù)怎么放,放在哪兒。
在java中一個(gè)線(xiàn)程就會(huì)相應(yīng)有一個(gè)線(xiàn)程棧與之對(duì)應(yīng),這點(diǎn)很容易理解,因?yàn)椴煌木€(xiàn)程執(zhí)行邏輯有所不同,因此需要一個(gè)獨(dú)立的線(xiàn)程棧。而堆則是所有線(xiàn)程共享的。棧因?yàn)槭沁\(yùn)行單位,因此里面存儲(chǔ)的信息都是跟當(dāng)前線(xiàn)程(或程序)相關(guān)的信息。包括局部變量、程序運(yùn)行狀態(tài)、方法返回值等等,而堆只負(fù)責(zé)存儲(chǔ)對(duì)象信息。
為什么要把堆和棧區(qū)分出來(lái)呢?棧中不是也可以存儲(chǔ)數(shù)據(jù)嗎?
1. 從軟件設(shè)計(jì)的角度看,棧代表了處理邏輯,而堆代表了數(shù)據(jù)。這樣分開(kāi),使得處理邏輯更為清晰。分而治之的思想。這種隔離、模塊化的思想在軟件設(shè)計(jì)的方方面面都有體現(xiàn)。
2.堆與棧的分離,使得堆中的內(nèi)容可以被多個(gè)棧共享(也可以理解為多個(gè)線(xiàn)程訪(fǎng)問(wèn)同一個(gè)對(duì)象)。這種共享的收益是很多的。一方面這種共享提供了一種有效的數(shù)據(jù)交互方式(如:共享內(nèi)存),另一方面,堆中的共享常量和緩存可以被所有棧訪(fǎng)問(wèn),節(jié)省了空間。
3. 棧因?yàn)檫\(yùn)行時(shí)的需要,比如保存系統(tǒng)運(yùn)行的上下文,需要進(jìn)行地址段的劃分。由于棧只能向上增長(zhǎng),因此就會(huì)限制住棧存儲(chǔ)內(nèi)容的能力,而堆不同,堆中的對(duì)象是可以根據(jù)需要?jiǎng)討B(tài)增長(zhǎng)的,因此棧和堆的拆分使得動(dòng)態(tài)增長(zhǎng)成為可能,相應(yīng)棧中只需記錄堆中的一個(gè)地址即可。
4. 面向?qū)ο缶褪嵌押蜅5耐昝澜Y(jié)合。其實(shí),面向?qū)ο蠓绞降某绦蚺c以前結(jié)構(gòu)化的程序在執(zhí)行上沒(méi)有任何區(qū)別。但是,面向?qū)ο蟮囊耄沟脤?duì)待問(wèn)題的思考方式發(fā)生了改變,而更接近于自然方式的思考。當(dāng)我們把對(duì)象拆開(kāi),你會(huì)發(fā)現(xiàn),對(duì)象的屬性其實(shí)就是數(shù)據(jù),存放在堆中;而對(duì)象的行為(方法),就是運(yùn)行邏輯,放在棧中。我們?cè)诰帉?xiě)對(duì)象的時(shí)候,其實(shí)就是編寫(xiě)了數(shù)據(jù)結(jié)構(gòu),也編寫(xiě)了處理數(shù)據(jù)的邏輯。不得不承認(rèn),面向?qū)ο蟮脑O(shè)計(jì),確實(shí)很美。
在java中,Main函數(shù)就是棧的起始點(diǎn),也是程序的起始點(diǎn)。
程序要運(yùn)行總是有一個(gè)起點(diǎn)的。同C語(yǔ)言一樣,java中的Main就是那個(gè)起點(diǎn)。無(wú)論什么java程序,找到main就找到了程序執(zhí)行的入口。
堆中存什么?棧中存什么?
堆中存的是對(duì)象。棧中存的是基本數(shù)據(jù)類(lèi)型和堆中對(duì)象的引用。一個(gè)對(duì)象的大小是不可估計(jì)的,或者說(shuō)是可以動(dòng)態(tài)變化的,但是在棧中,一個(gè)對(duì)象只對(duì)應(yīng)了一個(gè)4byte的引用(堆棧分離的好處)。
為什么不把基本類(lèi)型放堆中呢?因?yàn)槠湔加玫目臻g一般是1~8個(gè)字節(jié)---需要空間比較少,而且因?yàn)槭腔绢?lèi)型,所以不會(huì)出現(xiàn)動(dòng)態(tài)增長(zhǎng)的情況---長(zhǎng)度固定,因此棧中存儲(chǔ)就夠了,如果把它存在堆中是沒(méi)有什么意義的(還會(huì)浪費(fèi)空間,后面說(shuō)明)。可以這么說(shuō),基本類(lèi)型和對(duì)象的引用都是存放在棧中,而且都是幾個(gè)字節(jié)的一個(gè)數(shù),因此在程序運(yùn)行時(shí),它們的處理方式是統(tǒng)一的。但是基本類(lèi)型、對(duì)象引用和對(duì)象本身就有所區(qū)別了,因?yàn)橐粋€(gè)是棧中的數(shù)據(jù)一個(gè)是堆中的數(shù)據(jù)。最常見(jiàn)的一個(gè)問(wèn)題就是,java中參數(shù)傳遞時(shí)的問(wèn)題。
java中的參數(shù)傳遞是傳值呢?還是傳引用?
1. 不要試圖與C進(jìn)行類(lèi)比,java中沒(méi)有指針的概念。
2. 程序運(yùn)行永遠(yuǎn)都是在棧中進(jìn)行的,因而參數(shù)傳遞時(shí),只存在傳遞基本類(lèi)型和對(duì)象引用的問(wèn)題。不會(huì)直接傳遞對(duì)象本身。
明確以上兩點(diǎn)后。java在方法調(diào)用傳遞參數(shù)時(shí),因?yàn)闆](méi)有指針,所以它都是進(jìn)行傳值調(diào)用(這點(diǎn)可以參考C的傳值調(diào)用)。因此,很多書(shū)里面都說(shuō)java是進(jìn)行傳值調(diào)用,這點(diǎn)沒(méi)有問(wèn)題,而且也簡(jiǎn)化了C中復(fù)雜性。
但是傳引用的錯(cuò)覺(jué)是如何造成的呢?在運(yùn)行棧中,基本類(lèi)型和引用的處理是一樣的,都是傳值,所以,如果是傳引用的方法調(diào)用,也同時(shí)可以理解為“傳引用值”的傳值調(diào)用,即引用的處理跟基本類(lèi)型是完全一樣的。但是當(dāng)進(jìn)入被調(diào)用方法時(shí),被傳遞的這個(gè)引用的值,被程序解釋?zhuān)ɑ蛘卟檎遥┑蕉阎械膶?duì)象,這個(gè)時(shí)候才對(duì)應(yīng)到真正的對(duì)象。如果此時(shí)進(jìn)行修改,修改的是引用對(duì)應(yīng)的對(duì)象,而不是對(duì)象本身,即:修改的是堆中的數(shù)據(jù)。所以這個(gè)修改是可以保持的。
對(duì)象,從某種意義上說(shuō),是由基本類(lèi)型組成的。可以把一個(gè)對(duì)象看作為一棵樹(shù),對(duì)象的屬性如果還是對(duì)象,則還是一棵樹(shù)(即非葉子節(jié)點(diǎn)),基本類(lèi)型則為樹(shù)的葉子節(jié)點(diǎn)。程序參數(shù)傳遞時(shí),被傳遞的值本身都是不能進(jìn)行修改的,但是,如果這個(gè)值是一個(gè)非葉子節(jié)點(diǎn)(即一個(gè)對(duì)象引用),則可以修改這個(gè)節(jié)點(diǎn)下面的所有內(nèi)容。
堆和棧中,棧是程序運(yùn)行最根本的東西。程序運(yùn)行可以沒(méi)有堆,但是不能沒(méi)有棧。而堆是為棧進(jìn)行數(shù)據(jù)存儲(chǔ)服務(wù)的,說(shuō)白了堆就是一塊共享的內(nèi)存。不過(guò),正是因?yàn)槎押蜅5姆蛛x的思想,才使得java的垃圾回收成為可能。
java中,棧的大小通過(guò)-Xss來(lái)設(shè)置,當(dāng)棧中存儲(chǔ)的數(shù)據(jù)比較多時(shí),需要適當(dāng)調(diào)大這個(gè)值,否則會(huì)出現(xiàn) java.lang.StackOverflowError異常。常見(jiàn)的出現(xiàn)這個(gè)異常的是無(wú)法返回的遞歸,因?yàn)榇藭r(shí)棧中保存的信息都是方法返回的記錄點(diǎn)。
java對(duì)象的大小
基本數(shù)據(jù)類(lèi)型的大小是固定的,這里就不多說(shuō)了,對(duì)于非基本類(lèi)型的java對(duì)象,其大小就值得商討。
在java中,一個(gè)空Object對(duì)象的大小是8byte,這個(gè)大小只是保存堆中一個(gè)沒(méi)有任何屬性的對(duì)象的大小。看看下面語(yǔ)句:
Object ob = new Object();
這樣在程序中完成了一個(gè)java對(duì)象的聲明,但是它所占的空間為:4byte+8byte。4byte是上面部分所說(shuō)的java棧中保存引用的所需要空間。
而那8byte則是java堆中對(duì)象的信息。因?yàn)樗械?strong>java非基本類(lèi)型的對(duì)象都需要默認(rèn)繼承Object對(duì)象,因此不論什么樣的java對(duì)象,其大小都必須是大于8byte。
有了Object對(duì)象的大小,我們就可以計(jì)算其他對(duì)象的大小了。

其大小為:空對(duì)象大小(8byte)+int大小(4byte)+Boolea大小(1byte)+空Object引用的大小(4byte)=17byte。但是因?yàn)?strong>java在對(duì)對(duì)象內(nèi)存分配時(shí)都是以8的整數(shù)倍來(lái)分的,因此大于17byte的最接近8的整數(shù)倍的是24,因此此對(duì)象的大小為24byte。
這里需要注意一下基本類(lèi)型的包裝類(lèi)型的大小。因?yàn)檫@種包裝類(lèi)型已經(jīng)成為對(duì)象了,因此需要把它們作為對(duì)象來(lái)看待。包裝類(lèi)型的大小至少是12byte(聲明一個(gè)空Object至少需要的空間),而且12byte沒(méi)有包含任何有效信息,同時(shí),因?yàn)?strong>java對(duì)象大小是8的整數(shù)倍,因此一個(gè)基本類(lèi)型包裝類(lèi)的大小至少是16byte。這個(gè)內(nèi)存占用是很恐怖的,它是使用基本類(lèi)型的N倍(N>2),這些類(lèi)型的內(nèi)存占用更是夸張。因此,可能的話(huà)應(yīng)盡量少使用包裝類(lèi)。在JDK5.0以后,因?yàn)榧尤肓俗詣?dòng)類(lèi)型裝換,因此,java虛擬機(jī)會(huì)在存儲(chǔ)方面進(jìn)行相應(yīng)的優(yōu)化。
引用類(lèi)型
對(duì)象引用類(lèi)型分為強(qiáng)引用、軟引用、弱引用和虛引用
強(qiáng)引用:就是我們一般聲明對(duì)象時(shí)虛擬機(jī)生成的引用,強(qiáng)引用環(huán)境下,垃圾回收時(shí)需要嚴(yán)格判斷當(dāng)前對(duì)象是否被強(qiáng)引用,如果被強(qiáng)引用,則不會(huì)被垃圾回收。
軟引用:軟引用一般被作為緩存來(lái)使用。與強(qiáng)引用的區(qū)別是,軟引用在垃圾回收時(shí),虛擬機(jī)會(huì)根據(jù)當(dāng)前系統(tǒng)的剩余內(nèi)存來(lái)決定是否對(duì)軟引用進(jìn)行回收。如果剩余內(nèi)存比較緊張,則虛擬機(jī)會(huì)回收軟引用所引用的空間,如果剩余內(nèi)存相對(duì)富裕,則不會(huì)進(jìn)行回收。換句話(huà)說(shuō),虛擬機(jī)在發(fā)生OutOfMemory時(shí),肯定是沒(méi)有軟引用存在的。
弱引用:弱引用與軟引用類(lèi)似,都是作為緩存來(lái)使用。但與軟引用不同,弱引用在進(jìn)行垃圾回收時(shí),是一定會(huì)被回收掉的,因此其生命周期只存在于一個(gè)垃圾回收周期內(nèi)。
強(qiáng)引用不用說(shuō),我們系統(tǒng)一般在使用時(shí)都是用的強(qiáng)引用。而“軟引用”和“弱引用”比較少見(jiàn)。他們一般被作為緩存使用,而且一般是在內(nèi)存比較受限的情況下作為緩存。
因?yàn)槿绻麅?nèi)存足夠大的話(huà),可以直接使用強(qiáng)引用作為緩存即可,同時(shí)可控性更高。因而,他們常見(jiàn)的是被使用在桌面應(yīng)用系統(tǒng)的緩存。
|
ReferenceQueue queue = new ReferenceQueue ();
PhantomReference pr = new PhantomReference (object, queue);
|
可以從不同的角度去劃分垃圾回收算法:
按照基本回收策略分
引用計(jì)數(shù)(Reference Counting)
比較古老的回收算法。原理是此對(duì)象有一個(gè)引用,即增加一個(gè)計(jì)數(shù),刪除一個(gè)引用則減少一個(gè)計(jì)數(shù)。垃圾回收時(shí),只用收集計(jì)數(shù)為0的對(duì)象。此算法最致命的是無(wú)法處理循環(huán)引用的問(wèn)題。
標(biāo)記-清除(Mark-Sweep)

此算法執(zhí)行分兩階段。第一階段從引用根節(jié)點(diǎn)開(kāi)始標(biāo)記所有被引用的對(duì)象,第二階段遍歷整個(gè)堆,把未標(biāo)記的對(duì)象清除。此算法需要暫停整個(gè)應(yīng)用,同時(shí),會(huì)產(chǎn)生內(nèi)存碎片。
復(fù)制(Copying)

此算法把內(nèi)存空間劃分為兩個(gè)相等的區(qū)域,每次只是用其中一個(gè)區(qū)域。垃圾回收時(shí),遍歷當(dāng)前使用區(qū)域,把正在使用中的對(duì)象復(fù)制到另外一個(gè)區(qū)域中。此算法每次只處理正在使用中的對(duì)象,因此復(fù)制成本比較小,同時(shí)復(fù)制過(guò)去以后還能進(jìn)行相應(yīng)的內(nèi)存整理,不會(huì)出現(xiàn)“碎片”問(wèn)題??。當(dāng)然,此算法的缺點(diǎn)也是比較明顯的,就是需要兩倍內(nèi)存空間。
標(biāo)記-整理(Mark-Compact)

此算法結(jié)合了“標(biāo)記-清除”和“復(fù)制”兩個(gè)算法的優(yōu)點(diǎn)。也是分兩個(gè)階段,第一階段從根節(jié)點(diǎn)開(kāi)始標(biāo)記所有被引用對(duì)象,第二階段遍歷整個(gè)堆,把清除未標(biāo)記對(duì)象并且把存活對(duì)象“壓縮”到堆中的其中一塊,按順序排放。此算法避免了“標(biāo)記-清除”的碎片問(wèn)題,同時(shí)也避免了“復(fù)制”算法的空間問(wèn)題。
按分區(qū)對(duì)待的方式分
增量收集(Incremental Collecting):實(shí)時(shí)垃圾回收算法,即:在應(yīng)用進(jìn)行的同時(shí)進(jìn)行垃圾回收。不知道什么原因JDK5.0中的收集器沒(méi)有使用這種算法。
分代收集(Generational Collecting):基于對(duì)對(duì)象生命周期分析后得出的垃圾回收算法。把對(duì)象分為年輕代、年老代、持久代,對(duì)不同生命周期的對(duì)象使用不同的算法(上述方式中的一個(gè))進(jìn)行回收?,F(xiàn)在的垃圾回收器(從J2SE1.2開(kāi)始)都是使用此算法的。
按系統(tǒng)線(xiàn)程分
串行收集:串行收集使用單線(xiàn)程處理所有垃圾回收工作,因?yàn)闊o(wú)需多線(xiàn)程交互,實(shí)現(xiàn)容易,而且效率比較高。但是,其局限性也比較明顯,即無(wú)法使用多處理器的優(yōu)勢(shì),所以此收集適合單處理器機(jī)器。當(dāng)然,此收集器也可以用在小數(shù)據(jù)量(100M左右)情況下的多處理器機(jī)器上。
并行收集:并行收集使用多線(xiàn)程處理垃圾回收工作,因而速度快,效率高。而且理論上CPU數(shù)目越多,越能體現(xiàn)出并行收集器的優(yōu)勢(shì)。
并發(fā)收集:GC線(xiàn)程和應(yīng)用線(xiàn)程大部分時(shí)間是并發(fā)執(zhí)行,只是在初始標(biāo)記(initial mark)和二次標(biāo)記(remark)時(shí)需要stop-the-world,這可以大大縮短停頓時(shí)間(pause time),所以適用于響應(yīng)時(shí)間優(yōu)先的應(yīng)用,減少用戶(hù)等待時(shí)間。由于GC是和應(yīng)用線(xiàn)程并發(fā)執(zhí)行,只有在多CPU場(chǎng)景下才能發(fā)揮其價(jià)值,在執(zhí)行過(guò)程中還會(huì)產(chǎn)生新的垃圾floating garbage,如果等空間滿(mǎn)了再開(kāi)始GC,那這些新產(chǎn)生的垃圾就沒(méi)地方放了,這時(shí)就會(huì)啟動(dòng)一次串行GC,等待時(shí)間將會(huì)很長(zhǎng),所以要在空間還未滿(mǎn)時(shí)就要啟動(dòng)GC。mark和sweep操作會(huì)引起很多碎片,所以間隔一段時(shí)間需要整理整個(gè)空間,否則遇到大對(duì)象,沒(méi)有連續(xù)空間也會(huì)啟動(dòng)一次串行GC。采用此收集器(如tenured generation),收集頻率不能大,否則會(huì)影響到cpu的利用率,進(jìn)而影響吞吐量。。
如何區(qū)分垃圾
上面說(shuō)到的“引用計(jì)數(shù)”法,通過(guò)統(tǒng)計(jì)控制生成對(duì)象和刪除對(duì)象是的引用數(shù)來(lái)判斷。垃圾回收程序收集計(jì)數(shù)為0的對(duì)象即可。但是這種方法無(wú)法解決循環(huán)引用。所以,后來(lái)實(shí)現(xiàn)的垃圾判斷算法中,都是從程序運(yùn)行的根節(jié)點(diǎn)出發(fā),遍歷整個(gè)對(duì)象引用,查找存活的對(duì)象,那么在這種方式的實(shí)現(xiàn)中,垃圾回收從哪兒開(kāi)始的呢?即,從哪兒開(kāi)始查找哪些對(duì)象是正在被當(dāng)前系統(tǒng)使用的,上面分析的堆和棧的區(qū)別,其中棧是真正進(jìn)行程序執(zhí)行的地方,所以要獲取哪些對(duì)象正在被使用,則需要從java棧開(kāi)始。同時(shí),一個(gè)棧是與一個(gè)線(xiàn)程對(duì)應(yīng)的,因此,如果有多個(gè)線(xiàn)程的話(huà),則必須對(duì)這些線(xiàn)程對(duì)應(yīng)的所有的棧進(jìn)行檢查。

同時(shí),除了棧外,還有系統(tǒng)運(yùn)行時(shí)的寄存器等,也是存儲(chǔ)程序運(yùn)行數(shù)據(jù)的。這樣,以棧或寄存器中的引用為起點(diǎn),我們可以找到堆中的對(duì)象,又從這些對(duì)象找到對(duì)堆中其它對(duì)象的引用,這種引用逐步擴(kuò)展,最終以null引用或者基本類(lèi)型結(jié)束,這樣就形成了一顆以java棧中引用所對(duì)應(yīng)的對(duì)象為根節(jié)點(diǎn)的一顆對(duì)象樹(shù),如果棧中有多個(gè)引用,則最終會(huì)形成多顆對(duì)象樹(shù)。在這些對(duì)象樹(shù)上的對(duì)象,都是當(dāng)前系統(tǒng)運(yùn)行所需要的對(duì)象,不能被垃圾回收,而其他剩余對(duì)象,則可以視為無(wú)法被引用到的對(duì)象,可以被當(dāng)做垃圾進(jìn)行回收。
因此,垃圾回收的起點(diǎn)是一些根對(duì)象(java棧、靜態(tài)變量、寄存器...)。而最簡(jiǎn)單的java棧就是java程序執(zhí)行的main函數(shù)。這種回收方式,也是上面提到的“標(biāo)記-清除”的回收方式。
如何處理碎片
由于不同java對(duì)象存活時(shí)間是不一定的,因此,在程序運(yùn)行一段時(shí)間以后,如果不進(jìn)行內(nèi)存整理,就會(huì)出現(xiàn)零散的內(nèi)存碎片。碎片最直接的問(wèn)題就是會(huì)導(dǎo)致無(wú)法分配大塊的內(nèi)存空間,以及程序運(yùn)行效率降低。所以,在上面提到的基本垃圾回收算法中 ,“復(fù)制”方式和“標(biāo)記-整理”方式,都可以解決碎片的問(wèn)題。
如何解決同時(shí)存在的對(duì)象創(chuàng)建和對(duì)象回收問(wèn)題
垃圾回收線(xiàn)程是回收內(nèi)存的,而程序運(yùn)行線(xiàn)程則是消耗(或分配)內(nèi)存的,一個(gè)回收內(nèi)存,一個(gè)分配內(nèi)存,從這點(diǎn)看,兩者是矛盾的。因此,在現(xiàn)有的垃圾回收方式中,要進(jìn)行垃圾回收前,一般都需要暫停整個(gè)應(yīng)用(即:暫停內(nèi)存的分配),然后進(jìn)行垃圾回收,回收完成后再繼續(xù)應(yīng)用。這種實(shí)現(xiàn)方式是最直接,而且最有效的解決二者矛盾的方式。
但是這種方式有一個(gè)很明顯的弊端,就是當(dāng)堆空間持續(xù)增大時(shí),垃圾回收的時(shí)間也將會(huì)相應(yīng)的持續(xù)增大,相應(yīng)應(yīng)用暫停的時(shí)間也會(huì)相應(yīng)的增大。一些相應(yīng)時(shí)間要求很高的應(yīng)用,比如最大暫停時(shí)間要求是幾百毫秒,那么當(dāng)堆空間大于幾個(gè)G時(shí),就很有可能超過(guò)這個(gè)限制,在這種情況下,垃圾回收將會(huì)成為系統(tǒng)運(yùn)行的一個(gè)瓶頸。為解決這種矛盾,有了并發(fā)垃圾回收算法,使用這種算法,垃圾回收線(xiàn)程與程序運(yùn)行線(xiàn)程同時(shí)運(yùn)行。在這種方式下,解決了暫停的問(wèn)題,但是因?yàn)樾枰谛律蓪?duì)象的同時(shí)又要回收對(duì)象,算法復(fù)雜性會(huì)大大增加,系統(tǒng)的處理能力也會(huì)相應(yīng)降低,同時(shí),“碎片”問(wèn)題將會(huì)比較難解決,以后研究的重點(diǎn)?。。。。。 ?/p>
為什么要分代
分代的垃圾回收策略,是基于這樣一個(gè)事實(shí):不同的對(duì)象的生命周期是不一樣的。因此,不同聲明周期的對(duì)象可以采取不同的收集方式,以便提高回收效率。
在Java程序運(yùn)行的過(guò)程中,會(huì)產(chǎn)生大量的對(duì)象,其中有些對(duì)象是與業(yè)務(wù)信息相關(guān),比如Http請(qǐng)求中的Session對(duì)象、線(xiàn)程、Socket連接,這類(lèi)對(duì)象跟業(yè)務(wù)直接掛鉤,因此生命周期比較長(zhǎng)。但是還有一些對(duì)象,主要是程序運(yùn)行過(guò)程中生成的臨時(shí)變量,這些對(duì)象生命周期比較短,比如:String對(duì)象,由于其不變類(lèi)的特性,系統(tǒng)會(huì)產(chǎn)生大量的這些對(duì)象,有些對(duì)象甚至只用一次即可回收。
是想,在不進(jìn)行對(duì)象存活時(shí)間區(qū)分的情況下,每次垃圾回收都是對(duì)整個(gè)堆空間進(jìn)行回收,花費(fèi)時(shí)間相對(duì)會(huì)長(zhǎng),同時(shí),因?yàn)槊看位厥斩夹枰闅v所有存活對(duì)象,但實(shí)際上,對(duì)于生命周期長(zhǎng)的對(duì)象而言,這種遍歷是沒(méi)有效果的,因?yàn)榭赡苓M(jìn)行了很多次遍歷,但是它們依舊存在。因此,分代垃圾回收采用分治的思想,進(jìn)行代的劃分,把不同生命周期的對(duì)象放在不同代上,不同代上采用最適合它的垃圾回收方式進(jìn)行回收。
如何分代

如圖所示:
虛擬機(jī)中共劃分了三個(gè)代:年輕代(Young Generation)、年老代(Old Generation)和持久代(Permanent Generation)。
其中持久代主要存放的是java類(lèi)的類(lèi)信息,與垃圾收集要收集的java對(duì)象關(guān)系不大。年輕代和年老代的劃分是對(duì)垃圾收集影響比較大的。
年輕代:
所有新生成的對(duì)象首先都是放在年輕代的。年輕代的目標(biāo)就是盡可能快速的收集掉那些生命周期短的對(duì)象。年輕代分為三個(gè)區(qū)。一個(gè)Eden區(qū),兩個(gè)Survivor區(qū)(一般而言)。大部分對(duì)象在Eden區(qū)中生成。當(dāng)Eden區(qū)滿(mǎn)時(shí),還存活的對(duì)象將被復(fù)制到Survivor區(qū)(兩個(gè)中的一個(gè)),當(dāng)這個(gè)Survivor區(qū)滿(mǎn)時(shí),此區(qū)的存活將被復(fù)制到另外一個(gè)Survivor區(qū),當(dāng)這個(gè)Survivor區(qū)也滿(mǎn)了的時(shí)候,從第一個(gè)Survivor區(qū)復(fù)制過(guò)來(lái)的并且此時(shí)還存活的對(duì)象,將被復(fù)制“年老區(qū)(Tenured)”。需要注意,Survivor的兩個(gè)區(qū)是對(duì)稱(chēng)的,沒(méi)先后關(guān)系,所以同一個(gè)區(qū)中可能同時(shí)存在從Eden復(fù)制過(guò)來(lái)的對(duì)象和從前一個(gè)Survivor復(fù)制過(guò)來(lái)的對(duì)象,而復(fù)制到年老區(qū)的只有從第一個(gè)Survivor區(qū)過(guò)來(lái)的對(duì)象。而且,Survivor區(qū)總有一個(gè)是空的。同時(shí),根據(jù)程序需要,Survivor區(qū)是可以配置為多個(gè)的(多于兩個(gè)),這樣可以增加對(duì)象在年輕代中的存在時(shí)間,減少被放到年老代的可能。
年老代:
在年輕代中經(jīng)歷了N次垃圾回收后仍然存活的對(duì)象,就會(huì)被放到年老代中。因此,可以認(rèn)為年老代中存放的都是一些生命周期較長(zhǎng)的對(duì)象。
持久代:
用于存放靜態(tài)文件,如java類(lèi)、方法等。持久代對(duì)垃圾回收沒(méi)有顯著影響,但是有些應(yīng)用可能動(dòng)態(tài)生成或者調(diào)用一些class,例如Hibernate等,在這種時(shí)候需要設(shè)置一個(gè)比較大的持久空間來(lái)存放這些運(yùn)行過(guò)程中新增的類(lèi)。持久代大小通過(guò) -XX:MaxPermSize = <N> 進(jìn)行設(shè)置。
什么情況下觸發(fā)垃圾回收
由于對(duì)象進(jìn)行了分代處理,因此垃圾回收區(qū)域、時(shí)間也不一樣。GC有兩種類(lèi)型:Scavenge GC 和 Full GC
Scavenge GC
一般情況下,當(dāng)新對(duì)象生成,并且在Eden申請(qǐng)空間失敗時(shí),就會(huì)觸發(fā)Scavenge GC,對(duì)Eden區(qū)域進(jìn)行GC,清除非存活對(duì)象,并且把尚且存活的對(duì)象移動(dòng)到Survivor區(qū)。然后整理Survivor的兩個(gè)區(qū)。這種方式的GC是對(duì)年輕代的Eden區(qū)進(jìn)行,不會(huì)影響到年老代。因?yàn)榇蟛糠謱?duì)象都是從Eden區(qū)開(kāi)始的,同時(shí)Eden區(qū)不會(huì)分配的很大,所以Eden區(qū)的GC會(huì)頻繁進(jìn)行。因而,一般在這里需要使用速度快、效率高的算法,使Eden區(qū)能盡快空閑出來(lái)。
Full GC
對(duì)整個(gè)堆進(jìn)行整理,包括Young、Tenured 和 Perm。Full GC 因?yàn)樾枰獙?duì)整個(gè)堆進(jìn)行回收,所以比 Scavenge GC 要慢,因此應(yīng)該盡可能減少 Full GC 的次數(shù)。在對(duì)JVM調(diào)優(yōu)的過(guò)程中,很大一部分工作就是對(duì)于 Full GC 的調(diào)節(jié)。
有如下原因可能導(dǎo)致Full GC:
. 年老代(Tenured)被寫(xiě)滿(mǎn)
. 持久代(Perm)被寫(xiě)滿(mǎn)
. System.gc()被顯式調(diào)用
. 上一次GC之后Heap的各域分配策略動(dòng)態(tài)變化
分代垃圾回收流程示意




選擇合適的垃圾收集算法
串行收集器

用單線(xiàn)程處理所有垃圾回收工作,因?yàn)闊o(wú)需多線(xiàn)程交互,所有效率比較高。但是,也無(wú)法使用多處理器的優(yōu)勢(shì),所以此收集器適合單處理器機(jī)器。當(dāng)然,此收集器也可以用在小數(shù)據(jù)量(100M左右)情況下的多處理器機(jī)器上??梢允褂?-XX:+UseSerialGC打開(kāi)。
并行收集器

對(duì)年輕代進(jìn)行并行垃圾回收,因此可以減少垃圾回收時(shí)間。一般在多線(xiàn)程多處理器機(jī)器上使用。使用 -XX:+UseParallelGC 打開(kāi)。并行收集器在 J2SE5.0第六6更新上引入,在java SE6.0中進(jìn)行了增強(qiáng) --- 可以對(duì)年老代進(jìn)行并行收集。如果年老代不使用并行收集的話(huà),默認(rèn)是使用單線(xiàn)程進(jìn)行垃圾回收,因此會(huì)制約擴(kuò)展能力。使用 -XX:+UseParallelOldGC打開(kāi)。
使用 -XX:ParallelGCThreads = <N> 設(shè)置并行垃圾回收的線(xiàn)程數(shù)。此值可以設(shè)置與機(jī)器處理器數(shù)量相等。
此收集器可以進(jìn)行如下配置:
最大垃圾回收暫停:指定垃圾回收時(shí)的最長(zhǎng)暫停時(shí)間,通過(guò)-XX:MaxGCPauseMillis = <N>指定。<N> 為毫秒,如果指定了此值的話(huà),堆大小和垃圾回收相關(guān)參數(shù)會(huì)進(jìn)行調(diào)整以達(dá)到指定值。設(shè)定此值可能會(huì)減少應(yīng)用的吞吐量。
吞吐量:吞吐量為垃圾回收時(shí)間與非垃圾回收時(shí)間的比值,通過(guò)-XX:GCTimeRatio = <N> 來(lái)設(shè)定,公式為 1/(1 + N)。例如,-XX:GCTimeRatio = 19時(shí),表示5%的時(shí)間用于垃圾回收。默認(rèn)情況為99,即1%的時(shí)間用于垃圾回收。
并發(fā)收集器
可以保證大部分工作都并發(fā)進(jìn)行(應(yīng)用不停止),垃圾回收只暫停很少的時(shí)間,此收集器適合對(duì)響應(yīng)時(shí)間要求比較高的中、大規(guī)模應(yīng)用。使用 -XX:+UseConcMarkSweepGC打開(kāi)。

并發(fā)收集器主要減少年老代的暫停時(shí)間,它在應(yīng)用不停止的情況下使用獨(dú)立的垃圾回收線(xiàn)程,跟蹤可達(dá)對(duì)象。在每個(gè)年老代垃圾回收周期中,在收集初期并發(fā)收集器會(huì)對(duì)整個(gè)應(yīng)用進(jìn)行簡(jiǎn)短的暫停。在收集中還會(huì)再暫停一次。第二次暫停會(huì)比第一次稍長(zhǎng),在此過(guò)程中多個(gè)線(xiàn)程同時(shí)進(jìn)行垃圾回收工作。
并發(fā)收集器使用處理器換來(lái)短暫的停頓時(shí)間。在一個(gè)N個(gè)處理器的系統(tǒng)上,并發(fā)收集部分使用 k/N 個(gè)可用處理器進(jìn)行回收,一般情況下 1 <= k <= N / 4。
在只有一個(gè)處理器的主機(jī)上使用并發(fā)收集器,設(shè)置為 incremental mode 模式也可獲得較短的停頓時(shí)間。
浮動(dòng)垃圾:由于在應(yīng)用運(yùn)行的同時(shí)進(jìn)行垃圾回收,所以有些垃圾可能在垃圾回收進(jìn)行完成時(shí)產(chǎn)生,這樣就造成了“Floating Garbage”,這些垃圾需要在下次垃圾回收周期時(shí)才能回收掉。所以,并發(fā)收集器一般需要20%的預(yù)留空間用于這些浮動(dòng)垃圾。
Concurrent Mode Failure:并發(fā)收集器在應(yīng)用運(yùn)行時(shí)進(jìn)行收集,所以需要保證堆在垃圾回收的這段時(shí)間有足夠的空間供程序使用,否則,垃圾回收還未完成,堆空間先滿(mǎn)了。這種情況下將會(huì)發(fā)生“并發(fā)模式失敗”,此時(shí)整個(gè)應(yīng)用將會(huì)暫停,進(jìn)行垃圾回收。
啟動(dòng)并發(fā)收集器:因?yàn)椴l(fā)收集在應(yīng)用運(yùn)行時(shí)進(jìn)行收集,所以必須保證收集完成之前有足夠的內(nèi)存空間供程序使用,否則會(huì)出現(xiàn)“Concurrent Mode Failure”。通過(guò)設(shè)置 -XX:CMSInitiatingOccupancyFraction = <N> 指定還有多少剩余堆是開(kāi)始執(zhí)行并發(fā)收集。
小結(jié)
串行處理器:
-- 適用情況:數(shù)據(jù)量比較?。?00M左右),單處理器下并且對(duì)相應(yīng)時(shí)間無(wú)要求的應(yīng)用。
-- 缺點(diǎn):只能用于小型應(yīng)用。
并行處理器:
-- 適用情況:“對(duì)吞吐量有高要求”,多CPU,對(duì)應(yīng)用過(guò)響應(yīng)時(shí)間無(wú)要求的中、大型應(yīng)用。舉例:后臺(tái)處理、科學(xué)計(jì)算。
-- 缺點(diǎn):垃圾收集過(guò)程中應(yīng)用響應(yīng)時(shí)間可能加長(zhǎng)。
并發(fā)處理器:
-- 適用情況:“對(duì)響應(yīng)時(shí)間有高要求”,多CPU,對(duì)應(yīng)用響應(yīng)時(shí)間有較高要求的中、大型應(yīng)用。舉例:Web服務(wù)器/應(yīng)用服務(wù)器、電信交換、集成開(kāi)發(fā)環(huán)境。
以下配置主要針對(duì)分代垃圾回收算法而言。
堆大小設(shè)置
年輕代的設(shè)置很關(guān)鍵
JVM中最大堆大小有三方面限制:相關(guān)操作系統(tǒng)的數(shù)據(jù)模型(32-bit 還是64-bit)限制;系統(tǒng)的可用虛擬內(nèi)存限制;系統(tǒng)的可用物理內(nèi)存限制。32位系統(tǒng)下,一般限制在1.5G~2G;64位操作系統(tǒng)對(duì)內(nèi)存無(wú)限制。在Windows Server 2003系統(tǒng),3.5G物理內(nèi)存,JDK5.0下測(cè)試,最大可設(shè)置為1478m。
典型設(shè)置:
java -Xmx3550m -Xms3550m -Xmn2g -Xss128k
-Xmx3550m:設(shè)置JVM最大可用內(nèi)存為3550m。
-Xms3550m:設(shè)置JVM初始內(nèi)存為3550m。此值可以設(shè)置與 -Xmx 相同,以避免每次垃圾回收完成后JVM重新分配內(nèi)存。
-Xmn2g:設(shè)置年輕代大小為2G。整個(gè)堆大小=年輕代大小+年老代大小+持久代大小。持久代一般固定大小為64m,所以增大年輕代后,將會(huì)減小年老代大小。此值對(duì)系統(tǒng)性能影響較大,Sun官方推薦配置為整個(gè)堆的3/8。
-Xss128k:設(shè)置每個(gè)線(xiàn)程的堆棧大小。JDK5.0以后每個(gè)線(xiàn)程堆棧大小為1M,以前每個(gè)線(xiàn)程堆棧大小為256k。根據(jù)應(yīng)用的線(xiàn)程所需內(nèi)存大小進(jìn)行調(diào)整。在相同物理內(nèi)存下,減小這個(gè)值能生成更多的線(xiàn)程。但是操作系統(tǒng)對(duì)一個(gè)進(jìn)程內(nèi)的線(xiàn)程數(shù)還是有限制的,不能無(wú)限生成,經(jīng)驗(yàn)值在3000~5000左右。
java -Xmx3550m -Xms3550m -Xss128k -XX:NewRatio=4 -XX:SurvivorRatio=4 -XX:MaxPermSize=16m -XX:MaxTenuringThreshold=0
-XX:NewRatio=4:設(shè)置年輕代(包括Eden和兩個(gè)Survivor區(qū))與年老代的比值(除去持久代)。設(shè)置為4,則年輕代與年老代所占比值為1:4,年輕代占整個(gè)堆棧的1/5。
-XX:SurvivorRatio=4:設(shè)置年輕代中Eden區(qū)與Survivor區(qū)的大小比值。設(shè)置為4,則兩個(gè)Survivor區(qū)與一個(gè)Eden區(qū)的比值為2:4,一個(gè)Survivor區(qū)占整個(gè)年輕代的1/6。
-XX:MaxPermSize=16m:設(shè)置持久代大小為16m。
-XX:MaxTenuringThreshold=0:設(shè)置垃圾最大年齡。如果設(shè)置為0的話(huà),則年輕代對(duì)象不經(jīng)過(guò)Survivor區(qū),直接進(jìn)入年老代。對(duì)于年老代比較多的應(yīng)用,可以提高效率。如果此值設(shè)置為一個(gè)較大值,則年輕代對(duì)象會(huì)在Survivor區(qū)進(jìn)行多次復(fù)制,這樣可以增加對(duì)象在年輕代的存活時(shí)間,增加在年輕代被回收的概率。
回收器選擇
JVM給了三種選擇:串行收集器、并行收集器、并發(fā)收集器,但是串行收集器只適用于小數(shù)據(jù)量的情況,所以這里的選擇主要針對(duì)并行收集器和并發(fā)收集器。默認(rèn)情況下,JDK5.0以前都是使用串行收集器,如果想使用其他收集器需要在啟動(dòng)的時(shí)候加入相應(yīng)參數(shù)。JDK5.0以后,JVM會(huì)根據(jù)當(dāng)前系統(tǒng)配置進(jìn)行判斷。
吞吐量?jī)?yōu)先的并行收集器
如上文所述,并行收集器主要以到達(dá)一定的吞吐量為目標(biāo),適用于科學(xué)計(jì)算和后臺(tái)處理等。
典型配置:
java -Xmx3800m -Xms3800m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:ParallelGCThreads=20
-XX:+UseParallelGC:選擇垃圾收集器為并行收集器。此配置僅對(duì)年輕代有效。即上述配置下,年輕代使用并發(fā)收集,而年老代仍舊使用串行收集。
-XX:+ParallelGCThreads=20:配置并行收集器的線(xiàn)程數(shù),即:同時(shí)多少個(gè)線(xiàn)程一起進(jìn)行垃圾回收。此值最好配置與處理器數(shù)目相等。
java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:ParallelGCThreads=20 -XX:+UseParallelOldGC
-XX:+UseParallelOldGC:配置年老代垃圾收集方式為并行收集。JDK6.0支持對(duì)年老代并行收集。
java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:MaxGCPauseMillis=100
-XX:MaxGCPauseMillis=100:設(shè)置每次年輕代垃圾回收的最長(zhǎng)時(shí)間,如果無(wú)法滿(mǎn)足此時(shí)間,JVM會(huì)自動(dòng)調(diào)整年輕代大小,以滿(mǎn)足此值。
java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:MaxGCPauseMillis=100 -XX:+UseAdaptiveSizePolicy
-XX:+UseAdaptiveSizePolicy:設(shè)置此選項(xiàng)后,并行收集器會(huì)自動(dòng)選擇年輕代區(qū)大小和相應(yīng)的Survivor區(qū)比例,以達(dá)到目標(biāo)系統(tǒng)規(guī)定的最低響應(yīng)時(shí)間或者收集頻率等,此值建議使用并行收集器時(shí),一直打開(kāi)。
響應(yīng)時(shí)間優(yōu)先的并發(fā)收集器
如上文所述,并發(fā)收集器主要是保證系統(tǒng)的響應(yīng)時(shí)間,減少垃圾收集時(shí)的停頓時(shí)間。適用于應(yīng)用服務(wù)器、電信領(lǐng)域等。
典型配置:
java -Xmx3550m -Xms3550 -Xmn2g -Xss128k -XX:ParallelGCThreads=20 -XX:+UseConcMarkSweepGC -XX:+UseParNewGC
-XX:+UseConcMarkSweepGC:設(shè)置年老代為并發(fā)收集。測(cè)試中配置這個(gè)以后,-XX:NewRatio=4的配置失效了,原因不明。所以,此時(shí)年輕代大小最好用-Xmn設(shè)置。
-XX:+UseParNewGC:設(shè)置年輕代為并行收集。可與CMS收集同時(shí)使用。JDK5.0以上,JVM會(huì)根據(jù)系統(tǒng)配置自行設(shè)置,所以無(wú)需再設(shè)置此值。
java -Xmx3550m -Xms3550 -Xmn2g -Xss128k -XX:+UseConcMarkSweepGC -XX:CMSFullGCsBeforeCompaction=5 -XX:+UseCMSCompactAtFullCollection
-XX:CMSFullGCsBeforeCompaction:由于并發(fā)收集器不對(duì)內(nèi)存空間進(jìn)行壓縮、整理,所以運(yùn)行一段時(shí)間后會(huì)產(chǎn)生“碎片”,使得運(yùn)行效率降低。此值設(shè)置運(yùn)行多少次GC以后對(duì)內(nèi)存空間進(jìn)行壓縮、整理。
-XX:+UseCMSCompactAtFullCollection:打開(kāi)對(duì)年老代的壓縮??赡軙?huì)影響性能,但是可以消除碎片。
常見(jiàn)配置匯總
堆設(shè)置
-Xms:初始堆大小
-Xmx:最大堆大小
-XX:NewSize=n:設(shè)置年輕代大小
-XX:NewRatio=n:設(shè)置年輕代和年老代的比值。如:為3,表示年輕代與年老代比值為1:3,表示Eden:Survivor=3:2,一個(gè)Survivor區(qū)占整個(gè)年輕代的1/5。
-XX:MaxPermSize=n:設(shè)置持久代大小
收集器設(shè)置
-XX:+UseSerialGC:設(shè)置串行收集器
-XX:+UseParallelGC:設(shè)置并行收集器
-XX:+UseParalledlOldGC:設(shè)置并行年老代收集器
-XX:+UseConcMarkSweepGC:設(shè)置并發(fā)收集器
垃圾回收統(tǒng)計(jì)信息
-XX:+PrintGC
-XX:+PrintGCDetails
-XX:+PrintGCTimeStamps
-Xloggc:filename
并行收集器設(shè)置
-XX:ParallelGCThreads=n:設(shè)置并行收集器收集時(shí)使用的CPU數(shù)。并行收集線(xiàn)程數(shù)。
-XX:MaxGCPauseMillis=n:設(shè)置并行收集最大暫停時(shí)間
-XX:GCTimeRatio=n:設(shè)置垃圾回收時(shí)間占程序運(yùn)行時(shí)間的百分比。公式為1/(1+N)
并發(fā)收集器設(shè)置
-XX:+CMSIncrementalMode:設(shè)置為增量模式。適用于單CPU情況。
-XX:+ParallelGCThreads=n:設(shè)置并發(fā)收集器年輕代收集方式為并行收集時(shí),使用的CPU數(shù)。并行收集線(xiàn)程數(shù)。

浙公網(wǎng)安備 33010602011771號(hào)