斯坦?!靖怕逝c統(tǒng)計(jì)】課程筆記(四):EDA | 莖葉圖
莖葉圖的只做方法如下:
- 將每個(gè)數(shù)字分成莖和葉
- 對(duì)所有莖排序,并縱向從小到大放置好
- 對(duì)相同莖下的葉歸到一起并排序,垂直于莖的排列方向放置好
舉個(gè)例子:我們有一份奧斯卡影后的年齡集合:
34 34 27 37 42 41 36 32 41 33 31 74 33 49 38 61 21 41 26 80 42 29 33 36 45 49 39 34 26 25 33 35 35 28 30 29 61 32 33 45 29 62 22 44
按照上述方法做出莖葉圖:

- 上圖中,先分析了一下年齡的數(shù)字,將個(gè)位數(shù)作為葉子,個(gè)位數(shù)之外的部分作為莖,所以莖的集合是:2、3、4、5、6、7、8;葉子的集合是所有個(gè)位數(shù)
- 莖集合排序后垂直排列好,右側(cè)畫一條直線,以便和葉子區(qū)分
- 每個(gè)莖下面的葉子從小到大排序,并垂直于莖的方向放置后(上圖1和2)
上圖的3的意思是:一些軟件如果發(fā)現(xiàn)莖下面葉子高度過(guò)大,會(huì)將每個(gè)莖劈成兩半放置,其下面的葉子的0-4給子莖1,5-9給子莖2(其實(shí)就是進(jìn)一步細(xì)分,用直方圖類比就是:之前是每10歲作為一個(gè)group,后來(lái)變成每5歲作為一個(gè)group了,類比一下就應(yīng)該很容易理解)
莖葉圖和直方圖有一點(diǎn)類似,但其比直方圖好的一個(gè)點(diǎn)是:直方圖實(shí)際上損失了一些詳細(xì)信息(比如把21、22、25、26、27都?xì)w結(jié)成[20, 30)這個(gè)group后,就只知道這個(gè)group下面的樣本個(gè)數(shù),而不知道實(shí)際每個(gè)樣本的真實(shí)值了);而莖葉圖保留了每個(gè)樣本的真實(shí)值。
但莖葉圖也有不好的地方:其制作比較復(fù)雜,一般只能用在小規(guī)模的數(shù)據(jù)集合上。
另外還有一種和莖葉圖類似的圖:dotplot(點(diǎn)狀圖)

其就是把莖葉圖中的實(shí)際值變成了點(diǎn)

浙公網(wǎng)安備 33010602011771號(hào)