斯坦福【概率與統計】課程筆記(六):EDA | 標準差和方差
這一篇比較簡單,就不展開記錄了,方差和標準差的計算方法記住了就可以。
- 計算mean
- 計算每個樣本與mean的差值的平方,將其累加后除以(樣本數-1)【注:這里的除數可以是n-1也可以是n】,即得到方差
- 方差開根號,即得到標準差
另外,記得標準差和方差都是衡量樣本集中程度的,方差或標準差越大,樣本越向兩邊離散;方差或標準差越小,樣本越向mean集中。
標準差在對稱分布下面,有幾個在統計學上非常有用的數字:68%,95%,99.7%,意思是:
- 用median和標準差stdDev(下面簡稱SD)的1倍、2倍、3倍值,將整個分布分成8份
- 68%的樣本都會落在-1SD 到 +1SD之間
- 95%的樣本都會落在-2SD 到 +2SD之間
- 99.7%的樣本都會落在-3SD 到 +3SD之間
- < -3SD和>+3SD的兩部分,加起來只有0.3%的樣本會分布到那里
舉個例子:

這3個經驗數據會用在非常多的領域:金融、IT、項目管理等等都會直接使用,他們省去了很多繁瑣計算的過程
靠上述這種劃分和統計方法,在大部分不需要很精確計算的場景下,直接套用來評估就可以了

浙公網安備 33010602011771號