日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

協(xié)方差通俗理解例子 協(xié)方差函數(shù)計(jì)算公式推導(dǎo)過程

今天是概率統(tǒng)計(jì)專題的第六篇,我們來看看方差相關(guān)的概念 。
方差的定義
方差在我們的日常生活當(dāng)中非常常見,它主要是為了提供樣本離群程度的描述 。舉個(gè)簡單的例子,我們?nèi)ベI一包薯片,一般來說一袋薯片當(dāng)中的數(shù)量是固定的 。我們假設(shè)平均每袋當(dāng)中都有50片薯片好了,即使是機(jī)器灌裝,也不可能做到每一袋都剛好是50片,或多或少都會(huì)有些誤差 。而均值則無法衡量這種誤差 。
如果現(xiàn)在有兩個(gè)薯片品牌,它們的口味都差不多,平均每袋也都是50片 。但是其中A品牌的薯片有一半是80片,還有一半是20片 。B品牌呢,99%都在45-55之間 。你說你會(huì)買哪一個(gè)牌子呢?(在不考慮通過稱重的情況下) 。
在現(xiàn)代社會(huì),凡是工廠出廠的產(chǎn)品,基本上都離不開方差這個(gè)概念 。方差越低,說明工廠的生產(chǎn)能力越強(qiáng),能夠做到每一個(gè)產(chǎn)品都很精細(xì),相反如果方差越大,則說明瑕疵很多,不夠精細(xì) 。也就是說,方差衡量的是樣本距離均值的期望 。
它本來應(yīng)該寫成:E|X – E(X)| 。
但是由于式子當(dāng)中存在絕對值,我們通常會(huì)對它平方,從而將絕對值消掉 。寫成:

協(xié)方差通俗理解例子 協(xié)方差函數(shù)計(jì)算公式推導(dǎo)過程


這里的E表示期望,這是統(tǒng)計(jì)學(xué)當(dāng)中的寫法,如果看不明白,我們也可以把式子展開寫成:
協(xié)方差通俗理解例子 協(xié)方差函數(shù)計(jì)算公式推導(dǎo)過程


這里的N表示的是樣本數(shù)量,X bar 是樣本的均值 。Var是英文variance的縮寫,我們也可以寫成D(X) 。
由于方差是通過平方計(jì)算得到的,我們也可以將它進(jìn)行開方,得到標(biāo)準(zhǔn)差 。根號D(X),也可以寫成σ(X) 。
方差的性質(zhì)
關(guān)于方差有幾個(gè)著名的性質(zhì),如果X是變量,而C是常數(shù) 。那么:
協(xié)方差通俗理解例子 協(xié)方差函數(shù)計(jì)算公式推導(dǎo)過程


也就是對于每一個(gè)變量都乘上一個(gè)常數(shù),那么整體的方差擴(kuò)大C的平方倍 。這個(gè)很好理解,因?yàn)闃颖局禂U(kuò)大了C倍,由于我們在計(jì)算方差的時(shí)候用到了平方,那么自然就是擴(kuò)大了C的平方倍 。我們利用上面展開的公式代入可以很容易得到證明 。
下一個(gè)性質(zhì)是:
協(xié)方差通俗理解例子 協(xié)方差函數(shù)計(jì)算公式推導(dǎo)過程


也就是全體樣本加上一個(gè)常數(shù),整體的方差不變 。如果我們的樣本不是一個(gè)值,而是一個(gè)向量的話,那么這個(gè)公式可以拓展成樣本加上一個(gè)常數(shù)向量,樣本的方差保持不變 。這個(gè)也很好理解,樣本加上一個(gè)常數(shù)向量,相當(dāng)于整體朝著向量的方向移動(dòng)了一個(gè)距離,對于整體的分布并不會(huì)影響 。
如果某個(gè)樣本X的方差為0,那么說明樣本內(nèi)只有一個(gè)值 。
下面一個(gè)性質(zhì)稍微復(fù)雜一點(diǎn):
協(xié)方差通俗理解例子 協(xié)方差函數(shù)計(jì)算公式推導(dǎo)過程


也就是說方差等于樣本平方的期望減去樣本期望的平方,我們光從定義上很難得出這個(gè)結(jié)論,需要通過嚴(yán)謹(jǐn)?shù)耐茖?dǎo):
協(xié)方差通俗理解例子 協(xié)方差函數(shù)計(jì)算公式推導(dǎo)過程


在有些時(shí)候,我們直接求解樣本的方差不太方便,而求解平方的期望很容易,這個(gè)時(shí)候我們可以考慮使用這個(gè)公式進(jìn)行代換 。
方差與協(xié)方差
方差我們一般不直接在機(jī)器學(xué)習(xí)當(dāng)中進(jìn)行使用,更多的時(shí)候是用在特征分析當(dāng)中,查看特征的方差來感知它的離散情況,決定要不要對特征進(jìn)行一些處理 。因?yàn)閷τ谝恍┠P蛠碚f,如果特征的方差過大,那么模型可能很難收斂,或者是收斂的效果可能會(huì)受到影響 。這個(gè)時(shí)候往往需要考慮使用一些方法對特征值進(jìn)行標(biāo)準(zhǔn)化處理 。

推薦閱讀