第一篇:04 第四節 大數定理與中心極限定理
第四節 大數定理與中心極限定理
概率論與數理統計是研究隨機現象統計規律性的學科.而隨機現象的規律性在相同的條件下進行大量重復試驗時會呈現某種穩定性.例如, 大量的拋擲硬幣的隨機試驗中, 正面出現頻率;在大量文字資料中, 字母使用頻率;工廠大量生產某種產品過程中, 產品的廢品率等.一般地, 要從隨機現象中去尋求事件內在的必然規律, 就要研究大量隨機現象的問題.在生產實踐中, 人們還認識到大量試驗數據、測量數據的算術平均值也具有穩定性.這種穩定性就是我們將要討論的大數定律的客觀背景.在這一節中,我們將介紹有關隨機變量序列的最基本的兩類極限定理----大數定理和中心極限定理.內容分布圖示
★大數定理的引入 ★切比雪夫不等式
★例1
★例2 ★大數定理
★中心極限定理的引入 ★林德伯格—勒維定理
★例3 ★例6
★推論
大數定理
★棣莫佛—拉普拉斯定理 ★例4
★例5 ★例7
★例8 ★高爾頓釘板試驗
中心極限定理
★內容小結
★課堂練習★習題4-4
內容要點:
一、依概率收斂
與微積分學中的收斂性的概念類似, 在概率論中, 我們要考慮隨機變量序列的收斂性.定義
1設X1,X2,?,Xn,?是一個隨機變量序列, a為一個常數,若對于任意給定的正數?,有 limP{|Xn?a|??}?1, 則稱序列X1,X2,?,Xn,?依概率收斂于a, 記為
n??Xn???aP(n??).PP定理1 設Xn???a,Yn???b,又設函數g(x,y)在點(a,b)連續, 則
g(Xn,Yn)???g(a,b).P
二、切比雪夫不等式
定理2設隨機變量X有期望E(X)??和方差D(X)??2,則對于任給??0, 有
P{|X??|??}???22.上述不等式稱切比雪夫不等式.注:(i)由切比雪夫不等式可以看出,若?2越小, 則事件
{|X?E(X)|??} 的概率越大, 即, 隨機變量X集中在期望附近的可能性越大.由此可見方差刻劃了隨機變量取值的離散程度.(ii)當方差已知時,切比雪夫不等式給出了X與它的期望的偏差不小于?的概率的估計式.如取??3?, 則有
P{|X?E(X)|?3?}??9?22?0.111.故對任給的分布,只要期望和方差?2存在, 則隨機變量X取值偏離E(X)超過3?的概率小于0.111.三、大數定理 1.切比雪夫大數定律
定理3(切比雪夫大數定律)設X1,X2,?,Xn,?是兩兩不相關的隨機變量序列,它們數學期望和方差均存在, 且方差有共同的上界, 即D(Xi)?K,i?1,2,?, 則對任意??0, 有
??1limP?n????nn?i?1Xi?1nn?i?1??E(Xi)????
1??1nn注: 定理表明: 當n很大時,隨機變量序列{Xn}的算術平均值學期望
2.伯努利大數定理 1nn?i?1Xi依概率收斂于其數?E(X).ii?1定理4(伯努利大數定律)設nA是n重伯努利試驗中事件A發生的次數, p是事件A在每次試驗中發生的概率, 則對任意的??0, 有
?n??n?limP?A?p????1
或 limP?A?p????0.n??n???n??n?注:(i)伯努利大數定律是定理1的推論的一種特例, 它表明: 當重復試驗次數n充分大時, 事件A發生的頻率nAn依概率收斂于事件A發生的概率p.定理以嚴格的數學形式表達了頻率的穩定性.在實際應用中, 當試驗次數很大時,便可以用事件發生的頻率來近似代替事件的概率.(ii)如果事件A的概率很小,則由伯努利大數定律知事件A發生的頻率也是很小的,或者說事件A很少發生.即“概率很小的隨機事件在個別試驗中幾乎不會發生”,這一原理稱為小概率原理,它的實際應用很廣泛.但應注意到,小概率事件與不可能事件是有區別的.在多次試驗中,小概率事件也可能發生.3.辛欽大數定理
定理5(辛欽大數定律)設隨機變量X1,X2,?,Xn,?相互獨立, 服從同一分布,且具有數學期望E(Xi)??,i?1,2,?, 則對任意??0, 有
?1limP?n???nn?i?1?Xi??????1.?注:(i)定理不要求隨機變量的方差存在;
(ii)伯努利大數定律是辛欽大數定律的特殊情況;
(iii)辛欽大數定律為尋找隨機變量的期望值提供了一條實際可行的途徑.例如, 要估計某地區的平均畝產量, 可收割某些有代表性的地塊, 如n塊,計算其平均畝產量, 則當n較大時,可用它作為整個地區平均畝產量的一個估計.此類做法在實際應用中具有重要意義.四、中心極限定理
在實際問題中, 許多隨機現象是由大量相互獨立的隨機因素綜合影響所形成, 其中每一個因素在總的影響中所起的作用是微小的.這類隨機變量一般都服從或近似服從正態分布.以一門大炮的射程為例, 影響大炮的射程的隨機因素包括: 大炮炮身結構的制造導致的誤差, 炮彈及炮彈內炸藥在質量上的誤差, 瞄準時的誤差, 受風速、風向的干擾而造成的誤差等.其中每一種誤差造成的影響在總的影響中所起的作用是微小的, 并且可以看成是相互獨立的, 人們關心的是這眾多誤差因素對大炮射程所造成的總影響.因此需要討論大量獨立隨機變量和的問題.中心極限定理回答了大量獨立隨機變量和的近似分布問題, 其結論表明: 當一個量受許多隨機因素(主導因素除外)的共同影響而隨機取值, 則它的分布就近似服從正態分布.1.林德伯格—勒維定理
定理6(林德伯格—勒維)設X1,X2,?,Xn,?是獨立同分布的隨機變量序列, 且
E(Xi)??,D(Xi)??,i?1,2,?,n,?2
則
?n???Xi?n???i?1?limP??x??n???n?????????x12?e?t2/2dt
注: 定理6表明: 當n充分大時, n個具有期望和方差的獨立同分布的隨機變量之和近似服從正態分布.雖然在一般情況下, 我們很難求出X1?X2???Xn的分布的確切形式, 但當n很大時, 可求出其近似分布.由定理結論有
n?i?1Xi?n?n1近似n?~N(0,1)?n?i?1Xi??n近似?/~N(0,1)?X~N(?,?22/n),X?1nn?i?1Xi.故定理又可表述為: 均值為?, 方差的??0的獨立同分布的隨機變量X1,X2,?,Xn,?的算術平均值X, 當n充分大時近似地服從均值為?,方差為?2/n的正態分布.這一結果是數理統計中大樣本統計推斷的理論基礎.2.棣莫佛—拉普拉斯定理
在第二章中,作為二項分布的正態近似,我們曾經介紹了棣莫佛—拉普拉斯定理,這里再次給出,并利用上述中心極限定理證明之.定理7(棣莫佛—拉普拉斯定理)設隨機變量Yn服從參數n,p(0?p?1)的二項分布, 則對任意x, 有
???Yn?np?limP??x??n?????np(1?p)????x12?e?t22dt??(x)
注: 易見,棣莫佛—拉普拉斯定理就是林德伯格—勒維定理的一個特殊情況.3.用頻率估計概率的誤差
設?n為n重貝努里試驗中事件A發生的頻率, p為每次試驗中事件A發生的概率,q?1?p,由棣莫佛—拉普拉斯定理,有
???n??P??p????P?????n?????npq??n?npnpq??n??? pq??n???1.pq??
?????n????????pq????n???2????pq???這個關系式可用解決用頻率估計概率的計算問題:
4.李雅普諾夫定理
定理8(李雅普諾夫定理)設隨機變量X1,X2,?,Xn,? 相互獨立, 它們具有數學期望
n和方差: E(Xk)??k,n??時, D(Xk)??2k?0,i?1,2,?,記B?2n??.若存在正數?, 使得當
k?12k1Bn2??nn?E{|k?1Xk??k|2??}?0,則隨機變量之和?Xk的標準化變量: k?1n?Zn?k?1?n?Xk?E?X??k???k?1???D?X??k???k?1?nnnk?X?k?1?Bn??k?1k 的分布函數Fn(x)對于任意x, 滿足
nn??X??k??k??k?1k?1limFn(x)?limP??x??n??n??Bn????x???12?e?t/22dt??(x).注:定理8表明, 在定理的條件下, 隨機變量
nn?Zn?k?1Xk?Bn??k?1k.nn當n很大時,近似地服從正態分布N(0,1).由此, 當n很大時,?Xk?BnZn???k近似地服
k?1k?1?n?2?.這就是說,無論各個隨機變量Xk(k?1,2,?)服從什么分布,只要滿從正態分布N??,B??kn??k?1?n足定理的條件,那么它們的和?Xk當n很大時,就近似地服從正態分布.這就是為什么正態隨
k?1機變量在概率論中占有重要地位的一個基本原因.在很多問題中,所考慮的隨機變量可以表示成很多個獨立的隨機變量之和,例如,在任一指定時刻,一個城市的耗電量是大量用戶耗電量的總和;一個物理實驗的測量誤差是由許多觀察不到的、可加的微小誤差所合成的,它們往往近似地服從正態分布.例題選講:
切比雪夫不等式
例1(講義例1)已知正常男性成人血液中, 每一毫升白細胞數平均是7300, 均方差是700.利用切比雪夫不等式估計每毫升白細胞數在5200~9400之間的概率.解 設每毫升白細胞數為X, 依題意, ??7300,?2?7002,P{5200?X?9400}?P{5200?7300?X?7300?9400?7300}
?P{?2100?X???2100}?P{|X??|?2100}.所求概率為
由切比雪夫不等式
P{|X??|?2100}?1??222/(2100)?1?(700/2100)?1?1/9?8/9,即每毫升白細胞數在5200 ~ 9400之間的概率不小于8/9.例2 在每次試驗中, 事件A發生的概率為0.75, 利用切比雪夫不等式求: 事件A出現的頻率在0.74~0.76之間的概率至少為0.90? 解 設X為次試驗中, 事件A出現的次數, 則
X~b(n,0.75), ??0.75n, ?2?0.75?0.25n?0.1875n,所求為滿足P{0.74?X/n?0.76}?0.90的最小的n.P{0.74?X/n?0.76}可改寫為
P{0.74n?X?0.76n}?P{?0.01n?X?0.75n?0.01n}?P{|X??|?0.01n}
在切比雪夫不等式中取??0.01n, 則
P{0.74?X/n?0.76}?P{|X??|?0.01n}?1??22/(0.01n)2
?1?0.1875n/0.0001n?1?1875/n
依題意, 取n使1?1875/n?0.9, 解得
n?1875/(1?0.9)?1875,0 即n取18750 時, 可以使得在n次獨立重復試驗中, 事件A出現的頻率在0.74~0.76之間的概率至少為 0.90.中心極限定理
例3(講義例2)
一盒同型號螺絲釘共有100個, 已知該型號的螺絲釘的重量是一個隨機變量, 期望值是100g, 標準差是10g, 求一盒螺絲釘的重量超過10.2kg的概率.解 設為第i個螺絲釘的重量, i?1,2,?,100,100且它們之間獨立同分布, 于是一盒螺絲釘的重量為X??Xi?1i,且由??E(Xi)?100,??D(Xi)?10,n?100,知E(X)?100?E(Xi)?10000,由中心極限定理有
???P{X?10200}?P????nD(X)?100,?i?1Xi?n??n??10200?n???X?10000??p???n100?????10200?10000??
100??X?10000??X?10000??P??2??1?P??2?
100100?????1??(2)?1?0.97725?0.02275.例4(講義例3)計算機在進行數學計算時, 遵從四舍五入原則.為簡單計.現在對小數點后面第一位進行舍入運算, 則誤差X可以認為服從[?0.5,0.5]上的均勻分布.若在一項計算中進行了100次數字計算, 求平均誤差落在區間[?3/20,3/20]上的概率.解 n?100, 用Xi表示第i次運算中產生的誤差.相互獨立, 都服從[?0.5,0.5]上的均勻分布, X1,X2,?,X100且E(Xi)?0,var(Xi)?1/12,i?1,2,?,100, 從而
Y100??100i?1Xi?100?0100/12?35100?i?1近似Xi~N(0,1).故平均誤差X?1100100?i?1?33?,Xi落在???2020????上的概率為
??33?31???P???X??P????20?100???20??20100?i?1Xi?3???20??
?3??P??3?5??100?i?1??Xi?3???(3)??(?3)?0.9973.??
例5(講義例4)某公司有200名員工參加一種資格證書考試.按往年經驗考試通過率為0.8,試計算這200名員工至少有150人考試通過的概率.解 ?1,令1??0,第i人通過考試第i人未通過考試,i?1,2,?,200,依題意,P{Xi?1}?0.8,np?200?0.8?160,np(1?p)?32.?200i?1Xi是考試通過人數, 由中心極限定理4, 得
P{?Xi??X?160?/32~N(0,1),?150}?P{??X?160?/32}??150?160?/200近似i?1i200ii32
?P{??200i?1Xi?160/?32??1.77}
1??(?1.77)??(1.77)?0.96, 即至少有150名員工通過這種考試的概率為0.96.例6(講義例5)某市保險公司開辦一年人身保險業務, 被保險人每年需交付保險費160元, 若一年內發生重大人身事故, 其本人或家屬可獲2萬元賠金.已知該市人員一年內發生重大人身事故的概率為0.005, 現有5000人參加此項保險, 問保險公司一年內從此項業務所得到的總收益在20萬到40萬元之間的概率是多少? 解 記Xi???1,若第i個被保險人發生重大事?0,若第i個被保險人未發生重大故事故(i?1,2,?,5000)
于是Xi均服從參數為p?0.005的兩點分布, 且p{Xi?1}?0.005,np?25.?5000i?1Xi是5000個被保險人中一年內發生重大人身事故的人數, 保險公司一年內從此
5000i?1項業務所得到的總收益為0.016?5000?2??于是
Xi萬元.5000??????P?20?0.016?5000?2Xi?40??P?20????i?1???5000??i?1??Xi?30???
???P???20?2525?0.995??5000i?1Xi?2525?0.995??????(1)??(?1)?0.6826
25?0.995??30?25 例7 對于一個學校而言, 來參加家長會的家長人數是一個隨機變量, 設一個學生無家長, 1名家長, 2名家長來參加會議的概率分別0.05, 0.8, 0.15.若學校共有400名學生, 設各學生參加會議的家長數相互獨立, 且服從同一分布.求參加會議的家長數X超過450的概率.解 以Xk(k?1,2,?,400)記第k個學生來參加會議的家長數, 則Xk的分布律為
Xkpk00.0510.820.15
400易知E(Xk)?1.1,D(Xk)?0.19,k?1,2,?,400, 而X??Xk?1k,由定理3, 隨機變量
400?Xk?1k?400?1.1?X?400?1.14000.190.19近似~400N(0,1), 故
?X?400?1.1450?400?1.1?P{X?450}?P???
4000.19??4000.19?X?400?1.1??1?P??1.147?
?4000.19??1??(1.147)?0.1357.例8 設有1000人獨立行動, 每個人能夠按時進入掩蔽體的概率為0.9.以95%概率估計, 在一次行動中, 至少有多少人能進入掩蔽體.解 用Xi表示第i人能夠按時進入掩蔽體, 令Sn?X1?X2???X1000.設至少有m人能進入掩蔽體, 則要求
P{m?Sn}?0.95,Sn?90090 {m?Sn}???m?1000?0.9?1000?0.9?0.1?Sn?900?? 90?近似由中心極限定理, 有
~N(0,1), 所以
?m?900?Sn?900S?900?m?900?P{m?Sn}?P??n?1?P????
90909090????查正態分布數值表, 得
m?90090??1.65, 故m?900?15.65?884.35?884人.課堂練習
某地有甲、乙兩個電影院競爭當地每天的1000名觀眾, 觀眾選擇電影院是獨立的和隨機的.問: 每個電影院至少應設有多少個座位, 才能保證觀眾因缺少座位而離去的概率小于1%?
第二篇:第五章、大數定律與中心極限定理
第五章、大數定律與中心極限定理
一、選擇題:
1.若隨機變量X的數學期望與方差分別為EX =1,DX = 0.1,根據切比雪夫不等式,一定有()
A.P{?1?X?1}?0.9B.P{0?x?2}?0.9
C.P{?1?X?1}?0.9D.P{0?x?2}?0.9
2.設X1,X2,?X9相互獨立,EXi?1,DXi?1(i?1,2,?9),根據切比雪夫不等式,???1有()
A.P{?xi?1??}?1??B.P{?xi?1??}?1???2 9i?1i?1?29
C.P{?2D. x?9??}?1??P{x?9??}?1?9??i?i?
2i?1i?199
3.若X1、X2、2?1000即都?X1000為獨立同分布的隨機變量,且Xi~B(1,p)i?
1、服從參數為p的0-1分布,則()不正確
100011000
A.Xi?PB.?Xi~B(1000、P)?1000i?1i?
11000
C.P{a??X
i?1i?b}??(b)??(a)
1000
D
.P{a??Xi?b}??i?1?? 1,根據切比雪夫不等式,164.設隨機變量X的數學期望EX = 1,且滿足P{X?1?2}?
X的方差必滿足()
11B.DX? 16
41C.DX?D.DX?1 2A.DX?
5.設隨機變量X的數學期望EX = 1,方差DX = 1,且滿足P{X?1??}?1,根據切16
比雪夫不等式,則?應滿足()
A.??4B.??4
C.??
11D.?? 44
二、填空題:
1.若隨機變量X的數學期望與方差分別為EX = 1,DX = 1,且 P{X?1??}?
切比雪夫不等式,?應滿足。
2.若隨機變量X的數學期望與方差均存在,且EX = 1,P{X?1?1}?
夫不等式,DX應滿足。
3.設X1,X2,?,X9相互獨立,且EXi?1,DXi?1,i?1、2、?9,根據切比雪夫不等式,則???0有P{1,根據41,根據切比雪4?X
i?19i?9??}?。
4.設X1,X2,?,X9相互獨立,且EXi?1,DXi?1,i?1、2、?9,根據切比雪夫不等式,19
則???0有P?Xi?1??}? 9i?
1三、計算題:
1.計算機進行加法計算時,把每個加數取為最接近它的整數來計算。設所有的取整誤差是
相互獨立的隨機變量,并且都在[-0.5,0.5]上服從均勻分布,求:300個數相加時誤差總和的絕對值小于10的概率。
(附:?(1)?0.8413,?(2)?0.9772,?(3)?0.99865,?(4)?0.99968)
2. 一顆螺絲釘的重量是一個隨機變量,期望值是1兩,標準差是0.1兩.求一盒
(100個)同型號螺絲釘的重量超過10.2斤的概率.(附:?(1)?0.8413,?(2)?0.9772,?(3)?0.99865,?(4)?0.99968)
3.已知一本1000頁的書中每頁印刷錯誤的個數服從泊松分布P(0.1),求這本書的印刷錯
誤總數大于120的概率。
(附:?(1)?0.8413,?(2)?0.9772,?(3)?0.99865,?(4)?0.99968)
4.據以往經驗,某種電器元件的壽命服從均值為100小時的指數分布,現隨機地取25只,設他們的壽命是互相獨立的,求這25只元件的壽命總和大于3000小時的概率。
(附:?(1)?0.8413,?(2)?0.9772,?(3)?0.99865,?(4)?0.99968)
第三篇:大數定律與中心極限定理的若干應用
大數定律與中心極限定理的若干應用
摘要:在概率論中,大數定律是比較重要的內容,他主要就是以嚴格的數學形式來表達概率中隨機現象的性質,也是一定穩定性的表現。大數定律在數學的應用中比較重要,一般都是利用大數定律和中心極限定理一起來應用。本文根據在不同的條件下存在的大數定律和中心極限定理做了具體的分析,對幾種比較常見的大數定律進行了介紹,結合他們條件的不同,分析了不同數學模型的特定,并在各個領域應列舉它們的應用。這也是將理論具體化的一種表現形式,使得大數定律與中心極限定理在實際的生活中應用更加廣泛,應用價值更深一層。關鍵詞:大數定律;中心極限定理;應用;范圍 1前言
大數定律是概率歷史上第一個極限定理。由于隨機變量序列向常數的收斂有多種不同的形式,按其收斂為依概率收斂,以概率 1 收斂或均方收斂,分別有弱大數定律、強大數定律和均方大數定律。常見的大數定律有伯努利大數定理、辛欽大數定律、重對數定理等等。中心極限定理是是概率論中討論隨機變量序列部分和的分布漸近于正態分布的一類定理。這組定理是數理統計學和誤差分析的理論基礎,指出了大量隨機變量近似服從正態分布的條件。
概率理論是數理理論都是研究現實世界隨機現象的一種統計科學,大數定律與中心極限極限定理都是數學重要的組成部分,在自然學科與經濟發展中有著廣泛的應用,大數定律與中心極限定理都是重要定理,也是概率論與數理統計的一個樞紐中心,大數定律主要闡明的是平均結果具有穩定性,證明了在樣本的條件下,樣本平均值與總體平均值是一樣的,這也是算術平均值法則的基本理論,在現實的生活中,經常可以看到這樣的數據模型。取一個物體的平均值,一般都是反復測量的結果,當時測量結果在不斷增大時,算術平均值的偏差就會越來越小,也是1nn?i?1的偏差也是越來越小。這種思想貫穿在整個的概率理論中,并且占有著重要的左右,在其他的數學領域中占有著重要的地位,中心極限定理與大數定律相比就更加詳細,中心極限定理是在嚴格的數學形勢下闡明的條件,無論總體是怎樣分布,樣本的平均值都是呈正態的形式分布,中心極限定理也是以正態分布作為廣泛的理論基礎應用。目前無論是在國內還是在國外,大數定律與中心極限定理已經被廣泛的研究,尤其是在實際生活中的應用,銀行業就是根據中心極限定理來發展,而大數定律更是應用在保險行業,很多研究者在這個領域都研究了具有一定價值的成果。推廣大數定律與中心極限定理的應用問題是一個非常有研究價值的方向,通過這些問題來不斷的推廣,這樣不僅僅能夠加深大叔定理與中心極限定律的理解,并且很多問題也能夠加以解決。2相關定義定理以及應用 2.1相關定義
定義:設X1,X2,?,Xn,?是一個隨機變量序列,a是一個常數,若對于任意正數?,有limP?Xn?a????1,n??P則稱序列X1,X2,?,Xn,?依概率收斂于a.記為Xn???a.切比雪夫不等式
設隨機變量?具有有限的期望與方差,則對???0,有
P(??E(?)??)?D(?)?2或P(??E(?)??)?1?D(?)?2
證明:我們就連續性隨機變量的情況來證明。設?~p(x),則有
(x?E(?))2P(??E(?)??)??x?E(?)??p(x)dx??x?E(?)???D(?)2p(x)dx
?1?2?????(x?E(?))p(x)dx?2?2
該不等式表明:當D(?)很小時,P(??E(?)??)也很小,即?的取值偏離E(?)的可能性很小。這再次說明方差是描述?取值分散程度的一個量。
切比雪夫不等式常用來求在隨機變量分布未知,只知其期望和方差的情況下,事件{??E???}概率的下限估計;同時,在理論上切比雪夫不等式常作為其它定理證明的工具。
定理1(切比雪夫大數定律)
設{?n}是相互獨立的隨機變量序列,每一隨機變量都有有限的方差,且一致有界,即存在常數C,使D(?i)?ClimP{1nii?1,2,?,則對任意的??0,有n????ni?1?1niE(??ni?1)??}?0[即
??ni?11ni???E(p??ni?11ni)(n??)] 證明:由切比雪夫不等式知:???0,有:
n0?P{1nn??i?i?11n?nE(?i)??}?1i?1?2D(1nn?D?i?1i??i)?i?1n?22?nCn?22?Cn?2?0(n??)
該定理表明:當n很大時,隨機變量?1,?,?n的算術平均值ni1nn??i?1i接近于其數學期望E(??ni?11),這種接近是在概率意義下的接近。通俗的說,在定理的條件下,n個相互獨立的隨機變量算術平均值,在n無限增加時將幾乎變成一個常數。
推論:設?1,?,?n是相互獨立的隨機變量,由相同的數學期望和方差E(?i)??,D(?i)??2i?1,2,?,則???0,有
limP{n??1nn??i?1i????}?0(即
1ni??ni?1以概率收斂于?)
這個結論有很實際的意義:人們在進行精密測量時,為了減少隨機誤差,往往重復測量多次,測得若干實測值?1,?,?n,然后用其平均值
1ni??ni?1來代替?。
定理2(De Moivre-Laplace極限定理)(定理1的特殊情形)設?n(n?1,2,?)是n重Bernoulli試驗中成功的次數,已知每次試驗成功的概率為p?0?p?1?,則對?x?R,有 limP{n???n?npnpq?x}?12??e??xt?22dt???x?。
該定理也可改寫為:?a?b,有limP{a?n???n?npnpq?b}???b????a?
?1證明: 令?i???0第i次試驗出現成功第i次試驗不出現成功 則
{?i}為獨立同分布的隨機變量序列,且E?i?p,D?i?p(1?p)均存在
n顯然:?n???i,此時?n?i?1?n?npnpq
該定理為上定理的一個特殊情形,故由上定理該定理得證。2.2幾個大數定律的關系及適用場合
2.2.1伯努利定理是泊松定理的特例
泊松定理是指在一定的時間段內,平均若干次發生的時間,有的時候會多,有的時候會少,發生的次數是隨機的時間,這也使泊松分配。P(k,T)?(?T)ke
若是Pk=p,則泊松大數定理也就是伯努利大數定理,伯努利大數定理也完全證明了時間在完全相同的條件下進行重復的試機實驗,并且頻率比較穩定,隨著n的無限增大,n在試驗中葉氏趨近于穩定,與A出現的頻率的平均值比較接近。
2.2.2泊松大數定律是切比雪夫大數定律的特例
在泊松的大數定理的條件中,D??piqn?1,也能夠滿足切比雪夫大數定律的條件。
2.2.3切比雪夫大數定律是馬爾科夫大數定律的特例
在切比雪夫大數定律中,D?i?C(i?1,2,3,4.....),根據隨機變量序列兩兩不相關的性質可以了解到,1nnD(??i)?i?11n?ni?1D(?i)?cn????0,根據這樣的式子也能夠看出滿足馬爾可夫大數定
n??律的條件。由此可見,伯努利大數定律與泊松大數定律都是馬爾可夫大數定律的特例。伯努利大數定律也使辛欽大數定律的特別情況。在伯努利的大數定律中,由于隨機變量時可以變化的,則?n必然會是獨立分布的,并且都會服從伯努利分布的基本情況:p??i?1??p,p??i?0??q,并且E??i??p,所以這樣的公式必然會滿足辛欽大數定律的條件。但是辛欽大數定律并不是泊松大數定律與切比雪夫大數定律的推廣。2.2中心極限定理的基本關系
在實際問題中,常常需要考慮許多隨機因素所產生總影響.例如:炮彈射擊的落點與目標的偏差,就受著許多隨機因素的影響.如瞄準時的誤差,空氣阻力所產生的誤差,炮彈或炮身結構所引起的誤差等等.對我們來說重要的是這些隨機因素的總影響.中心極限定理,正是從理論上證明,對于大量的獨立隨機變量來說,只要每個隨機變量在總和中所占比重很小,那么不論其中各個隨機變量的分布函數是什么形狀,也不論它們是已知還是未知,而它們的和的分布函數必然和正態分布函數很近似。這就是為什么實際中遇到的隨機變量很多都服從正態分布的原因,也正因如此,正態分布在概率論和數理統計中占有極其重要的地位。中心極限定理也可以分為幾種情況:由于無窮個隨機變量之和可能趨于∞,故我們不研究n個隨機變量之和,本身而考慮它的標準化的隨機變量。
中心極限定理表明:在相當一般的條件下,當獨立隨機變量的個數增加時,其和的分布趨于正態分布。因此,只要和式中加項的個數充分大,就可以不必考慮和式中的隨機變量服從什么分布,都可以用正態分布來近似,這在應用上是有效的和重要的。
nn?Zn?k?1Xk?E(?Xk)k?1n的分布函數的極限.D(?Xk)k?1列維一林德伯格中心極限定理:設隨機變量相互獨立,服從同一分布,且有n,n,則隨機變量之和
n的標準?化變量Yn?i?1Xi?E(?Xi)i?1n?X?i?1i?n?的分布函數。
D(?Xi)i?1?n將n個觀測數據相加時,首先對小數部分按“四舍五入”舍去小數位后化為整數.試利用中心極限定理估計
(1)當n=1500時,舍入誤差之和的絕對值大于15的概率;
(2)n滿足何條件時,能以不小于0.90的概率使舍入誤差之和的絕對值小于10.這就可以根
n?據列維林德伯格中心極限定理來解決問題,當n充分大的時候,數據個數n應滿足條件:?|Sn|P{|Sn|?10}?P??n/12????0.90 ,即 2Φ(n/12?10i?1Xi?n?近似地?n~N(0,1),10n/12)?1?0.90 ,Φ(10n/12)?0.95 ,10n/12?1.645 ,n?443.5 ,當n<443時,才能夠保證誤差之后的絕對值小于10,概率不小于0.9。3定理的應用
3.1在生產生活中的應用 一生產線生產的產品成箱包裝,每箱的重量是隨機的,假設每箱的平均重50千克,標準差5千克.若用最大載重量為5噸的汽車承運,試利用中心極限定理說明每輛車最多可以裝多少箱,才能保證不超載的概率大于0.977.解答:設n為第i箱的重量(), Yn??Xi?1i由列維-林德伯格中心極限定理,有,近似地~?5000?50n?所以n必須滿足P{Yn?5000}?Φ???0.977?Φ(2),N(50n,25n),5n??1000?10nn也就是最多可以裝98箱.?2,? n?98.0199,(供電問題)某車間有200臺車床,在生產期間由于需要檢修、調換刀具、變換位置及調換零件等常需停車.設開工率為0.6, 并設每臺車床的工作是獨立的,且在開工時需電力1千瓦.問應供應多少瓦電力就能以99.9%的概率保證該車間不會因供電不足而影響生產? 解:某一時刻開動的車床數,X~B(200, 0.6),要求最小的k,使P{0?X?k}?0.999.由D-L近似地定理
? P{0?X?k}?Φ(k?npnpq)?Φ(0?npnpq,)X~N(np,npq),P{0?X?k}?Φ(k?npnpq)?Φ(0?npnpq)?Φ(k?12048)?Φ(?12048)?Φ(k?12048)?0.999
所以若供電141.5千瓦,那么由于供電不足而影響生產的可能性不到0.001,相當于8小時內約有半分鐘受影響,這一般是允許的。
某產品次品率p = 0.05,試估計在1000件產品中次品數的概率.次品數X~B(1000,0.05),E(X)?np?1000?0.05?50,D(X)?np(1?p)?50?0.95?47.5,由棣莫弗-拉普拉斯中心極限定理,有:P{40?X?60}?Φ(60?5047.5)?Φ(40?5047.5)?2Φ(1.45)?1?0.853.次品數:X~B(1000,0.05),E(X)?np?1000?0.05?50,D(X)?np(1?p)?50?0.95?47.5,P{40?X?60}?Φ(60?5047.5)?Φ(40?5047.5)?2Φ(1.45)?1?0.853.若是使用切比雪夫的不等式來進行計算,P{40?X?60}?P{X?50?10}?1?47.5102?0.525.但是這樣的計算并不完整,有點過于保守。
3.2在數學分析中的應用
在一次試驗中事件A出現的概率為0.4,應至少進行多少次試驗,才能使事件A出現的頻率與概率之差在之間的概率不低于0.9 ?
解答:由中心極限定理知, Xn N(np, npq),P(Xnn?p?0.1)?P(Xn?npnpq?0.1npq)
?2Φ(0.1npq)?1?0.9? Φ(0.1npq)?0.95? 0.1npq?1.65? n?66.設第i次射擊得分為,則的分布律為
100E(Xi)?9.15,D(Xi)?1.227.由中心極限定理,?Xi N(915, 122.7)
i?1100? P{900??i?1Xi?930}?P{?1511.08??Xi?100122.7?1511.08}?2Φ(1.354)?1?2?0.9115?1?0.823.高爾頓(Galton)釘板試驗:
如下圖中每一黑點表示釘在板上的一顆釘子,它們彼此的距離均相等,上一層的每一顆的水平位置恰好位于下一層的兩顆正中間。從入口處放進一個直徑略小于兩
顆釘子之間的距離的小圓玻璃球,當小圓球向下降落過程中,碰到釘子后皆以1/2的概率向左或向右滾下,于是又碰到下一層釘子。如此繼續下去,直到滾到底板的一個格子內為止。把許許多多同樣大小的小球不斷從入口處放下,只要球的數目相當大,它們在底板將堆成近似于正態 的密度函數圖形(即:中間高,兩頭低,呈左右對稱的古鐘型),其中 為釘子的層數。
令 量(表示某一個小球在第 次碰了釘子后向左或向右落下這一隨機現象相聯系的隨機變表示向右落下,表示向左落下),由題意,的分布列可設為下述形式:對
則有,對
令,其中 相互獨立。則 表示這個小球第 次碰釘后的位置。試驗表明近似地服從正態分布。
上述例子表明,需要研究相互獨立隨機變量和的極限分布是正態分布的問題,這是本章要介紹的中心極限定理刻畫的主要內容。這個問題的解決,對概率論在自然科學和技術應用中一個最重要的手段奠定了理論基礎,這一手段是把一個現象或過程看作是許多因素的獨立影響下出現的,而每一因素對該現象或過程所發生的影響都很小。如果我們關心的是該現象或過程的研究,則只要考慮這些因素的總作用就行了。
3.3在信息論中的應用
設在某保險公司有1萬個人參加投保,每人每年付120元保險費.在一年內一個人死亡的概率為0.006,死亡時其家屬可向保險公司領得1萬元,問:(1)該保險公司虧本的概率為多少?(2)該保險公司一年的利潤不少于40,60,80萬元的概率各是多少? 設一年內死亡的人數為X,則X?B(10000, 0.006),由D-L中心極限定理,(1)P{10000X?1200000}?P{X?120}
?P{X?npnpq?120?npnpq}?1?Φ(120?6060?0.994)?1?Φ(7.77)?0,通過計算可得到即該保險公司虧本的概率幾乎為0.2)P{1200000?10000X?400000}?P{X?80}?Φ(80?6060?0.994)?Φ(2.589)?0.995,P{1200000?10000X?600000}?P{X?60}?Φ(60?6060?0.994)?Φ(0)?0.5, P{1200000?10000X?800000}?P{X?40}?P{X?40}
?Φ(40?6060?0.994)?1?Φ(2.589)?0.005.假設生產線組裝每件成品的時間服從指數分布,統計資料表明每件成品的組裝時間平均為10分鐘.設各件產品的組裝時間相互獨立.(1)試求組裝100件成品需要15到20小時的概率;(2)以95%的概率在16小時內最多可以組裝多少件成品? 解答:設第i件組裝的時間為Xi分鐘,i=1,?,100.利用獨立同分布中心極限定理.100E(Xi)?10,D(Xi)?10,i?1,2,?,100,P{900?1002?i?1Xi?1200}
?P{900?100?10100?102??i?1Xi?100?10100?102?1200?100?10100?102}
100?P{900?100?10100?10n2??i?1Xi?100?10100?102?1200?100?10100?102}
?X0.95?P{i?1i?10n?960?10n100n100n}
?Φ(960?10n100n通過表可查的),960?10n100n?1.645,n?81.18,故最多可組裝81件成品。
Vk(k?1,2,?,20)20一加法器同時收到20個噪聲電壓,設它們是相互獨立的隨變量,且都
V?在區間(0,10)上服從均勻分布。記
?Vk?1k,求P(V?105)的近似值。
解:E(Vk)?5,D(Vk)?10012(k?1,2,?,20),由定理1,得 P(V?105?P(V?20?5(1012)20?105?20?5(1012)20)?P(V?100(1012)20V?100(10?0.387)
?1?P(12)20?0.387)
?1??(0.387)
?0.348
即有 P(V?105)?0.348
抽樣檢查產品質量時,如果發現次品多于10個,則拒絕接受這批產品,設某批產品的次品率為10%,問至少應抽取多少個產品檢查才能保證拒絕接受該產品的概率達到0.9?
解 設 為至少應抽取的產品數,為其中的次品數
則
拉斯定理,有,,由德莫佛-拉普
當 充分大時,4結語,隨著試驗次數的增加,事件發生的頻率逐漸穩定于某個常數,這一事實顯示了可以用一個數來表征事件發生的可能性大小,這使人們認識到概率是客觀存在的,進而由頻率的三條性質的啟發和抽象給出了概率的定義,而頻率的穩定性是概率定義的客觀基礎。在實踐中人們還認識到大量測量值的算術平均值也具有穩定性,而這種穩定性就是本節所要討論的大數定律的客觀背景,而這些理論正是概率論的理論基礎。
參考文獻 [1] 錢和平宋家樂.強混合鞅差序列部分和乘積的幾乎處處中心極限定理 [J].《中國科技信息》 2012年 第8期
[2] 羅中德.中心極限定理教學方法研究 [ J].《現代商貿工業》 2012年 第8期 [3] 馮鳳香.獨立隨機變量序列部分和乘積的幾乎處處中心極限定理 [J].《吉林大學學報:理學版》 2012年 第2期
[4] 許道云 秦永彬 劉長云.學習《概率論與數理統計》應該注意的若干問題(6)——極限性質及其應用 [J].《銅仁學院學報》 2011年 第6期
[5] 王丙參 魏艷華 林朱.大數定律及中心極限定理在保險中的應用 [ J].《通化師范學院學報》 2011年 第12期
[6] 任敏 張光輝.非同分布φ-混合序列部分和乘積的幾乎處處中心極限定理 [J].《黑龍江大學自然科學學報》 2011年 第6期
[7] 王媛媛.部分和乘積的幾乎處處中心極限定理 [J].《桂林理工大學學報》 2011年 第3期
[8] 張鑫.大數定理發展邊程初探 [ J].《科技信息》 2011年 第22期
[9] 陳曉材 吳群英 鄧光明 周德宏.不同分布φ^~混合序列的弱大數定理 [J].《平頂山學院學報》 2010年 第2期
第四篇:第五章 大數定律及中心極限定理
第五章
大數定律及中心極限定理
概率統計是研究隨機變量統計規律性的數學學科,而隨機現象的規律只有在對大量隨機現象的考察中才能顯現出來。研究大量隨機現象的統計規律,常常采用極限定理的形式去刻畫,由此導致對極限定理進行研究。極限定理的內容非常廣泛,本章中主要介紹大數定律與中心極限定理。
5.1 切比雪夫Chebyshev不等式
一個隨機變量離差平方的數學期望就是它的方差,而方差又是用來描述隨機變量取值的分散程度的。下面我們研究隨機變量的離差與方差之間的關系式。
定理5-1(切比雪夫不等式)設隨機變量X的期望E(X)及方差D(X)存在,則對任意小正數ε>0,有:
或:
[例5-1]設X是拋擲一枚骰子所出現的點數,若給定ε=2,2.5,實際計算P{|X-E(X)|≥ε},并驗證切比雪夫不等式成立。
解 X的分布律為
所以
當ε=2時,當ε=2.5時,可見,切比雪夫不等式成立。
[例5-2]設電站供電網有10 000盞燈,夜晚每一盞燈開燈的概率都是0.7,而假定所有電燈開或關是彼此獨立的。試用切比雪夫不等式估計夜晚同時開著的燈數在6 800~7 200的概率。
解:設X表示在夜晚同時開著的電燈的數目,它服從參數n=10 000,p=0.7的二項分布。于是有
E(X)=np=10 000×0.7=7 000,D(X)=npq=10 000×0.7×0.3=2100,P{6 800 可見,雖然有10 000盞燈,但是只要有供應7 000盞燈的電力就能夠以相當大的概率保證夠用。 [例5-3補充] 用切比雪夫不等式估計 解: 的三倍的可能性極 可見,隨機變量X取值與期望EX的差的絕對值大于其均方差小。 5.2 大數定律 在第一章中曾經提到過,事件發生的頻率具有穩定性,即隨著試驗次數增多,事件發生的頻率將逐漸穩定于一個確定的常數值附近。另外,人們在實踐中還認識到大量測量值的算術平均值也具有穩定性,即平均結果的穩定性。大數定律以嚴格的數學形式表示證明了在一定的條件下,大量重復出現的隨機現象呈現的統計規律性,即頻率的穩定性與平均結果的穩定性。 5.2.1 貝努利大數定律 定理5-2 設m是n次獨立重復試驗中事件A發生的次數,p是事件A的概率,則對任意正數ε,有 貝努利大數定律說明,在大量試驗同一事件A時,事件A的概率是A的頻率的穩定值。 5.2.2 獨立同分布隨機變量序列的切比雪夫大數定律 先介紹獨立同分布隨機變量序列的概念。 稱隨機變量序列X1,X2,…Xn,…是相互獨立的,若對任意的n>1,X1,X2,…Xn是相互獨立的。此時,若所有的Xi又具有相同的分布,則稱X1,X2,…Xn,…是獨立同分布隨機變量序列。 定理5-3 設X1,X2,…Xn,…是獨立同分布隨機變量序列E(Xi)=μ,D(Xi)=σ2(i=1,2…)均存在,則對于任意ε>0有 這一定理說明:經過算術平均后得到的隨機變量在統計上具有一種穩定性,它的取值將比較緊密聚集在它的期望附近。這正是大數定律的含義。在概率論中,大數定律是隨機現象的統計穩定性的深刻描述;同時,也是數理統計的重要理論基礎。 5.3 中心極限定理 5.3.1獨立同分布序列的中心極限定理 定理5-4 設X1,X2,…Xn,…是獨立同分布的隨機變量序列,且具有相同數學期望和方差E(Xi)=μ,D(Xi)=σ2(i=1,2,…)。記隨機變量 的分布函數為Fn(x),則對于任意實數x,有 (不證) 其中φ(x)為標準正態分布函數。 由這一定理知道下列結論: (1)當n充分大時,獨立同分布的隨機變量之和的分布近似于正態分布N2(nμ,nσ)。我們知道,n個獨立同分布的正態隨機變量之和服從正態分布。中心極限定理進一步告訴我們。 不論X1,X2,…Xn,…獨立同服從什么分布,當n充分大時,其和Zn近似服從正態分布。 (2)考慮X1,X2,…Xn,…的平均值,有 它的標準化隨機變量為,即為上述Yn。因此的分布函數即是上述的F(,nx)因而有 由此可見,當n充分大時,獨立同分布隨機變量的平均值 的分布近似于正態分布 [例5-3]對敵人的防御地段進行100次射擊,每次射擊時命中目標的炮彈數是一個隨機變量,其數學期望為2,均方差為1.5,求在100次射擊中有180顆到220顆炮彈命中目標的概率。解 設Xi為第i次射擊時命中目標的炮彈數(i=1,2,…,100),則中命中目標的炮彈總數,而且X1,X2,…X100同分布且相互獨立。 為100次射擊 由定理5-4可知,隨機變量近似服從標準正態分布,故有 [例5-4]某種電器元件的壽命服從均值為100(單位:小時)的指數分布?,F隨機抽出16只,設它們的壽命是相互獨立的,求這16只元件的壽命的總和大于1 920小時的概率。 解 設第i只電器元件的壽命為Xi=(i=1,2,…16),E(Xi)=100,D(Xi)=1002=10 000,則是這16只元件的壽命的總和。 E(Y)=100×16=1 600,D(Y)= 160 000,則所求概率為: 5.3.2 棣莫弗(De Moivre)-拉普拉斯(Laplace)中心極限定理 下面介紹另一個中心極限定理,它是定理5-4的特殊情況。 定理5-5(棣莫弗-拉普拉斯中心極限定理)設隨機變量Zn是n次獨立重復試驗中事件A發生的次數,p是事件A發生的概率,則對于任意實數x 其中q=1-p,φ(x)為標準正態分布函數。由棣莫弗-拉普拉斯中心極限定理得到下列結論: (1)在貝努利試驗中,若事件A發生的概率為p。又設Zn為n次獨立重復試驗中事件A發生的頻數,則當n充分大時,Zn近似服從正態分布N(np,npq)。 (2)在貝努利試驗中,若事件中A發生的概率為p,發生的頻率,則當n充分大時,近似服從正態分布 【例5-5】用中心極限定理得到求解5.1例5-2的概率。 解 設同時開著的燈數為X,則 X-B(1000,0.7),np=1000×0.7=7000,為n次獨立重復試驗中事件A 【例5-6】設某單位內部有1000臺電話分機,每臺分機有5%的時間使用外線通話,假定各個分機是否使用外線是相互獨立的,該單位總機至少需要安裝多少條外線,才能以95%以上的概率保證每臺分機需要使用外線時不被占用? 解:把觀察每一臺分機是否使用外線作為一次試驗,則各次試驗相互獨立,設X為1000臺分機中同時使用外線的分機數,則 X~B(1000,0.05),np=1000×0.05=50,根據題意,設N為滿足條件的最小正整數 由于φ(-7.255)≈0,故有 查標準正態分布表得φ(1.65)=0.9505,故有 由此 N≥61.37 即該單位總機至少需要62條外線,才能以95%以上的概率保證每臺分機在使用外線時不被占用。 小結 本章考核要求 (一)知道切比雪夫不等式 或 并且會用切比雪夫不等式估計事件|X-EX|≥ε或|X-EX|<ε的概率。 (二)知道貝努利大數定律 其中n是試驗次數,m是A發生次數,p是A的概率,它說明試驗次數很多時,頻率近似于概率。 (三)知道切比雪夫不等式大數定律 取值穩定在期望附近。 它說明在大量試驗中,隨機變量 (四)知道獨立同分布中心極限定理 若 記Yn~Fn(x),則有 它說明當n很大時,獨立同分布的隨機變量之和近似服從正態N(nμ,nσ2)所以,無論n個獨立同分布的X1,X2,…Xn服從何種分布,n很大時,X1+X2+…Xn卻近似正態N(nμ,nσ2).(五)知道棣莫弗—拉普拉斯中心極限定理 若Zn表示n次獨立重復事件發生次數,即 Zn~B(n,p),則有 即Zn近似正態N(np,np(1-p)2)。并會用中心極限定理計算簡單應用問題。 CH5 大數定律及中心極限定理 1.設Ф(x)為標準正態分布函數,Xi=? 100?1,事件A發生;?0,事件A不發生,i=1,2,…,100,且P(A)=0.8,X1,X2,…,X100 相互獨立。令Y=? i?1Xi,則由中心極限定理知Y的分布函數F(y)近似于() y?80 4A.Ф(y) 2.從一大批發芽率為0.9的種子中隨機抽取100粒,則這100粒種子的發芽率不低于88%的概率約為.(已知φ(0.67)=0.7486) 3.設隨機變量X1,X2,…,Xn,…獨立同分布,且i=1,2…,0 nB.Ф()C.Ф(16y+80)D.Ф(4y+80) Yn?? i?1??Xi,n?1,2,?.Φ(x)為標準正態分布函數,則limP?n???????1??()np(1?p)??Yn?np A.0B.Φ(1)C.1-Φ(1)D.1 4.設 5.設X服從(-1,1)上的均勻分布,試用切比雪夫不等式估計 6.設 7.報童沿街向行人兜售報紙,設每位行人買報紙的概率為0.2,且他們買報紙與否是相互獨立的。試求報童在想100為行人兜售之后,賣掉報紙15到30份的概率 8.一個復雜系統由n個相互獨立的工作部件組成,每個部件的可靠性(即部件在一定時間內無故障的概率)為0.9,且必須至少有80%的部件工作才能使得整個系統工作。問n至少為多少才能使系統的可靠性為0.95 9.某人有100個燈泡,每個燈泡的壽命為指數分布,其平均壽命為5小時。他每次用一個燈泡,燈泡滅了之后立即換上一個新的燈泡。求525小時之后他仍有燈泡可用的概率近似值相互獨立的隨機變量,且都服從參數為10的指數分布,求 的下界 是獨立同分布的隨機變量,設, 求第五篇:CH5 大數定律及中心極限定理--練習題