第一篇:淺談中心極限定理及其應用 論文
淺談中心極限定理及其應用
李月20091103558
數學科學學院信息與計算科學09信息一班
指導老師韓文忠
摘要:概率論中討論隨機變量序列部分和的分布漸近于正態分布的一類定理。在自然界與生產中,一些現象受到許多相互獨立的隨機因素的影響,如果每個因素所產生的影響都很微小時,總的影響可以看作是服從正態分布的。中心極限定理就是從數學上證明了這一現象。本文主要敘述中心極限定理在現實中的應用。關鍵字:中心極限定理 隨機變量 正態分布
1.定理一(獨立同分布的中心極限定理)設隨機變量X1,X2,…,Xn,…相互獨
立,服從同一分布,且具有數學期望和方差,E(Xk)??,n
D(Xk)=?
>0(k=1,2,3?),則隨機變量之和?Xk的標準化變量
k?1
n
n
n
X
k
?E(?Xk)
k?1n
?
=
k?1
X
K
?n?
Yn=?
k?1
D(?Xk)
k?1
n?的分布函數Fn(x)對于任意x滿足
n
?x
limFn(x)=limFn(x)=limP{
n??
k
?n?
?x
k?1
n?
}=?
x
12?
??
?t
dt= ?(x).這就是說,均值為?,方差為?2?0 的獨立同分布的隨機變量
n
X1,X2,…,Xn之和?Xk的標準化變量,當n充分大時,有
k?1
n
?
k?1
X
n
?n?
n?
~N(0,1)
1.1:一加法器同時接收20個噪聲電壓Vk(k=1,2,3?,20),設它們是相互獨
立的隨機變量,且都在區間(0,10)上服從均勻分布,記V?
P{V?105}的近似值。
?V,求
k
k?1
解:易知E(Vk)?5,D(Vk)?100/12(k=1,2,3?,20),由定理一,隨機
變量Z?
?V
K?1
k
=
V?20?5?
近似服從正態分布N(0,1),于是
P{V?105}?P{?
V?20?520
105?20?520
V?20?520
?0.387}
?1?P{
V?20?520
?0.387}
?1?
?
0.387
12?
??
?t
dt?1??(0.387)?0.384.即有P{V?105}?0.34
2.(李雅譜諾夫(Lyapunov)定理)設隨機變量X1,X2,…,Xn,…相互獨立,它們具有數學期望和方差
?0,k?1,2?,E(Xk)??,D(XK)??K
nn
記??k?
k?1
??.k
k?1
若存在正數?,使得當n??時,n
1B
2??n
n
?
k?1
E{Xk??k
2??
}?0,則隨機變量之和?Xk的標準化變量
k?1
nnnn
?
Zn?
k?1
X
k
?E(?Xk)
k?1n
?
?
k?1
X
k
?Bn
?
k?1
X
k
D(?Xk)
k?1
n
n
?的分布函數limFn(x)?limP{
n??
n??
k?1
X
k
?Bn
??
k?1
k
?x}
?
?
x
12?
?t
dt= ?(x).??
此定理表明,在定理的條件下,隨機變量
n
n
k
?X
Zn?
k?1
?Bn
?X
k?1
k
當n很大時,近似的服從正態分布
n
n
N(0,1),由此,當n很大,n
?
k?1
X
k
?BnZn?
??
k?1
k
近似的服從正態分布
N(??k,Bn)
k?1
.這就是說,無論各個隨機變量
n
Xk(k?1,2?)
服從什么分布,只要滿足定理的條件,那么它們的和k?1
?
X
k
當n很大時就近似地服從正態
分布,在很多問題中所考慮的隨機變量可以表示成很多個獨立的隨機變量之和。請看下面的例子。
2.1:設有一條河流經某城市,河上有一座橋,該橋的強度服從正態分布
N(300,40)(強度的單位是t(噸))。有很多車要經過此橋,如果各車的平
均重量是5t,方差是2t2。問:為保證此橋不出問題的概率(安全度)不小于0.99997.最多允許在橋上同時出現多少車輛?
解:用Y表示該橋的強度,若有M輛車在橋上,第i輛車的重量Xi
M
(i?1,2?M),則M輛車的總重量SM?
?
i?1
Xi,我們可以認為
Y,X1,X2?XM是相互獨立的,E(Xi)?5,var(Xi)?2,該橋不出現問
題的概率為
R?P(M輛車的總重量不超過橋的強度)。
顯然R?P(SM?Y)?R?P(SM?Y?0),我們要找滿足不等式
R?0.99997的最大的M,不難想到,這個M,由于
SM)
E(SM
=,M?1,var(=
M?1
(這里
?1?E(Xi)?5
?1?var(Xi)?2,i?1,2?M),由定理可知SM近似的服從
N(M?1,M?1)
.又N
(300,40),可知SM?Y
近似服從
N(M?1?300,M?12?40),于是
R??[
0?(M?1?300)
M?
]
?40
由于?(4)=0.99997,故為了R?0.99997,必須且只需
令x?
0?(M?1?300)
M?
2M?40
?4
?40
(x?40),上述不等式化為,則M?
x?4x?400?0
((11.87)?400))
由此知x?11.87,從而M?=50.就是說,最多允許50輛車
同時在橋上。
下面介紹另一個中心極限定理,它是定理一的特殊情況。
3.(棣莫弗-拉普拉斯(De Moirve-Laplace)定理)設隨機變量(n?1,2,?)服從參數為n,p(0?p?1)的二項分布,則對于任意x,有limP{
n??
?npnp(1?p)
?x}=?
x
12?
?t
dt=?(x)。
??
這個定理表明,二項分布的極限分布式正態分布
n
?Xk~N(np,npq)當n充分大時,服從二項分布的隨機變量的概
k?1
率計算可以轉化為正態隨機變量的概率計算。
3.1 :對于一個學生而言,來參加家長會的家長人數是一個隨機變量,設一個學
生無家長,1名家長,2名家長來參加會議的概率分別為0.05,0.8,0.15,若學校共有400名學生,設各學生參加會議的家長人數相互獨立且服從同一分布。(1)求參加會議的家長人數x超過450的概率:
(2)求有1名家長來參加會議的學生人數不多于340的概率。
解(1)以Xk(k?1,2?,400)記第k個學生來參加會議的家長人數,則Xk的分布率為
400
易知E(Xk)?1.1,D(Xk)?0.19,k?1,2?400.而X?隨機變量
400
?X。由定理一
k
k?1
?X
k?1
k
?400?1.1
0.19
?
X?400?1.1400
0.19
400
近似服從正態分布N(0,1),于是
P{X?450
}=P{
X?400?1.1400
0.19
?
450?400?1.1400
0.19
=1-P{
X?400?1.1400
0.19
?1.147}
?1??(1.147)?0.1251’
(3)以Y記有一名家長參加會議的學生人數,則Y~b(400,0.8),由定理三
P{Y?340}
=P{
Y?400?0.8400?0.8?0.2Y?400?0.8400?0.8?0.2
?
340?400?0.8400?0.8?0.2
}
=P{?2.5}??(2.5)=0.9938
小結 中心極限定理表明,在相當一般的條件下,當獨立隨機變量的個數不斷增加時,其和態分布趨于正態分布,這一事實闡明了正態分布的重要性,也揭示了為什么在實際應用中會經常用到正態分布,也就揭示了產生正態分布變量的源泉,另一方面,它提供了獨立同分布變量隨機變量之和?Xk(其中Xk的方
k?1
n
差存在的近似分布,只要和式中加項的個數充分大,就可以不必考慮和式中的隨機變量服從什么分布。都可以用正態分布來近似,這在應用上是有效和重要的。
參考文獻
[1] 盛驟概率論與數理統計,高等教育出版社,2006 [2] 陳家鼎 鄭中國概率與統計 高等教育出版社 2004
第二篇:中心極限定理應用
中心極限定理及其應用
【摘要】中心極限定理的產生具有一定的客觀背景,最常見的是德莫佛-拉普拉斯中心極限定理和林德貝格-勒維中心極限定理。它們表明了當n充分大時,方差存在的n個獨立同分布的隨機變量和近似服從正態分布,在實際中的應用相當廣泛。本文討論了中心極限定理的內容、應用與意義。
【關鍵詞】:中心極限定理 正態分布 隨機變量
一、概述
概率論與數理統計是研究隨機現象、統計規律性的學科。隨機現象的規律性只有在相同條件下進行大量重復的實驗才會呈現出來,而研究大量的隨機現象常常采用極限的形式,由此導致了對極限定理的研究。極限定理的內容很廣泛,中心極限定理就是其中非常重要的一部分內容。中心極限定理主要描述了在一定條件下,相互獨立的隨機變量序列X1、X2、…Xn、…的部分和的分布律:當n→∞時的極限符合正態分布。因此中心極限定理這個結論使正態分布在數理統計中具有很重要的地位,也使得中心極限定理有了廣泛的應用。
二、定理及應用
1、定理一(林德貝格—勒維定理)
若?
k1,=a,?2,…是一列獨立同分布的隨機變量,且E?D?
k=k??x2(?2>0),k=1,2,…則有limp(k?
1n????n?na?x)??n
n12???e?t22dt。
當n充分大時,??k?1k?na
?n~N(0,1),k?1??nk~N(na,n?)
22、定理二(棣莫弗—拉普拉斯中心極限定理)
在n重伯努利試驗中,事件A在每次試驗中出現的概率為錯誤!未找到引用源。, 錯誤!未
?找到引用源。為n次試驗中事件A出現的次數,則limp(n??n?npnpq?x)??2?1x??e?t22dt
其中q?1?p。這個定理可以簡單地說成二項分布漸近正態分布,因此當n充分大時,可
以利用該定理來計算二項分布的概率。
同分布下中心極限定理的簡單應用
獨立同分布的中心極限定理可應用于求隨機變量之和Sn落在某區間的概率和已知隨機變量之和Sn取值的概率,求隨機變量的個數。
例1:設各零件的重量都是隨機變量,它們相互獨立且服從相同的分布,其數學期望為0.5kg,均方差為0.1kg,問5000只零件的總重量超過2510kg的概率是多少?
解:設Xi(i=1,2,…,5000)表示第i個零件的重量X1,X2,…,X5000獨立同分布且E(Xi)=0.5,D(Xi)=0.12。
由獨立同分布的中心極限定理可知
[3]
=I-φ(1.414)=1-0.921
5=0.0785
例2:一生產線生產的產品成箱包裝,每箱的重量是隨機的且同分布,設每箱平均重50kg,標準差為5kg,若用最大載重為50噸的汽車承運,每輛車最多可以裝多少箱才能保證不超載的概率大于0.977?
解:設Xi(i=1,2,…,n)是裝運第i箱的重量,n為所求箱數。由條件可把X1,X2,…,Xn看作獨立同分布的隨機變量,而n箱的總重量為Tn=X1+X2+…+Xn,是獨立同分布的隨機變量之和。
由E(Xi)=50、D(Xi)=52得:E(Tn)=50n,D(Tn)=52n
根據獨立同分布的中心極限定理:
[3]
即最多可以裝98箱。
例3:報名聽心理學課程的學生人數K是服從均值為100的泊松分布的隨機變量,負責這門課的教授決定,如果報名人數不少于120,就分成兩班,否則就一班講授。問該教授講授兩個班的概率是多少?
分析:該教授講授兩個班的情況出現當且僅當報名人數x不少于120,精確解為P(x≥120)=e-100 100i/i!很難求解,如果利用泊松分布的可加性,想到均值為100的泊松分布隨機變量等于100個均值為1的獨立泊松分布隨機變量之和,即X= Xi,其中每個Xi具有參數1的泊松分布,則我們可利用中心極限定理求近似解。[2]
解:可知E(X)=100,D(X)=100
教授講授兩個班的概率是0.023。
例4:火炮向目標不斷地射擊,若每次射中目標的概率是0、1。
(1)求在400次射擊中擊中目標的次數在區間[30,50]內的概率。
(2)問最少要射擊多少次才能使擊中目標的次數超過10次的概率不小于0.9?
分析:顯然火炮射擊可看作是伯努利實驗。[1]即
我們知道,正態分布可近似于二項分布,而且泊松分布可近似于二項分布,當二項分布b(n,p),n較大、p較小時可用泊松分布估計近似值。如果p接近1,有q=l-p很小,這時也可用泊松分布計算;但是當n較大,p不接近0或1時,再用泊松分布估計二項分布的概率就不夠精確了,這時應采用拉普拉斯定理來計算。
解:(1)設在射擊中擊中目標的次數為Yn,所求概率(30≤Yn<50)等于:
最小正整數n=147就是所要求的最小射擊數。
以上例子都是獨立同分布的隨機變量,可以用中心極限定理近似估算,但是如果不同分布,中心極限定理是否也成立呢?
李雅普諾夫定理
當隨機變量Xi獨立,但不一定同分布時,中心極限定理也成立。定理3[2](李雅普諾夫定理):
設X1,X2,…,Xn,…為獨立隨機變量序列,且E(Xn)=an,D(Xn)=σn2存在,Bn2= σn2(n=1,2,…),若存在δ>0,使得:
也就是說,無論各個隨機變量Xi服
從什么分布,只要滿足李雅普諾夫條件,當n很大時,它們的和近似服從正態分布。由于在大學本科階段接觸的不同分布的樣本較少,本文對它的應用將不舉例說明。
中心極限定理以嚴格的數學形式闡明了在大樣本條件下,不論總體的分布如何,樣本均值總是近似地服從正態分布。正是這個結論使得正態分布在生活中有著廣泛的應用。
四、中心極限定理的意義
首先,中心極限定理的核心內容是只要n足夠大,便可以把獨立同分布的隨機變量和的標準化當作正態變量,所以可以利用它解決很多實際問題,同時這還有助于解釋為什么很多自然群體的經驗頻率呈現出鐘形曲線這一值得注意的事實,從而正態分布成為概率論中最重要的分布,這就奠定了中心極限定理的首要功績。其次,中心極限定理對于其他學科都有著重要作用。例如數理統計中的參數(區間)估計、假設檢驗、抽樣調查等;進一步,中心極限定理為數理統計在統計學中的應用鋪平了道路,用樣本推斷總體的關鍵在于掌握樣本特征
值的抽樣分布,而中心極限定理表明只要樣本容量足夠地大,得知未知總體的樣本特征值就近似服從正態分布。從而,只要采用大量觀察法獲得足夠多的隨機樣本數據,幾乎就可以把數理統計的全部處理問題的方法應用于統計學,這從另一個方面也間接地開辟了統計學的方法領域,其在現代推斷統計學方法論中居于主導地位。參考文獻
[1]鄧永錄 著 應用概率及其理論基礎.清華大學出版社。
[2]魏振軍 著 概率論與數理統計三十三講.中國統計出版社。
[3]程依明 等 著 概率論與數理統計習題與解答.高等數學出版社。
第三篇:中心極限定理證明
中心極限定理證明
一、例子
高爾頓釘板試驗.圖中每一個黑點表示釘在板上的一顆釘子.每排釘子等距排列,下一排的每個釘子恰在上一排兩相鄰釘子之間.假設有排釘子,從入口中處放入小圓珠.由于釘板斜放,珠子在下落過程中碰到釘子后以的概率滾向左邊,也以的概率滾向右邊.如果較大,可以看到許多珠子從處滾到釘板底端的格子的情形如圖所示,堆成的曲線近似于正態分布.如果定義:當第次碰到釘子后滾向右邊,令;當第次碰到釘子后滾向左邊,令.則是獨立的,且
那么由圖形知小珠最后的位置的分布接近正態.可以想象,當越來越大時接近程度越好.由于時,.因此,顯然應考慮的是的極限分布.歷史上德莫佛第一個證明了二項分布的極限是正態分布.研究極限分布為正態分布的極限定理稱為中心極限定理.二、中心極限定理
設是獨立隨機變量序列,假設存在,若對于任意的,成立
稱服從中心極限定理.設服從中心極限定理,則服從中心極限定理,其中為數列.解:服從中心極限定理,則表明
其中.由于,因此
故服從中心極限定理.三、德莫佛-拉普拉斯中心極限定理
在重貝努里試驗中,事件在每次試驗中出現的概率為為次試驗中事件出現的次數,則
用頻率估計概率時的誤差估計.由德莫佛—拉普拉斯極限定理,由此即得
第一類問題是已知,求,這只需查表即可.第二類問題是已知,要使不小于某定值,應至少做多少次試驗?這時利用求出最小的.第三類問題是已知,求.解法如下:先找,使得.那么,即.若未知,則利用,可得如下估計:.拋擲一枚均勻的骰子,為了至少有0.95的把握使出現六點的概率與之差不超過0.01,問需要拋擲多少次?
解:由例4中的第二類問題的結論,.即.查表得.將代入,便得.由此可見,利用比利用契比曉夫不等式要準確得多.已知在重貝努里試驗中,事件在每次試驗中出現的概率為為次試驗中事件出現的次數,則服從二項分布:的隨機變量.求.解:
因為很大,于是
所以
利用標準正態分布表,就可以求出的值.某單位內部有260架電話分機,每個分機有0.04的時間要用外線通話,可以認為各個電話分機用不用外線是是相互獨立的,問總機要備有多少條外線才能以0.95的把握保證各個分機在使用外線時不必等候.解:以表示第個分機用不用外線,若使用,則令;否則令.則.如果260架電話分機同時要求使用外線的分機數為,顯然有.由題意得,查表得,故取.于是
取最接近的整數,所以總機至少有16條外線,才能有0.95以上的把握保證各個分機在使用外線時不必等候.根據孟德爾遺傳理論,紅黃兩種番茄雜交第二代結紅果植株和結黃果植株的比率為3:1,現在種植雜交種400株,試求結黃果植株介于83和117之間的概率.解:將觀察一株雜交種的果實顏色看作是一次試驗,并假定各次試驗是獨立的.在400株雜交種中結黃果的株數記為,則.由德莫佛—拉普拉斯極限定理,有
其中,即有
四、林德貝格-勒維中心極限定理
若是獨立同分布的隨機變量序列,假設,則有
證明:設的特征函數為,則的特征函數為
又因為,所以
于是特征函數的展開式
從而對任意固定的,有
而是分布的特征函數.因此,成立.在數值計算時,數用一定位的小數來近似,誤差.設是用四舍五入法得到的小數點后五位的數,這時相應的誤差可以看作是上的均勻分布.設有個數,它們的近似數分別是,.,.令
用代替的誤差總和.由林德貝格——勒維定理,以,上式右端為0.997,即以0.997的概率有
設為獨立同分布的隨機變量序列,且互相獨立,其中,證明:的分布函數弱收斂于.證明:為獨立同分布的隨機變量序列,且互相獨立,所以仍是獨立同分布的隨機變量序列,易知有
由林德貝格——勒維中心極限定理,知的分布函數弱收斂于,結論得證.作業:
p222EX32,33,34,3
5五、林德貝爾格條件
設為獨立隨機變量序列,又
令,對于標準化了的獨立隨機變量和的分布
當時,是否會收斂于分布?
除以外,其余的均恒等于零,于是.這時就是的分布函數.如果不是正態分布,那么取極限后,分布的極限也就不會是正態分布了.因而,為了使得成立,還應該對隨機變量序列加上一些條件.從例題中看出,除以外,其余的均恒等于零,在和式中,只有一項是起突出作用.由此認為,在一般情形下,要使得收斂于分布,在的所有加項中不應該有這種起突出作用的加項.因為考慮加項個數的情況,也就意味著它們都要“均勻地斜.設是獨立隨機變量序列,又,這時
(1)若是連續型隨機變量,密度函數為,如果對任意的,有
(2)若是離散型隨機變量,的分布列為
如果對于任意的,有
則稱滿足林德貝爾格條件.以連續型情形為例,驗證:林德貝爾格條件保證每個加項是“均勻地斜.證明:令,則
于是
從而對任意的,若林德貝爾格條件成立,就有
這個關系式表明,的每一個加項中最大的項大于的概率要小于零,這就意味著所有加項是“均勻地斜.六、費勒條件
設是獨立隨機變量序列,又,稱條件為費勒條件.林德貝爾格證明了林德貝爾格條件是中心極限定理成立的充分條件,但不是必要條件.費勒指出若費勒條件得到滿足,則林德貝爾格條件也是中心極限定理成立的必要條件.七、林德貝爾格-費勒中心極限定理
引理1對及任意的,證明:記,設,由于
因此,其次,對,用歸納法即得.由于,因此,對也成立.引理2對于任意滿足及的復數,有
證明:顯然
因此,由歸納法可證結論成立.引理3若是特征函數,則也是特征函數,特別地
證明定義隨機變量
其中相互獨立,均有特征函數,服從參數的普哇松分布,且與諸獨立,不難驗證的特征函數為,由特征函數的性質即知成立.林德貝爾格-費勒定理
定理設為獨立隨機變量序列,又.令,則
(1)
與費勒條件成立的充要條件是林德貝爾格條件成立.證明:(1)準備部分
記
(2)
顯然(3)
(4)
以及分別表示的特征函數與分布函數,表示的分布函數,那么(5)
這時
因此林德貝爾格條件化為:對任意,(6)
現在開始證明定理.設是任意固定的實數.為證(1)式必須證明
(7)
先證明,在費勒條件成立的假定下,(7)與下式是等價的:
(8)
事實上,由(3)知,又因為
故對一切,把在原點附近展開,得到
因若費勒條件成立,則對任意的,只要充分大,均有
(9)
這時
(10)
對任意的,只要充分小,就可以有
(11)
因此,由引理3,引理2及(10),(11),只要充分大,就有
(12)
因為可以任意小,故左邊趨于0,因此,證得(7)與(8)的等價性.(2)充分性
先證由林德貝爾格條件可以推出費勒條件.事實上,(13)
右邊與無關,而且可選得任意小;對選定的,由林德貝爾格條件(6)知道第二式當足夠大時,也可以任意地小,這樣,費勒條件成立.其次證明林德貝爾格條件能保證(1)式成立.注意到(3)及(4),可知,當時,當時,因此
(14)
對任給的,由于的任意性,可選得使,對選定的,用林德貝爾格條件知只要充分大,也可使.因此,已證得了(8),但由于已證過費勒條件成立,這時(8)與(7)是等價的,因而(7)也成立.(3)必要性
由于(1)成立,因此相應的特征函數應滿足(7).但在費勒條件成立時,這又推出了(8),因此,(15)
上述被積函數的實部非負,故
而且
(16)
因為對任意的,可找到,使,這時由(15),(16)可得
故林德貝爾格條件成立.八、李雅普諾夫定理
設為獨立隨機變量序列,又.令,若存在,使有
則對于任意的,有
第四篇:大數定律與中心極限定理的若干應用
大數定律與中心極限定理的若干應用
摘要:在概率論中,大數定律是比較重要的內容,他主要就是以嚴格的數學形式來表達概率中隨機現象的性質,也是一定穩定性的表現。大數定律在數學的應用中比較重要,一般都是利用大數定律和中心極限定理一起來應用。本文根據在不同的條件下存在的大數定律和中心極限定理做了具體的分析,對幾種比較常見的大數定律進行了介紹,結合他們條件的不同,分析了不同數學模型的特定,并在各個領域應列舉它們的應用。這也是將理論具體化的一種表現形式,使得大數定律與中心極限定理在實際的生活中應用更加廣泛,應用價值更深一層。關鍵詞:大數定律;中心極限定理;應用;范圍 1前言
大數定律是概率歷史上第一個極限定理。由于隨機變量序列向常數的收斂有多種不同的形式,按其收斂為依概率收斂,以概率 1 收斂或均方收斂,分別有弱大數定律、強大數定律和均方大數定律。常見的大數定律有伯努利大數定理、辛欽大數定律、重對數定理等等。中心極限定理是是概率論中討論隨機變量序列部分和的分布漸近于正態分布的一類定理。這組定理是數理統計學和誤差分析的理論基礎,指出了大量隨機變量近似服從正態分布的條件。
概率理論是數理理論都是研究現實世界隨機現象的一種統計科學,大數定律與中心極限極限定理都是數學重要的組成部分,在自然學科與經濟發展中有著廣泛的應用,大數定律與中心極限定理都是重要定理,也是概率論與數理統計的一個樞紐中心,大數定律主要闡明的是平均結果具有穩定性,證明了在樣本的條件下,樣本平均值與總體平均值是一樣的,這也是算術平均值法則的基本理論,在現實的生活中,經常可以看到這樣的數據模型。取一個物體的平均值,一般都是反復測量的結果,當時測量結果在不斷增大時,算術平均值的偏差就會越來越小,也是1nn?i?1的偏差也是越來越小。這種思想貫穿在整個的概率理論中,并且占有著重要的左右,在其他的數學領域中占有著重要的地位,中心極限定理與大數定律相比就更加詳細,中心極限定理是在嚴格的數學形勢下闡明的條件,無論總體是怎樣分布,樣本的平均值都是呈正態的形式分布,中心極限定理也是以正態分布作為廣泛的理論基礎應用。目前無論是在國內還是在國外,大數定律與中心極限定理已經被廣泛的研究,尤其是在實際生活中的應用,銀行業就是根據中心極限定理來發展,而大數定律更是應用在保險行業,很多研究者在這個領域都研究了具有一定價值的成果。推廣大數定律與中心極限定理的應用問題是一個非常有研究價值的方向,通過這些問題來不斷的推廣,這樣不僅僅能夠加深大叔定理與中心極限定律的理解,并且很多問題也能夠加以解決。2相關定義定理以及應用 2.1相關定義
定義:設X1,X2,?,Xn,?是一個隨機變量序列,a是一個常數,若對于任意正數?,有limP?Xn?a????1,n??P則稱序列X1,X2,?,Xn,?依概率收斂于a.記為Xn???a.切比雪夫不等式
設隨機變量?具有有限的期望與方差,則對???0,有
P(??E(?)??)?D(?)?2或P(??E(?)??)?1?D(?)?2
證明:我們就連續性隨機變量的情況來證明。設?~p(x),則有
(x?E(?))2P(??E(?)??)??x?E(?)??p(x)dx??x?E(?)???D(?)2p(x)dx
?1?2?????(x?E(?))p(x)dx?2?2
該不等式表明:當D(?)很小時,P(??E(?)??)也很小,即?的取值偏離E(?)的可能性很小。這再次說明方差是描述?取值分散程度的一個量。
切比雪夫不等式常用來求在隨機變量分布未知,只知其期望和方差的情況下,事件{??E???}概率的下限估計;同時,在理論上切比雪夫不等式常作為其它定理證明的工具。
定理1(切比雪夫大數定律)
設{?n}是相互獨立的隨機變量序列,每一隨機變量都有有限的方差,且一致有界,即存在常數C,使D(?i)?ClimP{1nii?1,2,?,則對任意的??0,有n????ni?1?1niE(??ni?1)??}?0[即
??ni?11ni???E(p??ni?11ni)(n??)] 證明:由切比雪夫不等式知:???0,有:
n0?P{1nn??i?i?11n?nE(?i)??}?1i?1?2D(1nn?D?i?1i??i)?i?1n?22?nCn?22?Cn?2?0(n??)
該定理表明:當n很大時,隨機變量?1,?,?n的算術平均值ni1nn??i?1i接近于其數學期望E(??ni?11),這種接近是在概率意義下的接近。通俗的說,在定理的條件下,n個相互獨立的隨機變量算術平均值,在n無限增加時將幾乎變成一個常數。
推論:設?1,?,?n是相互獨立的隨機變量,由相同的數學期望和方差E(?i)??,D(?i)??2i?1,2,?,則???0,有
limP{n??1nn??i?1i????}?0(即
1ni??ni?1以概率收斂于?)
這個結論有很實際的意義:人們在進行精密測量時,為了減少隨機誤差,往往重復測量多次,測得若干實測值?1,?,?n,然后用其平均值
1ni??ni?1來代替?。
定理2(De Moivre-Laplace極限定理)(定理1的特殊情形)設?n(n?1,2,?)是n重Bernoulli試驗中成功的次數,已知每次試驗成功的概率為p?0?p?1?,則對?x?R,有 limP{n???n?npnpq?x}?12??e??xt?22dt???x?。
該定理也可改寫為:?a?b,有limP{a?n???n?npnpq?b}???b????a?
?1證明: 令?i???0第i次試驗出現成功第i次試驗不出現成功 則
{?i}為獨立同分布的隨機變量序列,且E?i?p,D?i?p(1?p)均存在
n顯然:?n???i,此時?n?i?1?n?npnpq
該定理為上定理的一個特殊情形,故由上定理該定理得證。2.2幾個大數定律的關系及適用場合
2.2.1伯努利定理是泊松定理的特例
泊松定理是指在一定的時間段內,平均若干次發生的時間,有的時候會多,有的時候會少,發生的次數是隨機的時間,這也使泊松分配。P(k,T)?(?T)ke
若是Pk=p,則泊松大數定理也就是伯努利大數定理,伯努利大數定理也完全證明了時間在完全相同的條件下進行重復的試機實驗,并且頻率比較穩定,隨著n的無限增大,n在試驗中葉氏趨近于穩定,與A出現的頻率的平均值比較接近。
2.2.2泊松大數定律是切比雪夫大數定律的特例
在泊松的大數定理的條件中,D??piqn?1,也能夠滿足切比雪夫大數定律的條件。
2.2.3切比雪夫大數定律是馬爾科夫大數定律的特例
在切比雪夫大數定律中,D?i?C(i?1,2,3,4.....),根據隨機變量序列兩兩不相關的性質可以了解到,1nnD(??i)?i?11n?ni?1D(?i)?cn????0,根據這樣的式子也能夠看出滿足馬爾可夫大數定
n??律的條件。由此可見,伯努利大數定律與泊松大數定律都是馬爾可夫大數定律的特例。伯努利大數定律也使辛欽大數定律的特別情況。在伯努利的大數定律中,由于隨機變量時可以變化的,則?n必然會是獨立分布的,并且都會服從伯努利分布的基本情況:p??i?1??p,p??i?0??q,并且E??i??p,所以這樣的公式必然會滿足辛欽大數定律的條件。但是辛欽大數定律并不是泊松大數定律與切比雪夫大數定律的推廣。2.2中心極限定理的基本關系
在實際問題中,常常需要考慮許多隨機因素所產生總影響.例如:炮彈射擊的落點與目標的偏差,就受著許多隨機因素的影響.如瞄準時的誤差,空氣阻力所產生的誤差,炮彈或炮身結構所引起的誤差等等.對我們來說重要的是這些隨機因素的總影響.中心極限定理,正是從理論上證明,對于大量的獨立隨機變量來說,只要每個隨機變量在總和中所占比重很小,那么不論其中各個隨機變量的分布函數是什么形狀,也不論它們是已知還是未知,而它們的和的分布函數必然和正態分布函數很近似。這就是為什么實際中遇到的隨機變量很多都服從正態分布的原因,也正因如此,正態分布在概率論和數理統計中占有極其重要的地位。中心極限定理也可以分為幾種情況:由于無窮個隨機變量之和可能趨于∞,故我們不研究n個隨機變量之和,本身而考慮它的標準化的隨機變量。
中心極限定理表明:在相當一般的條件下,當獨立隨機變量的個數增加時,其和的分布趨于正態分布。因此,只要和式中加項的個數充分大,就可以不必考慮和式中的隨機變量服從什么分布,都可以用正態分布來近似,這在應用上是有效的和重要的。
nn?Zn?k?1Xk?E(?Xk)k?1n的分布函數的極限.D(?Xk)k?1列維一林德伯格中心極限定理:設隨機變量相互獨立,服從同一分布,且有n,n,則隨機變量之和
n的標準?化變量Yn?i?1Xi?E(?Xi)i?1n?X?i?1i?n?的分布函數。
D(?Xi)i?1?n將n個觀測數據相加時,首先對小數部分按“四舍五入”舍去小數位后化為整數.試利用中心極限定理估計
(1)當n=1500時,舍入誤差之和的絕對值大于15的概率;
(2)n滿足何條件時,能以不小于0.90的概率使舍入誤差之和的絕對值小于10.這就可以根
n?據列維林德伯格中心極限定理來解決問題,當n充分大的時候,數據個數n應滿足條件:?|Sn|P{|Sn|?10}?P??n/12????0.90 ,即 2Φ(n/12?10i?1Xi?n?近似地?n~N(0,1),10n/12)?1?0.90 ,Φ(10n/12)?0.95 ,10n/12?1.645 ,n?443.5 ,當n<443時,才能夠保證誤差之后的絕對值小于10,概率不小于0.9。3定理的應用
3.1在生產生活中的應用 一生產線生產的產品成箱包裝,每箱的重量是隨機的,假設每箱的平均重50千克,標準差5千克.若用最大載重量為5噸的汽車承運,試利用中心極限定理說明每輛車最多可以裝多少箱,才能保證不超載的概率大于0.977.解答:設n為第i箱的重量(), Yn??Xi?1i由列維-林德伯格中心極限定理,有,近似地~?5000?50n?所以n必須滿足P{Yn?5000}?Φ???0.977?Φ(2),N(50n,25n),5n??1000?10nn也就是最多可以裝98箱.?2,? n?98.0199,(供電問題)某車間有200臺車床,在生產期間由于需要檢修、調換刀具、變換位置及調換零件等常需停車.設開工率為0.6, 并設每臺車床的工作是獨立的,且在開工時需電力1千瓦.問應供應多少瓦電力就能以99.9%的概率保證該車間不會因供電不足而影響生產? 解:某一時刻開動的車床數,X~B(200, 0.6),要求最小的k,使P{0?X?k}?0.999.由D-L近似地定理
? P{0?X?k}?Φ(k?npnpq)?Φ(0?npnpq,)X~N(np,npq),P{0?X?k}?Φ(k?npnpq)?Φ(0?npnpq)?Φ(k?12048)?Φ(?12048)?Φ(k?12048)?0.999
所以若供電141.5千瓦,那么由于供電不足而影響生產的可能性不到0.001,相當于8小時內約有半分鐘受影響,這一般是允許的。
某產品次品率p = 0.05,試估計在1000件產品中次品數的概率.次品數X~B(1000,0.05),E(X)?np?1000?0.05?50,D(X)?np(1?p)?50?0.95?47.5,由棣莫弗-拉普拉斯中心極限定理,有:P{40?X?60}?Φ(60?5047.5)?Φ(40?5047.5)?2Φ(1.45)?1?0.853.次品數:X~B(1000,0.05),E(X)?np?1000?0.05?50,D(X)?np(1?p)?50?0.95?47.5,P{40?X?60}?Φ(60?5047.5)?Φ(40?5047.5)?2Φ(1.45)?1?0.853.若是使用切比雪夫的不等式來進行計算,P{40?X?60}?P{X?50?10}?1?47.5102?0.525.但是這樣的計算并不完整,有點過于保守。
3.2在數學分析中的應用
在一次試驗中事件A出現的概率為0.4,應至少進行多少次試驗,才能使事件A出現的頻率與概率之差在之間的概率不低于0.9 ?
解答:由中心極限定理知, Xn N(np, npq),P(Xnn?p?0.1)?P(Xn?npnpq?0.1npq)
?2Φ(0.1npq)?1?0.9? Φ(0.1npq)?0.95? 0.1npq?1.65? n?66.設第i次射擊得分為,則的分布律為
100E(Xi)?9.15,D(Xi)?1.227.由中心極限定理,?Xi N(915, 122.7)
i?1100? P{900??i?1Xi?930}?P{?1511.08??Xi?100122.7?1511.08}?2Φ(1.354)?1?2?0.9115?1?0.823.高爾頓(Galton)釘板試驗:
如下圖中每一黑點表示釘在板上的一顆釘子,它們彼此的距離均相等,上一層的每一顆的水平位置恰好位于下一層的兩顆正中間。從入口處放進一個直徑略小于兩
顆釘子之間的距離的小圓玻璃球,當小圓球向下降落過程中,碰到釘子后皆以1/2的概率向左或向右滾下,于是又碰到下一層釘子。如此繼續下去,直到滾到底板的一個格子內為止。把許許多多同樣大小的小球不斷從入口處放下,只要球的數目相當大,它們在底板將堆成近似于正態 的密度函數圖形(即:中間高,兩頭低,呈左右對稱的古鐘型),其中 為釘子的層數。
令 量(表示某一個小球在第 次碰了釘子后向左或向右落下這一隨機現象相聯系的隨機變表示向右落下,表示向左落下),由題意,的分布列可設為下述形式:對
則有,對
令,其中 相互獨立。則 表示這個小球第 次碰釘后的位置。試驗表明近似地服從正態分布。
上述例子表明,需要研究相互獨立隨機變量和的極限分布是正態分布的問題,這是本章要介紹的中心極限定理刻畫的主要內容。這個問題的解決,對概率論在自然科學和技術應用中一個最重要的手段奠定了理論基礎,這一手段是把一個現象或過程看作是許多因素的獨立影響下出現的,而每一因素對該現象或過程所發生的影響都很小。如果我們關心的是該現象或過程的研究,則只要考慮這些因素的總作用就行了。
3.3在信息論中的應用
設在某保險公司有1萬個人參加投保,每人每年付120元保險費.在一年內一個人死亡的概率為0.006,死亡時其家屬可向保險公司領得1萬元,問:(1)該保險公司虧本的概率為多少?(2)該保險公司一年的利潤不少于40,60,80萬元的概率各是多少? 設一年內死亡的人數為X,則X?B(10000, 0.006),由D-L中心極限定理,(1)P{10000X?1200000}?P{X?120}
?P{X?npnpq?120?npnpq}?1?Φ(120?6060?0.994)?1?Φ(7.77)?0,通過計算可得到即該保險公司虧本的概率幾乎為0.2)P{1200000?10000X?400000}?P{X?80}?Φ(80?6060?0.994)?Φ(2.589)?0.995,P{1200000?10000X?600000}?P{X?60}?Φ(60?6060?0.994)?Φ(0)?0.5, P{1200000?10000X?800000}?P{X?40}?P{X?40}
?Φ(40?6060?0.994)?1?Φ(2.589)?0.005.假設生產線組裝每件成品的時間服從指數分布,統計資料表明每件成品的組裝時間平均為10分鐘.設各件產品的組裝時間相互獨立.(1)試求組裝100件成品需要15到20小時的概率;(2)以95%的概率在16小時內最多可以組裝多少件成品? 解答:設第i件組裝的時間為Xi分鐘,i=1,?,100.利用獨立同分布中心極限定理.100E(Xi)?10,D(Xi)?10,i?1,2,?,100,P{900?1002?i?1Xi?1200}
?P{900?100?10100?102??i?1Xi?100?10100?102?1200?100?10100?102}
100?P{900?100?10100?10n2??i?1Xi?100?10100?102?1200?100?10100?102}
?X0.95?P{i?1i?10n?960?10n100n100n}
?Φ(960?10n100n通過表可查的),960?10n100n?1.645,n?81.18,故最多可組裝81件成品。
Vk(k?1,2,?,20)20一加法器同時收到20個噪聲電壓,設它們是相互獨立的隨變量,且都
V?在區間(0,10)上服從均勻分布。記
?Vk?1k,求P(V?105)的近似值。
解:E(Vk)?5,D(Vk)?10012(k?1,2,?,20),由定理1,得 P(V?105?P(V?20?5(1012)20?105?20?5(1012)20)?P(V?100(1012)20V?100(10?0.387)
?1?P(12)20?0.387)
?1??(0.387)
?0.348
即有 P(V?105)?0.348
抽樣檢查產品質量時,如果發現次品多于10個,則拒絕接受這批產品,設某批產品的次品率為10%,問至少應抽取多少個產品檢查才能保證拒絕接受該產品的概率達到0.9?
解 設 為至少應抽取的產品數,為其中的次品數
則
拉斯定理,有,,由德莫佛-拉普
當 充分大時,4結語,隨著試驗次數的增加,事件發生的頻率逐漸穩定于某個常數,這一事實顯示了可以用一個數來表征事件發生的可能性大小,這使人們認識到概率是客觀存在的,進而由頻率的三條性質的啟發和抽象給出了概率的定義,而頻率的穩定性是概率定義的客觀基礎。在實踐中人們還認識到大量測量值的算術平均值也具有穩定性,而這種穩定性就是本節所要討論的大數定律的客觀背景,而這些理論正是概率論的理論基礎。
參考文獻 [1] 錢和平宋家樂.強混合鞅差序列部分和乘積的幾乎處處中心極限定理 [J].《中國科技信息》 2012年 第8期
[2] 羅中德.中心極限定理教學方法研究 [ J].《現代商貿工業》 2012年 第8期 [3] 馮鳳香.獨立隨機變量序列部分和乘積的幾乎處處中心極限定理 [J].《吉林大學學報:理學版》 2012年 第2期
[4] 許道云 秦永彬 劉長云.學習《概率論與數理統計》應該注意的若干問題(6)——極限性質及其應用 [J].《銅仁學院學報》 2011年 第6期
[5] 王丙參 魏艷華 林朱.大數定律及中心極限定理在保險中的應用 [ J].《通化師范學院學報》 2011年 第12期
[6] 任敏 張光輝.非同分布φ-混合序列部分和乘積的幾乎處處中心極限定理 [J].《黑龍江大學自然科學學報》 2011年 第6期
[7] 王媛媛.部分和乘積的幾乎處處中心極限定理 [J].《桂林理工大學學報》 2011年 第3期
[8] 張鑫.大數定理發展邊程初探 [ J].《科技信息》 2011年 第22期
[9] 陳曉材 吳群英 鄧光明 周德宏.不同分布φ^~混合序列的弱大數定理 [J].《平頂山學院學報》 2010年 第2期
第五篇:第六章 第三節中心極限定理
第六章 大數定律和中心極限定理
第三節 中心極限定理
在對大量隨機現象的研究中發現,如果一個量是由大量相互獨立的隨機因素所造成,而每一個別因素在總影響中所起的作用較小,那么這種量通常都服從或近似服從正態分布.例如測量誤差、炮彈的彈著點、人體體重等都服從正態分布,這種現象就是中心極限定理的客觀背景.設隨機變量X,X,???,X,???獨立
12n同分布,且Xi~N(?,?),2(i?1,2,???)
記Y??X,(EY?n?,DY?n?),2nni?1inn 1 Y?EYY?n?? Y?稱為Y的標準DYn?*nnnnnn化, 則有Y~N(0,1)
FY*(x)?P{Yn*?x}??(x)
n*n對任意實數x,有
Y?n??x}
limP{n?nn???P{Yn ?limn?????(x)??x??*?x}?limF(x)
n???Yn*1edt.2?t2?2一般地,有下述結果。定理三(同分布的中心極限定理)設隨機變量X,X,???,X,???獨立同分布,且存在有限的數學期望和方差
EX??,DX???0,12n2ii(i?1,2,???)
記Y??X,(EY?n?,DY?n?),2nni?1innY?EYY?n?? Y?稱為Y的標DYn?*nnnnnn 2 準化, FYn*(x)?P{Y?x}
n*則對任意實數x,有
Y?n??x}
limP{n?nn???P{Yn ?limn?????(x)??x*?x}?limF(x)
n???Yn*??1edt.2?t2?2
定理表明,當n充分大時,隨機變量?X?n?i?1inn?近似地服從標準正
ni?1i態分布N(0,1).因此,?X近似地服從正態分布N(n?,n?).由此可見,正態分布在概率論中占有重要的地位.定理四(De Moivre-Laplace定理)
2設?n是n次獨立重復試驗中事件A發生的次數,p是事件A在每次 試驗中發生的概率, 則對任意區間[a,b],成立 limP{a?n?????npnnp(1?p)?b}
??ba1edt??(b)??(a)2??t22 證明 引人隨機變量
?1,第i次試驗中A發生 X?? ,?0,第i次試驗中A不發生i則n次試驗中事件A發生的次數
?n?X?X?????X ,12n12n由于是獨立試驗,所以X,X,???,X相互獨立,且都服從相同的(0—1)分布,即
P{X?1}?p,P{X?0}?1?p,i?1,2,???,nii于是
EXii?p, DX?p(1?p)
由定理三,即得
limP{n?????npnnp(1?p)ni?1i?x}
?limP{n????X?npnp(1?p)?x}
??x??1edt??(x), 2??t22于是對任意區間[a,b],有
limP{a?np(1?p)?b}
nn?????npt22??ba1edt??(b)??(a).2??
近似計算公式:
??npN?npM?np,N???M???np(1?p)np(1?p)np(1?p)nnP{N???M}nn
??npN?npM?np?P{??}np(1?p)np(1?p)np(1?p)M?npN?np??()??().np(1?p)np(1?p)例1 某計算機系統有120個終端,每個終端有5%的時間在使用,若各終端使用與否是相互獨立的,試求有10個以上的終端在使用的概率.解 以X表示使用終端的個數, 引人隨機變量 ?1,第i個終端在使用 X?? ,?0,第i個終端不使用i i?1,2,???,120 , 則
X?X?X?????X ,121202120由于使用與否是獨立的,所以X,X,???,X相互獨立,且都服從相同的(0—1)分布,即 P{X?1}?p?0.05,P{X?0}?1?p,i?1,2,???,120 1ii于是,所求概率為
P{X?10}?1?P{X?10}
X?np10?np?1?P{?},np(1?p)np(1?p)由中心極限定理得
P{X?10}?1?P{X?10}
X?np10?np?1?P{?}
np(1?p)np(1?p)10?np)
?1??(np(1?p)10?120?0.05?1??()
120?0.05?0.95?1??(1.68)?1?0.9535?0.0465.例2 現有一大批種子,其中良種占1.現從中任選6000粒,試問在這些61種子中,良種所占的比例與之誤差
6小于1%的概率是多少? 解 設X表示良種個數, 則
1X~B(n,p),n?6000,p? , 所求概率為 X1P{|?|?0.01}?P{|X?np|?n?0.01}n6
X?npn?0.01?P{||?}
np(1?p)np(1?p)X?np6000?0.01?P{||?}
15np(1?p)6000??66??(2.078)??(?2.078)
?2?(2.078)?1?2?0.98?1?0.96.例3 設有30個電子器件D,D,???,D,它們的使用情況如下: 1230D損壞,D接著使用;D損壞,D接1223著使用等等.設器件D的使用壽命服從參數??0.1(單位:h)的指數分布.令T
為30個器件使用的總時數,問T超過350h的概率是多少?
i?1 8 解 設Xi為 器件D的使用
i壽命,Xi 服從參數??0.1(單位:h)
?1的指數分布, X,X,???,X相互獨1230立, T?X1?X2?????Xnn?30, ??EX?11i??0.1?10 , ?2?DXi?1?2?10.12?100, 由中心極限定理得
P{T?350}?1?P{T?350}
?1?P{T?n?n??350?n?n?} ?1??(350?30030?10)?1??(530)?1??(0.91)?1?0.8186
?0.1814.,例4 某單位設置一電話總機,共有200架電話分機.設每個電話分機有5%的時間要使用外線通話,假定每個電話分機是否使用外線通話是相互獨立的,問總機需要安裝多少條外線才能以90%的概率保證每個分機都能即時使用.解 依題意
設X為同時使用的電話分機個數, 則X~B(n,p),n?200,p?0.05, 設安裝了N條外線, 引人隨機變量
?1,第i個分機在使用 X?? ,?0,第i個分機不使用i i?1,2,???,200 , 則
X?X?X?????X ,122002200由于使用與否是獨立的,所以X,X,???,X相互獨立,且都服從相同的(0—1)分布,即 1 10 P{X?1}?p?0.05,iP{X?0}?1?p,i?1,2,???,200, i {X?N}?保證每個分機都能即時使用, P{X?N}?0.9 , 0.9?P{X?N}
X?npN?np?} ?P{np(1?p)np(1?p)N?np)
??(np(1?p)N?200?0.05??()
200?0.05?0.95N?10N?10??()??(),3.089.5查標準正態分布表
N?10?z?1.28, 3.080.9N?1.28?3.08?10?13.94, 取 N?14, 答: 需要安裝14條外線.例5 設隨機變量X的概率密度為
?x?e,x?0 f(x)??m!,??0,x?0其中m為正整數,證明
m?xmP{0?X?2(m?1)}?.m?1 證明
xEX??xf(x)dx??x?edx
m!1xedx ??m!m?????x??0??m?2?1?x011 ??(m?2)?(m?1)!?m?1, m!m!
xEX??xf(x)dx??x?edxm!m2??2??2?x??0
1x ??m!??0m?3?1edx
?x
11??(m?3)?(m?2)!?(m?2)(m?1), m!m!
DX?EX?(EX)
222
?(m?2)(m?1)?(m?1)
?m?1 , 利用車貝謝不等式,得 P{0?X?2(m?1)}
?P{?(m?1)?X?(m?1)?(m?1)} ?P{|X?(m?1)|?(m?1)} ?P{|X?EX|?(m?1)}
DXm?1?1??1?
(m?1)(m?1)m ?.m?122 13