第一篇:中心極限定理的教學
中心極限定理的教學
摘 要: 中心極限定理是概率論與數理統計課程中一個重要的定理,也是學生學習過程中的難點,因此教學也有一定的難度.本文首先分析學生學習的主要困惑,其次針對性地理解了中心極限定理的實質,教學過程中設計了具體事例鼓勵學生自主發現探索,從而對中心極限定理容易接受,最后用實例鞏固中心極限定理的應用.關鍵詞: 中心極限定理 正態分布 自主探索 概率近似
中心極限定理是概率論與數理統計課程中一個重要的定理,銜接著概率論知識與數理統計的相關知識,是教學中的一個難點.利用中心極限定理,數理統計中許多紛亂復雜的隨機變量序列和的分布都可以用正態分布進行近似,而正態分布有著許多完美的結論,從而可以獲得實用且簡單的統計分析方法和結論.然而,由于中心極限定理的教學課時少而定理本身又較抽象,學生很難在短時間內理解該定理并能夠加以應用.為此,不少教師對該內容進行了探討.本文結合學生的基礎和知識結構,產生的疑惑,以及教學的需要,提高學生的應用能力,對該定理的教學方法進行探討.一、學生學習中心極限定理的困難
中心極限定理這一節的教學目標是要求學生理解中心極限定理,并熟練運用該定理進行事件概率的近似計算,然而在講解這一內容只有2個課時,學生又不熟悉相應的概率基礎,導致無論是數學專業還是非數學專業的學生對該知識點都存在疑惑,主要表現在:不知道中心極限定理是什么意思,具體形式是什么,怎么用.針對這三方面的問題,教師首先應該要理解深刻,概括恰當,簡明扼要.1.中心極限定理的背景
在實際問題中,許多隨機現象都是由大量微小的相互獨立的隨機因素綜合影響所產生的,比如誤差受到材料、環境、設備、操作者等因素的影響,每個因素都是微小的、隨機的,但綜合起來就產生實驗過程中的誤差,即誤差是大量的隨機因素的總和,我們關心誤差就是關心大量獨立隨機變量和的問題.中心極限定理告訴我們,大量獨立隨機變量和的極限分布是正態分布.這一點突出了正態分布在概率論與數理統計中的重要地位,在應用中凸顯了正態分布的許多優勢,同時在總體為非正態的統計問題中發揮著重要的指導作用.在實際問題中,首先分析隨機現象,將其可分解成大量的隨機變量的和,那么無論隨機變量服從正態還是非正態,其和近似看做正態分布,進而求相關的概率計算問題.學生對此不理解,主要是因為太抽象、太籠統,在教學中可讓學生自主探討,發現總結.2.中心極限定理的具體形式
中心極限定理探討的是隨機變量和的極限分布,教材中給出了不同條件下的中心極限定理的多種結論,其形式復雜,證明繁瑣,但總結起來本質是一個形式.棣莫佛-拉普拉斯中心極限定理是Lindeberg-Levy中心極限定理的特例,兩個中心極限定理歸根到底是說獨立同分布的隨機變量和的極限分布為正態分布,可變形為標準正態分布.3.中心極限定理的應用
學生對中心極限定理內容不理解,也導致無法將理論用于實踐,偶爾的依葫蘆畫瓢并沒有掌握其實質.中心極限定理常用作概率近似計算,需要根據問題的實際含義定義多個隨機變量并給出分布,然后變為獨立隨機變量和,再利用中心極限定理和正態分布的查表求概率.只有在教學中選擇恰當的例題,深入分析,合理總結,才能取到良好的效果.中心極限定理包含極限理論,因此理論上利用中心極限定理處理極限問題.在經濟問題中,質檢問題中也有廣泛的應用.教學中可引申生活實際等有趣的問題,讓學生體會學以致用的樂趣.二、中心極限定理的教學設計
首先利用簡單的引例,讓學生自主探索,總結規律.例1:有一個總體X,它是取值于[2,8]的隨機數,在等可能被取出的假設下,總體X的分布為均勻分布U(2,8).學生自主觀察直方圖的特點,得出的規律是“中間高,兩邊低,左右基本對稱”.比照正態分布的密度曲線:
上述直方圖輪廓曲線,用如下概率函數表示關于u對稱的鐘形曲線最合適.將這一規律概括起來就是中心極限定理:
其具體形式體現出三個定理.(1)中心極限定理是用極限理論反映的一個重要定理,其優勢體現在非正態分布或不知道分布類型時,為數理統計的學習奠定基礎.(2)主要應用兩方面:第一,求隨機變量之和落在某區間的概率;第二,已知隨機變量之和的概率,求.(3)解題中分析隨機總體可分解為許多獨立隨機變量的和的形式甚為關鍵.例2:某保險公司有2500個人參加保險,每人每年付1200元保險費,在一年內一個人死亡的概率為0.002,死亡時其家屬可向保險公司領得20萬元,問保險公司虧本的概率.學生處理實際問題的難點就在于不知如何進行問題的轉化.提示兩點:第一,將問題用隨機變量表示,每個人參保是隨機的獨立的,如何刻畫?第二,保險公司所得的總收益如何表示,學生經整理后發現,所求總收益正好可以看成2500個獨立同分布隨機變量之和,n=2500足夠大,故想到用中心極限定理將其近似為正態分布.求出變量和的期望和方差,利用正態分布查表求概率.為了加強對中心極限定理的理解和鞏固,對學生提出如下思考:
2.列舉貼近生活實例,讓學生鞏固練習,加以總結.3.學有余力拓展中心極限定理的應用領域.通過本節的學習,讓學生自主發現規律,善于總結,容易接受,形成解決實際問題的統計思維,熟悉中心極限定理和正態分布相關理論很有必要.參考文獻:
[1]茆詩松,程依明,濮曉龍.概率論與數理統計教程第二版[M].北京:高等教育出版社,2011.[2]黎玉芳.中心極限定理的教學方法探討[J].科技教育創新,2010(24):220-221.[3]孫碑.中心極限定理及其在若干實際問題中的應用[J].論談教學,2012(6):65-67.
第二篇:中心極限定理證明
中心極限定理證明
一、例子
高爾頓釘板試驗.圖中每一個黑點表示釘在板上的一顆釘子.每排釘子等距排列,下一排的每個釘子恰在上一排兩相鄰釘子之間.假設有排釘子,從入口中處放入小圓珠.由于釘板斜放,珠子在下落過程中碰到釘子后以的概率滾向左邊,也以的概率滾向右邊.如果較大,可以看到許多珠子從處滾到釘板底端的格子的情形如圖所示,堆成的曲線近似于正態分布.如果定義:當第次碰到釘子后滾向右邊,令;當第次碰到釘子后滾向左邊,令.則是獨立的,且
那么由圖形知小珠最后的位置的分布接近正態.可以想象,當越來越大時接近程度越好.由于時,.因此,顯然應考慮的是的極限分布.歷史上德莫佛第一個證明了二項分布的極限是正態分布.研究極限分布為正態分布的極限定理稱為中心極限定理.二、中心極限定理
設是獨立隨機變量序列,假設存在,若對于任意的,成立
稱服從中心極限定理.設服從中心極限定理,則服從中心極限定理,其中為數列.解:服從中心極限定理,則表明
其中.由于,因此
故服從中心極限定理.三、德莫佛-拉普拉斯中心極限定理
在重貝努里試驗中,事件在每次試驗中出現的概率為為次試驗中事件出現的次數,則
用頻率估計概率時的誤差估計.由德莫佛—拉普拉斯極限定理,由此即得
第一類問題是已知,求,這只需查表即可.第二類問題是已知,要使不小于某定值,應至少做多少次試驗?這時利用求出最小的.第三類問題是已知,求.解法如下:先找,使得.那么,即.若未知,則利用,可得如下估計:.拋擲一枚均勻的骰子,為了至少有0.95的把握使出現六點的概率與之差不超過0.01,問需要拋擲多少次?
解:由例4中的第二類問題的結論,.即.查表得.將代入,便得.由此可見,利用比利用契比曉夫不等式要準確得多.已知在重貝努里試驗中,事件在每次試驗中出現的概率為為次試驗中事件出現的次數,則服從二項分布:的隨機變量.求.解:
因為很大,于是
所以
利用標準正態分布表,就可以求出的值.某單位內部有260架電話分機,每個分機有0.04的時間要用外線通話,可以認為各個電話分機用不用外線是是相互獨立的,問總機要備有多少條外線才能以0.95的把握保證各個分機在使用外線時不必等候.解:以表示第個分機用不用外線,若使用,則令;否則令.則.如果260架電話分機同時要求使用外線的分機數為,顯然有.由題意得,查表得,故取.于是
取最接近的整數,所以總機至少有16條外線,才能有0.95以上的把握保證各個分機在使用外線時不必等候.根據孟德爾遺傳理論,紅黃兩種番茄雜交第二代結紅果植株和結黃果植株的比率為3:1,現在種植雜交種400株,試求結黃果植株介于83和117之間的概率.解:將觀察一株雜交種的果實顏色看作是一次試驗,并假定各次試驗是獨立的.在400株雜交種中結黃果的株數記為,則.由德莫佛—拉普拉斯極限定理,有
其中,即有
四、林德貝格-勒維中心極限定理
若是獨立同分布的隨機變量序列,假設,則有
證明:設的特征函數為,則的特征函數為
又因為,所以
于是特征函數的展開式
從而對任意固定的,有
而是分布的特征函數.因此,成立.在數值計算時,數用一定位的小數來近似,誤差.設是用四舍五入法得到的小數點后五位的數,這時相應的誤差可以看作是上的均勻分布.設有個數,它們的近似數分別是,.,.令
用代替的誤差總和.由林德貝格——勒維定理,以,上式右端為0.997,即以0.997的概率有
設為獨立同分布的隨機變量序列,且互相獨立,其中,證明:的分布函數弱收斂于.證明:為獨立同分布的隨機變量序列,且互相獨立,所以仍是獨立同分布的隨機變量序列,易知有
由林德貝格——勒維中心極限定理,知的分布函數弱收斂于,結論得證.作業:
p222EX32,33,34,3
5五、林德貝爾格條件
設為獨立隨機變量序列,又
令,對于標準化了的獨立隨機變量和的分布
當時,是否會收斂于分布?
除以外,其余的均恒等于零,于是.這時就是的分布函數.如果不是正態分布,那么取極限后,分布的極限也就不會是正態分布了.因而,為了使得成立,還應該對隨機變量序列加上一些條件.從例題中看出,除以外,其余的均恒等于零,在和式中,只有一項是起突出作用.由此認為,在一般情形下,要使得收斂于分布,在的所有加項中不應該有這種起突出作用的加項.因為考慮加項個數的情況,也就意味著它們都要“均勻地斜.設是獨立隨機變量序列,又,這時
(1)若是連續型隨機變量,密度函數為,如果對任意的,有
(2)若是離散型隨機變量,的分布列為
如果對于任意的,有
則稱滿足林德貝爾格條件.以連續型情形為例,驗證:林德貝爾格條件保證每個加項是“均勻地斜.證明:令,則
于是
從而對任意的,若林德貝爾格條件成立,就有
這個關系式表明,的每一個加項中最大的項大于的概率要小于零,這就意味著所有加項是“均勻地斜.六、費勒條件
設是獨立隨機變量序列,又,稱條件為費勒條件.林德貝爾格證明了林德貝爾格條件是中心極限定理成立的充分條件,但不是必要條件.費勒指出若費勒條件得到滿足,則林德貝爾格條件也是中心極限定理成立的必要條件.七、林德貝爾格-費勒中心極限定理
引理1對及任意的,證明:記,設,由于
因此,其次,對,用歸納法即得.由于,因此,對也成立.引理2對于任意滿足及的復數,有
證明:顯然
因此,由歸納法可證結論成立.引理3若是特征函數,則也是特征函數,特別地
證明定義隨機變量
其中相互獨立,均有特征函數,服從參數的普哇松分布,且與諸獨立,不難驗證的特征函數為,由特征函數的性質即知成立.林德貝爾格-費勒定理
定理設為獨立隨機變量序列,又.令,則
(1)
與費勒條件成立的充要條件是林德貝爾格條件成立.證明:(1)準備部分
記
(2)
顯然(3)
(4)
以及分別表示的特征函數與分布函數,表示的分布函數,那么(5)
這時
因此林德貝爾格條件化為:對任意,(6)
現在開始證明定理.設是任意固定的實數.為證(1)式必須證明
(7)
先證明,在費勒條件成立的假定下,(7)與下式是等價的:
(8)
事實上,由(3)知,又因為
故對一切,把在原點附近展開,得到
因若費勒條件成立,則對任意的,只要充分大,均有
(9)
這時
(10)
對任意的,只要充分小,就可以有
(11)
因此,由引理3,引理2及(10),(11),只要充分大,就有
(12)
因為可以任意小,故左邊趨于0,因此,證得(7)與(8)的等價性.(2)充分性
先證由林德貝爾格條件可以推出費勒條件.事實上,(13)
右邊與無關,而且可選得任意小;對選定的,由林德貝爾格條件(6)知道第二式當足夠大時,也可以任意地小,這樣,費勒條件成立.其次證明林德貝爾格條件能保證(1)式成立.注意到(3)及(4),可知,當時,當時,因此
(14)
對任給的,由于的任意性,可選得使,對選定的,用林德貝爾格條件知只要充分大,也可使.因此,已證得了(8),但由于已證過費勒條件成立,這時(8)與(7)是等價的,因而(7)也成立.(3)必要性
由于(1)成立,因此相應的特征函數應滿足(7).但在費勒條件成立時,這又推出了(8),因此,(15)
上述被積函數的實部非負,故
而且
(16)
因為對任意的,可找到,使,這時由(15),(16)可得
故林德貝爾格條件成立.八、李雅普諾夫定理
設為獨立隨機變量序列,又.令,若存在,使有
則對于任意的,有
第三篇:第六章 第三節中心極限定理
第六章 大數定律和中心極限定理
第三節 中心極限定理
在對大量隨機現象的研究中發現,如果一個量是由大量相互獨立的隨機因素所造成,而每一個別因素在總影響中所起的作用較小,那么這種量通常都服從或近似服從正態分布.例如測量誤差、炮彈的彈著點、人體體重等都服從正態分布,這種現象就是中心極限定理的客觀背景.設隨機變量X,X,???,X,???獨立
12n同分布,且Xi~N(?,?),2(i?1,2,???)
記Y??X,(EY?n?,DY?n?),2nni?1inn 1 Y?EYY?n?? Y?稱為Y的標準DYn?*nnnnnn化, 則有Y~N(0,1)
FY*(x)?P{Yn*?x}??(x)
n*n對任意實數x,有
Y?n??x}
limP{n?nn???P{Yn ?limn?????(x)??x??*?x}?limF(x)
n???Yn*1edt.2?t2?2一般地,有下述結果。定理三(同分布的中心極限定理)設隨機變量X,X,???,X,???獨立同分布,且存在有限的數學期望和方差
EX??,DX???0,12n2ii(i?1,2,???)
記Y??X,(EY?n?,DY?n?),2nni?1innY?EYY?n?? Y?稱為Y的標DYn?*nnnnnn 2 準化, FYn*(x)?P{Y?x}
n*則對任意實數x,有
Y?n??x}
limP{n?nn???P{Yn ?limn?????(x)??x*?x}?limF(x)
n???Yn*??1edt.2?t2?2
定理表明,當n充分大時,隨機變量?X?n?i?1inn?近似地服從標準正
ni?1i態分布N(0,1).因此,?X近似地服從正態分布N(n?,n?).由此可見,正態分布在概率論中占有重要的地位.定理四(De Moivre-Laplace定理)
2設?n是n次獨立重復試驗中事件A發生的次數,p是事件A在每次 試驗中發生的概率, 則對任意區間[a,b],成立 limP{a?n?????npnnp(1?p)?b}
??ba1edt??(b)??(a)2??t22 證明 引人隨機變量
?1,第i次試驗中A發生 X?? ,?0,第i次試驗中A不發生i則n次試驗中事件A發生的次數
?n?X?X?????X ,12n12n由于是獨立試驗,所以X,X,???,X相互獨立,且都服從相同的(0—1)分布,即
P{X?1}?p,P{X?0}?1?p,i?1,2,???,nii于是
EXii?p, DX?p(1?p)
由定理三,即得
limP{n?????npnnp(1?p)ni?1i?x}
?limP{n????X?npnp(1?p)?x}
??x??1edt??(x), 2??t22于是對任意區間[a,b],有
limP{a?np(1?p)?b}
nn?????npt22??ba1edt??(b)??(a).2??
近似計算公式:
??npN?npM?np,N???M???np(1?p)np(1?p)np(1?p)nnP{N???M}nn
??npN?npM?np?P{??}np(1?p)np(1?p)np(1?p)M?npN?np??()??().np(1?p)np(1?p)例1 某計算機系統有120個終端,每個終端有5%的時間在使用,若各終端使用與否是相互獨立的,試求有10個以上的終端在使用的概率.解 以X表示使用終端的個數, 引人隨機變量 ?1,第i個終端在使用 X?? ,?0,第i個終端不使用i i?1,2,???,120 , 則
X?X?X?????X ,121202120由于使用與否是獨立的,所以X,X,???,X相互獨立,且都服從相同的(0—1)分布,即 P{X?1}?p?0.05,P{X?0}?1?p,i?1,2,???,120 1ii于是,所求概率為
P{X?10}?1?P{X?10}
X?np10?np?1?P{?},np(1?p)np(1?p)由中心極限定理得
P{X?10}?1?P{X?10}
X?np10?np?1?P{?}
np(1?p)np(1?p)10?np)
?1??(np(1?p)10?120?0.05?1??()
120?0.05?0.95?1??(1.68)?1?0.9535?0.0465.例2 現有一大批種子,其中良種占1.現從中任選6000粒,試問在這些61種子中,良種所占的比例與之誤差
6小于1%的概率是多少? 解 設X表示良種個數, 則
1X~B(n,p),n?6000,p? , 所求概率為 X1P{|?|?0.01}?P{|X?np|?n?0.01}n6
X?npn?0.01?P{||?}
np(1?p)np(1?p)X?np6000?0.01?P{||?}
15np(1?p)6000??66??(2.078)??(?2.078)
?2?(2.078)?1?2?0.98?1?0.96.例3 設有30個電子器件D,D,???,D,它們的使用情況如下: 1230D損壞,D接著使用;D損壞,D接1223著使用等等.設器件D的使用壽命服從參數??0.1(單位:h)的指數分布.令T
為30個器件使用的總時數,問T超過350h的概率是多少?
i?1 8 解 設Xi為 器件D的使用
i壽命,Xi 服從參數??0.1(單位:h)
?1的指數分布, X,X,???,X相互獨1230立, T?X1?X2?????Xnn?30, ??EX?11i??0.1?10 , ?2?DXi?1?2?10.12?100, 由中心極限定理得
P{T?350}?1?P{T?350}
?1?P{T?n?n??350?n?n?} ?1??(350?30030?10)?1??(530)?1??(0.91)?1?0.8186
?0.1814.,例4 某單位設置一電話總機,共有200架電話分機.設每個電話分機有5%的時間要使用外線通話,假定每個電話分機是否使用外線通話是相互獨立的,問總機需要安裝多少條外線才能以90%的概率保證每個分機都能即時使用.解 依題意
設X為同時使用的電話分機個數, 則X~B(n,p),n?200,p?0.05, 設安裝了N條外線, 引人隨機變量
?1,第i個分機在使用 X?? ,?0,第i個分機不使用i i?1,2,???,200 , 則
X?X?X?????X ,122002200由于使用與否是獨立的,所以X,X,???,X相互獨立,且都服從相同的(0—1)分布,即 1 10 P{X?1}?p?0.05,iP{X?0}?1?p,i?1,2,???,200, i {X?N}?保證每個分機都能即時使用, P{X?N}?0.9 , 0.9?P{X?N}
X?npN?np?} ?P{np(1?p)np(1?p)N?np)
??(np(1?p)N?200?0.05??()
200?0.05?0.95N?10N?10??()??(),3.089.5查標準正態分布表
N?10?z?1.28, 3.080.9N?1.28?3.08?10?13.94, 取 N?14, 答: 需要安裝14條外線.例5 設隨機變量X的概率密度為
?x?e,x?0 f(x)??m!,??0,x?0其中m為正整數,證明
m?xmP{0?X?2(m?1)}?.m?1 證明
xEX??xf(x)dx??x?edx
m!1xedx ??m!m?????x??0??m?2?1?x011 ??(m?2)?(m?1)!?m?1, m!m!
xEX??xf(x)dx??x?edxm!m2??2??2?x??0
1x ??m!??0m?3?1edx
?x
11??(m?3)?(m?2)!?(m?2)(m?1), m!m!
DX?EX?(EX)
222
?(m?2)(m?1)?(m?1)
?m?1 , 利用車貝謝不等式,得 P{0?X?2(m?1)}
?P{?(m?1)?X?(m?1)?(m?1)} ?P{|X?(m?1)|?(m?1)} ?P{|X?EX|?(m?1)}
DXm?1?1??1?
(m?1)(m?1)m ?.m?122 13
第四篇:中心極限定理和概率統計
若{Xn}的分布函數序列{Fn(x)}與X的分布函數F(x)有,在任意連續點x,limFn(x)?F(x)。n??
依概率收斂
n??若???0,有P(Xn?X??)????0。準確的表述是,???0,???0,?N,n?N,有P(Xn?X??)??成立
(3)幾乎必然收斂
如果有P(limXn?X)?1。準確的表述是,除掉一個0概率集A,對所有的???A,n??
有limXn(?)?X(?)成立。這是概率空間上的點收斂。n??
定理1。(切貝雪夫大數律){Xn}相互獨立,且有相同的期望和方差,(不一定同分布)
1nPE(Xn)?uD(Xn)??,?n,記Yn??Xi,則Yn???u。ni?1
2統計發生——事物某方面的定量記錄事前是不確定的,發生后的數據由真值和誤差兩部分構成,X????。X是數據,?是真值,?是誤差。導致誤差的原因有:
1. 系統性誤差:偏離真值的本質性錯誤,有內在原因所致;
2. 隨機性誤差:偏離真值的偶然性錯誤,沒有內在原因,是純偶然因素所致。
總體就是一個特定的隨機變量
通過抽樣,獲得樣本,構造樣本統計量,由此推斷總體中某些未知的信息
從總體中抽樣是自由的,且當總體數量足夠大,有放回與無放回抽樣區別不大,有理由認為,取得的抽樣觀察值是沒有關系的。所以,樣本在未抽取前它們是與總體X同分布的隨機變量,且是相互獨立的,稱此為隨機樣本。
定義2。設x1,?,xn是取自總體X的一組樣本值,g(x1,?,xn)是Borel 可測函數,則稱隨機變量g(X1,?,Xn)是一個樣本統計量。
如果總體X中分布函數有某些參數信息是未知的,我們用統計量g(X1,?,Xn)去推斷這些信息,稱此問題為統計推斷問題。
給樣本值x?(x1,?,xN)?,y?(y1,?,yN)?,定義:(1)樣本均值
??(xi/n)
i?
1n
(2)樣本方差
1n
?x)????var((xi?)2 ?n?1i?1
??樣本標準差
s.e.e??)
x)i(y)
1n
(3)樣本協方差c?ov(x,y)???(1x
n?1i?1
樣本相關系數
?xy?
?(x,y)cov
1/2
?(x)var?(y)][var
1nk
(4)樣本k階矩 Ak??xi k?1,2,?
ni?11n
(5)樣本k階中心矩 Bk??(xi?)k
ni?1
?
k?1,2,?
X的左側分位點F?,P(X?F?)??dF(x)??。左?分位點的概率含義是,隨機變量
F?
不超過該點的概率等于?
設總體X分布已知,但其中有一個或多個參數未知,抽樣X1,?,Xn,希望通過樣本來估計總體中的未知參數,稱此為參數估計問題,它是統計推斷理論中最重要的基礎部分。
用樣本矩作為總體矩的估計量,以及用樣本矩的連續函數作為總體矩的連續函數的估計量,這種方法稱為矩估計法,這是一種最自然的估計方法。
?(x,?,x))??對任意???成立。當樣本是稱??是參數?的一個無偏估計,如果E(?1n
有限的時候,我們首先要考慮的是無偏性。
n1n22
??S??(Xi?)2才是方差?的無偏估計。故我們在樣本統計量中定義?n?1n?1i?1
S2為樣本方差。
??是參數?的一個一致估計,如果依概率有lim??(x1,?,xn)??對任意???成立。
n??
有效性
在所有關于參數?的無偏估計類中?0,或所有的一致估計類?1中,如果存在?*是參數?的一個無偏有效估計或一?*)?D(??)對任意????或任意????成立,稱?D(?01
?具有最小方差性。致漸近有效估計。即?
*
。無論總體X分布是什么,任意樣本Xi和都是X的無偏估計,但?比單獨的樣本估計Xi更有效。
DXi,所以n
設總體X關于分布F(x,?)存在兩類問題,一類是分布的形式未知,一類是分布的形式已知但參數未知,提出的問題是,需要對分布的形式作出推斷,此稱為非參數檢驗的問題; 或需要對參數作出推斷,此稱為參數檢驗問題。
奈克—皮爾遜定理告訴我們,當樣本容量n固定,若要減少犯第一類錯誤的概率則犯第二類錯誤的概率會增加,要使兩類錯誤都減少當且僅當增加樣本容量。
超過了我們設定的F?,(如,體溫超過37度。)此意味一個小概率事件發生了。于是,我們有理由拒絕命題H0是真的。
X~N(u1,?12),Y~N(u2,?2),且相互獨立,取樣有(x1?xn1),(y1?yn2)。
欲檢驗H0:u1?u2,或更一般,H0:u1?u2?u(u已知)。如何檢驗?
2(1)若?12、?2已知
因為~N(u1,?1
2n
1),~N(u2,2?2
n2),且相互獨立,所以?~N(u1?u2,?12?2
n1
?
n2),~N(0,1),所以可找到檢驗統計量U?。
(2)若?12??2??2,但?未知,欲檢驗H0:u1?u2?0,因為V?
?
222
[(n?1)S?(n?1)S]~?(n1?n2?2),11222
且與
U?
~N(0,1)獨立,n1?1n2?12
~t(n1?n2?2),令S2?,S12?S2
n1?n2?2n1?n2?2可得
V?2S2,所以可找到統計量
n1?n2?2?
T?
?
~t(n1?n2?2)。
注:如果u未知,問題就變困難了,可以證明此時統計量T就是一個非中心的t分布。
(3)又如何知道?12??2??2?
?12(n?1)(n?1)2可做假設檢驗H0:2?1。因為12S12~?2(n1?1),22S2 ~?2(n2?1)且獨立。
?1?2?2
S12
所以,可找到統計量F?2~F(n1?1,n2?1)。
S2
(4)若?12??2,且未知。問題就變困難多了,我們找不到合適的統計量。如果樣本容量
足夠大,那么,可以用漸近檢驗的辦法處理。注意,U?
中,因為?12,?2未
知,但已知S12,S2是?12,?2的一致估計,故用它們代替,有:
n1,n2??
limU?
~N(0,1)。
從而當n1,n2充分大時可用漸近正態檢驗。
又當n1?n2?n較小時,可以證明,~t(n),注意,此與T?
?
~t(n1?n2?2)
自由度不同。此意味當期望、方差相同時,樣本可以合并,認為X,Y屬于同一總體。當期望相同,方差不同時,樣本不能簡單合并。
注:關于H0:u1?u2?u,或H0:u1?u2?u,統計量相同,并采用單側的右分位點或單側的左分位點檢驗。
?是無偏線性估計類中的有效估計。OLS?
? ?的極大似然估計在基本模型假定下就是OLS?
估計做出后,評價、判斷模型中的假定是否合理是對事前設定的模型做一個整體的把握。我們可以把這些假定、設定歸結為一些對未知參數的判斷,如果這些判斷基本正確或錯誤,那么從整體數據中就能夠反映出來。假設檢驗是估計完成后對模型的設定做進一步的確認。它以證否的形式完成。拒絕原假設,意味著命題真時犯錯誤的可能性可控制在一定的概率范圍內。
第五篇:淺談中心極限定理及其應用 論文
淺談中心極限定理及其應用
李月20091103558
數學科學學院信息與計算科學09信息一班
指導老師韓文忠
摘要:概率論中討論隨機變量序列部分和的分布漸近于正態分布的一類定理。在自然界與生產中,一些現象受到許多相互獨立的隨機因素的影響,如果每個因素所產生的影響都很微小時,總的影響可以看作是服從正態分布的。中心極限定理就是從數學上證明了這一現象。本文主要敘述中心極限定理在現實中的應用。關鍵字:中心極限定理 隨機變量 正態分布
1.定理一(獨立同分布的中心極限定理)設隨機變量X1,X2,…,Xn,…相互獨
立,服從同一分布,且具有數學期望和方差,E(Xk)??,n
D(Xk)=?
>0(k=1,2,3?),則隨機變量之和?Xk的標準化變量
k?1
n
n
n
X
k
?E(?Xk)
k?1n
?
=
k?1
X
K
?n?
Yn=?
k?1
D(?Xk)
k?1
n?的分布函數Fn(x)對于任意x滿足
n
?x
limFn(x)=limFn(x)=limP{
n??
k
?n?
?x
k?1
n?
}=?
x
12?
??
?t
dt= ?(x).這就是說,均值為?,方差為?2?0 的獨立同分布的隨機變量
n
X1,X2,…,Xn之和?Xk的標準化變量,當n充分大時,有
k?1
n
?
k?1
X
n
?n?
n?
~N(0,1)
1.1:一加法器同時接收20個噪聲電壓Vk(k=1,2,3?,20),設它們是相互獨
立的隨機變量,且都在區間(0,10)上服從均勻分布,記V?
P{V?105}的近似值。
?V,求
k
k?1
解:易知E(Vk)?5,D(Vk)?100/12(k=1,2,3?,20),由定理一,隨機
變量Z?
?V
K?1
k
=
V?20?5?
近似服從正態分布N(0,1),于是
P{V?105}?P{?
V?20?520
105?20?520
V?20?520
?0.387}
?1?P{
V?20?520
?0.387}
?1?
?
0.387
12?
??
?t
dt?1??(0.387)?0.384.即有P{V?105}?0.34
2.(李雅譜諾夫(Lyapunov)定理)設隨機變量X1,X2,…,Xn,…相互獨立,它們具有數學期望和方差
?0,k?1,2?,E(Xk)??,D(XK)??K
nn
記??k?
k?1
??.k
k?1
若存在正數?,使得當n??時,n
1B
2??n
n
?
k?1
E{Xk??k
2??
}?0,則隨機變量之和?Xk的標準化變量
k?1
nnnn
?
Zn?
k?1
X
k
?E(?Xk)
k?1n
?
?
k?1
X
k
?Bn
?
k?1
X
k
D(?Xk)
k?1
n
n
?的分布函數limFn(x)?limP{
n??
n??
k?1
X
k
?Bn
??
k?1
k
?x}
?
?
x
12?
?t
dt= ?(x).??
此定理表明,在定理的條件下,隨機變量
n
n
k
?X
Zn?
k?1
?Bn
?X
k?1
k
當n很大時,近似的服從正態分布
n
n
N(0,1),由此,當n很大,n
?
k?1
X
k
?BnZn?
??
k?1
k
近似的服從正態分布
N(??k,Bn)
k?1
.這就是說,無論各個隨機變量
n
Xk(k?1,2?)
服從什么分布,只要滿足定理的條件,那么它們的和k?1
?
X
k
當n很大時就近似地服從正態
分布,在很多問題中所考慮的隨機變量可以表示成很多個獨立的隨機變量之和。請看下面的例子。
2.1:設有一條河流經某城市,河上有一座橋,該橋的強度服從正態分布
N(300,40)(強度的單位是t(噸))。有很多車要經過此橋,如果各車的平
均重量是5t,方差是2t2。問:為保證此橋不出問題的概率(安全度)不小于0.99997.最多允許在橋上同時出現多少車輛?
解:用Y表示該橋的強度,若有M輛車在橋上,第i輛車的重量Xi
M
(i?1,2?M),則M輛車的總重量SM?
?
i?1
Xi,我們可以認為
Y,X1,X2?XM是相互獨立的,E(Xi)?5,var(Xi)?2,該橋不出現問
題的概率為
R?P(M輛車的總重量不超過橋的強度)。
顯然R?P(SM?Y)?R?P(SM?Y?0),我們要找滿足不等式
R?0.99997的最大的M,不難想到,這個M,由于
SM)
E(SM
=,M?1,var(=
M?1
(這里
?1?E(Xi)?5
?1?var(Xi)?2,i?1,2?M),由定理可知SM近似的服從
N(M?1,M?1)
.又N
(300,40),可知SM?Y
近似服從
N(M?1?300,M?12?40),于是
R??[
0?(M?1?300)
M?
]
?40
由于?(4)=0.99997,故為了R?0.99997,必須且只需
令x?
0?(M?1?300)
M?
2M?40
?4
?40
(x?40),上述不等式化為,則M?
x?4x?400?0
((11.87)?400))
由此知x?11.87,從而M?=50.就是說,最多允許50輛車
同時在橋上。
下面介紹另一個中心極限定理,它是定理一的特殊情況。
3.(棣莫弗-拉普拉斯(De Moirve-Laplace)定理)設隨機變量(n?1,2,?)服從參數為n,p(0?p?1)的二項分布,則對于任意x,有limP{
n??
?npnp(1?p)
?x}=?
x
12?
?t
dt=?(x)。
??
這個定理表明,二項分布的極限分布式正態分布
n
?Xk~N(np,npq)當n充分大時,服從二項分布的隨機變量的概
k?1
率計算可以轉化為正態隨機變量的概率計算。
3.1 :對于一個學生而言,來參加家長會的家長人數是一個隨機變量,設一個學
生無家長,1名家長,2名家長來參加會議的概率分別為0.05,0.8,0.15,若學校共有400名學生,設各學生參加會議的家長人數相互獨立且服從同一分布。(1)求參加會議的家長人數x超過450的概率:
(2)求有1名家長來參加會議的學生人數不多于340的概率。
解(1)以Xk(k?1,2?,400)記第k個學生來參加會議的家長人數,則Xk的分布率為
400
易知E(Xk)?1.1,D(Xk)?0.19,k?1,2?400.而X?隨機變量
400
?X。由定理一
k
k?1
?X
k?1
k
?400?1.1
0.19
?
X?400?1.1400
0.19
400
近似服從正態分布N(0,1),于是
P{X?450
}=P{
X?400?1.1400
0.19
?
450?400?1.1400
0.19
=1-P{
X?400?1.1400
0.19
?1.147}
?1??(1.147)?0.1251’
(3)以Y記有一名家長參加會議的學生人數,則Y~b(400,0.8),由定理三
P{Y?340}
=P{
Y?400?0.8400?0.8?0.2Y?400?0.8400?0.8?0.2
?
340?400?0.8400?0.8?0.2
}
=P{?2.5}??(2.5)=0.9938
小結 中心極限定理表明,在相當一般的條件下,當獨立隨機變量的個數不斷增加時,其和態分布趨于正態分布,這一事實闡明了正態分布的重要性,也揭示了為什么在實際應用中會經常用到正態分布,也就揭示了產生正態分布變量的源泉,另一方面,它提供了獨立同分布變量隨機變量之和?Xk(其中Xk的方
k?1
n
差存在的近似分布,只要和式中加項的個數充分大,就可以不必考慮和式中的隨機變量服從什么分布。都可以用正態分布來近似,這在應用上是有效和重要的。
參考文獻
[1] 盛驟概率論與數理統計,高等教育出版社,2006 [2] 陳家鼎 鄭中國概率與統計 高等教育出版社 2004