第一篇:教案_第七章 假設(shè)檢驗(yàn)
《統(tǒng)計(jì)學(xué)》教案
第七章
假設(shè)檢驗(yàn)
教學(xué)目的: 介紹假設(shè)檢驗(yàn)的基本思想、步驟和規(guī)則,兩類(lèi)錯(cuò)誤的概念,以及重要總體參數(shù)的檢驗(yàn)方法。
基本要求: 通過(guò)本章學(xué)習(xí)要求同學(xué)們理解假設(shè)檢驗(yàn)的基本思想、規(guī)則和兩類(lèi)錯(cuò)誤的概念,掌握假設(shè)檢驗(yàn)的步驟和總體均值、成數(shù)、方差的檢驗(yàn)方法。
重點(diǎn)和難點(diǎn): 假設(shè)檢驗(yàn)的基本思想、規(guī)則和兩類(lèi)錯(cuò)誤的概念。
教學(xué)內(nèi)容:§1假設(shè)檢驗(yàn)的一般問(wèn)題
§2 一個(gè)正態(tài)總體的參數(shù)檢驗(yàn) 體的參數(shù)檢驗(yàn)
§4假設(shè)檢驗(yàn)中的其它問(wèn)題
學(xué)時(shí)分配:4學(xué)時(shí) 主要參考書(shū)目:
1、陳珍珍等,統(tǒng)計(jì)學(xué),廈門(mén):廈門(mén)大學(xué)出版社,2003年版
2、于磊等,統(tǒng)計(jì)學(xué),上海:同濟(jì)大學(xué)出版社,2003年
3、徐國(guó)強(qiáng)等,統(tǒng)計(jì)學(xué),上海:上海財(cái)經(jīng)大學(xué)出版社,2001年版 思考題:
1、請(qǐng)闡述假設(shè)檢驗(yàn)的步驟
2、假設(shè)檢驗(yàn)的結(jié)果是接受原假設(shè),是否表明原假設(shè)是正確的?
3、如何構(gòu)造檢驗(yàn)統(tǒng)計(jì)量?
§1假設(shè)檢驗(yàn)的一般問(wèn)題
教學(xué)內(nèi)容
一、假設(shè)檢驗(yàn)的概念 1.概念
? 事先對(duì)總體參數(shù)或分布形式作出某種假設(shè) ? 然后利用樣本信息來(lái)判斷原假設(shè)是否成立
2.類(lèi)型
? 參數(shù)假設(shè)檢驗(yàn)----檢驗(yàn)總體參數(shù) ? 非參數(shù)假設(shè)檢驗(yàn)----檢驗(yàn)總體分布形式
3.特點(diǎn)
? 采用邏輯上的反證法
3二個(gè)正態(tài)總 §? 依據(jù)統(tǒng)計(jì)上的小概率原理----小概率事件在一次試驗(yàn)中不會(huì)發(fā)生
二、假設(shè)檢驗(yàn)的步驟
? ? ? ? ? 提出原假設(shè)和備擇假設(shè) 確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量 規(guī)定顯著性水平? 計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值 作出統(tǒng)計(jì)決策
三、假設(shè)檢驗(yàn)中的小概率原理
在一次試驗(yàn)中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)。因?yàn)槲覀兙芙^發(fā)生錯(cuò)誤的可能性至多是?
四、假設(shè)檢驗(yàn)中的兩類(lèi)錯(cuò)誤
1.第一類(lèi)錯(cuò)誤(棄真錯(cuò)誤)
? 原假設(shè)為真時(shí),我們拒絕了原假設(shè) ? 第一類(lèi)錯(cuò)誤的概率為? 2.第二類(lèi)錯(cuò)誤(取偽錯(cuò)誤)
? 原假設(shè)為假時(shí),我們接受了原假設(shè) ? 第二類(lèi)錯(cuò)誤的概率為?? ? 比第一類(lèi)錯(cuò)誤更容易發(fā)生
即接受原假設(shè)很容易發(fā)生
五、Neyman和Pearson檢驗(yàn)原則
在控制犯第一類(lèi)錯(cuò)誤的概率?條件下, 盡可能使犯第二類(lèi)錯(cuò)誤的概率?減小。
該原則的含義是, 原假設(shè)要受到維護(hù), 使它不致被輕易否定, 若要否定原假設(shè), 必須有充分的理由---小概率事件發(fā)生了;接受原假設(shè), 只說(shuō)明否定它的理由還不充分
六、雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)
教學(xué)方法
采用課堂教學(xué)方法
提問(wèn)與討論
1.在假設(shè)檢驗(yàn)中顯著性水平?有什么意義?
2.顯著性水平?相同時(shí),雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)的拒絕域是否相同?
板書(shū)設(shè)計(jì)
主要運(yùn)用多媒體課件展示。重要內(nèi)容采用書(shū)寫(xiě)板書(shū)
§2一個(gè)正態(tài)總體的參數(shù)檢驗(yàn)
教學(xué)內(nèi)容
一、總體方差已知時(shí)的均值檢驗(yàn)
1.假定條件
? 總體服從正態(tài)分布
? 若不服從正態(tài)分布, 可用正態(tài)分布來(lái)近似(n?30)2.原假設(shè)為:H0: ?=?0;備擇假設(shè)為:H1:? ??0
或
H0: ?≥?0 H1:?<?0
或
H0: ?≤?0 H1:?>?0 3.使用z-統(tǒng)計(jì)量
二、例題
1.某機(jī)床廠加工一種零件,根據(jù)經(jīng)驗(yàn)知道,該廠加工零件的橢圓度近似服從正態(tài)分布,其總體均值為?0=0.081mm,總體標(biāo)準(zhǔn)差為?= 0.025。今換一種新機(jī)床進(jìn)行加工,抽取n=200個(gè)零件進(jìn)行檢驗(yàn),得到的橢圓度為0.077mm。試問(wèn)新機(jī)床加工零件的橢圓度的均值與以前有無(wú)顯著差異?(?=0.05)
2某批發(fā)商欲從生產(chǎn)廠家購(gòu)進(jìn)一批燈泡,根據(jù)合同規(guī)定,燈泡的使用壽命平均不能低于1000小時(shí)。已知燈泡使用壽命服從正態(tài)分布,標(biāo)準(zhǔn)差為200小時(shí)。在總體中隨機(jī)抽取100只燈泡,測(cè)得樣本均值為960小時(shí)。批發(fā)商是否應(yīng)該購(gòu)買(mǎi)這批燈泡?(?=0.05)
三、總體方差未知時(shí)的均值檢驗(yàn)
1.假定條件 ? 總體為正態(tài)分布
? 如果不是正態(tài)分布, 只有輕微偏斜和大樣本(n ?30)條件下 2.使用t 統(tǒng)計(jì)量
四、例題
1.某廠采用自動(dòng)包裝機(jī)分裝產(chǎn)品,假定每包產(chǎn)品的重量服從正態(tài)分布,每包標(biāo)準(zhǔn)重量為1000克。某日隨機(jī)抽查9包,測(cè)得樣本平均重量為986克,樣本標(biāo)準(zhǔn)差為24克。試問(wèn)在0.05的顯著性水平上,能否認(rèn)為這天自動(dòng)包裝機(jī)工作正常?
2.一個(gè)汽車(chē)輪胎制造商聲稱(chēng),某一等級(jí)的輪胎的平均壽命在一定的汽車(chē)重量和正常行駛條件下大于40000公里,對(duì)一個(gè)由20個(gè)輪胎組成的隨機(jī)樣本作了試驗(yàn),測(cè)得平均值為41000公里,標(biāo)準(zhǔn)差為5000公里。已知輪胎壽命的公里數(shù)服從正態(tài)分布,我們能否根據(jù)這些數(shù)據(jù)作出結(jié)論,該制造商的產(chǎn)品同他所說(shuō)的標(biāo)準(zhǔn)相符?(? = 0.05)
五、總體比例的假設(shè)檢驗(yàn)
1.在大樣本條件下,樣本比例p漸近服從正態(tài)分布
2.比例檢驗(yàn)的 z 統(tǒng)計(jì)量
六、例題
某研究者估計(jì)本市居民家庭的電腦擁有率為30%。現(xiàn)隨機(jī)抽查了200的家庭,其中68個(gè)家庭擁有電腦。試問(wèn)研究者的估計(jì)是否可信?(? = 0.05)
七、總體方差的檢驗(yàn)
1.檢驗(yàn)一個(gè)總體的方差或標(biāo)準(zhǔn)差 2.假設(shè)總體近似服從正態(tài)分布 3.原假設(shè)為 H0: ?2 = ?02 4.檢驗(yàn)統(tǒng)計(jì)量
八、例題
根據(jù)長(zhǎng)期正常生產(chǎn)的資料可知,某廠所產(chǎn)維尼綸的纖度服從正態(tài)分布,其方差為0.0025。現(xiàn)從某日產(chǎn)品中隨機(jī)抽取20根,測(cè)得樣本方差為0.0042。試判斷該日纖度的波動(dòng)與平日有無(wú)顯著差異?
教學(xué)方法
采用課堂教學(xué)方法
提問(wèn)與討論
1.結(jié)合實(shí)例討論,選取不同的顯著性水平,會(huì)否影響檢驗(yàn)結(jié)果
2.結(jié)合實(shí)例討論,有些問(wèn)題若將原假設(shè)與備擇假設(shè)對(duì)調(diào),檢驗(yàn)結(jié)果為什么矛盾?
板書(shū)設(shè)計(jì)
主要運(yùn)用多媒體課件展示。重要內(nèi)容采用書(shū)寫(xiě)板書(shū)
§3兩個(gè)正態(tài)總體的參數(shù)檢驗(yàn)
教學(xué)內(nèi)容
一、兩個(gè)總體均值之差的檢驗(yàn)
1.假定條件
? 兩個(gè)樣本是獨(dú)立的隨機(jī)樣本 ? 兩個(gè)總體都是正態(tài)分布
? 若不是正態(tài)分布, 可以用正態(tài)分布來(lái)近似(n1?30和 n2?30)2.原假設(shè):H0: ?1-?2 =0;備擇假設(shè):H1: ?1-?2 ? 0 3.檢驗(yàn)統(tǒng)計(jì)量
若兩個(gè)總體方差已知,用Z統(tǒng)計(jì)量;若兩個(gè)總體方差未知,用t統(tǒng)計(jì)量
二、例題
有兩種方法可用于制造某種以抗拉強(qiáng)度為重要特征的產(chǎn)品。根據(jù)以往的資料得知,第一種方法生產(chǎn)出的產(chǎn)品其抗拉強(qiáng)度的標(biāo)準(zhǔn)差為8公斤,第二種方法的標(biāo)準(zhǔn)差為10公斤。從兩種方法生產(chǎn)的產(chǎn)品中各抽取一個(gè)隨機(jī)樣本,樣本容量分別為n1=32,n2=40,測(cè)得?x1 = 50公斤,?x2 = 44公斤。問(wèn)這兩種方法生產(chǎn)的產(chǎn)品平均抗拉強(qiáng)度是否有顯著差別?(? = 0.05)
三、兩個(gè)總體比例之差的檢驗(yàn)
對(duì)兩個(gè)大型企業(yè)青年工人參加技術(shù)培訓(xùn)的情況進(jìn)行調(diào)查,調(diào)查結(jié)果如下:
甲廠調(diào)查60人,18人參加技術(shù)培訓(xùn)。乙廠調(diào)查40人,13人參加技術(shù)培訓(xùn)。能否根據(jù)以上調(diào)查結(jié)果認(rèn)為甲乙兩廠工人參加技術(shù)培訓(xùn)的人數(shù)比例相同?(? = 0.05)
教學(xué)方法
采用課堂教學(xué)方法
提問(wèn)與討論
1.如何檢驗(yàn)一個(gè)總體的均值大于另一個(gè)總體的均值?
2.如何檢驗(yàn)一個(gè)總體的某個(gè)成數(shù)小于另一個(gè)總體的相應(yīng)成數(shù)?
板書(shū)設(shè)計(jì)
主要運(yùn)用多媒體課件展示。重要內(nèi)容采用書(shū)寫(xiě)板書(shū)
§4假設(shè)檢驗(yàn)中的其它問(wèn)題
教學(xué)內(nèi)容
一、利用置信區(qū)間進(jìn)行假設(shè)檢驗(yàn)
置信區(qū)間對(duì)應(yīng)接受域
二、例題
一種袋裝食品每包的標(biāo)準(zhǔn)重量應(yīng)為1000克?,F(xiàn)從生產(chǎn)的一批產(chǎn)品中隨機(jī)抽取16袋,測(cè)得其平均重量為991克。已知這種產(chǎn)品重量服從標(biāo)準(zhǔn)差為50克的正態(tài)分布。試確定這批產(chǎn)品的包裝重量是否合格?(? = 0.05)
三、利用 P-值進(jìn)行假設(shè)檢驗(yàn) 1.單側(cè)檢驗(yàn)
? 若p-值 ? ?,接受 H0 ? 若p-值 < ?, 拒絕 H0 5 2.雙側(cè)檢驗(yàn)
? 若p-值 ? ?, 接受 H0 ? 若p-值 < ?, 拒絕 H0
四、例題
欣欣兒童食品廠生產(chǎn)的盒裝兒童食品每盒的標(biāo)準(zhǔn)重量為368克?,F(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取25盒進(jìn)行檢查,測(cè)得每盒的平均重量為?x = 372.5克。企業(yè)規(guī)定每盒重量的標(biāo)準(zhǔn)差?為15克。確定P-值并進(jìn)行檢驗(yàn)。
教學(xué)方法
采用課堂教學(xué)方法
提問(wèn)與討論
1.為什么說(shuō)參數(shù)估計(jì)中的置信區(qū)間對(duì)應(yīng)假設(shè)檢驗(yàn)中的接受域? 2.什么是 P 值??
板書(shū)設(shè)計(jì)
主要運(yùn)用多媒體課件展示。重要內(nèi)容采用書(shū)寫(xiě)板書(shū)
第二篇:假設(shè)檢驗(yàn)練習(xí)題
假設(shè)檢驗(yàn)練習(xí)題
一、判斷題
1、大多數(shù)的統(tǒng)計(jì)調(diào)查研究的都是樣本而不是整個(gè)總體。
2、零假設(shè)和研究假設(shè)是相互對(duì)立的關(guān)系。
3、當(dāng)我們拒絕了一個(gè)真的零假設(shè)時(shí),所犯錯(cuò)誤為第二類(lèi)錯(cuò)誤。
4、我們可以通過(guò)減少α來(lái)降低β錯(cuò)誤。
5、如果α=.05,當(dāng)我們拒絕H0時(shí)我們就有5%的可能犯錯(cuò)誤。
6、如果α=.05,則當(dāng)我們接受H0時(shí),我們就有95%的可能犯錯(cuò)誤。
7、如果取α=.01,我們拒絕了H0,則取α=.05時(shí),我們?nèi)匀豢梢跃芙^H0。
8、如果取α=.01,我們接受了H0,則取α=.05時(shí),我們?nèi)匀豢梢越邮蹾0。
9、如果H0為假,采用單側(cè)檢驗(yàn)比雙側(cè)檢驗(yàn)更容易得到拒絕H0的結(jié)論。
10、即使我們更多地利用樣本,還是有必要對(duì)一個(gè)給定總體的所有個(gè)體進(jìn)行研究。
二、選擇題
1、總體是:
A、很難被窮盡研究; B、可以通過(guò)樣本進(jìn)行估計(jì); C、通常是假設(shè)性的; D、可能是無(wú)限的; E、以上都對(duì)。
2、如果要研究100個(gè)選民在預(yù)選時(shí)的投票結(jié)果表明,我們的主要興趣應(yīng)該是:
A、推斷他們將會(huì)把票投給誰(shuí)
B、推斷所有選民的投票情況;
C、估計(jì)什么樣的個(gè)人會(huì)投票;
D、以上都是;
E、以上都不是。
3、如果我們從一個(gè)已知的總體中抽取大量的樣本,我們將毫不驚訝地得到:
A、樣本統(tǒng)計(jì)結(jié)果值之間有差異;
B、樣本統(tǒng)計(jì)結(jié)果分布在一個(gè)中心值附近;
C、許多樣本平均數(shù)不等于總體平均數(shù);
D、以上都可能;
E、以上都不可能。
4、對(duì)零假設(shè)的拒絕通常是:
A、直接的;
B、間接的;
C、建立對(duì)研究假設(shè)的拒絕的基礎(chǔ)上;
D、建立在對(duì)研究假設(shè)的直接證明上;
E、以上都不對(duì)。
5、研究者考察了生字密度高低兩種條件下各30名學(xué)生閱讀成績(jī)的情況,得到兩種條件下兩組被試的成績(jī)分別為:78±10和84±8,從中你可以得到:
A、兩種條件下學(xué)生成績(jī)的差異非常顯著;
B、因?yàn)?4≠78,所以?xún)煞N條件下學(xué)生成績(jī)差異非常顯著;
C、因?yàn)?4>78,所以生字密度低的條件下學(xué)生成績(jī)非常顯著地高于生字密度高的條件下學(xué)生的成績(jī);
D、以上都對(duì);
E、以上都不對(duì)。
三、綜合計(jì)算題
1、根據(jù)下列陳述寫(xiě)出零假設(shè)和研究假設(shè):
1)樣本的平均數(shù)23與總體的均值30有統(tǒng)計(jì)差異。
2)樣本的平均數(shù)56小于總體的均值70。
3)樣本的平均數(shù)75大于總體的均值70。
2、一研究者調(diào)查了一個(gè)容量為31的樣本,得到被試在測(cè)驗(yàn)一上的平均數(shù)為75,標(biāo)準(zhǔn)差S=4.7;在測(cè)驗(yàn)二上的平均數(shù)為80,標(biāo)準(zhǔn)差S=5.2;已知兩個(gè)測(cè)驗(yàn)的相關(guān)系數(shù)為.85。則兩次測(cè)驗(yàn)是否有差異?
3、根據(jù)某次調(diào)查,從中抽取30名男生與30名女生,得到其測(cè)驗(yàn)分?jǐn)?shù)分別為:83±12和86±9,請(qǐng)問(wèn)男女生成績(jī)是否有差異?
第三篇:第五章 統(tǒng)計(jì)估計(jì)和假設(shè)檢驗(yàn)
第五章 統(tǒng)計(jì)估計(jì)和假設(shè)檢驗(yàn)
統(tǒng)計(jì)學(xué)的基本問(wèn)題就是根據(jù)樣本所提供的信息對(duì)總體的分布以及分布的數(shù)字特征作出統(tǒng)計(jì)推斷。統(tǒng)計(jì)推斷包括兩大部分:一是統(tǒng)計(jì)估計(jì),二是假設(shè)檢驗(yàn)。
統(tǒng)計(jì)估計(jì)問(wèn)題就是根據(jù)樣本的數(shù)字特征來(lái)估計(jì)總體參數(shù)的數(shù)字特征,因此通常也稱(chēng)作參數(shù)估計(jì)。參數(shù)估計(jì)根據(jù)所得出結(jié)論的方式不同有兩種形式:點(diǎn)估計(jì)和區(qū)間估計(jì)。
假設(shè)檢驗(yàn)就是對(duì)關(guān)于總體分布的一些數(shù)字特征或分布函數(shù)所做的假設(shè)進(jìn)行檢驗(yàn),以判斷其正確性。假設(shè)檢驗(yàn)也分為兩類(lèi):一類(lèi)是對(duì)總體分布的一些數(shù)字特征進(jìn)行檢驗(yàn),稱(chēng)為參數(shù)假設(shè)檢驗(yàn);另一類(lèi)是要求根據(jù)樣本所提供的信息對(duì)關(guān)于分布函數(shù)的假設(shè)進(jìn)行檢驗(yàn),此時(shí)只檢驗(yàn)分布,而不對(duì)參數(shù)作檢驗(yàn),這稱(chēng)作非參數(shù)的假設(shè)檢驗(yàn)。非參數(shù)檢驗(yàn)將在第六章進(jìn)行討論,本章著重討論參數(shù)檢驗(yàn)。
第一節(jié) 點(diǎn)估計(jì)
一、點(diǎn)估計(jì)的極大似然法
點(diǎn)估計(jì)就是以單個(gè)數(shù)據(jù)對(duì)總體參數(shù)值作出估計(jì)。若未知的總體參數(shù)為,這時(shí)是一個(gè)未知的常數(shù)。我們根據(jù)抽樣樣本的觀察值構(gòu)造一個(gè)統(tǒng)計(jì)量()來(lái)估計(jì)總體參數(shù)。由于抽樣的隨機(jī)性,統(tǒng)計(jì)量是一個(gè)隨機(jī)變量。點(diǎn)估計(jì)就是將的具體值作為的估計(jì)值。顯然,這樣做必然會(huì)有誤差產(chǎn)生。這種誤差就稱(chēng)為抽樣誤差。
極大似然法是一種對(duì)參數(shù)點(diǎn)估計(jì)的重要方法之一。我們先用一個(gè)例子說(shuō)明其原理。
例5-1。設(shè)有一批產(chǎn)品,質(zhì)量上分為正品與次品。產(chǎn)品的次品率有兩種估計(jì):0.1和0.4,今隨機(jī)抽樣15件產(chǎn)品,發(fā)現(xiàn)只有一件是次品?,F(xiàn)根據(jù)這一抽樣情況,來(lái)決定用哪一種次品率來(lái)估計(jì)更為可靠呢?
記
A
=“抽取15件產(chǎn)品,只有一件是次品”,設(shè)抽得正品用X=0,抽得次品用X=1來(lái)表示。抽樣結(jié)果只有
X=0
與
X=1
兩種情形,于是,可得事件
A發(fā)生的概率為:
P(A)=
其中:是這批產(chǎn)品的次品率。
若次品率=0.1,則P(A)=×0.1=0.0229
若次品率=0.4,則P(A)=×0.4=0.0003。
現(xiàn)在事件A
既然在一次觀察中就發(fā)生了,直觀地我們可以認(rèn)為事件A發(fā)生的概率P(A)不會(huì)小,故應(yīng)選擇使P(A)較大的次品率作為產(chǎn)品的次品率的估計(jì)更為可靠些。
由于0.0229>0.0003,故應(yīng)選擇0.1作為產(chǎn)品的次品率比選擇0.4更可靠些。
把上例推廣到一般的情形,我們就可以得到極大似然法的一般原理。設(shè)是取自密度函數(shù)為f(x,)的總體的一組樣本。其中:x和都為參數(shù),待估計(jì)。的極大似然估計(jì)的基本思路是,若記A
=“一次觀察中,所得一組樣本的樣本值為()”?,F(xiàn)在在一次觀察中A發(fā)生了,即P(A)應(yīng)盡可能地大,即應(yīng)在所有可能取值的集合中選出一個(gè)使P(A)達(dá)到最大值的作為的估計(jì)值。此時(shí)的又稱(chēng)為的極大似然估計(jì)值。由于
相互獨(dú)立,且都與X具有相同的分布,由此可以得到,P(A)就相當(dāng)于事件:
同時(shí)發(fā)生的概率,也就是P(A)=,記為L(zhǎng)()=L(),于是有:
L()=
L()稱(chēng)為的似然函數(shù)。求極大似然值的問(wèn)題就是求似然函數(shù)L()的最大值問(wèn)題,根據(jù)微分學(xué)的結(jié)果,L()取到最大值的必要條件是它對(duì)的導(dǎo)數(shù)為零。因?yàn)閘n
L()與L()取得極大值的點(diǎn)相同,為計(jì)算方便,我們通常就用對(duì)數(shù)似然方程來(lái)求解最大似然估計(jì)值。
在我們上述例子中,f(1,)=,f(0,)=1-,于是得到似然函數(shù):
L()=
令=0,舍去=1,得的最大似然估計(jì)值=0.067。
實(shí)際上,正是在15次抽樣中得到一次次品的頻率,用頻率估計(jì)概率,當(dāng)n充分大時(shí)無(wú)疑是合理的。
例5-2。從一個(gè)正態(tài)總體中抽取容量為n的樣本,求總體參數(shù)的極大似然估計(jì)。
解:構(gòu)造似然函數(shù)
為了求和,使ln的極大,令
解上述方程得到:
所以得到和的極大似然估計(jì)量為:
二、估計(jì)量好壞的評(píng)選標(biāo)準(zhǔn)
前面討論了如何利用極大似然法來(lái)求參數(shù)的估計(jì)量。但對(duì)于同一個(gè)參數(shù)可以用不同的方法來(lái)求其估計(jì)量,于是,在參數(shù)估計(jì)中就存在怎樣選擇一個(gè)比較好的統(tǒng)計(jì)量來(lái)推斷總體參數(shù)的理論問(wèn)題。那么,什么樣的估計(jì)量是好的估計(jì)量呢。這就有一個(gè)如何對(duì)估計(jì)進(jìn)行評(píng)價(jià)的問(wèn)題。請(qǐng)看下面一個(gè)例子。
例5-3。假如某一建設(shè)單位購(gòu)進(jìn)了一批建筑用的線材,就需要了解這批線材的平均抗拉強(qiáng)度是多少。現(xiàn)在要通過(guò)抽樣,選擇樣本的某個(gè)函數(shù)(統(tǒng)計(jì)量)來(lái)推斷總體指標(biāo)值。由于隨機(jī)原因,每次抽取樣本的測(cè)量結(jié)果是不同的。如果樣本容量為3,抽取4組樣本,測(cè)得結(jié)果如表5-1所示。
表5-1
一組抽樣樣本的觀察值
樣本值
樣本順序
均值
900
999
1011
970
995
1050
1105
1065
1010
941
890
947
950
910
1140
1000
為了說(shuō)明的方便起見(jiàn),我們假定,實(shí)際上μ=1000公斤,當(dāng)然這在事先是不知道的。我們要求利用樣本信息來(lái)推斷總體指標(biāo),并使其誤差最小。第一組樣本的中位數(shù)最接近總體指標(biāo),第二組樣本是最小值最接近總體指標(biāo),第三組樣本是最大值最接近總體指標(biāo),第四組樣本是均值剛好等于總體指標(biāo)。于是就產(chǎn)生了一個(gè)問(wèn)題,在大量的實(shí)驗(yàn)中,究竟采用哪一個(gè)指標(biāo)來(lái)推斷總體指標(biāo)更合理呢?
評(píng)價(jià)點(diǎn)估計(jì)的結(jié)果通常有無(wú)偏性、有效性和一致性等標(biāo)準(zhǔn)。
1.無(wú)偏性
無(wú)偏性的含義是個(gè)別樣本由于隨機(jī)原因可能偏大或偏小,然而一個(gè)好的估計(jì)量從平均上看應(yīng)該等于所估計(jì)的那個(gè)指標(biāo),其直觀意義是估計(jì)量的值應(yīng)在參數(shù)的真值周?chē)鷶[動(dòng)而無(wú)系統(tǒng)誤差。一般地,無(wú)偏性的定義為:設(shè)為被估計(jì)參數(shù),若有估計(jì)量(),對(duì)一切n,有=,則稱(chēng)為的無(wú)偏估計(jì)量。
若-=b,則稱(chēng)b為估計(jì)量的偏差。若b≠0,則稱(chēng)為的有偏估計(jì)量。如果,則稱(chēng)為的漸近無(wú)偏估計(jì)量。
不論是重復(fù)抽樣或不重復(fù)抽樣,也不論樣本容量大小,樣本均值及樣本比例都是總體均值和總體比例的無(wú)偏估計(jì),即,但樣本方差并不是總體方差的無(wú)偏估計(jì)量。這是因?yàn)槿绻覀儼讯x為
=,則:
產(chǎn)生偏差的原因是總體方差的無(wú)偏估計(jì)應(yīng)該是,但抽樣時(shí)由于μ是未知的,因而用估計(jì)量來(lái)代替。根據(jù)最小平方原理,變量X距樣本均值的離差平方和為最小,因此就小于,從而用代替μ計(jì)算的方差就低估了,為了得到的無(wú)偏估計(jì),令
這時(shí),由于,就是的無(wú)偏估計(jì)了。
樣本方差與之差稱(chēng)為偏差。但當(dāng)n很大時(shí),所以它是漸近無(wú)偏差估計(jì)。當(dāng)樣本容量很大時(shí),也可以直接用樣本方差作為總體方差的估計(jì)值。但如樣本容量較小時(shí)偏差就比較大了。
圖5-1
估計(jì)的無(wú)偏性和有效性
2.有效性
即使是符合無(wú)偏性要求的估計(jì)統(tǒng)計(jì)量,在抽取個(gè)別樣本時(shí)也會(huì)產(chǎn)生誤差。為了使誤差盡量地小,要求估計(jì)量圍繞其真值的變動(dòng)愈小愈好,也就是說(shuō)要求統(tǒng)計(jì)量的離散程度要小,或者說(shuō)其方差要小。一般地,有效性的定義為:設(shè)、是未知參數(shù)的兩個(gè)估計(jì)量,若對(duì)任意的正常數(shù)c,有,則稱(chēng)比有效。有效性反映了估計(jì)量分布的集中程度,估計(jì)量的分布越是集中在參數(shù)真值附近,則其估計(jì)效率越高,如圖5-1所示。
但是為了方便起見(jiàn),在實(shí)際上有效性可定義為:、是未知參數(shù)的兩個(gè)無(wú)偏估計(jì)量,若用V(),V()分別表示各自的方差,若V()/V()<1,則稱(chēng)比有效。
例如,對(duì)正態(tài)總體,利用樣本均值及樣本中位數(shù)M來(lái)估計(jì)總體的均值時(shí),均為無(wú)偏估計(jì),那末哪一個(gè)更有效呢?
均值的抽樣分布為,統(tǒng)計(jì)上可以證明中位數(shù)的分布為,由于。這就說(shuō)明比有效,即用樣本均值來(lái)估計(jì)總體的均值比用中位數(shù)來(lái)估計(jì)總體的均值效率高。換句話說(shuō),用中位數(shù)來(lái)估計(jì)總體均值的平均誤差要比用樣本均值來(lái)估計(jì)總體均值時(shí)的更大。如果用中位數(shù)作為估計(jì)量要達(dá)到與以樣本均值作為估計(jì)量同樣可靠的程度,就要增加樣本。設(shè)用均值估計(jì)的樣本為,中位數(shù)估計(jì)的樣本為,設(shè)其估計(jì)效率相等,即方差相等,則,由此得到=1.57,即用中位數(shù)估計(jì)時(shí)要比用樣本均值來(lái)估計(jì)時(shí)多抽57%的樣本單位。
3.一致性
這就是要使統(tǒng)計(jì)量隨樣本容量n的增加,不斷趨近于總體指標(biāo)。在n→∞(有限總體n→N)時(shí),估計(jì)值與總體參數(shù)完全一致。一般地,點(diǎn)估計(jì)的一致性定義如下:設(shè)
()為未知參數(shù)的估計(jì)量,若依概率收斂于,則為的一致估計(jì)量。
現(xiàn)在來(lái)看樣本均值這一統(tǒng)計(jì)量是否符合一致性的要求。根據(jù)切比雪夫等式:
令
當(dāng)時(shí)
一致性是從極限意義上來(lái)說(shuō)明統(tǒng)計(jì)量與總體參數(shù)關(guān)系的。這種性質(zhì)只有當(dāng)樣本容量很大時(shí)才起作用。另外,符合一致性的統(tǒng)計(jì)量也不止一個(gè),因此,僅考慮一致性是不夠的。事實(shí)上,我們也可以證明,當(dāng)總體為正態(tài)分布時(shí),中位數(shù)這一統(tǒng)計(jì)量也符合一致性的要求。而樣本的最小值和最大值盡管在個(gè)別的抽樣中可能取得好的效果,但從總體上來(lái)看并不是一個(gè)好的估計(jì)量。
第二節(jié) 區(qū)間估計(jì)
一、區(qū)間估計(jì)的概念和步驟
點(diǎn)估計(jì)用一個(gè)確定的值去估計(jì)未知的參數(shù),具有較大的風(fēng)險(xiǎn)。因?yàn)楣烙?jì)量來(lái)自于一個(gè)隨機(jī)抽取的樣本,結(jié)果也就帶有隨機(jī)性。樣本估計(jì)量剛好等于所估計(jì)的總體參數(shù)的可能性極小。但是如果說(shuō)所估計(jì)的總體參數(shù)就落在估計(jì)值附近,即所估計(jì)的總體參數(shù)就落在以點(diǎn)估計(jì)所得到的估計(jì)值為中心的某一個(gè)小區(qū)間內(nèi),那就比較有把握了。這種方法就是區(qū)間估計(jì)法。
在第四章中我們已經(jīng)知道,一個(gè)足夠大樣本的均值的抽樣分布是正態(tài)的,并且所抽到的樣本均值落在總體均值的兩側(cè)范圍內(nèi)的概率是0.683,落在總體均值范圍內(nèi)的概率是0.955,落在總體均值范圍內(nèi)的概率是0.997等等。由此可見(jiàn),我們可以按照概率來(lái)估計(jì)總體均值是落在某一區(qū)間范圍內(nèi)的。我們把這種對(duì)總體均值的估計(jì)稱(chēng)作區(qū)間估計(jì)。從上述說(shuō)明可以看到:
1.如果所估計(jì)的區(qū)間越大,參數(shù)被包含在該區(qū)間內(nèi)的概率就越大。
2.如果樣本的方差越小,則在相同的概率下區(qū)間估計(jì)所得到的結(jié)果就越短。
一般地,設(shè)為總體的一個(gè)未知參數(shù),分別為由一組樣本所確定的對(duì)的兩個(gè)估計(jì)量,對(duì)于給定的,若P()=,則稱(chēng)區(qū)間[]為置信度是的置信區(qū)間。分別為置信區(qū)間的下限和上限。稱(chēng)為置信度或置信概率,表示區(qū)間估計(jì)的可靠度。稱(chēng)為置信度水平。
常用的置信度有 0.80,0.90,0.95 0.99等。一般來(lái)說(shuō),對(duì)于估計(jì)要求比較精確的問(wèn)題,置信程度也要求高一些,在社會(huì)經(jīng)濟(jì)現(xiàn)象中,通常采用95%就可以了。置信度反過(guò)來(lái)也表示可能犯錯(cuò)誤的概率。如置信度為95%,則犯錯(cuò)誤的概率就為1-95%=5%。這一概率也就是置信度水平,也可理解為風(fēng)險(xiǎn)率或風(fēng)險(xiǎn)水平。
圖5-2
根據(jù)不同樣本所得到的置信度為95.5%的置信區(qū)間
需要指出的是,P()=不應(yīng)理解為落在某一固定區(qū)間的概率。因?yàn)檫@里是一個(gè)參數(shù),而不是隨機(jī)變量,而是根據(jù)抽樣的結(jié)果計(jì)算出來(lái)的,因此,[]是一個(gè)隨機(jī)區(qū)間。即每一個(gè)樣本都可產(chǎn)生一個(gè)估計(jì)區(qū)間[],因此,上述概率可以理解為隨機(jī)區(qū)間[]中包括參數(shù)的概率。
圖5-2表示根據(jù)不同樣本所得到的置信度為95.5%的置信區(qū)間與總體均值的位置關(guān)系。從所有樣本得到的置信區(qū)間中有95.5%的區(qū)間將包括總體均值,因此可以說(shuō)所得到的估計(jì)區(qū)間包括總體均值具有95.5%的置信度。
二、單個(gè)總體參數(shù)的區(qū)間估計(jì)
(一)正態(tài)總體,方差已知,總體均值的區(qū)間估計(jì)
根據(jù)第四章關(guān)于樣本均值分布的結(jié)果,有
~N(0,1)
在給定了估計(jì)置信度為時(shí),我們有
我們可以根據(jù)這一原理用樣本均值來(lái)推斷總體均值的區(qū)間估計(jì)值。若樣本的均值為,同時(shí)若規(guī)定置信度為,則總體均值的區(qū)間估計(jì)的公式是
這一置信區(qū)間的估計(jì)可以用圖5-3來(lái)表示。
上述估計(jì)公式僅適用于無(wú)限總體的情形,對(duì)于有限總體的不放回抽樣來(lái)說(shuō),如果總體規(guī)模為N,樣本大小為n,則區(qū)間估計(jì)的公式中還需要乘上一個(gè)修正系數(shù)。因此,總體均值的區(qū)間估計(jì)的公式就變?yōu)?/p>
圖5-3
置信度為的置信區(qū)間
從上述說(shuō)明中我們可以總結(jié)出對(duì)于正態(tài)總體,方差已知,總體均值的區(qū)間估計(jì)的步驟如下:
1.計(jì)算出樣本的統(tǒng)計(jì)量并確定該統(tǒng)計(jì)量的抽樣分布。例如,若總體是正態(tài)的,那么樣本均值也必然服從正態(tài)分布。
2.根據(jù)研究的目的確定置信度或置信度水平大小。按照要求的置信度或置信度水平查出相應(yīng)的系數(shù)。
3.計(jì)算樣本均方差,即抽樣的標(biāo)準(zhǔn)誤。
4.最后把上述數(shù)據(jù)代入公式,得到區(qū)間估計(jì)的結(jié)果。
其實(shí),這些步驟也同樣適用于其他類(lèi)型的區(qū)間估計(jì)問(wèn)題。
(二)非正態(tài)總體,方差未知,大樣本,總體均值的區(qū)間估計(jì)
實(shí)際中所遇到的總體,往往不一定服從正態(tài)分布,而且總體方差也是未知的。在這種情況下要推斷總體均值,就要借助于中心極限定理,這需要抽取足夠大的樣本。這樣樣本均值仍服從正態(tài)分布。此時(shí)盡管總體方差未知,但當(dāng)樣本足夠大時(shí),一般當(dāng)時(shí),我們可用樣本標(biāo)準(zhǔn)差來(lái)代替總體標(biāo)準(zhǔn)差,直接把S代入上式中的就可以了。
(三)正態(tài)總體、方差未知,用小樣本對(duì)總體均值的區(qū)間估計(jì)
在總體方差未知的情況下,如果抽取的樣本就必須采用其他的估計(jì)辦法。我們已知服從t分布,其自由度為n-1。因此我們就可以利用t分布來(lái)進(jìn)行估計(jì)。此時(shí)
與前面同樣地,上述估計(jì)公式僅適用于無(wú)限總體的情形,對(duì)于有限總體來(lái)說(shuō),如果總體規(guī)模為N,樣本大小為n,不放回抽樣的情形,則區(qū)間估計(jì)公式中也還需要乘上一個(gè)修正系數(shù)。
(四)總體比例的區(qū)間估計(jì)
根據(jù)第四章關(guān)于樣本比例分布的結(jié)果,我們有
若樣本的比例為,同時(shí)規(guī)定估計(jì)的置信度為,則總體比例的區(qū)間估計(jì)的公式就是
這里有一個(gè)問(wèn)題,就是在確定總體比例的置信區(qū)間時(shí)要用到本身,而又恰恰是待估值。但由點(diǎn)估計(jì)理論我們知道,樣本比例是總體比例P的無(wú)偏估計(jì),于是在估計(jì)樣本比例的方差時(shí),直接用樣本比例代替總體比例P。只要樣本容量n足夠大,并且滿足和都大于5就可以保證結(jié)果是可靠的。最后,得到總體比例的置信區(qū)間為:
當(dāng)然對(duì)于有限總體不放回抽樣的情形,也同樣需要乘上一個(gè)修正系數(shù)。
(五)正態(tài)總體方差的區(qū)間估計(jì)
在第四章關(guān)于分布的結(jié)果中我們介紹過(guò),來(lái)自正態(tài)總體的一組樣本的方差和總體方差之比服從于分布,即
~
于是對(duì)于給定的置信度,我們可以利用分布的特性,查表得到和,則有
于是總體方差的區(qū)間估計(jì)為
三、兩個(gè)總體參數(shù)的區(qū)間估計(jì)
(一)兩總體均值之差的區(qū)間估計(jì)
1.兩個(gè)正態(tài)總體,方差已知,大樣本
從兩個(gè)總體中所抽取的樣本都是大樣本,并且兩個(gè)總體的方差已知時(shí),則兩個(gè)樣本均值之差也服從正態(tài)分布。此時(shí),因此。
由此可以得到,在置信度水平為的情況下,的置信區(qū)間為
2.兩正態(tài)總體,方差未知,但相等,大樣本
兩個(gè)樣本都為大樣本時(shí),兩樣本均值之差也服從正態(tài)分布,由于假設(shè)兩總體方差相等,但未知,需要根據(jù)樣本方差進(jìn)行估計(jì)。由于樣本方差具有隨機(jī)性,一般地,因此,合并推算總體方差,所以,兩個(gè)樣本均值之差的抽樣分布的方差為,于是,對(duì)兩總體均值之差估計(jì)的置信區(qū)間為。
3.兩正態(tài)總體,方差未知但相等,小樣本
根據(jù)上一章的結(jié)果,總體方差未知時(shí),我們用樣本的方差代替總體的方差,由于小樣本,相應(yīng)的統(tǒng)計(jì)量不再服從正態(tài)分布而服從t分布。由于,則如大樣本時(shí)一樣,應(yīng)將兩個(gè)樣本合并起來(lái)代替總體方差。即
其自由度為,則兩總體差的區(qū)間估計(jì)結(jié)果為。
(二)兩總體比例之差的區(qū)間估計(jì)
根據(jù)兩個(gè)樣本比例之差的抽樣分布,兩個(gè)樣本比例之差的均值為兩個(gè)總體比例之差。兩個(gè)樣本比例之差的方差為
當(dāng)兩個(gè)比例的樣本容量為大樣本時(shí),兩個(gè)比例之差也服從正態(tài)分布,所以當(dāng)置信度為時(shí),兩總體比例之差的置信區(qū)間為:
(三)兩正態(tài)總體方差比的區(qū)間估計(jì)
根據(jù)第四章所介紹的F分布的結(jié)果,來(lái)自于兩個(gè)正態(tài)分布總體的總體方差和樣本方差和,和所構(gòu)成的統(tǒng)計(jì)量
故對(duì)于給定的置信度水平,我們可以從F分布表查得置信區(qū)間的臨界值:
和
從而
于是
最后我們得到的置信度為1-的置信區(qū)間為
第三節(jié)
樣本容量的確定
在區(qū)間估計(jì)中我們發(fā)現(xiàn),對(duì)于某一個(gè)總體的參數(shù)進(jìn)行估計(jì)時(shí),在樣本數(shù)目一定的條件下,要提高估計(jì)結(jié)果的可靠性,就需要擴(kuò)大置信區(qū)間,這就要增加估計(jì)中的誤差,減少了估計(jì)的實(shí)際意義。如果要減少估計(jì)的誤差,就要縮短置信區(qū)間,但這樣就必須要降低估計(jì)的可靠性??梢?jiàn)在樣本數(shù)目一定的條件下,估計(jì)的精確性和估計(jì)的可靠性不能兩全其美。既要提高估計(jì)的精確性,減少誤差,又要提高估計(jì)可靠性的辦法就是增加樣本容量。但是增加樣本就要同時(shí)增加抽樣調(diào)查的成本,同時(shí)又可能延誤時(shí)間。因此就需要研究能夠滿足對(duì)估計(jì)的可靠性和精確性要求的最小樣本數(shù)問(wèn)題。
一、均值估計(jì)問(wèn)題中,樣本大小的決定
在總體均值的估計(jì)問(wèn)題中,要決定必要的樣本大小,必須先明確如下三個(gè)問(wèn)題:
1.要規(guī)定允許的估計(jì)誤差的大小,即允許的估計(jì)值與實(shí)際值之間的最大偏離值是多少,實(shí)際上也就是估計(jì)區(qū)間的大小,
2.規(guī)定置信度,即估計(jì)所要求達(dá)到的可靠性,也就是實(shí)際的抽樣誤差不超過(guò)所規(guī)定的誤差的可信度。
3.要明確總體的標(biāo)準(zhǔn)差,即要求了解總體的分布情況??傮w的標(biāo)準(zhǔn)差小,只要抽較少的樣本就能滿足對(duì)估計(jì)精確度和可靠性的要求,若總體標(biāo)準(zhǔn)差大,就必須抽取較多的樣本才能達(dá)到對(duì)估計(jì)精確度和可靠性的要求。
設(shè)總體標(biāo)準(zhǔn)差為,樣本均值的標(biāo)準(zhǔn)差為。估計(jì)的置信度為,于是可以相應(yīng)地得到置信系數(shù)。于是對(duì)總體均值的估計(jì)可由下式得到:
上式中的實(shí)際上就表示估計(jì)所允許的最大誤差,我們用Δ表示,于是根據(jù)上式有
則
由此只要規(guī)定了允許誤差的大小Δ和總體的標(biāo)準(zhǔn)差σ,由置信度查表得到相應(yīng)的,代入公式,求得滿足要求的最小整數(shù)就是滿足估計(jì)誤差不大于Δ和置信度為的要求的最少樣本數(shù)。
上述公式適用于重復(fù)抽樣或無(wú)限總體不放回抽樣時(shí)的情形。但對(duì)于有限總體不放回抽樣的情形,公式變?yōu)槿缦碌男问剑?/p>
由此可求得滿足上式要求的最小的整數(shù)為。
其中:Δ為允許最大誤差,為有限總體的個(gè)體數(shù),為置信度水平,為根據(jù)置信度水平查表得到的置信系數(shù)。
二、比例估計(jì)問(wèn)題中,樣本大小的決定
關(guān)于總體比例的估計(jì)問(wèn)題中,要決定樣本大小首先也要明確關(guān)于均值的估計(jì)問(wèn)題中同樣的三個(gè)問(wèn)題:
1.允許誤差的大小,即規(guī)定估計(jì)值與實(shí)際值的最大偏離值。
2.規(guī)定置信度,即估計(jì)所要求達(dá)到的可信度。
3.對(duì)總體比例的事先估計(jì)值,即大致的或估計(jì)的總體比例是多少。
與均值的估計(jì)問(wèn)題完全平行地,我們可以得到以下的結(jié)果。
對(duì)于重復(fù)抽樣或無(wú)限總體不重復(fù)(放回)抽樣時(shí)的情形為
但對(duì)于有限總體不放回抽樣的情形,公式變?yōu)槿缦碌男问剑?/p>
第四節(jié) 假設(shè)檢驗(yàn)
一、假設(shè)檢驗(yàn)的基本原理
假設(shè)總體的均值為某一個(gè)值,為了檢驗(yàn)這一假設(shè)的正確性,我們收集樣本的數(shù)據(jù),計(jì)算出假設(shè)值與樣本均值之間的差異,然后根據(jù)差異的大小來(lái)判斷所作假設(shè)的正確性,這就是假設(shè)檢驗(yàn)。直觀地,我們知道差異越小,對(duì)于總體均值的假設(shè)正確的可能性就愈大。差異越大,對(duì)總體均值的假設(shè)正確的可能性就愈小。
然而在多數(shù)情況下,對(duì)總體參數(shù)的假設(shè)值與樣本統(tǒng)計(jì)量之間的差異既不至于大到顯而易見(jiàn),應(yīng)該拒絕假設(shè),也不至于小到可以完全肯定,應(yīng)該接受假設(shè)的程度。于是就不能簡(jiǎn)單地決定接受或拒絕所作的假設(shè),而需要判斷所作的假設(shè)在多大的程度上是正確的。于是就需要研究假設(shè)和判斷假設(shè)是否正確的程度。
(一)假設(shè)檢驗(yàn)中的假設(shè)
假設(shè)檢驗(yàn)中通常把所要檢驗(yàn)的假設(shè)稱(chēng)作原假設(shè)或零假設(shè),記作。例如要檢驗(yàn)總體均值μ=100這個(gè)假設(shè)是否正確,就表示為:μ=100。如果樣本所提供的信息無(wú)法證明原假設(shè)成立,則我們就拒絕原假設(shè)。此時(shí),我們只能接受另外備選的假設(shè)了,稱(chēng)之為備擇假設(shè),我們以表示備擇假設(shè)。備擇假設(shè)可以有三種形式,例如,在原假設(shè):μ=100的條件下,備擇假設(shè)可以是:
:μ100。這表示備擇假設(shè)是總體的均值不等于100。或者是
:μ>100。這表示備擇假設(shè)是總體的均值大于100?;蛘呤?/p>
:μ<100。這表示備擇假設(shè)是總體的均值小于100。
上述備擇假設(shè)的選擇與檢驗(yàn)的要求是密切相關(guān)的。我們根據(jù)假設(shè)檢驗(yàn)的目的要求不同又把假設(shè)檢驗(yàn)分為雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)。
如果樣本均值高于或低于假設(shè)的總體均值很顯著時(shí)都拒絕原假設(shè),我們稱(chēng)作雙側(cè)檢驗(yàn)。在雙側(cè)檢驗(yàn)時(shí)有左右兩個(gè)拒絕區(qū)域。當(dāng)原假設(shè)是::μ=100,備擇假設(shè)是::μ100時(shí)就必須使用雙側(cè)檢驗(yàn)。
若只有在樣本的均值高于(或低于)假設(shè)的總體均值很顯著時(shí)才拒絕原假設(shè),這就稱(chēng)作單側(cè)檢驗(yàn)。單側(cè)檢驗(yàn)只有一個(gè)拒絕區(qū)域。若假設(shè)檢驗(yàn)只有在樣本均值高于假設(shè)的總體均值很顯著時(shí)才拒絕原假設(shè),這種假設(shè)檢驗(yàn)稱(chēng)作右側(cè)檢驗(yàn)。此時(shí),原假設(shè)實(shí)際上變?yōu)?μ100,備擇假設(shè)為:μ>100。反之,如果只有在樣本均值低于假設(shè)的總體均值很顯著時(shí)才拒絕原假設(shè),則稱(chēng)作左側(cè)檢驗(yàn)。此時(shí),原假設(shè)實(shí)際上變?yōu)?μ100,備擇假設(shè)為:μ<100。由此可見(jiàn),原假設(shè)和備擇假設(shè)總是排他性的。
(二)檢驗(yàn)的顯著性水平
假設(shè)檢驗(yàn)需要確定一個(gè)是接受還是拒絕原假設(shè)的標(biāo)準(zhǔn),這個(gè)標(biāo)準(zhǔn)就是顯著性水平。所謂檢驗(yàn)的顯著性水平就表示,在假設(shè)正確的條件下落在某個(gè)界限以外的樣本均值所占的百分比。具體地說(shuō),“在5%的顯著性水平下檢驗(yàn)假設(shè)”就是說(shuō),假定對(duì)總體參數(shù)所作的假設(shè)正確,那么樣本均值同假設(shè)的總體均值差異過(guò)大的,在每100個(gè)樣本中不應(yīng)超過(guò)5個(gè)。如果樣本均值與總體均值差異過(guò)大的超過(guò)這一數(shù)目就認(rèn)為這個(gè)樣本不可能抽自所假設(shè)的總體,所以拒絕零假設(shè)。
我們可以用圖5-4來(lái)直觀地解釋假設(shè)檢驗(yàn)的原理。假如設(shè)檢驗(yàn)的顯著性水平=5%,我們已知在概率密度曲線下包括在假設(shè)的均值兩側(cè)直線間的面積是95%,兩邊每一個(gè)尾端的面積各為2.5%。于是若樣本的均值落在95%的區(qū)域內(nèi),我們就認(rèn)為樣本統(tǒng)計(jì)量與假設(shè)的總體參數(shù)的差異是不顯著的。結(jié)果就接受原假設(shè)。若樣本統(tǒng)計(jì)量落在左右尾端的各為2.5%的區(qū)域內(nèi),則差異就是顯著的。我們就拒絕原假設(shè)。接受備擇假設(shè)。
圖5-4
假設(shè)檢驗(yàn)的接受區(qū)域和拒絕區(qū)域
不過(guò)應(yīng)該強(qiáng)調(diào)指出,在假設(shè)檢驗(yàn)中“接受原假設(shè)”的意思僅僅是意味著沒(méi)有充分的統(tǒng)計(jì)證據(jù)拒絕原假設(shè)。在假設(shè)檢驗(yàn)中“接受原假設(shè)”的特定含義就是不拒絕原假設(shè)。但實(shí)際上,即使樣本統(tǒng)計(jì)量落在95%的面積內(nèi),也并不能證明原假設(shè)就是正確的。因?yàn)橹挥性谥懒丝傮w參數(shù)的真實(shí)值與假設(shè)值完全相同才能證明假設(shè)正確。但我們無(wú)法知道總體參數(shù)的真實(shí)值。
在給定了檢驗(yàn)的顯著性水平后,我們可以根據(jù)假設(shè)來(lái)確定接受還是拒絕原假設(shè)的區(qū)域或范圍。如果樣本均值落在某一區(qū)域內(nèi)我們就接受原假設(shè),則就稱(chēng)這一區(qū)域?yàn)榻邮軈^(qū)域。如果樣本均值落在某一區(qū)域內(nèi)就拒絕原假設(shè),我們就稱(chēng)這一區(qū)域?yàn)榫芙^區(qū)域。
對(duì)于顯著性水平的選擇沒(méi)有一個(gè)唯一的或通用的標(biāo)準(zhǔn)。實(shí)際上在任何顯著性水平下檢驗(yàn)?zāi)硞€(gè)假設(shè)都是可能的,但是必須注意不管選擇什么樣的顯著性水平,都存在假設(shè)為真而被拒絕的可能性。另一方面,在檢驗(yàn)同一個(gè)假設(shè)時(shí),使用的顯著性水平愈高,原假設(shè)為真時(shí)而被拒絕的概率也就愈高。這就需要研究假設(shè)檢驗(yàn)中的錯(cuò)誤,我們?cè)谝院髮?duì)此進(jìn)行討論。
二、假設(shè)檢驗(yàn)的步驟
1.提出原假設(shè)和備擇假設(shè)。原假設(shè)和備擇假設(shè)必須由題意來(lái)決定。在一般情況下總是把檢驗(yàn)的目的作為備擇假設(shè),這樣可以有充分的把握拒絕原假設(shè)。
2.選擇檢驗(yàn)的顯著性水平,從而確定檢驗(yàn)的拒絕區(qū)域或臨界點(diǎn)。表示在假設(shè)檢驗(yàn)時(shí)當(dāng)原假設(shè)為真而我們卻拒絕了原假設(shè),接受備擇假設(shè)的錯(cuò)誤概率。假設(shè)檢驗(yàn)中還可能犯另一種錯(cuò)誤,這將在下面討論。
3.確定樣本的統(tǒng)計(jì)量和分布。樣本統(tǒng)計(jì)量又稱(chēng)檢驗(yàn)統(tǒng)計(jì)量。不同的統(tǒng)計(jì)量具有不同的分布,用于檢驗(yàn)不同的假設(shè),要根據(jù)所檢驗(yàn)的假設(shè)來(lái)正確地選擇檢驗(yàn)統(tǒng)計(jì)量。
4.計(jì)算檢驗(yàn)統(tǒng)計(jì)量并由此作出決策。根據(jù)樣本數(shù)據(jù)計(jì)算出檢驗(yàn)統(tǒng)計(jì)量的值,如果統(tǒng)計(jì)量的值落在拒絕區(qū)(包括臨界點(diǎn))內(nèi)就說(shuō)明原假設(shè)與樣本所反映的情形有顯著的差異,應(yīng)該拒絕原假設(shè)。如果統(tǒng)計(jì)量的值落在接受區(qū)域內(nèi),就說(shuō)明原假設(shè)與樣本所反映的情形的差異并不顯著,應(yīng)該接受原假設(shè)。
三、幾種常用的假設(shè)檢驗(yàn)
(一)平均數(shù)的假設(shè)檢驗(yàn)
1.雙側(cè)檢驗(yàn)
讓我們研究下面的例子。
例5-4。某食品廠規(guī)定某種罐頭每罐的標(biāo)準(zhǔn)重量是500克。多年的經(jīng)驗(yàn)表明這個(gè)廠每罐重量的標(biāo)準(zhǔn)差是15克。今隨機(jī)抽取了49個(gè)罐頭,發(fā)現(xiàn)這些罐頭的平均重量是506克。問(wèn)在=0.05的顯著性水平下能否認(rèn)為這批罐頭的重量符合標(biāo)準(zhǔn)的要求?
要檢驗(yàn)這批罐頭的重量是否符合標(biāo)準(zhǔn)的要求就是要檢驗(yàn)這批樣本的平均重量與標(biāo)準(zhǔn)重量之間是否具有明顯的差別。因此可以列出要檢驗(yàn)的假設(shè)為:
:μ=500
:μ500。
這是一個(gè)雙側(cè)檢驗(yàn)問(wèn)題。根據(jù)區(qū)間估計(jì)的結(jié)論可知原假設(shè)的接受區(qū)域?yàn)?/p>
由于置信度水平=0.05,=1.96。由此得到接受區(qū)域?yàn)閇495.8,504.2]。但現(xiàn)在樣本的實(shí)際均值為506,落在拒絕區(qū)域內(nèi),因此拒絕原假設(shè)接受備擇假設(shè)。我們無(wú)法認(rèn)為這批罐頭的重量符合標(biāo)準(zhǔn)的要求,即這批罐頭的重量不符合標(biāo)準(zhǔn)的要求。
當(dāng)總體方差未知,樣本數(shù)量又小于等于30時(shí),檢驗(yàn)統(tǒng)計(jì)量樣本均值服從t分布。這就要用t分布確定原假設(shè)的接受區(qū)域和拒絕區(qū)域了。在得到接受區(qū)域后也就可以利用上面同樣的方法,根據(jù)樣本均值所處的位置作出判斷。
2.單側(cè)檢驗(yàn)
再看下面的例子。
例5-5。某飲料廠規(guī)定某種紙罐包裝飲料的容量不得少于500ml。今隨機(jī)抽取了25個(gè)紙罐,發(fā)現(xiàn)這些罐頭的平均重量是498
ml,標(biāo)準(zhǔn)差S=10。問(wèn)在=0.05的顯著性水平下能否認(rèn)為這批紙罐的容重符合標(biāo)準(zhǔn)的要求?
根據(jù)問(wèn)題的要求可以列出要檢驗(yàn)的假設(shè)為:
:μ500
:μ<500
由于總體方差未知,樣本容量又小于30,檢驗(yàn)統(tǒng)計(jì)量服從t分布,其自由度為n-1。因此我們就必須利用t分布來(lái)進(jìn)行檢驗(yàn)。這又是一個(gè)單側(cè)(左側(cè))檢驗(yàn)問(wèn)題。根據(jù)區(qū)間估計(jì)的結(jié)論可知原假設(shè)的接受區(qū)域?yàn)?/p>
根據(jù)置信度水平=0.05,查表得到。所以計(jì)算得到接受區(qū)域的臨界點(diǎn)是496.6?,F(xiàn)樣本均值=498>496.6??梢?jiàn)樣本均值落在原假設(shè)的接受區(qū)域內(nèi)。我們接受原假設(shè),即認(rèn)為這批紙罐的容重符合標(biāo)準(zhǔn)的要求。
例5-6。某特種建材生產(chǎn)廠規(guī)定某種規(guī)格新型墻體材料的重量不得大于500公斤。今隨機(jī)抽取了16塊這種規(guī)格新型墻體材料,測(cè)得其平均重量為505公斤,標(biāo)準(zhǔn)差S=10。問(wèn)在=0.05的顯著性水平下能否認(rèn)為這批新型墻體材料的重量符合標(biāo)準(zhǔn)的要求?
這次要檢驗(yàn)的假設(shè)為:
:μ500
:μ>500
這次也需要利用t分布來(lái)進(jìn)行檢驗(yàn)。這是一個(gè)右側(cè)檢驗(yàn)問(wèn)題。原假設(shè)的接受區(qū)域?yàn)?/p>
根據(jù)置信度水平=0.05,查表得到。由此可以得到原假設(shè)的接受區(qū)域臨界點(diǎn)是504.4?,F(xiàn)樣本均值=505>504.4。可見(jiàn)樣本均值落在原假設(shè)的拒絕區(qū)域內(nèi)。我們拒絕原假設(shè),接受備擇假設(shè),即認(rèn)為這批新型墻體材料的重量不符合標(biāo)準(zhǔn)的要求。
(二)比例的假設(shè)檢驗(yàn)
例5-7。某酒廠規(guī)定某種酒中含有的糖度應(yīng)為12%,產(chǎn)品才能算合格。今隨機(jī)抽取了100瓶這種酒,發(fā)現(xiàn)平均的糖度為11.3%。問(wèn)在顯著性水平=0.10的條件下,這批酒與合格產(chǎn)品對(duì)糖度的要求有無(wú)明顯的差別?
問(wèn)題要檢驗(yàn)的假設(shè)為:
:μ=0.12
:μ0.12
這是比例的雙側(cè)檢驗(yàn)問(wèn)題。根據(jù)區(qū)間估計(jì)的結(jié)果,原假設(shè)的接受區(qū)域是
由于=0.10,則=1.64。計(jì)算得到原假設(shè)的接受區(qū)域是[0.114,0.126]。由于樣本比例0.113<0.114,落在原假設(shè)的拒絕區(qū)域內(nèi)。我們拒絕原假設(shè),接受備擇假設(shè),即認(rèn)為這批酒與合格產(chǎn)品對(duì)糖度的要求有明顯的差別。
對(duì)于比例問(wèn)題也同樣可以進(jìn)行單側(cè)的假設(shè)檢驗(yàn)。方法也幾乎與總體均值的單側(cè)檢驗(yàn)的情形相同。
此外,參照兩個(gè)總體區(qū)間估計(jì)的情形,我們也可以對(duì)兩個(gè)總體均值和比例差進(jìn)行假設(shè)檢驗(yàn),所用的方法幾乎是完全同樣的。
四、假設(shè)檢驗(yàn)中的兩類(lèi)錯(cuò)誤
假設(shè)檢驗(yàn)是根據(jù)概率來(lái)進(jìn)行判斷的,因此有可能判斷失誤。在三種不同顯著性水平下,例如=0.01,0.10,或0.50時(shí),進(jìn)行假設(shè)檢驗(yàn)所得到的結(jié)果就可能是完全不同的。對(duì)于同一組樣本的均值的位置,在=0.01和0.10的顯著性水平下可能是接受零假設(shè)的,而在=0.50的顯著性水平下拒絕零假設(shè)??梢?jiàn),采用高的顯著性水平不大可能接受一個(gè)不正確的零假設(shè),但卻很可能拒絕掉正確的零假設(shè)。
在假設(shè)檢驗(yàn)中,如果原假設(shè)正確而被拒絕時(shí),就稱(chēng)為犯了第一類(lèi)錯(cuò)誤,這是棄真的錯(cuò)誤,犯第一類(lèi)錯(cuò)誤的概率記作。相反,如果原假設(shè)錯(cuò)誤而被接受時(shí),稱(chēng)作犯了第二類(lèi)錯(cuò)誤,這是取偽的錯(cuò)誤,犯第二類(lèi)錯(cuò)誤的概率記作。表5-3表示了兩者之間的關(guān)系。這兩種錯(cuò)誤是互相替補(bǔ)的,這就是說(shuō),在樣本容量一定的情況下,要減少第一類(lèi)錯(cuò)誤的概率就不得不增加發(fā)生第二類(lèi)錯(cuò)誤的概率,反過(guò)來(lái)也一樣。實(shí)際上,為了減少第一類(lèi)錯(cuò)誤的概率就要增大接受區(qū)域,減少拒絕區(qū)域。但此時(shí)由于接受區(qū)域的增大,不正確的原假設(shè)也被接受的概率也隨之增大,即增加了,如圖5-4所示。要減少接受不正確的原假設(shè)的概率,就要減少的值,此時(shí)不正確的零假設(shè)被接受的概率減少了,但隨著拒絕區(qū)域的增大,正確的零假設(shè)被拒絕的概率就上升,即增大了,如圖5-4所示,表5-2
兩類(lèi)錯(cuò)誤之間的關(guān)系
接受
接受
為真
正確
棄真,第一類(lèi)錯(cuò)誤概率
α
為假
取偽,第二類(lèi)錯(cuò)誤概率β
正確
圖5-5
假設(shè)檢驗(yàn)中的兩類(lèi)錯(cuò)誤
由于兩類(lèi)錯(cuò)誤之間的這種替補(bǔ)關(guān)系,在管理上決定檢驗(yàn)第一類(lèi)錯(cuò)誤或第二類(lèi)錯(cuò)誤的顯著性水平時(shí)就要具體考察同這兩類(lèi)錯(cuò)誤相聯(lián)系的費(fèi)用和可能造成的損失。由此來(lái)決定究竟寧可發(fā)生第一類(lèi)錯(cuò)誤,而不愿發(fā)生第二類(lèi)錯(cuò)誤,還是寧可發(fā)生第二類(lèi)錯(cuò)誤,而不愿發(fā)生第一類(lèi)錯(cuò)誤。
練習(xí)題
5-1
對(duì)某機(jī)器生產(chǎn)的滾動(dòng)軸承隨機(jī)抽取196個(gè)樣本,測(cè)得直徑的均值為0.826厘米,樣本標(biāo)準(zhǔn)差0.042厘米,求這批軸承均值的95%與99%的置信區(qū)間。
5-2
某燈泡廠生產(chǎn)的燈泡的平均壽命是1120小時(shí),現(xiàn)從一批新生產(chǎn)的燈泡中抽取8個(gè)樣本,測(cè)得其平均壽命為1070小時(shí),樣本方差=(),試檢驗(yàn)燈泡的平均壽命有無(wú)變化(=0.05和=0.01)?
5-3
設(shè)正態(tài)總體的方差為已知,問(wèn)要抽取的樣本容量n應(yīng)為多大,才能使總體均值的置信度為0.95的置信區(qū)間的長(zhǎng)不大于L。
5-4有人在估計(jì)總體均值時(shí)要求在置信度為99%的條件下保證樣本平均數(shù)與總體均值之間的誤差不超過(guò)標(biāo)準(zhǔn)差的25%。問(wèn)應(yīng)抽取多少樣本?
5-5為降低貸款風(fēng)險(xiǎn),某銀行內(nèi)部規(guī)定要求平均每筆貸款數(shù)額不能超過(guò)120萬(wàn)元。隨著經(jīng)濟(jì)發(fā)展,貸款規(guī)模有增大趨勢(shì)?,F(xiàn)從一個(gè)n=144的樣本測(cè)得平均貸款額為128.1萬(wàn)元,S=45萬(wàn)元,用=0.01的顯著水平檢驗(yàn)貸款的平均規(guī)模是否明顯超過(guò)120萬(wàn)元。
5-6
正常人的脈搏平均為72次/分,今對(duì)某種疾病患者10人測(cè)得其脈搏為54
71(次/分)設(shè)患者的脈搏次數(shù)服從正態(tài)分布,試在顯著性水平=0.05下檢驗(yàn)患者與正常人在脈搏上有無(wú)顯著差異?
5-7
從A市的16名學(xué)生測(cè)得其智商的平均值為107,樣本標(biāo)準(zhǔn)差為10,而B(niǎo)市的16名學(xué)生測(cè)得智商的平均值為112,標(biāo)準(zhǔn)差為8,問(wèn)在下這兩組學(xué)生的智商有無(wú)顯著差別?
5-8
用簡(jiǎn)單隨機(jī)重復(fù)抽樣方法選取樣本時(shí),如果要使抽樣平均誤差降低50%,則樣本容量需要擴(kuò)大到原來(lái)的()。(單選題)
A.2倍
B.3倍
C.4倍
D.5倍
5-9
某產(chǎn)品規(guī)定的標(biāo)準(zhǔn)壽命為1300小時(shí),甲廠稱(chēng)其產(chǎn)品超過(guò)此規(guī)定。隨機(jī)選取甲廠100件產(chǎn)品,測(cè)得均值為1345小時(shí),已知標(biāo)準(zhǔn)差為300小時(shí),計(jì)算得到樣本均值大于等于1345的概率是0.067,則在:μ=1300,:μ>1300的情況下,有()成立。(單選題)
A.若=0.05,則接受
B.若=0.05,則接受
C.若=0.10,則接受
D.若=0.10,則拒絕
5-10下面關(guān)于假設(shè)檢驗(yàn)的陳述正確的是()。(多選題)
A.假設(shè)檢驗(yàn)實(shí)質(zhì)上是對(duì)原假設(shè)進(jìn)行檢驗(yàn)
B.假設(shè)檢驗(yàn)實(shí)質(zhì)上是對(duì)備擇假設(shè)進(jìn)行檢驗(yàn)
C.當(dāng)拒絕原假設(shè)時(shí),只能認(rèn)為肯定它的根據(jù)尚不充分,而不能認(rèn)為它絕對(duì)錯(cuò)誤
D.假設(shè)檢驗(yàn)并不是根據(jù)樣本結(jié)果簡(jiǎn)單地或直接地判斷原假設(shè)和備擇假設(shè)哪一個(gè)更有可能正確
E.當(dāng)接受原假設(shè)時(shí),只能認(rèn)為否定它的根據(jù)尚不充分,而不是認(rèn)為它絕對(duì)正確
5-11
某種新型建材單位面積的平均抗壓力服從正態(tài)分布,均值為5000公斤,標(biāo)準(zhǔn)差為120公斤。公司每次對(duì)50塊這種新型建材的樣本進(jìn)行檢驗(yàn)以決定這批建材的平均抗壓力是否小于5000公斤。公司規(guī)定樣本均值如小于4970就算不合格,求這種規(guī)定下犯第一類(lèi)錯(cuò)誤的概率。
第四篇:關(guān)于假設(shè)檢驗(yàn)的詳細(xì)總結(jié)與典型例題
關(guān)于假設(shè)檢驗(yàn)的詳細(xì)總結(jié)與典型例題
假設(shè)檢驗(yàn)是數(shù)一考生普遍反映非常頭疼的一塊內(nèi)容,因?yàn)樗腴T(mén)較難,其思想在初次復(fù)習(xí)時(shí)理解起來(lái)較難。雖然這一部分在歷年真題中考查次數(shù)很少,但為了做到萬(wàn)無(wú)一失,我們也應(yīng)該準(zhǔn)備充分,何況相對(duì)來(lái)說(shuō)這一部分內(nèi)容的難度和變化并不大。為了讓各位考生對(duì)假設(shè)檢驗(yàn)有一個(gè)全面深入的理解和掌握,我們給出如下總結(jié)與例題。
對(duì)于假設(shè)檢驗(yàn),首先要理解其基本原理,即小概率原理,假設(shè)檢驗(yàn)的方法即是從此原理衍生而來(lái);其次,要掌握其步驟,會(huì)根據(jù)顯著性水平?,即第一類(lèi)心理學(xué)考研錯(cuò)誤,來(lái)求拒絕域與接收域,其求法要根據(jù)不同的條件來(lái)套用公式,能根據(jù)理解推導(dǎo)公式是上策,如果時(shí)間不夠,可以選擇記憶各種不同條件下的求拒絕域的公式。最后,相比之下兩個(gè)正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)的考查可能性要低于一個(gè)正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)。
假設(shè)檢驗(yàn)的基本概念
數(shù)理統(tǒng)計(jì)的基本任務(wù)是根據(jù)樣本推斷總體,對(duì)總體的分布律或者分布參數(shù)作某種假設(shè),然后根據(jù)抽得的樣本,運(yùn)用統(tǒng)計(jì)分析的方法來(lái)檢驗(yàn)這一假設(shè)是否正確,從而作出接受假設(shè)或者拒絕假設(shè)的決定,這就是假設(shè)檢驗(yàn).根據(jù)實(shí)際問(wèn)題提出的假設(shè)H0稱(chēng)為原假設(shè),其對(duì)立假設(shè)H1稱(chēng)為備擇假設(shè).假設(shè)檢驗(yàn)中推理的依據(jù)是小概率原理:小概率事件在一次試驗(yàn)中實(shí)際上不會(huì)發(fā)生.假設(shè)檢驗(yàn)中的小概率?稱(chēng)為顯著性水平,通常取??0.05或者??0.01.假設(shè)檢驗(yàn)中使用的推理方法是:為了檢驗(yàn)原假設(shè)H0是否成立,我醫(yī)學(xué)考研論壇們先假定原假設(shè)H0成立.如果抽樣的結(jié)果導(dǎo)致小概率事件在一次試驗(yàn)中發(fā)生了,根據(jù)小概率原理,有理由懷疑H0的正確性,從而拒絕H0,否則接受H0.假設(shè)檢驗(yàn)的步驟
⑴根據(jù)實(shí)際問(wèn)題提出原假設(shè)H0和備擇假設(shè)H1; ⑵確定檢驗(yàn)統(tǒng)計(jì)量T;
⑶根據(jù)給定的顯著水平?,查概率分布表,確定拒絕域W;
⑷利用樣本值計(jì)算統(tǒng)計(jì)量T的值t,若t?W,則拒絕H0,否則接受H0.假設(shè)檢驗(yàn)中可能犯的兩類(lèi)錯(cuò)誤
由于小概率事件還是可能發(fā)生的,根據(jù)小概率作出的判斷可能是錯(cuò)誤的.事件H0真而拒絕H0,稱(chēng)為第一類(lèi)(棄真)錯(cuò)誤,犯第一類(lèi)錯(cuò)誤的概率為Pt?WH0??,因此顯著性水平?是用來(lái)控制犯第一類(lèi)錯(cuò)誤的概率的.H0假而接受H0,稱(chēng)為第二類(lèi)(納偽)錯(cuò)誤,犯第二類(lèi)錯(cuò)誤的概率為Pt?WH1,記作?.???? 典型例題
1.X1,?,X36是取自正態(tài)總體N(?,0.04)的簡(jiǎn)單隨機(jī)樣本,檢驗(yàn)假設(shè)H0:??0.5,備擇假設(shè)
05.檢驗(yàn)的顯著水平??0.05,取否醫(yī)學(xué)考研論壇定域?yàn)閄?c,則c?
,若?1?6H1:???1?0.5,則犯第二類(lèi)錯(cuò)誤的概率??
.,0.04),36c?0.5c?0.5??0.05?P?X?cH0??1??(),?()?0.95??(1.645),0.1/30.1/3c?0.5?1.645,得c?0.5548.0.1/30.04⑵H1成立時(shí),X~N(0.65,)
360.5548?0.65??P?X?cH1???()??(?2.856).0.1/3解
⑴H0成立時(shí),X~N(0.5,?1??(2.856)?1?0.9979?0.0021
?0已知,2.設(shè)總體X~N(?,?0),檢驗(yàn)假設(shè)H0:???0,備擇假設(shè)H1:???0,取否定域?yàn)閄?c,則對(duì)固定的樣本容量n,犯第一類(lèi)錯(cuò)誤的概率?隨c的增大而
.(減?。?/p>
解
H0成立時(shí),X~N(?0,22?02n),犯第一類(lèi)(棄真)錯(cuò)誤的概率??PX?cH0?1??(故犯第一類(lèi)錯(cuò)誤的概率?隨c的增大而減小.一個(gè)正態(tài)總體N(?,?)參數(shù)的假設(shè)檢驗(yàn) ⑴ ?已知,關(guān)于?的檢海文考研驗(yàn)(u檢驗(yàn))檢驗(yàn)假設(shè)H0:???0
統(tǒng)計(jì)量U?22??c??0?0/n),X??0?/n
拒絕域U?u? 檢驗(yàn)假設(shè)H0:???0
統(tǒng)計(jì)量U?X??0?/nX??0
拒絕域U??u?
檢驗(yàn)假設(shè)H0:???0
統(tǒng)計(jì)量U?2?/n
拒絕域U?u?
⑵?未知,關(guān)于?的檢驗(yàn)(t檢驗(yàn))檢驗(yàn)假設(shè)H0:???0
統(tǒng)計(jì)量t?X??0S/nX??0S/nX??0S/n
拒絕域t?t?(n?1)
2檢驗(yàn)假設(shè)H0:???0
統(tǒng)計(jì)量t?
拒絕域t??t?(n?1)
檢驗(yàn)假設(shè)H0:???0
統(tǒng)計(jì)量t?2
2拒絕域t?t?(n?1)
⑶?未知,關(guān)于?的檢驗(yàn)(?檢驗(yàn))檢驗(yàn)假設(shè)H0:???220 統(tǒng)計(jì)量??2(n?1)S2?02(n?1)S2202
拒絕域?2???(n?1)或者?2??2?(n?1)
21?2檢驗(yàn)假設(shè)H0:???220 統(tǒng)計(jì)量??2?
拒絕域???1??(n?1)
22檢驗(yàn)假設(shè)H0:???
統(tǒng)計(jì)量??▲拒絕域均采用上側(cè)分位數(shù).2202(n?1)S2?02
拒絕域????(n?1)
22兩個(gè)正態(tài)總體N(?1,?)、N(?2,?)參數(shù)的假設(shè)檢驗(yàn).⑴兩個(gè)正態(tài)總體N(?1,?)、N(?2,?)均值的假設(shè)檢驗(yàn)(t檢驗(yàn))檢驗(yàn)假設(shè)H0:?1??
2統(tǒng)計(jì)量t?2222X?Y
拒絕域t?t?(n1?n2?2)
112Sw?n1n2X?Y
拒絕域t??t?(n1?n2?2)
11Sw?n1n23 檢驗(yàn)假設(shè)H0:?1??2
統(tǒng)計(jì)量t? 檢驗(yàn)假設(shè)H0:?1??2
統(tǒng)計(jì)量t?X?Y
拒絕域t?t?(n1?n2?2)
11Sw?n1n22⑵兩個(gè)正態(tài)總體N(?1,?1)、N(?2,?2)方差的假設(shè)檢驗(yàn)(F檢驗(yàn))檢驗(yàn)假設(shè)H0:???2122 2S12 統(tǒng)計(jì)量F?2
拒絕域F?F?(n1?1,n2?1)或者F?F?(n1?1,n2?1)
1?S222S12 統(tǒng)計(jì)量F?2
拒絕域F?F1??(n1?1,n2?1)
S2檢驗(yàn)假設(shè)H0:???2122
S12檢驗(yàn)假設(shè)H0:???
統(tǒng)計(jì)量F?2
拒絕域F?F?(n1?1,n2?1)
S22122▲拒絕域均采用上側(cè)分位數(shù).典型例題
1.設(shè)X1,X2,?,Xn是來(lái)自正態(tài)總海文考研體N(?,?)的簡(jiǎn)單隨機(jī)樣本,其中參數(shù)?,?未知,記n1n2X??Xi,Q??(Xi?X)2,則假設(shè)H0:??0的t檢驗(yàn)使用統(tǒng)計(jì)量t?
.ni?1i?122解
統(tǒng)計(jì)量t?XnX??2S/nQ/(n?1)n(n?1)X.Q
2.某酒廠用自動(dòng)裝瓶機(jī)裝酒,每瓶規(guī)定重500克,標(biāo)準(zhǔn)差不超過(guò)10克,每天定時(shí)檢查,某天抽取9瓶,測(cè)得平均重X=499克,標(biāo)準(zhǔn)差S=16.03克.假設(shè)瓶裝酒的重量X服從正態(tài)分布.問(wèn)這臺(tái)機(jī)器是否工作正常?(??0.05).解
先檢驗(yàn)H0:??500,統(tǒng)計(jì)量t?X?500,拒絕域t?t0.025(8)?2.3060,S/nt?X?500499?500???0.187,接受H0; 16.03/3S/n4(n?1)S222?:??10,統(tǒng)計(jì)量??再檢驗(yàn)H0,拒絕域???0.05(8)?15.507,210222(n?1)S28?16.03222?H:??10,拒絕,????20.55702210102故該機(jī)器工作無(wú)系統(tǒng)誤差,但不穩(wěn)定
3.設(shè)X1,X2,?,X7是來(lái)自正態(tài)總體N(?1,?1)的簡(jiǎn)單隨機(jī)樣本,設(shè)Y1,Y2,?,Y8是來(lái)自正態(tài)總體2N(?2,?2)的簡(jiǎn)單隨機(jī)樣本,且兩個(gè)樣本相互獨(dú)立,它們的樣本均值分別為X?13.8,Y?17.8,樣本標(biāo)
2準(zhǔn)差S1?3.9,S2?4.7,問(wèn)在顯著性水平0.05下,是否可以認(rèn)為?1??2?
S12解
先檢驗(yàn)H0:???,檢驗(yàn)統(tǒng)計(jì)量F?2,拒絕域F?F0.025(6,7)?5.12或者
S22122S123.9211?0.6885,接受H0; F?F0.975(6,7)??,F(xiàn)?2?2S24.7F0.025(7,6)5.70?:?1??2,統(tǒng)計(jì)量t?再檢驗(yàn)H0X?Y,拒絕域t?t0.05(13)?1.7709,11Sw?n1n2t?X?Y?,即可以認(rèn)為?1??2.??1.7773,接受H011Sw?n1n2▲檢驗(yàn)兩個(gè)正態(tài)總體均值相等時(shí),應(yīng)先檢驗(yàn)它們的方差相等.
第五篇:關(guān)于“標(biāo)準(zhǔn)差不相等且都未知,樣本容量不同的雙正態(tài)總體均值差的假設(shè)檢驗(yàn)”的討論
關(guān)于“?1??222且都未知,樣本容量不同的雙正態(tài)總體均
值差的假設(shè)檢驗(yàn)”的討論
摘要:對(duì)于雙正態(tài)總體均值差的假設(shè)檢驗(yàn)中,相對(duì)于幾種比較常見(jiàn)的類(lèi)型來(lái)說(shuō),還有一種比較復(fù)雜的類(lèi)型就是
?1??222且都未知、樣本容量不同的雙正態(tài)總體均值差的假設(shè)檢驗(yàn),這種情況下,有時(shí)我們需要進(jìn)行兩次構(gòu)造。下面就著重系統(tǒng)介紹一下這種檢驗(yàn)方法。
關(guān)鍵詞:雙正態(tài)
樣本容量
假設(shè)檢驗(yàn)
正文: 我們?cè)谟懻撾p正態(tài)總體均值差的假設(shè)檢驗(yàn)時(shí),有一種情況是比較復(fù)雜的。那就是關(guān)于“
?1??222且都未知,樣本容量不同的雙正態(tài)總體均值差的假設(shè)檢驗(yàn)”的,如果我們像討論其它那些情況一樣去試圖構(gòu)造一個(gè)統(tǒng)計(jì)量進(jìn)行計(jì)算時(shí),發(fā)現(xiàn)并不是那么的容易。
首先,在一些簡(jiǎn)單計(jì)算中,如果樣本容量比較大的時(shí)候,我們還是可以進(jìn)行近似的假設(shè)檢驗(yàn)的,H比U?S0:?1??2;H1:?1??2這樣,較X?Y21方H0真22便,n1?S22構(gòu)
n2造統(tǒng)計(jì)量n1?Sn2?X?Y?(?1??2)S21~N(0,1)
,然后,可
但是這種方法僅僅是由P{U?z?/2}??,即得拒絕域U?z?/2;而對(duì)應(yīng)的單邊問(wèn)題的拒絕域分別是U??z?與U?z?.相對(duì)于樣本的容量比較大的前提下,才可以的。如果樣本容量比
較小,我們就不能這樣近似計(jì)算了。
所以,我們就要更加深入的討論這種情況下的假設(shè)檢驗(yàn)。此時(shí),面對(duì)著樣本容量比較小的情況,我們可以將雙正態(tài)均值差假設(shè)檢驗(yàn)轉(zhuǎn)化成常見(jiàn)的單正態(tài)總體方差未知時(shí)均值是否為零的常見(jiàn)問(wèn)題,叫做“斯切非Scheffe法”。
首先,要構(gòu)造一個(gè)正態(tài)隨機(jī)變量包含這雙正態(tài)總體,這樣就要求進(jìn)行第一次構(gòu)造。我們記這兩個(gè)正態(tài)總體的容量分別為
n1、n2(n1n2n1?n2)。不妨假設(shè)
n1n1<
n2此時(shí), 可令Zi?Xi?Yi?1n1n2?Yj?1j?Y,i?1,...,n1,則仍有
Z1, …,2iidZn1~N(?,?Z).2???1??2,?Z??1?2n1n2?22其中,其中的zi就是構(gòu)造的隨機(jī)變量。然后,再進(jìn)行第二次構(gòu)造,構(gòu)造出T?Z??0SnH0真?Z??Sn~t(n?1)。由P{|T|>t?/2(n ?1)} =?,可得拒絕域|T|>t?/2(n?1),查表、計(jì)算,比較大小即得結(jié)論。此時(shí),對(duì)于單邊問(wèn)題H0:?=?0;H1:? 0,有拒絕域T?0,有拒絕域T>t?(n?1)。
從上面的分析可知,對(duì)于這種類(lèi)型的問(wèn)題,其實(shí)就是兩次構(gòu)造,難就轉(zhuǎn)化為易了。將復(fù)雜問(wèn)題轉(zhuǎn)化成簡(jiǎn)單的已經(jīng)解決的問(wèn)題,這是一種在研究中經(jīng)常要用到的一種思維方式。