第一篇:數理統計試卷
試卷名稱:
數理統計I 課程所在院系:
理學院 考試班級:
學號:
姓名:
成績:
試卷說明:
1.本次考試為閉卷考試。本試卷共4頁,共八大部分,請勿漏答;
2.考試時間為120分鐘,請掌握好答題時間;
3.所有試題答案寫在試卷上;
4.答題中可能用到的數據如下: ,,,,,,,一.填空(每空2分,共30分)1.設 A、B、C 為三個隨機事件,則事件“A、B 發生但C不發生” 可表示為。
2.將一枚骰子連續投擲兩次,第二次出現的點數為3的概率等于。
3.每次試驗結果相互獨立,設每次試驗成功的概率為。則重復進行試驗直到第10次才取得 次成功的概率等于。
4.已知為從總體中抽取出來的容量為20的簡單隨機樣本的樣本平均,且=7,=4,則 ,。
5.已知到連續型隨機變量的概率密度函數為,則 。
6. 已知,,則 ,。
7.為估計大學生近視眼所占的百分比,用重復抽樣方式抽取200名同學進行調查,結果發現有68個同學是近視眼。則大學生近視眼所占的百分比的95%的置信區間為。8.已知是來自總體的簡單隨機樣本。令,則當 時,為總體均值的無偏估計。
9.已知隨機變量和相互獨立,且,則所服從的分布為。
10.已知=25,36,且和的相關系數,則。
11.已知,(這里).由車比雪夫不等知。
12.已知和都是連續型隨機變量,設的概率密度函數,則的概率密度函數 。
13.已知服從參數為1的泊松分布,則=。
二.(12分)一個口袋里有三個球,這三個球上面依次標有數字0、1、1。現在從袋里任取一個球,不放回袋中,接著再從袋里取出一個球。設表示第一次取到的球上標有的數字,表示第二次取到的球上標有的數字。
(1)求的聯合概率分布;
(2)求關于 的邊緣概率分布和關于的邊緣概率分布,判斷和是否獨立(3)計算和 的協方差。
三.(8分)某商場所供應的電視機中,甲廠產品與乙廠產品各占50%;
甲廠產品的次品率是10%,乙廠產品的次品率是15%。(1)求該商場電視機的次品率;
(2)現某人從該商場上買了一臺電視,發現它是次品,求它由甲廠生產的概率。
四.(8分)設某研究所有200名研究人員,現該研究所準備在會議廳舉行一個內部學術交流會。假設每個研究人員都以 現在該所準備在會議廳舉行一個內部學術交流會,假設每一位研究人員都以0.6的概率去參加這個學術交流會,并且每一位研究人員是否去參加會議是相互獨立的,問會議廳應至少準備多少個座位,才能以99.9%概率保證去參加交流會的人員都有座位坐。
五.(10分)一批糖袋的重量(單位:千克)服從正態分布。現在從該批糖袋中隨機抽取12袋,測得這12糖袋的平均重量為,樣本方差為0.1291。
(1)求這批糖袋的平均重量的置信度為95%的置信區間,并計算估計的精度。
(2)求這批糖袋的重量方差的置信度為95%的置信區間。
六.(8分)某批電子元件的壽命(單位:小時)服從正態分布。正常情況下,元件的平均壽命為225?,F在從中該批電子元件中任意抽取16件,測得這16件元件的平均壽命為241,樣本方差為92。據此以顯著水平0.05來判斷是否可以認為這批電子元件的平均壽命與225無顯著差異? 七.(12分)一批由同一種原料織成的布,用不同的印染工藝處理,然后進行縮水處理。假設采用A、B、C三種不同的工藝,每種工藝處理4塊布樣,測得縮水率(單位:%)的數據如表1所示。根據這些數據,完成下列問題:
(1)填寫下列未完成的方差分析表(表2),并根據方差分析表以顯著水平來判斷不同的工藝對布的縮水率的影響是否有顯著差異?(2)若有顯著差異,則用費歇檢驗法(即LSD檢驗法)做進一步多重比較,并且指出存在顯著差異的工藝的總體均值差的置信度為95%的置信區間。
工藝種類 縮水率 A 5 7 4 2 B 7 6 6 5 C 8 7 9 7 表1 變差來源平方和 自由度 均方和 F值 組間 21.167 F= 組內 \ 總計 38.917 \ \ 表2 八.(12分)為了研究某地區年度汽車擁有量y(單位:百臺)與貨運周轉量x(單位:萬噸*公里)之間的關系,抽樣測量得下列樣本數據:
貨運周轉量x 0.1 0.3 0.4 0.55 0.7 0.8 0.95 汽車擁有量y 15 18 19 21 22.6 23.8 26(1)求y對x的線性回歸系數與回歸剩余標準差,并寫出經驗線性回歸方程。
(2)計算樣本相關系數,并進行線性回歸的顯著性檢驗(顯著水平=0.05)。
(3)求當貨運周轉量x=0.5時,該地區年度汽車擁有量y的置信度為95%的置信區間。
參考答案 試卷名稱:
數理統計I 課程所在院系:
理學院 考試班級:
學號:
姓名:
成績:
試卷說明:
5.本次考試為閉卷考試。本試卷共4頁,共八大部分,請勿漏答;
6.考試時間為120分鐘,請掌握好答題時間;
7.所有試題答案寫在試卷上;
8.答題中可能用到的數據如下: ,,,, ;,二.填空(每空2分,共30分)1.設 A、B、C 為三個隨機事件,則事件“A、B 發生但C不發生” 可表示為。
2.將一枚骰子連續投擲兩次,第二次出現的點數為3的概率等于 1/6。
3.每次試驗結果相互獨立,設每次試驗成功的概率為。則重復進行試驗直到第10次才取得 次成功的概率等于 C9k pk(1-p)10-k。
4.已知為從某個總體中抽取出來的容量為20的簡單隨機樣本的樣本平均,且=7,=4,則 7 , 0.2。
5.已知到連續型隨機變量的概率密度函數為,則 0.5。
6. 已知,,則1/3 ,1/6。
7.為估計大學生近視眼所占的百分比,用重復抽樣方式抽取200名同學進行調查,結果發現有68個同學是近視眼。則大學生近視眼所占的百分比的95%的置信區間為 [0.2743,0.4057]或 [0.278,0.408]。
8.已知是來自總體的簡單隨機樣本。令,則當 1/16 時,為總體均值的無偏估計。
9.已知隨機變量和相互獨立,且,則所服從的分布為 N(-11,38)。
10.已知=25,36,且和的相關系數,則 37。
11.為隨機變量,且,.由車比雪夫不等知 0.9375。
12.已知和都是連續型隨機變量,設的概率密度函數,則的概率密度函數 。
13.已知服從參數為1的泊松分布,則= 2。
二.(12分)一個口袋里有三個球,這三個球上面依次標有數字0、1、1?,F在從袋里任取一個球,不放回袋中,接著再從袋里取出一個球。設表示第一次取到的球上標有的數字,表示第二次取到的球上標有的數字。
(2)求的聯合概率分布律;
(2)求關于 的邊緣概率分布和關于的邊緣概率分布,判斷和是否獨立;
(3)求和 協方差。
解:(1)0 1 0 0 1/3 1 1/3 1/3(2)0 1 P 1/3 2/3 0 1 P 1/3 2/3 和不獨立。
(3),,三.(8分)某商場所供應的電視機中,甲廠產品與乙廠產品各占50%;
甲廠產品次品率是10%,乙廠產品次品率是15%。(1)求該商場電視機的次品率;
(2)現某人從該商場上買了一臺電視,發現它是次品,求它由甲廠生產的概率。
解:用A表示“甲廠產品”, 用B表示“次品率”, 則 , ,(1).-----4分(2).----8分 四.(8分)設某研究所有200名研究人員,現該研究所準備在會議廳舉行一個內部學術交流會。假設每個研究人員都以 現在該所準備在會議廳舉行一個內部學術交流會,假設每一位研究人員都以0.6的概率去參加這個學術交流會,并且每一位研究人員是否去參加是相互獨立的,問會議廳應至少準備多少個座位,才能以99.9%概率保證去參加交流會的人員都有座位坐。
解:假設準備x個座位條,用表示與會的人數,顯然 服從B(200,0.6),1分 np=120,np(1-p)=48, 2分 因為n=10000,充分大由中心極限定理可以認為近似服從,4分, 根據題意知道:
6分 所以:,即,解得,至少準備141個座位 8分 五.(10分)一批糖袋的重量(單位:千克)服從正態分布。現在從該批糖袋中隨機抽取12袋,測得這12糖袋的平均重量為,方差為0.1291(3)求這批糖袋的平均重量的置信度為95%的置信區間,并計算估計的精度。
(4)求這批糖袋的重量方差的置信度為95%的置信區間。
解:因為 S2=0.1291,得,1分(1),, 查表得 的置信度為95%的置信區間為 4 分 估計精度為 7分(2)置信度為95%的估計:
查表得,所以,新生男嬰兒體重的方差的區間估計為.10分 六.(8分)某批電子元件的壽命(單位:小時)服從正態分布。正常情況下,元件的平均壽命為225。現在從中該批電子元件中任意抽取16件,測得它們的平均壽命為241,樣本方差為92。據此以顯著水平0.05來判斷是否可以認為這批電子元件的平均壽命與225無顯著差異? 解:樣本標準差9.591(1)建立統計假設 1分(2)建立統計量:
3分(3)在成立前提下計算:
5分 由0.05求得 6分(4)因為,拒絕即不可以認為這批電子元件的壽命與225無顯著差異.8分 七.(12分)一批由同一種原料織成的布,用不同的印染工藝處理,然后進行縮水處理。假設采用A、B、C三種不同的工藝,每種工藝處理4塊布樣,測得縮水率(單位:%)的數據如表1所示。根據這些數據,完成下列問題:
(3)填寫下列未完成的方差分析表(表2),并根據方差分析表以顯著水平來判斷不同的工藝對布的縮水率的影響是否有顯著差異?(4)若有顯著差異,則用費歇檢驗法(即LSD檢驗法)做進一步多重比較,并且指出存在顯著差異的工藝的總體均值差的置信度為95%的置信區間。(10分)工藝種類 縮水率 A 5 7 4 2 B 7 6 6 5 C 8 7 9 7 表1 方差來源平方和 自由度 均方和 F值 組間 21.167 2 10.583 F= 5.366 * 組內 17.750 9 1.972 \ 總計 38.917 11 \ \ 表2 解:(1)完成方差分析表如上 4分(其中F值1分,其他每空格0.5分)由知, F= 5.366>, 5分 可認為有顯著差異.6分(2),1.972,所以,()計算得,多重比較結果:
3.25* 1.5 1.75 / 因為時,認為差異顯著。
由上表知A和C有差異顯著。A和B,B和C差異不顯著 的可靠性為的置信區間為 計算LSD 7分 多重比較結果 10分 均值差的取間估計 12分 八.(12分)為了研究某地區年度汽車擁有量y(單位:百臺)與貨運周轉量x(單位:萬噸*公里)之間的關系,抽樣測量得下列樣本數據:
貨運周轉量x 0.1 0.3 0.4 0.55 0.7 0.8 0.95 汽車擁有量y 15 18 19 21 22.6 23.8 26(1)求y對x的線性回歸系數與回歸剩余標準差,寫出經驗線性回歸方程。
(2)計算樣本相關系數,并進行線性回歸的顯著性檢驗(顯著水平=0.05)。
(3)求當貨運周轉量x=0.5時,該地區年度汽車擁有量y的置信度為95%的置信區間。
解∶ 1分 2分 4分(1):經驗線性回歸方程為 5分(2)7分 檢驗假設 :對的線性回歸關系不顯著。
=0.05, 因為 所以拒絕,認為對的線性回歸關系顯著,關于是正相關的。
9分(3)因為經驗回歸方程為:。
所以 時,2.571 的置信區間為[19.67, 20.80],可靠性為95% 12分
第二篇:數理統計學習心得
數理統計學習心得
現實中常常存在這種情況,我們所掌握的數據只是部分單位的數據或有限單位的數據,而我們所關心的卻是整個總體甚至是無限總體的數量特征。例如民意測驗誰會當選主席?體育鍛煉對增強心臟功能是否有益?某種新藥是否提高療效?全國嬰兒性別比例如何?等等。這時只靠部分數據的描述是無法獲得總體特征的知識。我們利用統計推斷的方法來解決。所謂統計推斷就是以一定的置信標準要求,根據樣本數據來判斷總體數量特征的歸納推理的方法。統計推斷是邏輯歸納法在統計推理的應用,所以稱為歸納推理的方法。統計推斷可以用于總體數量特征的估計,也可以用于對總體某些假設的檢驗,所以又有不同的推斷方法,下面就參數估計和假設檢驗的基本概念及原理簡單談談。
參數估計是根據從總體中抽取的樣本估計總體分布中包含的未知參數的方法。它是統計推斷的一種基本形式,是數理統計學的一個重要分支,分為點估計和區間估計兩部分。參數估計包括點估計和區間估計兩種方法。
點估計是依據樣本估計總體分布中所含的未知參數或未知參數的函數。通常它們是總體的某個特征值,如數學期望、方差和相關系數等。點估計問題就是要構造一個只依賴于樣本的量,作為未知參數或未知參數的函數的估計值。構造點估計常用的方法是:①矩估計法。用樣本矩估計總體矩,如用樣本均值估計總體均值。②最大似然估計法。于1912年由英國統計學家R.A.費希爾提出,利用樣本分布密度構造似然函數來求出參數的最大似然估計。③最小二乘法。主要用于線性統計模型中的參數估計問題。④貝葉斯估計法?;谪惾~斯學派(見貝葉斯統計)的觀點而提出的估計法。
區間估計是依據抽取的樣本,根據一定的正確度與精確度的要求,構造出適當的區間,作為總體分布的未知參數或參數的函數的真值所在范圍的估計。例如人們常說的有百分之多少的把握保證某值在某個范圍內,即是區間估計的最簡單的應用。1934年統計學家J.奈曼創立了一種嚴格的區間估計理論。求置信區間常用的三種方法:①利用已知的抽樣分布。②利用區間估計與假設檢驗的聯系。③利用大樣本理論。
假設檢驗是抽樣推斷中的一項重要內容。它是根據原資料作出一個總體指標是否等于某一個數值,某一隨機變量是否服從某種概率分布的假設,然后利用樣本資料采用一定的統計方法計算出有關檢驗的統計量,依據一定的概率原則,以較小的風險來判斷估計數值與總體數值(或者估計分布與實際分布)是否存在顯著差異,是否應當接受原假設選擇的一種檢驗方法。假設檢驗的一般步驟
1、提出檢驗假設(又稱無效假設,符號是H0))和備擇假設(符號是H1)。H0:樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的; H1:樣本與總體或樣本與樣本間存在本質差異; 預先設定的檢驗水準為0.05;當檢驗假設為真,但被錯誤地拒絕的概率,記作α,通常取α=0.05或α=0.01。
2、選定統計方法,由樣本觀察值按相應的公式計算出統計量的大小,如X2值、t值等。根據資料的類型和特點,可分別選用Z檢驗,T檢驗,秩和檢驗和卡方檢驗等。
3、根據統計量的大小及其分布確定檢驗假設成立的可能性P的大小并判斷結果。若P>α,結論為按α所取水準不顯著,不拒絕H0,即認為差別很可能是由于抽樣誤差造成的,在統計上不成立;如果P≤α,結論為按所取α水準顯著,拒絕H0,接受H1,則認為此差別不大可能僅由抽樣誤差所致,很可能是實驗因素不同造成的,故在統計上成立。P值的大小一般可通過查閱相應的界值表得到。
學好數理統計這門課程,其實有很大的作用,它會讓人對日常生活中一些涉及概率方面的問題有更加深刻的體會。如果沒有統計學,人們在收集資料和進行各項的大型的數據收集工作是非常困難的,通過對統計方法的研究,使得我們處理各種數據更加簡便,所以統計也是一門很實用的科學,應該受到大家的重視。
第三篇:數理統計學習心得
數理統計學習心得
現實中常常存在這種情況,我們所掌握的數據只是部分單位的數據或有限單位的數據,而我們所關心的卻是整個總體甚至是無限總體的數量特征。例如民意測驗誰會當選主席?體育鍛煉對增強心臟功能是否有益?某種新藥是否提高療效?全國嬰兒性別比例如何?等等。這時只靠部分數據的描述是無法獲得總體特征的知識。我們利用統計推斷的方法來解決。所謂統計推斷就是以一定的置信標準要求,根據樣本數據來判斷總體數量特征的歸納推理的方法。統計推斷是邏輯歸納法在統計推理的應用,所以稱為歸納推理的方法。統計推斷可以用于總體數量特征的估計,也可以用于對總體某些假設的檢驗,所以又有不同的推斷方法,下面就參數估計和假設檢驗的基本概念及原理簡單談談。
參數估計是根據從總體中抽取的樣本估計總體分布中包含的未知參數的方法。它是統計推斷的一種基本形式,是數理統計學的一個重要分支,分為點估計和區間估計兩部分。參數估計包括點估計和區間估計兩種方法。
點估計是依據樣本估計總體分布中所含的未知參數或未知參數的函數。通常它們是總體的某個特征值,如數學期望、方差和相關系數等。點估計問題就是要構造一個只依賴于樣本的量,作為未知參數或未知參數的函數的估計值。構造點估計常用的方法是:①矩估計法。用樣本矩估計總體矩,如用樣本均值估計總體均值。②最大似然估計法。于1912年由英國統計學家R.A.費希爾提出,利用樣本分布密度構造似然函數來求出參數的最大似然估計。③最小二乘法。主要用于線性統計模型中的參數估計問題。④貝葉斯估計法?;谪惾~斯學派(見貝葉斯統計)的觀點而提出的估計法。
區間估計是依據抽取的樣本,根據一定的正確度與精確度的要求,構造出適當的區間,作為總體分布的未知參數或參數的函數的真值所在范圍的估計。例如人們常說的有百分之多少的把握保證某值在某個范圍內,即是區間估計的最簡單的應用。1934年統計學家J.奈曼創立了一種嚴格的區間估計理論。求置信區間常用的三種方法:①利用已知的抽樣分布。②利用區間估計與假設檢驗的聯系。③利用大樣本理論。
假設檢驗是抽樣推斷中的一項重要內容。它是根據原資料作出一個總體指標是否等于某一個數值,某一隨機變量是否服從某種概率分布的假設,然后利用樣
本資料采用一定的統計方法計算出有關檢驗的統計量,依據一定的概率原則,以較小的風險來判斷估計數值與總體數值(或者估計分布與實際分布)是否存在顯著差異,是否應當接受原假設選擇的一種檢驗方法。假設檢驗的一般步驟
1、提出檢驗假設(又稱無效假設,符號是H0))和備擇假設(符號是H1)。H0:樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的; H1:樣本與總體或樣本與樣本間存在本質差異; 預先設定的檢驗水準為0.05;當檢驗假設為真,但被錯誤地拒絕的概率,記作α,通常取α=0.05或α=0.01。
2、選定統計方法,由樣本觀察值按相應的公式計算出統計量的大小,如X2值、t值等。根據資料的類型和特點,可分別選用Z檢驗,T檢驗,秩和檢驗和卡方檢驗等。
3、根據統計量的大小及其分布確定檢驗假設成立的可能性P的大小并判斷結果。若P>α,結論為按α所取水準不顯著,不拒絕H0,即認為差別很可能是由于抽樣誤差造成的,在統計上不成立;如果P≤α,結論為按所取α水準顯著,拒絕H0,接受H1,則認為此差別不大可能僅由抽樣誤差所致,很可能是實驗因素不同造成的,故在統計上成立。P值的大小一般可通過查閱相應的界值表得到。
假設檢驗應注意的問題
1、做假設檢驗之前,應注意資料本身是否有可比性。
2、當差別有統計學意義時應注意這樣的差別在實際應用中有無意義。回歸分析:應用數學的方法,通過對大量的試驗數據進行處理和分析,從而得出正確的反映變量之間的相互關系的數學表達式,并判斷其有效性。進而根據表達式,根據一些變量的取值去預測或控制另一變量的變化,并分析這些變量對另一變量的影響程度。(強調的是數學模型的建立,且用F檢驗驗證所有自變量與因變量的顯著性。用T檢驗驗證模型中每個自變量單獨與因變量的影響顯著性。)
相關分析:在統計分析中,對兩個及兩個以上變量間數量關系的性質、特點、表現形式進行描述、處理的一種專門的統計分析技術。變量之間的不嚴格、不準確、不穩定的數量依存關系被稱為相關關系,相關關系的強弱、疏密、因環境、時間的變化而呈現出一種獨特的規律性。相關分析的目的就是探索相關關系的變動規律,并利用相關分析的結果,為回歸分析及統計決策提供有力的依據。
相關系數只能描述變量間的關系密切程度,不能揭示現象間的本質聯系。相關系數:隨機向量的各個變量之間線性關系的密切程度。
多重共線問題:當自變量之間存在一定程度的關聯,即相關系數在0和1之間時,回歸模型中的自變量就會削弱各自對因變量的影響,在一定程度上影響參數估計值的準確性和穩定性。
對多重共線問題的測度:
1,自變量的容忍度,以容許度指標表示。容許度=1-R平方。容許度越大,說明某個自變量X與方程中的其他自變量之間的線性關系越弱,多重共線性較低。反之,容許度接近0,說明某個自變量X與方程中的其他自變量之間的線性關系較強,多重共線性較高,應將此自變量剔除出模型。
2,方差膨脹因子。方差膨脹因子是容許度的倒數,其數值越大,說明自變量之間的多重共線越高。
3,D-W檢驗。檢驗模型中的誤差項是否存在自相關的一種有效方法。D在0-4之間。D=2,殘差之間獨立。D<2,殘差之間正相關。D>2,殘差之間負相關。根據經驗,D∈(1.5,2.5)之間表示沒有顯著自相關問題。
自變量:我們將變量中的原因變量稱為自變量,即不受其他因素影響而發生變化在前的變量。
因變量:結果變量,受自變量變化影響而跟著發生變化的變量。
線性回歸模型:是線性模型中的一種,變量之間的關系呈線性關系,數學基礎是回歸分析。(用回歸分析方法建立的,變量之間的關系呈線性關系,用以揭示經濟現象中的因果關系的模型)。
事件分析法:主要是分析某事件對于社會經濟生活是否確實有沖擊作用。需要首先界定事件發生作用的時間段,即事件窗口,然后通過事件窗口超額收益的大小來衡量事件的影響。所謂超額收益是指實際收益與假設發生該事件的期望收益之差,而期望收益是由計量經濟模型計算。
事件窗口即為事件期。
配對T檢驗主要解決配對樣本數據的兩個總體均值有否顯著差異的問題。主要解決來自配對樣本數據的兩個總體均值有否顯著差異的問題。所謂配對樣本,通常是指對同一觀察對象在使用某種新方法前后的兩組數據進行比照,用兩組數據的均值,有否顯著差異來判斷這種新方法的有效性。配對樣本的T檢驗對數據的要求:1,抽取樣本數據的兩個總體必須服從正態分布。2,兩個樣本的樣本容量相同。
顯著性水平:假設檢驗中,常有=0.05,=0.01作為檢驗的顯著水平。顯著性水平是指當原假設為真時人們拒絕它的概率,亦稱拒真概率。根據假設檢驗的原理,拒真概率應是一個小概率事件。如果在檢驗中發現用樣本數據計算出來的實際概率小于或等于事先給定顯著性水平(p≦),就可以認為這個在一次試驗中不應該發生的更小概率,居然在一次試驗中發生了,我們有理由懷疑原假設的真實性,所以拒絕原假設。(p>),接受原假設。學習到連續型隨機變量時已經與高中學習的相差很大,對連續型隨機變量求其在去某值時的概率是無意義的,只能求變量落在某一范圍內的概率。因為現實生活中的事件大多受到兩個或多個因素影響,很多隨機現象中,往往要涉及到多個隨機變量,而且這些隨機變量之間存在某種聯系,因此多維隨機變量的知識在生活中應用更廣。隨機變量的概率密度與分布直接反映出隨機變量的分布情況,隨機變量的數學期望,方差等在生活中可以幫助人們做出選擇。比如大賽前選拔選手才賽,對某產品的質量估計等。
當一些隨機變量的分布不易求出或不需要知道隨機變量的概率分布,而只需要知道其數學期望,方差即可知道其大概分布情況。隨機變量的數學期望反映了隨機變量取值的平均值,而隨機變量的方差反映了隨機變量離開其平均值的平均偏離大小,反映了隨機變量的穩定性。
學好數理統計這門課程,其實有很大的作用,它會讓人對日常生活中一些涉及概率方面的問題有更加深刻的體會。如果沒有統計學,人們在收集資料和進行各項的大型的數據收集工作是非常困難的,通過對統計方法的研究,使得我們處理各種數據更加簡便,所以統計也是一門很實用的科學,應該受到大家的重視。
第四篇:概率論與數理統計
《概率論與數理統計》公共基礎課教學實踐
1012502-31 湯建波
概率與數理統計在現實的牛產和生活中有著廣泛的應用,因此,《概率論與數理統計》作為公共課是很多專業所必修的。但是,由于這門課的學習方法與《微積分》《線性代數》等其他課程有著極大的差異,很多學生在學習過程中感到難以把握概念與理論,在遇到問題時不知如何人手。因此,筆者在總結這幾年教學實踐的基礎上,提出以下思考。
一、適度引入案例。形成生動教學及啟發性教學
概率論源于博弈,是賭博中的很多問題催生了概率論這門數學學科。在開課伊始,教師就適度引入觸發概率論的一些問題,如“De.mere”問題,“分賭金問題”等等,使學生在故事中不僅得到r課本里所沒有的歷史知識,而且無形中可以提高學習興趣,消弭一部分同學的畏難情緒。另外,再在隨后的教學過程中引入“彩票中獎問題”“蒙特卡羅法求訂法”“保險付賠問題”等等,引導學生了解、探索這門學科在現實中的應用,使學乍實現由知識向能力的轉化,從而增強學,F利用概率統計解決實際問題的“欲望”,促使他們更好地認識現實世界。
概念是概率課程中最基本的內容,對概念的理解程度直接影響學生對這門課程的學習與掌握程度。在教學中,應盡量從實際問題入手,先提出問題,接著在問題的分析和解決中抽象出概念,讓學生清楚概念的來龍去脈,而不是硬性給出定義,讓學生死記硬背。例如,在講述“事件”這個定義時,引入“衛瞿嫦娥二號將于2010年10月1日發射”這一現實中的“事件”在概率論中應該是“實驗”,而其結果“發射成功”才能算是概率論所定義的“事件”,這樣,在區別現實的“事件”與概率論所研究的“事件”基礎上,學生加深了對“事件”這一定義的理解。在闡明相互獨立和互不相容之間的區別有P(A)>0,P(B)>0時,A、B相瓦獨屯與互不相容是不能同時成立的,直觀上可以這樣解釋:相互獨立意味這
4、B其中一方發生與否并不影響另一方的發生,而互不相容意味著A、B只要其中一方發生了,另一方就一定不發生,所以這兩個關系不能同時存在。從公式上解釋是:P(A)>0,P(B)>0且A、B相互獨立,則P(AB)=P(A)P(B)>0,而如果A、B互不相容,則P(AB)=P(西)=0。但是只要有一方的概率為0,如,如果A=西,則A與B既相互獨立又互不相容,因為此時P(AB)=P(A)P(B)=0。綜上所述,相互獨立與互不相容并沒有必然的聯系。
而在區別“不相關”與“相互獨立”的區別時,可以通過舉例得知J]|f、y不相關不一定就獨立,因為X、l,之間有可能存在其他的函數關系,但是存在函數關系的隨機變量是否就不獨立了呢?答案是未必,例子如下:
考察隨機變量X、l,和Z:假定x與l,獨立月.都服從參數為P的(0—1)分布,令z為x與y的函數:
可以得到當P=1/2時,Z與X相互獨立。轉載于 無憂論文網 http://www.tmdps.cn
通過這些舉例,避免了學生將“獨立”和“互不相容”等同起來,又說明了“獨立”與“函數關系”之間的聯系。
二、課堂教學中注重數學思想的教育。培養學生建模能力
概率統計中的很多問題都可以歸結為同一類問題,數學模型就是這類事物共同本質的抽象?!皵祵W建?!笔侵笇τ诂F實世界的一個特定對象,為了一個特定目的,根據特有的內在規律,做出一些必要的簡化假設,運用適當的數學工具,得到一個數學結構。數學模型在概率統計中的應用隨處可見,模型化方法貫穿本課程全過程,因此,在教學過程中應該注意培養學生抽象出問題的本質以建立起一般的數學模型的能力。
如“將n只球隨機地放入Ⅳ(N大于等于n)個盒子中去,求每個盒子至多有一只球的概率”與“班級同學生日各不相同”具有相同的數學模型。另外,還有古典概型、貝努利概型、正態分布等等這些都是生產生活中抽象出來的,在很多問題中都可以歸結為以上的模型。如以下兩個
:
例1,設有80臺同類型設備,各臺工作是相互獨立的,發生故障的概率都是0.01,且一臺設備的故障能由一個人處理??紤]兩種配備維修工人的方法,其一是由4人維護,每人負責20臺;其二是由3人共同維護80臺。試比較這兩種方法在設備發生故障時不能及時維修的概率的大小。
例2,保險公司在一天內承保了5000張相同年齡、為期1年的壽險保單,每人一份。在合同有效期內若投保人死亡,則公司賠付3萬元。設在一年內,該年齡段的死亡率為0.0015,且各個投保人是否死亡相互獨立。求該公司對于這批投保人的賠付總額不超過30萬元的概率。
以上兩個例子雖然不同,但都可以歸結為伯努利概型,利用二項分布解決。對這類模型,不應簡單地給出它的結果,而應注秀模型的建立、模型的應用范圍以及如何把實際問題轉化為有關的數學模型去解決。
三、適度引入多媒體教學及數據處理軟件。促進課堂教學手段多樣化
在概率統計教學中,實際題目信息及文字很多,“一支粉筆、一塊黑板,以講授為主”的傳統教學方法顯然已經跟不上現代化的教學要求,不利于培養學生的綜合素質和創新能力。因此,有必要借助于現代化媒體技術和統計軟件,制作內容、圖形、聲音、圖像等結合起來的多媒體課件。~方面,采用多媒體教學手段進行輔助教學,能夠將教師從很多重復性的勞動中解脫出來,教師可以將更多的精力和時間投入到如何分析和解釋問題,以提高課堂效率,與學生有效地進行課堂交流。另一方面,用圖形動畫和模擬實驗等多媒體作為輔助教學手段,便于學生對概念、圖形等的理解。如投幣試驗、高爾頓板釘實驗等小動畫在不占用太多課堂時間的同時,又增添了課堂的趣味性。又如在利用Mathematica軟件演示大數定律和中心極限定理時,就能將抽象的定理化為形象的直觀認識,達到一定的教學效果。在處理概率統計問題中,教師也會面對大量的數據,另外,集數學計算、處理與分析為一身的數據處理軟件如:Excel,Matlab,Mathematic,SAS,SPSS等,在計算一些冗長數據時可以簡化計算,降低理論難度。而且,在教師的演示過程中,能讓學生初步了解如何應用計算機及軟件,將所學的知識用于解決生產生活中的實際問題,從而激發他們學習概率知識的熱情,提高他們利用計算機解決問題的能力。
最后,在教學過程中,教師應該考慮到各個專業的學生今后學習與發展的需要,在滿足教學大綱的要求下,選擇與其專業關系緊密的知識點進行重點講授。同時,在講授過程中,本著以人為本的教學理念,注意多種方法靈活應用,建立積極的互動教學模式,盡量避免教師在課堂上滿堂灌、填鴨式地教學,充分調動學生學習的主動性,挖掘學生的學習潛能,最大限度地發揮和發展學生的聰明才智,使學生能理解概率統計這一學科領域思想方法的精髓。
論文參考文獻:
[1]盛驟,謝式千。潘承毅.概率論與數理統計[M].北京:高等教育出版社,2009.
[2] 姜啟源.數學模型[M].北京:高等教育出版社。2003:4—7.
[3] 徐鐘濟.蒙特卡羅方法[M].上海:上??茖W技術出版社,1985:171—188.
[4] 郝曉斌,董西廣.數學建模思想在概率論與數理統計課程教學中的應用[J].經濟研究導刊,2010,90(16):244—245.
[5]徐榮聰,游華.(概率論與數理統計)課程案例教學法[J].寧德師專學報(自然科學版),2008(2):145—147.
第五篇:數理統計學習感想
數理統計學習感想
學習了一學期的數理統計,我學會了如何在生活中運用所學的知識去解決一些問題。
現實中常常存在這種情況,我們所掌握的數據只是部分單位的數據或有限單位的數據,而我們所關心的卻是整個總體甚至是無限總體的數量特征。例如,民意測驗誰會當選主席?體育鍛煉對增強心臟功能是否有益?某種新藥是否提高療效?全國嬰兒性別比例如何?等等。這時只靠部分數據的描述是無法獲得總體特征的知識。
我們利用統計推斷的方法來解決。所謂統計推斷就是以一定的置信標準要求,根據樣本數據來判斷總體數量特征的歸納推理的方法。統計推斷是邏輯歸納法在統計推理的應用,所以稱為歸納推理的方法。統計推斷可以用于總體數量特征的估計,也可以用于對總體某些假設的檢驗,所以又有不同的推斷方法。下面就參數估計和假設檢驗的基本概念及原理簡單談談。
參數估計是根據從總體中抽取的樣本估計總體分布中包含的未知參數的方法。它是統計推斷的一種基本形式,是數理統計學的一個重要分支,分為點估計和區間估計兩部分。參數估計包括點估計和區間估計兩種方法。
點估計是依據樣本估計總體分布中所含的未知參數或未知參數的函數。通常它們是總體的某個特征值,如數學期望、方差和相關系數等。點估計問題就是要構造一個只依賴于樣本的量,作為未知參數或未知參數的函數的估計值。構造點估計常用的方法是:①矩估計法。用樣本矩估計總體矩,如用樣本均值估計總體均值。②最大似然估計法。于1912年由英國統計學家R.A.費希爾提出,利用樣本分布密度構造似然函數來求出參數的最大似然估計。③最小二乘法。主要用于線性統計模型中的參數估計問題。④貝葉斯估計法?;谪惾~斯學派(見貝葉斯統計)的觀點而提出的估計法。
區間估計是依據抽取的樣本,根據一定的正確度與精確度的要求,構造出適當的區間,作為總體分布的未知參數或參數的函數的真值所在范圍的估計。例如人們常說的有百分之多少的把握保證某值在某個范圍內,即是區間估計的最簡單的應用。1934年統計學家J.奈曼創立了一種嚴格的區間估計理論。求置信區間常用的三種方法:①利用已知的抽樣分布。②利用區間估計與假設檢驗的聯系。③利用大樣本理論。
假設檢驗是抽樣推斷中的一項重要內容。它是根據原資料作出一個總體指標是否等于某一個數值,某一隨機變量是否服從某種概率分布的假設,然后利用樣本資料采用一定的統計方法計算出有關檢驗的統計量,依據一定的概率原則,以較小的風險來判斷估計數值與總體數值(或者估計分布與實際分布)是否存在顯著差異,是否應當接受原假設選擇的一種檢驗方法。
假設檢驗的一般步驟
1、提出檢驗假設(又稱無效假設,符號是H0))和備擇假設(符號是H1)。H0:樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的; H1:樣本與總體或樣本與樣本間存在本質差異; 預先設定的檢驗水準為0.05;當檢驗假設為真,但被錯誤地拒絕的概率,記作α,通常取α=0.05或α=0.01。
2、選定統計方法,由樣本觀察值按相應的公式計算出統計量的大小,如X2值、t值等。根據資料的類型和特點,可分別選用Z檢驗,T檢驗,秩和檢驗和卡方檢驗等。
3、根據統計量的大小及其分布確定檢驗假設成立的可能性P的大小并判斷結果。若P>α,結論為按α所取水準不顯著,不拒絕H0,即認為差別很可能是由于抽樣誤差造成的,在統計上不成立;如果P≤α,結論為按所取α水準顯著,拒絕H0,接受H1,則認為此差別不大可能僅由抽樣誤差所致,很可能是實驗因素不同造成的,故在統計上成立。P值的大小一般可通過查閱相應的界值表得到。
假設檢驗應注意的問題
1、做假設檢驗之前,應注意資料本身是否有可比性。
2、當差別有統計學意義時應注意這樣的差別在實際應用中有無意義。
3、根據資料類型和特點選用正確的假設檢驗方法。
4、根據專業及經驗確定是選用單側檢驗還是雙側檢驗。
5、當檢驗結果為拒絕無效假設時,應注意有發生I類錯誤的可能性,即錯誤地拒絕了本身成立的H0,發生這種錯誤的可能性預先是知道的,即檢驗水準那么大;當檢驗結果為不拒絕無效假設時,應注意有發生II類錯誤的可能性,即仍有可能錯誤地接受了本身就不成立的H0,發生這種錯誤的可能性預先是不知道的,但與樣本含量和I類錯誤的大小有關系。
6、判斷結論時不能絕對化,應注意無論接受或拒絕檢驗假設,都有判斷錯誤的可能性。
區間估計與假設檢驗有區別也有聯系。
(一)主要區別:
1、參數估計是以樣本資料估計總體參數的真值,假設檢驗是以樣本資料檢驗對總體參數的先驗假設是否成立;
2、區間估計求得的是求以樣本估計值為中心的雙側置信區間,假設檢驗既有雙側檢驗,也有單側檢驗;
3、區間估計 立足于大概率,假設檢驗立足于小概率。
(二)主要聯系:
1、都是根據樣本信息推斷總體參數;
2、都以抽樣分布為理論依據,建立在概率論基礎之上的推斷;
3、二者可相互轉換,形成對偶性。
另外,在統計推斷中,我們是利用樣本統計量估計和推測總體參數的。那么,很重要的一點就是要保證樣本的代表性。因為如果從總體中抽取出來的樣本缺乏代表性,那么利用這個樣本提供的信息是難以準確有效地推測總體的某些分布特征的。因此,搞好統計推斷的前提條件就是要利用隨機抽樣,盡量減小抽樣誤差。有關抽樣的方法主要有以下幾種:
1. 簡單隨機抽樣
如果總體中每個個體被抽到的機會是均等的(即抽樣的隨機性),并且在抽取一個個體之后總體內成分不變(抽樣的獨立性),這種抽樣方法稱為簡單隨機抽樣。簡單隨機抽樣是最簡單的抽樣方法,它簡便易行,使用范圍廣。常用的方式有:抽簽法、隨機數字表法等。
抽簽法:先將總體中每個個體編上號碼,再將每個號碼寫在簽上,將簽充分混合后,從中抽取n個(即樣本的容量)簽,與被抽到的簽號相應的個體就進入樣本。
隨機數字表法:利用隨機數字表抽樣是簡單隨機抽樣中常用的一種方法。隨機數字表是用電子隨機編號器編成的,由許多隨機數排列起來的數字表。例如,要從30人的班級中抽選出5個學生作為樣本,先把這30個學生編號,然后任意從表中的一個數字作為起點,或向上、向下、向左、向右的數字,選用其頭兩位按順序選取5個。凡是編號與選取的數字相同者,定為被選對象,構成樣本。
除利用隨機數字表產生隨機數字外,還可以利用計算機編制程序,或在計算機上產生隨機數,這樣抽樣也很方便。2.機械隨機抽樣
機械隨機抽樣要先將總體中的所有個體按一定順序編號,然后按確定的相等距離抽取個體(間隔距離的大小依據所需樣本與總體中個體數目的比率而定)。例如,要從1000個學生中抽取10名學生作為樣本,可將這1000名學生從1—1000編號后,先從1—100編號中隨機抽出一個號碼,假定是39,以下從39號開始,每隔100個號碼抽取一個,抽到39,139,239,…939共10個編號,這些編號對應的學生就構成容量為10的樣本。
3.分層隨機抽樣
分層隨機抽樣也稱類型隨機抽樣。先把總體按一定標準分為同質的若干層或類型,然后在每層或類型中隨機抽樣。采用分層隨機抽樣時應遵循一個基本原則,即所分的各層內的差異要盡量小,二層與層之間的差異要盡量大。對一個總體來說,怎樣分層要視具體情況而定,分層的標準可以是一個,也可以是多個。例如,研究某校高三畢業生的數學推理能力,可按文、理分層,各自取樣。而要調查某省高中二年級學生的實驗能力,在抽樣時就應考慮性別、城鄉、學校是否重點、家庭等等各種因素,以這幾個標準作為分層標準,依次分層,再抽取樣本。
在把總體分好層次后,如何將樣本容量n合理地分到各層中去,常用的方法是根據各層人數的多少按比例抽取。
4.整群隨機抽樣
從總體中抽取出來的研究對象,不是以個體為單位,而是以整群作為單位的抽樣方法,稱為整群隨機抽樣。例如,要了解某市某年化學學科高考的成績,可以以學校為單位進行隨機抽樣。
為了增強樣本對總體的代表性,彌補整群抽樣的不均勻性,可以采用整群隨機抽樣內部再進行分層隨機抽樣的兩階段隨機抽樣法。例如,要調查某省小學二年級學生的身體情況,抽樣就可以分為兩步。先將全省分為若干部分,從中隨機抽取幾個部分作為全省小學二年級學生的代表。接著在抽取的各部分中,再按性別、家庭、民族、學校等標準,以此進行分層抽樣。在這種做法中,第一階段中的樣本,對于第二階段來說又是總體。所以,在比較大的調查研究中,采用整群隨機抽樣與分層隨機抽樣相結合的做法是比較恰當的。
現實生活中概率問題隨處可見,學好概率論和數理統計知識十分必要,我們學到的概率統計知識僅僅是一點點皮毛,如有必要我們還需深入學習它,達到學以致用的目的,在今后的學習生活中順利解決遇到的此類問題。