第一篇:數理統計學習心得
數理統計學習心得
現實中常常存在這種情況,我們所掌握的數據只是部分單位的數據或有限單位的數據,而我們所關心的卻是整個總體甚至是無限總體的數量特征。例如民意測驗誰會當選主席?體育鍛煉對增強心臟功能是否有益?某種新藥是否提高療效?全國嬰兒性別比例如何?等等。這時只靠部分數據的描述是無法獲得總體特征的知識。我們利用統計推斷的方法來解決。所謂統計推斷就是以一定的置信標準要求,根據樣本數據來判斷總體數量特征的歸納推理的方法。統計推斷是邏輯歸納法在統計推理的應用,所以稱為歸納推理的方法。統計推斷可以用于總體數量特征的估計,也可以用于對總體某些假設的檢驗,所以又有不同的推斷方法,下面就參數估計和假設檢驗的基本概念及原理簡單談談。
參數估計是根據從總體中抽取的樣本估計總體分布中包含的未知參數的方法。它是統計推斷的一種基本形式,是數理統計學的一個重要分支,分為點估計和區間估計兩部分。參數估計包括點估計和區間估計兩種方法。
點估計是依據樣本估計總體分布中所含的未知參數或未知參數的函數。通常它們是總體的某個特征值,如數學期望、方差和相關系數等。點估計問題就是要構造一個只依賴于樣本的量,作為未知參數或未知參數的函數的估計值。構造點估計常用的方法是:①矩估計法。用樣本矩估計總體矩,如用樣本均值估計總體均值。②最大似然估計法。于1912年由英國統計學家R.A.費希爾提出,利用樣本分布密度構造似然函數來求出參數的最大似然估計。③最小二乘法。主要用于線性統計模型中的參數估計問題。④貝葉斯估計法。基于貝葉斯學派(見貝葉斯統計)的觀點而提出的估計法。
區間估計是依據抽取的樣本,根據一定的正確度與精確度的要求,構造出適當的區間,作為總體分布的未知參數或參數的函數的真值所在范圍的估計。例如人們常說的有百分之多少的把握保證某值在某個范圍內,即是區間估計的最簡單的應用。1934年統計學家J.奈曼創立了一種嚴格的區間估計理論。求置信區間常用的三種方法:①利用已知的抽樣分布。②利用區間估計與假設檢驗的聯系。③利用大樣本理論。
假設檢驗是抽樣推斷中的一項重要內容。它是根據原資料作出一個總體指標是否等于某一個數值,某一隨機變量是否服從某種概率分布的假設,然后利用樣本資料采用一定的統計方法計算出有關檢驗的統計量,依據一定的概率原則,以較小的風險來判斷估計數值與總體數值(或者估計分布與實際分布)是否存在顯著差異,是否應當接受原假設選擇的一種檢驗方法。假設檢驗的一般步驟
1、提出檢驗假設(又稱無效假設,符號是H0))和備擇假設(符號是H1)。H0:樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的; H1:樣本與總體或樣本與樣本間存在本質差異; 預先設定的檢驗水準為0.05;當檢驗假設為真,但被錯誤地拒絕的概率,記作α,通常取α=0.05或α=0.01。
2、選定統計方法,由樣本觀察值按相應的公式計算出統計量的大小,如X2值、t值等。根據資料的類型和特點,可分別選用Z檢驗,T檢驗,秩和檢驗和卡方檢驗等。
3、根據統計量的大小及其分布確定檢驗假設成立的可能性P的大小并判斷結果。若P>α,結論為按α所取水準不顯著,不拒絕H0,即認為差別很可能是由于抽樣誤差造成的,在統計上不成立;如果P≤α,結論為按所取α水準顯著,拒絕H0,接受H1,則認為此差別不大可能僅由抽樣誤差所致,很可能是實驗因素不同造成的,故在統計上成立。P值的大小一般可通過查閱相應的界值表得到。
學好數理統計這門課程,其實有很大的作用,它會讓人對日常生活中一些涉及概率方面的問題有更加深刻的體會。如果沒有統計學,人們在收集資料和進行各項的大型的數據收集工作是非常困難的,通過對統計方法的研究,使得我們處理各種數據更加簡便,所以統計也是一門很實用的科學,應該受到大家的重視。
第二篇:數理統計學習心得
數理統計學習心得
現實中常常存在這種情況,我們所掌握的數據只是部分單位的數據或有限單位的數據,而我們所關心的卻是整個總體甚至是無限總體的數量特征。例如民意測驗誰會當選主席?體育鍛煉對增強心臟功能是否有益?某種新藥是否提高療效?全國嬰兒性別比例如何?等等。這時只靠部分數據的描述是無法獲得總體特征的知識。我們利用統計推斷的方法來解決。所謂統計推斷就是以一定的置信標準要求,根據樣本數據來判斷總體數量特征的歸納推理的方法。統計推斷是邏輯歸納法在統計推理的應用,所以稱為歸納推理的方法。統計推斷可以用于總體數量特征的估計,也可以用于對總體某些假設的檢驗,所以又有不同的推斷方法,下面就參數估計和假設檢驗的基本概念及原理簡單談談。
參數估計是根據從總體中抽取的樣本估計總體分布中包含的未知參數的方法。它是統計推斷的一種基本形式,是數理統計學的一個重要分支,分為點估計和區間估計兩部分。參數估計包括點估計和區間估計兩種方法。
點估計是依據樣本估計總體分布中所含的未知參數或未知參數的函數。通常它們是總體的某個特征值,如數學期望、方差和相關系數等。點估計問題就是要構造一個只依賴于樣本的量,作為未知參數或未知參數的函數的估計值。構造點估計常用的方法是:①矩估計法。用樣本矩估計總體矩,如用樣本均值估計總體均值。②最大似然估計法。于1912年由英國統計學家R.A.費希爾提出,利用樣本分布密度構造似然函數來求出參數的最大似然估計。③最小二乘法。主要用于線性統計模型中的參數估計問題。④貝葉斯估計法。基于貝葉斯學派(見貝葉斯統計)的觀點而提出的估計法。
區間估計是依據抽取的樣本,根據一定的正確度與精確度的要求,構造出適當的區間,作為總體分布的未知參數或參數的函數的真值所在范圍的估計。例如人們常說的有百分之多少的把握保證某值在某個范圍內,即是區間估計的最簡單的應用。1934年統計學家J.奈曼創立了一種嚴格的區間估計理論。求置信區間常用的三種方法:①利用已知的抽樣分布。②利用區間估計與假設檢驗的聯系。③利用大樣本理論。
假設檢驗是抽樣推斷中的一項重要內容。它是根據原資料作出一個總體指標是否等于某一個數值,某一隨機變量是否服從某種概率分布的假設,然后利用樣
本資料采用一定的統計方法計算出有關檢驗的統計量,依據一定的概率原則,以較小的風險來判斷估計數值與總體數值(或者估計分布與實際分布)是否存在顯著差異,是否應當接受原假設選擇的一種檢驗方法。假設檢驗的一般步驟
1、提出檢驗假設(又稱無效假設,符號是H0))和備擇假設(符號是H1)。H0:樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的; H1:樣本與總體或樣本與樣本間存在本質差異; 預先設定的檢驗水準為0.05;當檢驗假設為真,但被錯誤地拒絕的概率,記作α,通常取α=0.05或α=0.01。
2、選定統計方法,由樣本觀察值按相應的公式計算出統計量的大小,如X2值、t值等。根據資料的類型和特點,可分別選用Z檢驗,T檢驗,秩和檢驗和卡方檢驗等。
3、根據統計量的大小及其分布確定檢驗假設成立的可能性P的大小并判斷結果。若P>α,結論為按α所取水準不顯著,不拒絕H0,即認為差別很可能是由于抽樣誤差造成的,在統計上不成立;如果P≤α,結論為按所取α水準顯著,拒絕H0,接受H1,則認為此差別不大可能僅由抽樣誤差所致,很可能是實驗因素不同造成的,故在統計上成立。P值的大小一般可通過查閱相應的界值表得到。
假設檢驗應注意的問題
1、做假設檢驗之前,應注意資料本身是否有可比性。
2、當差別有統計學意義時應注意這樣的差別在實際應用中有無意義。回歸分析:應用數學的方法,通過對大量的試驗數據進行處理和分析,從而得出正確的反映變量之間的相互關系的數學表達式,并判斷其有效性。進而根據表達式,根據一些變量的取值去預測或控制另一變量的變化,并分析這些變量對另一變量的影響程度。(強調的是數學模型的建立,且用F檢驗驗證所有自變量與因變量的顯著性。用T檢驗驗證模型中每個自變量單獨與因變量的影響顯著性。)
相關分析:在統計分析中,對兩個及兩個以上變量間數量關系的性質、特點、表現形式進行描述、處理的一種專門的統計分析技術。變量之間的不嚴格、不準確、不穩定的數量依存關系被稱為相關關系,相關關系的強弱、疏密、因環境、時間的變化而呈現出一種獨特的規律性。相關分析的目的就是探索相關關系的變動規律,并利用相關分析的結果,為回歸分析及統計決策提供有力的依據。
相關系數只能描述變量間的關系密切程度,不能揭示現象間的本質聯系。相關系數:隨機向量的各個變量之間線性關系的密切程度。
多重共線問題:當自變量之間存在一定程度的關聯,即相關系數在0和1之間時,回歸模型中的自變量就會削弱各自對因變量的影響,在一定程度上影響參數估計值的準確性和穩定性。
對多重共線問題的測度:
1,自變量的容忍度,以容許度指標表示。容許度=1-R平方。容許度越大,說明某個自變量X與方程中的其他自變量之間的線性關系越弱,多重共線性較低。反之,容許度接近0,說明某個自變量X與方程中的其他自變量之間的線性關系較強,多重共線性較高,應將此自變量剔除出模型。
2,方差膨脹因子。方差膨脹因子是容許度的倒數,其數值越大,說明自變量之間的多重共線越高。
3,D-W檢驗。檢驗模型中的誤差項是否存在自相關的一種有效方法。D在0-4之間。D=2,殘差之間獨立。D<2,殘差之間正相關。D>2,殘差之間負相關。根據經驗,D∈(1.5,2.5)之間表示沒有顯著自相關問題。
自變量:我們將變量中的原因變量稱為自變量,即不受其他因素影響而發生變化在前的變量。
因變量:結果變量,受自變量變化影響而跟著發生變化的變量。
線性回歸模型:是線性模型中的一種,變量之間的關系呈線性關系,數學基礎是回歸分析。(用回歸分析方法建立的,變量之間的關系呈線性關系,用以揭示經濟現象中的因果關系的模型)。
事件分析法:主要是分析某事件對于社會經濟生活是否確實有沖擊作用。需要首先界定事件發生作用的時間段,即事件窗口,然后通過事件窗口超額收益的大小來衡量事件的影響。所謂超額收益是指實際收益與假設發生該事件的期望收益之差,而期望收益是由計量經濟模型計算。
事件窗口即為事件期。
配對T檢驗主要解決配對樣本數據的兩個總體均值有否顯著差異的問題。主要解決來自配對樣本數據的兩個總體均值有否顯著差異的問題。所謂配對樣本,通常是指對同一觀察對象在使用某種新方法前后的兩組數據進行比照,用兩組數據的均值,有否顯著差異來判斷這種新方法的有效性。配對樣本的T檢驗對數據的要求:1,抽取樣本數據的兩個總體必須服從正態分布。2,兩個樣本的樣本容量相同。
顯著性水平:假設檢驗中,常有=0.05,=0.01作為檢驗的顯著水平。顯著性水平是指當原假設為真時人們拒絕它的概率,亦稱拒真概率。根據假設檢驗的原理,拒真概率應是一個小概率事件。如果在檢驗中發現用樣本數據計算出來的實際概率小于或等于事先給定顯著性水平(p≦),就可以認為這個在一次試驗中不應該發生的更小概率,居然在一次試驗中發生了,我們有理由懷疑原假設的真實性,所以拒絕原假設。(p>),接受原假設。學習到連續型隨機變量時已經與高中學習的相差很大,對連續型隨機變量求其在去某值時的概率是無意義的,只能求變量落在某一范圍內的概率。因為現實生活中的事件大多受到兩個或多個因素影響,很多隨機現象中,往往要涉及到多個隨機變量,而且這些隨機變量之間存在某種聯系,因此多維隨機變量的知識在生活中應用更廣。隨機變量的概率密度與分布直接反映出隨機變量的分布情況,隨機變量的數學期望,方差等在生活中可以幫助人們做出選擇。比如大賽前選拔選手才賽,對某產品的質量估計等。
當一些隨機變量的分布不易求出或不需要知道隨機變量的概率分布,而只需要知道其數學期望,方差即可知道其大概分布情況。隨機變量的數學期望反映了隨機變量取值的平均值,而隨機變量的方差反映了隨機變量離開其平均值的平均偏離大小,反映了隨機變量的穩定性。
學好數理統計這門課程,其實有很大的作用,它會讓人對日常生活中一些涉及概率方面的問題有更加深刻的體會。如果沒有統計學,人們在收集資料和進行各項的大型的數據收集工作是非常困難的,通過對統計方法的研究,使得我們處理各種數據更加簡便,所以統計也是一門很實用的科學,應該受到大家的重視。
第三篇:概率與數理統計學習心得
概率與數理統計學習心得
概率論與數理統計是研究隨機現象統計規律性的一門數學學科,其理論與方法的應用非常廣泛,幾乎遍及所有科學技術領域、工農業生產、國民經濟以及我們的日常生活。對于作為電子通信專業的我,其日后的幫助也是很大的。
這門課程給我最深刻的體會就是這門課程很抽象,很難以理解,初學時,就算覺得理解了老師的講課內容,但是一聯系實際也會很難以應用上,簡化不出有關所學知識的模型。后來經過老師的生動現實的實例分析,逐漸對這門課程有了新的認識。首先,這門課程給我帶來了一種新的思維方式。前幾章的知識好多都是高中大學講過的,接觸下來覺得挺簡單,但是后面從大數定理及中心極限定理就開始是新的內容了。我覺得學習概率論與數理統計最重要的就是要學習書本中滲透的一種全新的思維方式。統計與概率的思維方式,和邏輯推理不一樣,它是不確定的,也就是隨機的思想。這也是一個人思維能力最主要的體現,整個學習過程中要緊緊圍繞這個思維方式進行。這些都為后面的數理統計還有參數估計、檢驗假設打下了基礎。
概率論與數理統計不僅在自然科學中發揮重要作用,實證的方法就是基于數據分析整理并推理預測,而且在社會實踐中發揮著重要的不可替代的作用,這是因為 1.人類活動的各個領域都不同程度與數據打交道,都有如何收集和分析數據的問題,因此概率論與數理統計學的理論和方法,與人類活動的各個領域都有關聯。
2.組成社會的單元——人、家庭、單位、地區等,都有很大的變異性、不確定性,如果說,在自然現象中尚有一些嚴格的、確定性的規律,在社會現象中則絕少這規律,因此更加依靠從概率論與數理統計的角度去考察。
概率論與數理統計的發展方向是更加實用,基于多元函數、通過建立數學模型來分析解決問題,理論更加嚴密,應用更加廣泛,發展更加迅速。
通過老師的教學,使我初步了解了概率論與數理統計的基本概念和基本理論,知道了處理隨機現象的基本思想和方法,有助于培養自己解決實際問題的能力和水平。
第四篇:概率論與數理統計 學習心得
《概率論與數理統計》由于其理論及應用的重要性,目前在我國高等數學教育中,已與高等數學和線性代數漸成鼎足之勢。
學生們在學習《概率論與數理統計》時通常的反映之一是“課文看得懂,習題做不出”。概率論習題的難做是有名的。要做出題目,至少要弄清概念,有些還要掌握一定的技巧。這句話說起來簡單,但是真正的做起來就需要花費大量的力氣。不少學生在學習時,只注重公式、概念的記憶和套用,自己不對公式等進行推導。這就造成一個現象:雖然在平時的做題過程中,自我感覺還可以;尤其是做題時,看一眼題目看一眼答案,感覺自己已經掌握的不錯了,但一上了考場,就考砸。這就是平時的學習過程中只知其一,不知其二,不注重對公式的理解和推導造成的。比方說,在我們教材的第一章,有這樣一個公式:A-B=bar(AB)=A-AB,這個公式讓很多人迷糊,因為這個公式本身是錯誤的,在教材后面的例題1-15中證明利用了這個公式,很多人就用教材上這個錯誤的公式套用,結果看不懂。其實這個公式正確的應該是A-B=AbarB=A-AB.這是一個應用非常多的公式,而且考試的時候一般都會考的公式。在開始接觸這個公式的時候就應該自己進行推導,發現這個錯誤,而不是看到這個公式之后,記住,然后運用到題目中去。大家在看書的時候注意對公式的推導,這樣才能深層次的理解公式,真正的靈活運用。做到知其一,也知其二。
現在概率統計的考試試題難度,學員呼聲不一,有的人感覺非常難,而且最讓他們難以應對的是基礎知識,主要涉及排列組合、導數、積分、極限這四部分。現在就這部分內容給大家分析一下。說這部分是基礎,本身就說明這些知識不是概率統計研究的內容,他們只是在研究概率統計的時候不可缺少的一些工具。即然這樣,在考試中就不會對這部分內容作過多的考察,也會盡量避免大家在這些方面丟分。分析到這里,就要指出一些人在學習這門課的“戰術失誤”。有些人花大量的力氣學習微積分,甚至學習概率統計之前,將微積分重新學一遍,這是不可取的。對這部分內容,將教材上涉及到的知識選出來進行復習,理解就可以。萬不能讓基礎知識成為概率統計的攔路虎。學習中要知道哪是重點,哪是難點。
如何掌握做題技巧?俗話說“孰能生巧”,對于數學這門課,用另一個成語更貼切——“見多識廣”。對于我們自考生而言,學習時間短,想利用“孰能生巧”不太現實,但是“見多識廣”確實在短時間內可以做到。這就是說,在平時不能一味的多做題,關鍵是多做一些類型題,不要看量,更重要的是看多接觸題目類型。同一個知識點,可以從多個角度進行考察。有些學員由于選擇輔導書的問題,同類型的題目做了很多,但是題目類型卻沒有接觸多少。在考試的時候感覺一落千丈。那么應該如何掌握題目類型呢?我想歷年的真題是我們最好的選擇。
平時該如何練習?提出這個問題可能很多人會感到不可思議。有一句話說得好“習慣形成性格”。這句話應用到我們的學習上也成立。這么多年以來,有些人有很好的學習習慣,盡管他的學習基礎也不好,學習時間也有限,但是他們能按照自己知道的學習規律堅持學習,能夠按照老師說得去思考、前進。我們大多數人都有惰性,一個題目一眼看完不會,就趕緊找答案。看了答案之后,也就那么回事,感覺明白了,就放下了。就這樣“掰了很多玉米,最后卻只剩下一個玉米”。我們很清楚,最好的方法是摘一個,留一個。哪怕一路你只摘了2個,也比匆匆忙忙摘了一路,卻不知道保留的人得到的多。平時做題要先多思考,多總結,做一個會一個,而且對于做過的題目要經常地回顧,這樣才能掌握住知識。就我的輔導經驗而言,絕大多數人還是在這個問題上出現了問題。
考試有技巧,學習無捷徑。平時的學習要注重知識點的掌握,踏踏實實,這才是方法中的方法。“梅花香自苦寒來”,“書山有路勤為徑”。
這學期的數學學習情況比以往都好。可能是因為老師講得好,注意把握整本書的體系,在每節課上都會不斷提醒我們以往學過的知識,或者根本就是整本書的知識都是脈狀的,各個知識點都有相互交錯碰撞的節點,而不是線性的,僅有一條主線牽引,旁支彼此互不相干。一個知識點的學習需要用到以往學過的知識,所以每個知識都顯得很飽滿,有新的因子又有舊的根基,它們彼此交融補充,向我展示了概率論與數理統計的豐富多彩的面貌。也是在這本書的學習中,我強烈地感受到了數學的豐富多彩,邏輯的嚴密和體系的完整。我不禁老淚縱橫,在數學的殿堂門口晃悠了10多年,終于看到了那輝煌莊嚴富麗堂皇的大門。
偶然在圖書館自然科學書庫發現的一本小書,由商務印書館出版的科學之旅系列的《概率論與數理統計》,讓我看到了這個體系的發展過程,從隨機的賭博事件到布朗運動、馬爾可夫鏈再到核彈航空航天,從事件的簡單分析再總結規律推廣到不同領域。由不知名的數學教師再到世界頂級數學家,在前人研究結果上不斷修正補充發展,將這一體系不斷完善,我看到那是一棵枝繁葉茂的數學之樹,堅定穩固的根基不斷為后續生長提供源源不斷的養分。
下面對課本所學知識做一個簡要總結。本書從簡單隨機事件出發,將隨機事件分為有限或無限可數的古典概論事件和不可測的幾何概率事件。再用數學語言——隨機變量(是函數)描述出這兩類事件的概率發生情況,劃分為離散型隨機變量和連續性隨機變量。離散型隨機變量函數的自變量是每個可能取值,因變量是每個可能取值的概率。而連續性隨機變量函數則用面積來表示,隨機變量的概率等于其概率密度在區間上的積分。再將這些用分布函數表達,分別形成離散型和連續性隨機變量函數的分布。
再推廣到二維隨機變量,X和Y的不同取值相互組合,構成聯合離散型隨機變量和聯合連續性隨機變量,再出現了聯合概率分布律,聯合概率分布函數及其密度函數等等。其中在事件概率中,出現了條件概率和事件獨立性這兩個概念。A和B同時發生的概率等于A的概率乘以B的概率,當B受A影響時,B的概率應為A下B的概率,即條件概率,AB的概率則用乘法公式表達;若B不受A影響,彼此相互獨立,則直接相乘,即獨立性。如果一個事件在不同的條件下發生,則其概率為不同原因下發生的概率的總和,即全概率。有點類似前面講隨機事件,有一個提法,事情還沒做完(即前后兩步有聯系,即條件關系)用乘法,不同事情用加法(每個事件彼此不影響)。全概率公式倒推過來則是貝葉斯公式。基本上就是這樣了吧......每天腦子里想的都是怎么樣去簡化理解,而不是死記公式,所以那些公式記得有些模糊,什么泊松分布,正態分布!@#$
第五篇:概率論與數理統計學習心得
概率論與數理統計學習心得
摘要:通過概率論與數理統計這門課的學習,我掌握了基本的概率論的知識,當然學習中也曾遇到過很多的問題。本文主要就概率論的發展歷史、我的學習心得和其在生活中的應用三個方面來闡述我對這門課的理解。
關鍵詞:概率論,數理統計,學習心得,發展歷史,應用。
一、概率論與數理統計的發展歷史:
早在1654年,有一個賭徒向法國著名數學家帕斯卡挑戰,給他出了一道題目:甲乙兩個人賭博,他們兩人獲勝的機率相等,比賽規則是先勝三局者為贏家,贏家可以獲得100法郎的獎勵。比賽進行三局后,甲勝了兩局,乙勝了一局,這時由于某些原因中止了比賽,那么如何分配這100法郎才比較公平?用概率論的知識,不難得知,甲獲勝的概率為1/2+(1/2)*(1/2)=3/4,乙獲勝的概率為(1/2)*(1/2)=1/4。所以甲的期望所得值為100*3/4=75法郎,乙的期望所得值為25法郎。這個故事里出現了“期望”這個詞,數學期望由此而來。
三年后,也就是1657年,荷蘭著名的天文、物理兼數學家惠更斯企圖自己解決這一問題,結果寫成了《論機會游戲的計算》一書,這就是最早的概率論著作。在此期間,法國的費爾馬與帕斯卡也在相互通信中探討了隨機博弈現象中所出現的概率論的基本定理和法則.惠更斯等人的工作建立了概率和數學期望等主要概念,找出了它們的基本性質和演算方法,從而塑造了概率論的雛形。
18世紀是概率論的正式形成和發展時期。1713年,貝努利的名著《推想的藝術》發表。在這部著作中,貝努利明確指出了概率論最重要的定律之一“大數定律”,并且給出了證明,這使以往建立在經驗之上的頻率穩定性推測理論化了,從此概率論從對特殊問題的求解,發展到了一般的理論概括。繼貝努利之后,法國數學家棣謨佛于1781年發表了《機遇原理》。書中提出了概率乘法法則,以及“正態分布”的概念,為概率論的“中心極限定理”的建立奠定了基礎。1706年法國數學家蒲豐的《偶然性的算術試驗》完成,他把概率和幾何結合起來,開始了幾何概率的研究,他提出的“蒲豐問題”就是采取概率的方法來求圓周率π的嘗試。通過貝努利等人的努力,使數學方法有效地應用于概率研究之中,使概率論成為數學的一個分支。數理統計是一個比較年輕的數學分支。多數人認為它的形成是在20世紀40年代克拉美的著作《統計學的數學方法》問世之時,它使得1945年以前的25年間英、美統計學家在統計學方面的工作與法、俄數學家在概率論方面的工作結合起來,從而形成數理統計這門學科。它是以對隨機現象觀測所取得的資料為出發點,以概率論為基礎來研究隨機現象的一門學科。
近二十年來,隨著計算機的發展以及各種統計軟件的開發,概率統計方法在金融、保險、生物、醫學、經濟、運籌管理和工程技術等領域得到了廣泛應用。主要包括:極限理論、隨機過程論、數理統計學、概率論方法應用、應用統計學等。極限理論包括強極限理論及弱極限理論;隨機過程論包括馬氏過程論、鞅論、隨機微積分、平穩過程等有關理論。概率論方法應用是一個涉及面十分廣泛的領域,包括隨機力學、統計物理學、保險學、隨機網絡、排隊論、可靠性理論、隨機信號處理等有關方面。應用統計學方法的產生主要來源于實質性學科的研究活動中,例如,最小二乘法與正態分布理論源于天文觀察誤差分析,相關與回歸分析源于生物學研究,主成分分析與因子分析源于教育學與心理學的研究,抽樣調查方法源于政府統計調查資料的搜集等等。
二、學習心得與體會:
大二上學期,我們開始學習《概率論與數理統計》這門課程。如名稱所述,課程內容分為兩部分:概率論和數理統計。這兩部分是有著緊密聯系的。在概率論中,我們研究的隨機變量,都是在假定分布已知的情況下研究它的性質和特點;而在數理統計中,是在隨機變量分布未知的前提下通過對所研究的隨機變量進行重復獨立的觀察,并對觀察值進行分析,從而對所研究的隨機變量的分布做出推斷。因此,概率論可以說是數理統計的基礎。
概率論與數理統計是一門在大學數學中極為重要的課程。以我個人的理解,如果說微積分、線性代數只是分析數學、或是說解題的工具,那么概率論才是真正把實際問題轉換為數學問題的學問,因為它解決的并非純數學問題,不是給你一個命題讓你去解決,而恰恰是讓你去構思命題,進而構建模型來想方設法解決實際問題。
在學習這門課程時,我逐漸掌握了幾個要點:
1.在學習“概率論”的過程中要抓住對概念的引入和背景的理解,例如為什么要引進“隨機變量”這一概念。隨機變量X(即從樣本空間到實軸的單值實函數)的引進使原先不同隨機試驗的隨機事件的概率都可轉化為隨機變量落在某一實數集合B的概率,不同的隨機試驗可由不同的隨機變量來刻畫。此外若對一切實數集合B,知道P(X∈B)。那么隨機試驗的任一隨機事件的概率也就完全確定了。所以我們只須求出隨機變量X的分布P(X∈B)。就對隨機試驗進行了全面的刻畫。2.在學習“概率論”過程中對于引入概念的內涵和相互間的聯系和差異要仔細推敲,例如隨機變量概念的內涵有哪些意義:它是一個從樣本空間到實軸的單值實函數X(w),但它不同于一般的函數,首先它的定義域是樣本空間,不同隨機試驗有不同的樣本空間。
3.概率論中也有許多習題,在解題過程中不要為解題而解題,而應理解題目所涉及的概念及解題的目的,至于具體計算中的某些技巧基本上在高等數學中都已學過。因此概率論學習的關鍵不在于做許多習題,而要把精力放在理解不同題型涉及的概念及解題的思路上去。這樣往往能“事半功倍”。
三、概率論與數理統計在生活中的應用:
以下舉幾個有趣的實例來說明概率論與統計在生活中的應用。
一、首先來看一個經典的生日概率問題:
1.團體有一群人,我絕對可以肯定至少有2人生日相同,這群人人數至少要多少?(假設一年是365天)
對于這個問題,某一團體中,絕對肯定至少有2人生日相同,即為必然事件,p=1。由抽屜原理可知,這群人至少要有366人。或者這樣想,若是365人,則有可能這365人出生在一年的365天里,所以至少是366人。
2.如果某個隨機而遇的團體有50人以上,我敢打賄,這個團體幾乎可以肯定有生日相同的兩個人,你相信嗎?
要解決這個概率問題,我們首先來計算一下,50個人生日的搭配一共有多少種可能情況。第一個人生日,可以是一年中任何一天,一共有365種可能情況,而第二、第三及其它所有人生日也都有365種,這樣50個人共有36550種可能搭配。如果50人的生日無一相同,那么生日搭配可能情況就少得多了。第一個人有365種可能,第二人因不能與第一個生日相同,只有364種可能,依次類推,如50人生日無一相同,其生日搭配情況只有365×364×363×……×317×316。那么50人生日無一相同的概率僅為3%,所以至少有兩人的生日相同的概率為97%。所以我敢打賭是基本可以穩操勝券的。在這個實例中,我們可以清楚地發現有時自己感覺起來不太可能的事,其實概率是很大的。學習了概率論之后,我們要學會用概率論的知識判斷周圍的事物,使自己收益最大化。
二、中獎問題:
在各個國家都有各種彩票,使不少人一夜之間變成千萬或百萬富翁,但這種游戲究竟對參與者來說有沒有利,現在我們用概率論的知識來簡單地說明這個問題。
首先假設有十個人參與抽獎,每人要向彩票公司繳納一元錢,彩票公司必須掙錢呀,所以它最多會拿出5元錢作為中獎者的獎金。因為每個人中獎幾率一樣,即十分之一,所以每個人獲得回報的期望是0.5元,那么回報的期望小于自己的付出,顯然對自己來說是不劃算的。
當然,由于彩票的價錢一般不高,中獎獎金又數以千萬計,所以人們購買彩票的欲望才會這么高。再者人都是想不勞而獲的,所以雖然很多人知道中獎機率幾乎為零,還是想像自己可能會是幸運兒。
三、考試問題:
大學英語四六級考試是全面檢驗大學生英語水平的一種考試,四六級考試改革前除寫作和翻譯20分外,其余85道題是單項選擇題,每道題有四個選項,這種情況使個別學生產生碰運氣和僥幸心理,那么靠運氣能通過四六級考試嗎?答案是否定的。假設不考慮寫作和翻譯20分,及格按60分算,則85道題必須答對51題以上,可以看成85重伯努利試驗。概率非常小,相當于1000億個靠運氣的考生中僅有0.874人能通過。所以靠運氣通過考試是不可能的。這也告訴我們做人做事要腳踏實地,在有些時候學會用概率論的知識來判斷事物,但千萬不可做投機取巧的事,而要真真實實,腳踏實地。
掌握了概率論的知識會讓我們終生受益,它可以指導我們進行判斷與決策,讓我們避免人生的危機,走在通往光明的康莊大道上。當然遠離了腳踏實地,就像那些天天指望中一百萬、一千萬的人那樣,人生將會在漫無目的的等待和渴望中度過,一輩子渾渾噩噩,一事無成。
參考文獻:《概率論公理化進程的歷史研究》,張鑫,山東大學,2012-10-20 《數理統計學小史》,陳希儒,數理統計與管理,1998-04-10 《概率論的緣起、發展及其應用》,徐洪香,遼寧工學院學報,2001-06-30 《淺析現實生活中概率論的應用》,段靜涵,華章,2012-02-10