第一篇:管理統計學上機實驗報告
學 院 專 業 年級班別 姓 名 指導教師
管理統計學實驗報告
2015年12月
第3章
例3.1①實驗題目
表3-1是8名學生4門課程的考試成績數據(單位:分)。試找出統計學成績等于75分的學生,英語成績最高的前三名學生,四門課程成績都大于70分的學生。
②實驗步驟
圖3-1 統計學成績等于75分的學生.圖3-2 英語成績最高的前三名學生
圖3-3 四門課程成績都大于70分的學生
例3.2①實驗題目
在某大學隨機抽取30名學生,調查他們的性別、家庭所在地、平均月生活費支出、平均每月購買衣物支出和購買衣物時所考慮的首要因素等,得到的數據如下表。試建立一個數據透視表,在表的行變量中給出性別和買衣物首選因素,在列變量中給出學生的家庭所在地區,對平均月生活費和月平均衣物支出進行交叉匯總。
②實驗步驟
圖3-4 數據透視表
例3.3①實驗題目
為研究不同類型軟飲料的市場銷售情況,一家調查公司對隨機抽取的一家超市進行調查。表3-3是調查員隨機觀察的50名顧客購買的飲料類型及購買者性別的記錄。生產頻數分布表,觀察飲料類型和顧客性別的分布狀況,并進行描述性分析。
②實驗步驟
圖3-5 不同類型飲料和顧客性別的頻數分布表
圖3-6 飲料類型的條形圖
圖3-7 顧客性別的條形圖
圖3-8 飲料類型和顧客性別的復式條形圖
圖3-9 不同類型飲料的帕累托圖
圖3-10 不同類型飲料構成的餅圖
圖3-11 按性別繪制的不同類型飲料構成的復式餅圖
例3.4①實驗題目
表3-9是2006年北京、上海和天津地區按收入法計算的地區生產總值(按當年價格計算)數據。繪制環形圖比較三個地區的生產總值構成。
②實驗步驟
圖3-12 北京、shanghai、天津地區收入法下生產總值構成的環形圖
例3.5①實驗題目
在一項有關城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣調查300戶,其中的一個問題是:“您對您家庭目前的住房狀況是否滿意?”要求回答的類別依次如下:
1、非常不滿意;
2、不滿意;
3、一般;
4、滿意;
5、非常滿意。②實驗步驟 圖3-13 甲、乙城市家庭對住房狀況評價的頻數分布表及
甲城市家庭對住房狀況評價的累積分布圖
例3.6①實驗題目
表3-12是某電腦公司2005年前4個月每天的銷售量數據(單位:臺)。試對數據進行分組。
②實驗步驟
圖3-14 某電腦公司銷售量的頻數分布表
(一)(二)
(三)例3.7①實驗題目
從某大學經濟管理專業二年級學生中隨機抽取11人,對8門主要課程的考試成績進行調查,所得結果如表3-16所示。試繪制各科考試成績的比較箱圖,并分析各科考試成績的分布特征。
②實驗步驟
圖3-15
例3.8①實驗題目
已知1991-2003年我國城鄉居民家庭的人均收入數據(單位:元),如表3-17所示。試繪制線圖。
②實驗步驟
圖3-16 城鄉居民家庭人均收入線圖
例3.9①實驗題目
小麥的單位面積產量與降雨量和溫度等有一定關系。為了解它們 之間的關系形態,收集到如下數據。試繪制小麥產量與降雨量的散點圖,并分析它們之間的關系。
②實驗步驟
圖3-17 小麥產量與降雨量的散點圖
圖3-18 小麥產量與降雨量和溫度的氣泡圖
例3.10①實驗題目
2003年我國城鄉居民家庭平均每人各項生活消費支出構成數據如表所示。試繪制雷達圖。②實驗步驟
圖3-19 2003年城鄉居民家庭人均消費支出構成的雷達圖
第5章
例5.16①實驗題目
用Excel計算二項分布概率值
②實驗步驟
例5.18①實驗題目
用Excel計算泊松分布概率值
②實驗步驟 5.4.2①實驗題目
用Excel繪制標準正態分布概率密度函數曲線
②實驗步驟
例5.22①實驗題目
用Excel計算正態分布概率值
②實驗步驟 例5.24①實驗題目
用Excel繪制正態概率圖進行數據正態性的評估
②實驗步驟
第9章
例9.1①實驗題目
用Excel計算P值
②實驗步驟
第10章
表10-6①實驗題目
用Excel進行單因素方差分析
②實驗步驟
表10-10①實驗題目
用Excel進行無重復雙因素方差分析
②實驗步驟 表10-15①實驗題目
用Excel進行有交互作用的雙因素方差分析
②實驗步驟
第11章
例11.7①實驗題目
數據分析-相關系數的計算應用
②實驗步驟
例11.9①實驗題目
用Excel進行回歸分析
②實驗步驟 例11.9①實驗題目
用Excel進行殘差分析
②實驗步驟
不良貸款與貸款余額回歸的殘差圖
練習題11.1①實驗題目
書本課后練習題11.1
②實驗步驟(1)產量與生產費用散點圖:
從散點圖可以看出,產量與生產費用之間為正線性相關關系。(2)產量與生產費用間的線性相關系數:R=0.920232。(3)略。
練習題11.5①實驗題目
書本課后練習題11.5
②實驗步驟(1)
從散點圖可以看出,運送距離與運送時間之間為正線性相關關系。
(2)運送距離與運送時間之前的線性相關系數R=0.948943,R>0.8,表明運送距離與運送時間之間有較強的正線性相關關系。(3)SUMMARY OUTPUT回歸統計Multiple R0.948943R Square0.900492Adjusted R Sq0.888054標準誤差0.480023觀測值10方差分析df回歸分析殘差總計SSMSFSignificance F116.6816216.6816272.395852.79E-0581.8433790.230422918.525Coefficients標準誤差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept0.1181290.3551480.332620.74797-0.700840.937101-0.700840.937101X Variable 10.0035850.0004218.5085752.79E-050.0026130.0045570.0026130.004557 ?x。得到的回歸方程為:y?0.118129?0.003585
練習題11.7①實驗題目
書本課后練習題11.7
②實驗步驟(1)
從散點圖可以看出,航班正點率與顧客投訴次數之間為負線性相關關系。(2)
??430.1892?4.7x。回歸系數表示航班正點率每增加1%,顧客計算得到的回歸方程為:y投訴次數平均下降4.7次。
(3)回歸系數檢驗的P-Value=0.001108?0.05),拒絕原假設,回歸系數顯著。
?80?430.1892?4.7?80?54.1892(次)(4)y(5)略。
練習題11.10①實驗題目
書本課后練習題11.10 ②實驗步驟
??13.6254?2.3029x;判定系數R?93.74%,表明由上述結果可知:回歸方程為y回歸方程的擬合程度較高;估計標準誤差se?3.8092。
2練習題11.13①實驗題目
書本課后練習題11.13 ②實驗步驟
???46.2918?15.23977x 得到的線性回歸方程為:y
第12章
練習題12.4①實驗題目
書本課后練習題12.4
②實驗步驟
(1)
SUMMARY OUTPUT回歸統計Multiple R0.807807R Square0.652553Adjusted R Sq0.594645標準誤差1.215175觀測值8方差分析df回歸分析殘差總計SSMSFSignificance F116.640116.640111.268810.01528868.8599031.476651725.5Coefficients標準誤差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept88.637681.58236756.015882.17E-0984.7657792.5095984.7657792.50959X Variable 11.6038650.4777813.3569050.0152880.4347772.7729520.4347772.772952 得到估計的回歸方程:
y??88.637681?1.603865x1(2)
SUMMARY OUTPUT回歸統計Multiple R0.958663R Square0.919036Adjusted R Sq0.88665標準誤差0.642587觀測值8方差分析df回歸分析殘差總計SSMSFSignificance F223.4354111.717728.377770.00186552.0645920.412918725.5P-value4.57E-080.0006530.009761Lower 95%Upper 95%下限 95.0%上限 95.0%79.1843387.2758579.1843387.275851.5085613.0718061.5085613.0718060.4765992.1253790.4765992.125379 Coefficients標準誤差t StatIntercept83.230091.57386952.88248X Variable 12.2901840.3040657.531899X Variable 21.3009890.3207024.056697得到估計的回歸方程:
y??83.230092?2.290184x1?1.300989x2
(3)(4)(5)略。練習題12.6①實驗題目
書本課后練習題12.6
②實驗步驟
(1)
SUMMARY OUTPUT回歸統計Multiple R0.947362R Square0.897496Adjusted R Sq0.878276標準誤差791.6823觀測值20方差分析df回歸分析殘差總計SSMSFSignificance F***3546.696973.88E-***760.91997831680P-value0.7990360.1310990.0013070.057088Lower 95%Upper 95%下限 95.0%上限 95.0%-1069.021366.419-1069.021366.419-0.270631.900105-0.270631.9001050.3733051.2686540.3733051.268654-0.004580.274665-0.004580.274665 Coefficients標準誤差t StatIntercept148.7005574.42130.25887X Variable 10.8147380.5119891.591321X Variable 20.820980.2111773.887646X Variable 30.1350410.0658632.050322得到估計的回歸方程:
y??148.700454?0.814738x1?0.820980x2?0.135041x3
(2)(3)(4)略。練習題12.9①實驗題目
書本課后練習題12.9
②實驗步驟
(1)
銷售價格y購進價格x1銷售費用x2銷售價格y1購進價格x10.3089521銷售費用x20.0012141(3)
1-0.85285761(2)根據(1)中結果,用購進價格和銷售費用來預測銷售價格無用。SUMMARY OUTPUT回歸統計Multiple R0.593684R Square0.35246Adjusted R Sq0.244537標準誤差69.75121觀測值15方差分析df回歸分析殘差總計SSMSFSignificance F231778.1515889.083.2658420.0737221258382.784865.2321490160.93t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Coefficients標準誤差Intercept375.6018339.41061.106630.290145-363.911115.114-363.911115.114X Variable 10.5378410.2104472.5557110.02520.0793170.9963650.0793170.996365X Variable 21.4571940.6677072.1823860.0496810.0023862.9120010.0023862.912001 得到估計的回歸方程:
y??375.601829?0.537841x1?1.457194x2
F檢驗表明,y與x1、x2之間的線性關系不顯著。
t檢驗表明,自變量x1、x2對因變量y的影響均顯著。
(4)(5)略。
(6)模型中存在多重共線性。
問題與討論
由于和書上使用的excel版本不一致,使用方法和步驟也不同。例如創建數據透視表時,就需要在網上搜索相應版本的使用方法。在一張excel表里不能存在兩個數據透視表,使得數據處理不夠方便。另外在數據分組時只能手動輸入每一個分組,比較麻煩。第5章、第9章和第10章實驗題目較為簡單,沒有出現什么問題。第11章、12章練習題通過excel計算能很有效率得出答案。
第二篇:上機實驗報告
一. 題目1. 建立一個學生檔案,內容包括學號,姓名,年齡,性別,數學,物理和英語3門功課成績。要求實現以下功能:1)數據輸入;2)查詢某個學生的成績;3)按平均排列輸出;4)統計某門課各分數段人數;5)刪除某個學生記錄;2. 編程實現對二位數進行加,減,乘運算,每運行一次程序做10道題,完成后給出成績(每題10分)。二. 設計思想和模塊劃分1.1.先定義所需要的條件,例如,姓名,學號,性別,三門功課的成績,平均分等。2.輸入姓名,學號,性別,年齡,三門功課的成績后,就輸出相應的姓名,學號,性別,年齡,三門功課的成績。3.打印表頭;4.在求出平均分,并打印出平均分。5.在查找學生,并打印出學生的相關資料;并按照平均分的高低排列;6.在統計學生各科成績是否》=60分,如果是就是通過,否就是沒通過,最后打印出最后的結果。7.刪除學生,選中刪除的學生,如果確定要,那么該學生的一切記錄就變為0;2.1.隨機調用函數,產生兩個其值為10到99的隨機整數分別放在c,d中用作運算時的運算數。2.隨機調用函數,產生一個值為1到3 的隨機整數放入b中,用來選擇不同的運算。根據b的值選擇不同的運算。當b=1時,去進行c+d的運算練習;當b=2 時,去進行c-d的運算練習;當b=3時,去進行c×d的運算練習。每完成一個算題就給出是否正確的信息。3.根據答案正確與否統計。正確時,顯示’right’;錯誤時,顯示’wrong’。4.步驟1.2.3.4.重復10次。5.輸出學生成績。三. 運行結果1.Input the 1 student :num:03name:wfage:18sex:fmath:98phy:75eng:65Input the 2 student :num:06name:scage:17sex:fmath:78phy:45eng:65Input the 3 student :num:09name:ytage:17sex:mmath:69phy:75eng:501.readin 2.finds 3.del 4.tj 5.exit1-----------------------------table----num name age sex math phy eng ave------3 wf 18 f 98.0 75.0 65.0 79.3------9 yt 17 m 69.0 75.0 50.0 64.7-------6 sc 17 f 78.0 45.0 65.0 62.7-------1.readin 2.finds 3.del 4.tj 5.exit2Into number:3---num name age sex math phy eng ave---3 wf 18 f 98.0 75.0 65.0 79.3----1.readin 2.finds 3.del 4.tj 5.exit3Into number:6---num name age sex math phy eng ave---6 sc 17 f 78.0 45.0 65.0 62.6---true? Y/Ny1----------------table------------------num name age sex math phy eng ave----3 wf 18 f 98.0 75.0 65.0 79.3-----9 yt 17 m 69.0 75.0 50.0 64.7-----0 0 0 f 0.0 0.0 0.0 0.0-----1.readin 2.finds 3.del 4.tj 5.exit4 1.input the math 2.input the phy 3.input the eng 1math: pass num is :3 no pass num is :02.32+82=114right!97*15=1455right!99-58=41right!76-66=10right!58+13=71right!37+49=86right!99+52=151right!49*69=5462wrong!73-38=31wrong!86+34=120right!mark is 80四. 主要錯誤改正方法1.在本題的編寫過程中常出現begin 和end 不配對,只要始它們的個數相同就可以了,就可以了。在程序中常出現的’unknown identifier’沒有定義的錯誤,只要在程序前加上定義,就可以了。還有就是type mismatch’的類型不匹配,只要根據前后內容,重新定義,就可以了。2.在本題編寫中,題目要求是兩個兩位數運算,如果寫成c:=random(100)在運行過程中,就會出現一位數運算,只要把它寫成c:=random(90)+10,就可以了。五. 實習小結1.第一題的程序編寫比較復雜,需要較多的定義,因而在后面的程序部分,就常出現標識符重復,而導致的類型不匹配。還有就是每個部分編好后,上下不能連接,而無法調用。2.第二題較第一題簡單,和書上的例題類似,所以,比較簡單,但從中也出現一些不問題。以上兩大題中出現的問題,要在同學的幫助下,才能完成。總的來說兩題程序比較困難六. 程序清單1.program twins;const m=3;n=3;typestudent=recordnum:integer;name:string[3];age:integer;sex:char;s:array[1..n] of real;math,eng,phy:real;ave:real;end;sarr=array[1..m] of student;ta=array [1..m] of student;f=string[6];varstu:sarr;ct:ta;k,d:integer;procedure readin(var stu:sarr);const wrong='0<=data<=100 ,again!';var j,i:integer;a:student;beginwriteln;writeln('Input ',m,' num name sex math phy eng',' of student.');for j:=1 to m dobeginwriteln;writeln('Input the ',j,' student :');with a dobeginwrite('num:');readln(num);write('name:');readln(name);write('age:');readln(age);write('sex:');readln(sex);while(sex<>'m')and(sex<>'f')dobeginwrite('sex:');readln(sex)end;for i:=1 to n do begincase i of1:begin write('math:');readln(s[i]);while(s[i]<0)or(s[i]>100)dobeginwriteln(wrong);write('math:');readln(s[i]);end;end;2:begin write('phy:');readln(s[i]);while(s[i]<0)or(s[i]>100)dobeginwriteln(wrong);write('phy:');readln(s[i]);end;end;3:begin write('eng:');readln(s[i]);while(s[i]<0)or(s[i]>100)dobeginwriteln(wrong);write('eng:');readln(s[i]);end;end;end;end;stu[j]:=a;end;writeln;end;end;procedure ave(var stu:sarr);var j,i:integer;k:real;beginfor j:=1 to m dobegink:=0;with stu[j] dobeginfor i:=1 to n do k:=k+s[i];ave:=k/nend;end;end;procedure px(var stu:sarr);var tm:ta;j,i,p:integer;beginfor j:=1 to m dobeginp:=j;for i:=j+1 to m doif stu[i].ave>stu[p].ave then p:=i;tm[1]:=stu[p];stu[p]:=stu[j];stu[j]:=tm[1];end;end;procedure head(ct:ta);var i:integer;beginwrite(' ');for i:=1 to 72 do write('-');writeln;write('',' num':4,' ','name':9,' ','age':8,' ','sex':5,' ','math':6,' ','phy':9,' ','eng':8,' ');writeln('ave':6,' ');write(' ');for i:=1 to 72 do write('-');writeln;with ct[1] dobeginwrite('',num:7,' ',name:8,' ',age:8,' ',sex:5,' ');for i:=1 to n do write(s[i]:7,' ');write(ave:10,' ');writeln;end;write(' ');for i:=1 to 72 do write('-');writeln;end;procedure find(var stu:sarr);var n,i:integer;u:boolean;beginu:=true;while u dobeginwrite('Into number:');readln(n);for i:=1 to m dobeginif stu[i].num=n then beginct[1]:=stu[i];u:=false;d:=iend;end;end;end;procedure del(var stu:sarr);var i:integer;b:char;beginhead(ct);write('true? Y/N');readln(b);if b='y' then begin write('1');with stu[d] dobeginnum:=0;name:='0';age:=0;sex:='f';for i:=1 to n do s[i]:=0;ave:=0end;endelseend;procedure tj(var stu:sarr);var w1,q1,q2,num,j:integer;h1,h2,h3:boolean;beginh1:=false;h2:=false;h3:=false;q1:=0;q2:=0;writeln(' ':30,'1.input the math 2.input the phy 3.input the eng ');readln(w1);case w1 of1:h1:=true;2:h2:=true;3:h3:=true;end;if h1 thenbeginbeginfor j:=1 to m dowith stu[j] doif stu[j].math>=60 thenq1:=q1+1elseq2:=q2+1;writeln('math:');end;if h2 thenbeginbeginfor j:=1 to m dowith stu[j] doif stu[j].phy>=60 thenq1:=q1+1elseq2:=q2+1;writeln('phy:');end;if h3 thenbeginbeginfor j:=1 to m dowith stu[j] doif stu[j].eng>=60 thenq1:=q1+1elseq2:=q2+1;writeln('eng:');end;end;end;end;writeln(' ':5,'pass num is :',q1);writeln(' ':5,'no pass num is :',q2);end;procedure head1(var stu:sarr);var j,i:integer;beginwriteln('----------------table--------------':60);writeln;write(' ');for i:=1 to 72 do write('-');writeln;write('',' num':4,' ','name':9,' ','age':8,' ','sex':5,' ','math':6,' ','phy':9,' ','eng':8,' ');writeln('ave':6,' ');write(' ');for i:=1 to 72 do write('-');writeln;for j:=1 to m do beginwith stu[j] dobeginwrite('',num:7,' ',name:8,' ',age:8,' ',sex:5,' ');for i:=1 to n do write(s[i]:7:1,' ');write(ave:10:1,' ');writeln;end;write(' ');for i:=1 to 72 do write('-');writeln;end;end;beginreadin(stu);ave(stu);k:=0;while k<>5 dobeginwriteln('1.readin 2.finds 3.del 4.tj 5.exit');read(k);readln;while(k<>1)and(k<>2)and(k<>3)and(k<>4)and(k<>5)dobeginwriteln(' mistake,please again');read(k)end;case k of1: begin px(stu);head1(stu)end;2: begin find(stu);head(ct)end;3: begin find(stu);del(stu);px(stu);head1(stu)end;4: begin tj(stu);end;5: writeln('exit!');end;end;end..2.program shadow;var a,b,c,d,e:integer;right:boolean;procedure s1;beginwriteln('right!');right:=trueend;procedure s2;beginwriteln('wrong!');right:=falseend;procedure s3(x,y:integer);var h:integer;beginwrite(x,'+',y,'=');readln(h);if h=x+y then s1else s2 end;procedure s4(x,y:integer);var h,w:integer;beginif x 應用統計學實驗報告 武漢工大學 管理學院 應用統計學 課程實驗(上機)報告專業班級:2010級工商管理01班 學 號: 指導老師:夏劍鋒 實驗(上機)地點:活動中心 學期:2012—2013第二學期 第 1 頁;共 23頁 應用統計學實驗報告 實驗(上機)日期:2013年4月25日 第1 次 實驗(上機)主題:統計軟件的運用 實驗(上機)類別):驗證性 完成方式:獨立 實驗(上機)目的與要求: 1、掌握啟動和退出統計軟件 2、掌握數據庫的建立 3、搜集一些數據并建立數據庫 4、進行一些統計計算(函數、描述性統計) 5、制作統計圖 6、計算各種統計指標 實驗(上機)內容及方法 一、基本操作 1.在EXCEL圖標雙擊,打開工作表。 2.在“文件”菜單下,選擇“新建”,在右邊“新建工作簿”選擇“空白工作簿”。 3.單擊頁面右上角紅色關閉按鈕,關閉工作表,并退出軟件。如提醒“是否保存”則選擇保存,或者選擇取消在查看后在退出。 二、描述性統計 1.在數據表窗口輸入數據如下: 59 78 86 94 81 76 69 表1-1某學科成績表 78 94 49 76 89 95 83 58 76 66 81 68 78 76 93 68 63 69 78 2.單擊保存,在文件名稱中輸入“成績文件” 第 2 頁;共 23頁 應用統計學實驗報告 3.加載數據分析工具:在“工具”下拉菜單下找到“加載宏”,單擊,選擇“數據分析工具”點擊確認。 圖1-1 加載分析工具庫 4.再在工具下拉菜單下找到“數據分析”選項。 圖1-2 打開數據分析 第 3 頁;共 23頁 應用統計學實驗報告 5.單擊“數據分析”,選擇“描述性統計” 圖1-3開始描述性統計 6.數據復選框如下,單擊確定,圖1-4描述性統計選項卡 7.顯示結果如下: 平均 標準誤差 中位數 眾數 標準差 方差 峰度 偏度 表1-2 描述性指標顯示結果 77.91667 區域 1.972982 最小值 78 最大值 76 求和 11.83789 觀測數 140.1357 最大(1)-0.24247 最小(1)-0.19707 置信度(95.0%) 第 4 頁;共 23頁 2805 36 98 49 4.005367 應用統計學實驗報告 三、函數計算: 1、簡單函數運算: 1)將鼠標定位在單元格,進入編寫模式,輸入函數:“=A1*A1”,點擊回車鍵,在哦單元格內出現運算結果。把鼠標移到單元個右下角,直到出現“十字”按住鼠標右鍵往下拉,則將運算復制。顯示結果如下: 圖1-4 函數輸入 2)插入函數:(用函數求和) 3)單擊輸入框中的函數輸入符號,點擊確定(如下圖),計算書剛剛輸入成績的總和為:2805 圖1-5 插入函數選項卡 按照同樣的方法可以選擇其他函數形式進行統計統計運算。 第 5 頁;共 23頁 應用統計學實驗報告 2、制作統計圖: 1)直方圖: ? 在表格上輸入分組方式: 表1-3 分組方式 99 ? 在工具菜單下找到數據分析,單擊,并在對話框中選擇“直方圖”,單擊“確定” 圖1-6 直方圖操作選項 圖1-7 直方圖復選框 第 6 頁;共 23頁 應用統計學實驗報告 ? 統計結果如下: 表1-4 頻率分析表 分數 99 其他 頻率 8 11 7 7 0 直方圖***989分數99其他 圖1-8 成績分析直方圖 頻率頻率? 如果在復選框中選擇“柏拉圖”和“表格輸出”,顯示結果如下: 直方圖***99959其他接收 圖1-9 帶累計頻率的直方圖 150.00%100.00%50.00%0.00%頻率累積 %2)餅形圖: 在“插入”菜單下,選擇“圖表”,在對話框中選擇“餅形圖” 頻率第 7 頁;共 23頁 應用統計學實驗報告 圖1-10 餅形圖選擇框 根據向導輸入數據,分別選擇。最終統計圖表如下: 成績分析餅形圖90-9919%其他0-590%8%60-6922%80-8919%70-7932%0-5960-6970-7980-8990-99其他 圖1-11 成績分析餅形圖 第 8 頁;共 23頁 應用統計學實驗報告 上機總結: 1、通過本次上機,鞏固了excel的基本操作,讓操作更加流暢。 2、進一步了解了函數的使用,能夠熟練的掌握基本的統計量的運算。 3、通過實驗的學習和比較,進一步加深了對統計量意義的學習。 實驗(上機)成績:第 9 頁;共 23頁 評閱老師: 評閱時間: 應用統計學實驗報告 實驗(上機)日期: 2013年5月9日 第 2 次 實驗(上機)主題:假設檢驗與方差分析 實驗(上機)類別):驗證性 完成方式:獨立 實驗(上機)目的與要求: 1、建數據庫:(1)假設檢驗(雙樣本數據)(2)方差分析:單因素方差分析和雙因素方差分析 2、掌握假設檢驗的計算與分析 3、掌握方差分析的計算與分析 4、輸出計算結果并進行分析 5、進行檢驗和決策 實驗上機內容及方法 一、單因素分析 1.檢驗數據: 表2-1 三種訓練方法下工人的日產量 方法1 方法2 方法3 22 18 18 27 24 人均日產量 18 16 21 22 11 17 15 2.將數據輸入軟件,并在“工具”菜單下選擇“數據分析”,選擇如圖,單擊“確認” 圖2-1 分析工具選擇 第 10 頁;共 23頁 應用統計學實驗報告 3.在數據復選框內選擇數據如下; 圖2-2 單因素分析復選框 結果輸出: 表2-2 單因素分析結果 組 行 1 行 2 行 3 方差分析 差異源 組間 組內 總計 觀測數 5 5 5 SS 40 192 232 求和 85 105 95 df 2 12 14 平均 17 21 19 MS 20 16 方差 17.5 15.5 15 F 1.25 P-value 0.321277 F crit 3.885294 分析:F crit=3.885294;F=1.25 因為F=1.25<F crit=3.885294,所以拒絕訓練方法對日產量有顯著影響,即三種訓練方法對日產量沒有顯著影響。 二、雙因素分析(無交互作用)實驗數據 表2-3 4個工人和3臺機器配合的日產量 A1 A2 A3 B1 50 63 52 B2 47 54 42 第 11 頁;共 23頁 B3 47 57 41 B4 53 58 48 應用統計學實驗報告 將數據輸入軟件,并在“工具”菜單下選擇“數據分析”,選擇如圖,單擊“確認” 圖2-3 無交互作用雙因素分析選項 在數據復選框內選擇數據如下; 圖2-4 無交互作用雙因素分析復選框 分析結果輸出: 表2-4方差分析:無重復雙因素分析 SUMMARY 行 1 行 2 行 3 列 1 列 2 列 3 列 4 方差分析 觀測數 4 4 3 3 3 求和 197 232 183 165 143 145 159 平均 49.25 58 45.75 55 47.66667 48.33333 方差 8.25 14 26.91667 36.33333 65.33333 顯著性水平:1% 第 12 頁;共 23頁 應用統計學實驗報告 差異源 行 列 誤差 總計 SS 318.5 114.6667 32.83333 df 2 3 6 MS F P-value F crit 159.25 29.10152 0.000816 10.92477 38.22222 6.984772 0.022015 9.779538 5.472222 466 11 MS F P-value F crit 方差分析:無重復雙因素分析 方差分析 顯著性水平:5% 差異源 行 列 誤差 總計 SS 318.5 114.6667 32.83333 df 2 3 6 159.25 29.10152 0.000816 5.143253 38.22222 6.984772 0.022015 4.757063 5.472222 466 11 分析: 行因素:在顯著性水平為1%的時候,F crit=10.92477,在顯著性水平為5%時,F crit=5.143253,都遠小于F =29.10152。即不同牌號機器上的日產量有高度顯著性差別。 列因素:在顯著性水平為1%的時候,F crit=9.779538,在顯著性水平為5%時,F crit=4.757063,F=6.984772。因為4.757063<6.984772<9.779538。則不同工人的日產量只有顯著的差別。 三、雙因素分析(有交互作用)實驗數據 表2-5 燈泡壽命數據 因 子 B B1 B2 B3 A1 13.2 15 16.1 17.3 18 17 因子A A2 A3 14.4 14 15.6 13.6 13.7 16.3 14.3 17.1 14.5 17.1 15.7 16.1 第 13 頁;共 23頁 應用統計學實驗報告 將數據輸入軟件,并在“工具”菜單下選擇“數據分析”,選擇如圖,單擊“確認” 圖2-5 有交互作用雙因素分析 在數據復選框內選擇數據如下; 圖2-6 有交互作用雙因素分析復選框 分析結果輸出: 表2-5方差分析:可重復雙因素分析 觀測數 求和平均 方差 28.2 14.1 1.62 15 0.72 27.6 13.8 0.08 85.8 14.3 0.796 第 14 頁;共 23頁 應用統計學實驗報告 觀測數 求和平均 方差 觀測數 求和平均 方差 總計 觀測數 求和平均 方差 方差分析 差異源 樣本 列 交互 內部 總計 2 33.4 28 16.7 14 0.72 0.18 2 35 30.2 17.5 15.1 0.5 0.72 96.6 16.1 3.096 88.2 14.7 0.62 33.4 16.7 0.32 33.2 16.6 0.5 94.2 15.7 2.348 94.8 15.8 2.188 98.4 16.4 1.52 P-value F crit 顯著性水平為5% SS 14.04 6.24 10.92 5.36 36.56 df MS F 7.02 11.78731 0.003063 4.256495 2 3.12 5.238806 0.030987 4.256495 4 2.73 4.583955 0.027093 3.633089 9 0.595556 方差分析 差異源 樣本 列 交互 內部 總計 顯著性水平為:1% SS df MS 14.04 2 7.02 6.24 2 3.12 10.92 4 2.73 5.36 9 0.595556 36.56 17 F 11.78731 5.238806 4.583955 P-value 0.003063 0.030987 0.027093 F crit 8.021517 8.021517 6.422085 分析: 1、因子A(工藝方法)分析:在顯著性水平為1%的時候,F crit=8.021517,在顯著性水平為5%時,F crit=4.256495,F =6.24,因為4.256495<6.24<8.021517,則工藝方法對燈泡壽命的影響是顯著的。 2、因子B(燈絲配方)分析:在顯著性水平為1%的時候,F crit=8.021517,在顯著性水平為5%時,F crit=4.256495,F =11.78731,因為8.021517<11.78731,則燈絲配方對燈泡的壽命影響是高度顯著的。 第 15 頁;共 23頁 應用統計學實驗報告 3、交互作用分析:在顯著性水平為1%的時候,F crit=6.422085,在顯著性水平為5%時,F crit=3.633089,F =4.583955,因為3.633089<4.583955<6.422085。則工藝和菲方之間存在交互作用。 實驗上機總結: 1、學會如何讓運用軟件進行方差計算和分析; 2、通過提出假設,了解如何通過計算數據進行顯著性判斷和檢驗; 3、根據假設和檢驗結果,明白如何進行判斷。 實驗上機成績: 評閱老師: 評閱時間: 第 16 頁;共 23頁 應用統計學實驗報告 實驗(上機)日期:2013年5月16 第 3 次 實驗(上機)主題:回歸分析 實驗(上機)類別):驗證性 完成方式:獨立 實驗(上機)目的與要求: 1、搜集數據并建數據庫 2、掌握一元線性回歸的計算與分析 3、掌握多元線性回歸的計算與分析 4、輸出計算結果并進行分析 5、進行檢驗和預測 實驗上機的內容及方法 一,一元線性回歸 數據顯示如下: (表3-1十個企業的生產費用與產量數據) 企業編號 1 2 3 4 5 6 7 8 9 10 產量X(千克)40 42 48 55 65 79 88 100 120 140 生產費用Y(千元)150 140 160 170 150 162 185 165 190 185 將數據輸入工作表,在“工具”菜單下選擇“數據分析”,然后選擇“回歸”膽機確定。在復選框中選擇如下: (圖3-1一元回歸分析復選框) 第 17 頁;共 23頁 應用統計學實驗報告 則顯示相關數據處理結果如下: 表3-2 回歸統計表 Multiple R R Square Adjusted R quare 標準誤差 觀測值 表3-3 方差分析表 0.807766 0.652486 0.609047 10.5332 回歸分析 殘差 總計 df SS MS F Significance F 1666.514 1666.514 15.02064 0.004704 8 887.586 110.9483 2554.1 表3-4 回歸分析表 Intercept X Variable 1 Coefficients 標準誤差 t Stat Lower Upper 95% 95% 134.7893 8.643234 15.59477 2.85E-07 114.8579 154.7206 0.397821 0.102646 3.875647 0.004704 0.161118 0.634525 P-value 得到散點圖和擬合分析圖如下: Normal Probability Plot20010000204060Sample Percentile圖3-2 散點圖 Y80100 X Variable 1 Line Fit Plot***0X Variable 1圖3-3 擬合分析圖 Y預測 Y150Y 第 18 頁;共 23頁 應用統計學實驗報告 相關分析: 1、回歸方程 由散點圖得知回歸方程為一元線性方程。得到回歸方程如下: Y=134.7893+0.397821X 2、顯著性分析 得到Multiple R=0.807766>0.765(在檢驗數為0.01時相關系數檢驗數)表示回歸方程顯著。 t Stat=3.875647>2.306(α=0.05,自由度=8時t值)則統計檢驗結果顯著。其存在良好的線性關系。 F=15.02064>5.32(在α=0.05,n1=1,n2=8時F值),表示回歸結顯著。 3、相關預測 在產量為80千件時,平均生產費用的置信區間(α=0.05)生產費用預測Y0=134.7893+0.397821 *80=166.615 下界=Y0-2.306*10.5332*0.317=166.614-7.707=158.844 下界=166.614+7.707=174.321 即總體均值得95%置信區間為(158.844,174.321) 在產量為80千件時,生產費用的置信區間(α=0.05)生產費用預測Y0=134.7893+0.397821 *80=166.615 下界=Y0-2.306*10.5332*1.049=166.614-25.503=140.637 下界=166.614+25.503=191.643 即總體得95%置信區間為(140.637,191.643) 二,多元回歸 試驗數據: 表3-5 某企業10個月的月管理費用與工人勞動日數和機器開工臺數的資料 管理費用Y 工人勞動日數X1 29 45 24 42 27 44 25 45 26 43 28 46 30 44 28 45 28 44 27 43 第 19 頁;共 23頁 應用統計學實驗報告 機器開工臺數X2 14 15 13 13 14 16 16 15 15 將數據輸入工作表,在“工具”菜單下選擇“數據分析”,然后選擇“回歸”膽機確定。在復選框中選擇如下: 圖3-4 多元回歸復選框 則顯示相關數據處理結果如下: 表3-5 回歸統計表 回歸統計 Multiple R 0.85377 R Square 0.728923 Adjusted R 0.651473 Square 標準誤差 1.070639 觀測值 10 表3-6 方差分析表 回歸分析 殘差 總計 df SS MS F Significance F 2 21.57613 10.78806 9.411471 0.010371 7 8.023873 1.146268 29.6 表3-7 回歸分析表 Coefficients 標準誤差 t Stat 第 20 頁;共 23頁 P-value 下限 上限 應用統計學實驗報告 Intercept X Variable 1 X Variable 2 95.0% 95.0% -13.8196 13.3233-1.03725 0.334115-45.3242 17.68497 0.56366 0.303274 1.858586 0.10543-0.15347 1.280789 1.099469 0.313139 3.511123 0.009844 0.359013 1.839926 得到散點圖和擬合分析圖如下: Normal Probability Plot402000204060Sample Percentile圖3-5 散點圖 Y80100 X Variable 1 Line Fit Plot***X Variable 1圖3-6 擬合分析圖 Y預測 Y4647Y 相關分析: 1、回歸方程 由散點圖得知回歸方程為二元線性方程。得到回歸方程如下: Y=-13.8196+ 0.56366X1+ 1.099469X2 2、回歸方程檢驗 R Square= 0.728923>0.6516 第 21 頁;共 23頁 應用統計學實驗報告 F= 9.411471>4.74(α=0.05,自由度=2,7時,F值)即:回歸方程的擬合程度很好。 3、回歸系數: t 1= 1.858586<2.365(α=0.05,自由度=7時,t值)t2= 3.511123>2.365(α=0.05,自由度=7時,t值) 所以β1不顯著,β2顯著。即工人勞動日數對管理費用的影響并不是顯著;機器開工臺數對管理費用影響顯著。 4、相關系數分析: 表3-8相關系數分析表 Y X1 X2 Y X1 X2 0.501517 1 0.771462 0.184094 則得到Y與X1之間的相關系數為0.501517;Y與X2之間的相關系數為0.771462,X1與X2之間的相關系數為0.184094 計算相應的偏回歸系數Y與X1之間的偏相關系數為0.5748;Y與X2之間的相關系數為0.7987。 又t1= 0.5748*√7/√(1-0.5748*0.5748)=1.86<2.356(α=0.05,自由度=7時,t值) T2=0.7987*√7/√(1-0.7987*0.7987)=3.51>2.356(α=0.05,自由度=7時,t值) 即:工人勞動日數與管理費用之間的偏相關系數不顯著;機器開工臺數與管理費用之間的偏相關系數是顯著的。 第 22 頁;共 23頁 應用統計學實驗報告 實驗上機總結: 1、學會如何讓運用軟件進行一元與二元方程回歸分析的計算; 2、通過提出假設,了解如何通過計算數據進行系數顯著性判斷和檢驗;并對方程的擬合優度和相關性進行判斷 3、根據回歸結果很好的預測,并在給出置信度的情況下對總體均值和個體值進行預測。 實驗上機成績: 評閱老師: 評閱時間: 第 23 頁;共 23頁 統計學實驗報告 姓名: 學號: 班級: 成績: 一、實驗步驟總結 成績: (一)數據的搜集與整理 第一種方式是輸入網站,第二種方式是通過網絡獲取二手數據使用搜索引擎。第一步,將數據錄入到Microsoft Excel工作表中。 第二步,選中需要篩選的區域,使用“數據—篩選—自動篩選”菜單通過每列第一個單元格右下角的下拉箭頭來選擇實現篩選。 (二)描述數據的圖標方法 對數值型數據是做出頻數頻率表,我們用frequency函數來獲取頻數頻率。第一步:將數據輸入到Microsoft Excel里的單元格,在單元格輸入數據; 第二步:激活單元格,點擊函數調用卡片打開“插入函數”對話框,從選擇類別下拉框中選“統計”,在選擇函數框中選擇frequency函數; 第三步:點擊“插入函數”對話框確定按鈕進入“函數參數”對話框。Data_array選中第一列項單元格;Bins_array選中第二列項單元格; 第四步:使用組合鍵“ctrl+shift+enter”得到頻數結果; 第五步:對結果進行修飾,加入分組標志及其值,再加入頻數的具體名稱,并且計算頻率。 2用直方圖來表示 第一步,將數據輸入到表里的單元格; 第二步,使用“工具—數據分析”菜單,打開“數據分析”對話框,選擇“直方圖”; 第三步,單擊確定按鈕,進入“直方圖”分析工具庫對話框。 第四步,單擊確定按鈕,得到直方圖分析工具擴展函數的返回結果。第五步,對結果進行修飾。 (三)數值型描述度量 1、在Excel中用Average來計算平均數。直接點函數f(x)中的常用函數Average,然后選中區域就可以計算。還有一種方法是先激活單元格,然后輸入公式“=average(A1:E10)” 2、在Excel中使用Geomean來計算幾何平均數。用函數f(x)中的Geomean,然后選中區域計算結果。也可以激活單元格,輸入公式。 3、在Excel中使用Harmean函數計算調和平均數,同樣也是先激活單元格,然后使用函數Harmean,就可以計算出結果。也可以激活單元格,直接用公式。 (四)參數估計 1、抽樣 第一步,使用“工具-數據分析”菜單打開“數據分析”對話框,選擇抽樣。第二步,在輸入區域里選擇區域,然后點隨機,再選擇輸出區域,點確定 2、區間估計 第一步,選中單元格,并使用“插入-名稱-指定”菜單,打開“指定名稱”對話框,選擇“首行”復選框,對數據命名; 第二步,構建函數表單框架; 第三步,輸入框架下對應的數據和函數公式。函數表單中涉及到有樣本個數、樣本均值、總體標準差、置信水平、抽樣標準差、置信區間半徑、置信區間下限和上限等等內容。 (五)假設檢驗 首先構建函數表單,然后進行假設檢驗。假設檢驗中求P值要經過五個步驟: 1、寫出原假設HO及備擇假設H1; 2、選擇顯著性系數水平α及樣本容量n; 3、確定合適的檢驗統計量及抽樣分布; 4、搜集樣本數據計算樣本統計值和P值; 5、給出統計學意義上的結論和經濟管理學意義上的結論。 2、雙樣本方差分析分析工具擴展函數來完成兩個方差的F檢驗。 第一步,使用“工具-數據分析”菜單,打開數據分析對話框,選擇“F-檢驗:雙樣本分析”分析工具,點擊確定按鈕打開 第二步,選擇區域 第三步,點擊確定按鈕,返回分析結果。 (六)方差分析 第一步,使用“工具-數據分析”菜單打開數據分析對話框,選擇“方差分析:單因素方差分析”分析工具,點擊確定按鈕打開對話框。 第二步,輸入區域點擊右側箭頭,選擇單元格; 第三步,點擊“方差分析:單因素方差分析”對話框確定按鈕,返回結果。對無重復雙因素方差分析,也要用分析工具的數據分析來完成。 第一步,使用“工具-數據分析”菜單打開數據分析對話框,選擇“方差分析:無重復雙因素方差分析”分析工具; 第二步,輸入區域點擊右側箭頭,選擇單元格; 第三步,點擊確定,返回結果。 (七)相關與回歸分析 第一步,使用“工具-數據分析”菜單打開數據分析對話框,選擇“相關系數”分析工具,點擊確定; 第二步,在相關系數對話框中,點擊輸入區域右側的箭頭,選擇單元格,數據按列錄入,所以選中分組方式中的“列”單選框;點擊輸出區域右側的箭頭,選擇一個下側和右側沒有數據的單元格; 第三步,點擊相關系數對話框中的確定按鈕返回結果。 構建線性回歸模型Y=a+bX1和二元一次線性回歸模型Y=a+bX1+cX2.第一步,使用“工具-數據分析”菜單打開數據分析對話框,選擇“回歸”分析工具,點擊確定。 第二步,點擊“回歸”對話框的確定按鈕,返回結果。 (八)時間序列分析 第一步,激活單元格,輸入公式“=B3-B2”,回車返回想算出的逐期增長量; 第二步,再次激活輸入公式的單元格,使用拖拉權柄,點擊鼠標左鍵,向下拖動拖拉權柄至最后一個單元格,就能依次獲得逐期增長量。 累計增長量、平均增長量、環比發展速度、定基發展速度也是如此做。 季節變動分析的第一步,計算時間序列的長期趨勢;第二步,利用乘法模型,將時間序列的觀察值除以對應的長期趨勢值,得到季節因素引起的變動分值;第三步,將數據匯總在同一列上;第四步,求出每一季的變動分量值的平均值;第五步,計算季節調整系數;第六步,計算季節比率。 二、實驗心得報告 成績: (一)心得體會 統計學,在我看來無非就是統計數據嘛,對于我來說統計數據應該不是什么難題。后來學了統計學,才知道并不是那么簡單的事情。統計數據的確是統計學中很重要的一項工作,但并不是登記幾個數字就了事的。我們除了記錄數據,還要對數據進行整理和分析,從而得出有意義的結論。在上第一節實驗課的時候,老師給我們講了怎樣進行數據的搜集與整理,比如我們要搜集全國人口普查的調查數據,可以進入網址http://www.tmdps.cn/,點擊其中的數據目錄,然后點統計數據,選擇數據,再選人口數據就行了。 除了上述的對數據的搜集可以直接進入網站以外,在實驗課上我還得知可以用搜索引擎來得到數據。比如,我們可以使用百度網站,搜索四川省2010年國民經濟數據,如下圖 而直接數據的搜集可以通過三種途徑:科學實驗、觀察研究或者直接調查。我們生活中用得最多的就是直接調查,可以通過抽樣調查來取得直接數據。對數據的搜集對我們來說不是很難,除非我們自己去做一份調查。而對搜集來的數據我們要進行整理,這就需要借助辦公軟件工具來幫我們了,主要是學Excel的使用,它是統計學中一項很重要的工具。 比如,已經知道某班十四位同學的月生活費數據:其中男生:1100、600、1000、800、700、750、850;女生:900、1000、600、500、650、950、1100,希望得到500~700,700~900,900~1100。當我把數據搜集與整理好了以后,我們就需要描述數據。在實驗課中,我們用Excel來對數據描述。就拿我搜集到的數據來說明這十四位學生月生活費的情況,通過下圖就可以很直觀的看出信息。 這些都只是簡單的描述方法,在后面的幾節實驗課中,我才覺得用Excel來進行一系列的數值型描述、參數估計、假設檢驗、方差分析等等是比較難的。統計實驗課和上課是緊密相聯的,課上所學的知識全在實驗課上運用了。我的感覺是,實驗課就是統計學知識的濃縮和精華,這只是我的理解。當我們在進行數值型描述時,我們就要記下表示集中趨勢度量的有哪些函數,表示離散程度度量的函數又有哪些?比如用Average來計算平均數,用Geomean來計算幾何平均數,用Harmean函數計算調和平均數等等。將這十四位同學的月生活費支出情況輸入到Excel中,然后計算他們的算術平均數、幾何平均數、調和平均數、中位數、眾數等等。我們可以從這些計算出來的數據中分析結果,從而更了解大學生每月生活費的開支情況,可以通過他們的月生活費來推斷。 在Excel中有一項很重要的工具那就是“數據分析”,在后面的幾個實驗里幾乎每個實驗都會用到“數據分析”這個工具。對上面的這些函數我們也可以用“數據分析”來得出結果。 我們會發現,這些分析出來的結果和我們自己用公式算出來的結果是完全一致的,那就證明了我們自己算出來的結果是沒有錯的。使用數據分析更快捷方便,可以大大節省我們的時間。在接下來的參數估計中,我們就要記很多函數表達式,抽樣是由下至右,由左至右而且只能對一個變量進行抽樣,并可重復抽樣的簡單隨機抽樣。對于這些過程都要用到“工具—數據分析”這項工具。這十四位同學的月生活費已經是抽樣出來的,所以我們沒有必要還從這十四位同學中再次去抽樣,那樣是沒有意義的。 而區間估計的實驗就是要通過軟件,實現一定置信度水平下的置信區間反映結果。Excel沒有提供專門的分析工具庫擴展函數來分析各種情況下的參數區間估計結果,所以我們只能使用函數或者函數表單來實現實驗目標。從我所收集到的樣本數據來看,這十四位同學的月生活費是屬于小樣本數據,這樣,我們就可以用小樣本抽樣以樣本均值推斷總體均值。從而我們就要進行構建函數表單。函數表單是一種利用函數和命名組合形成的可以反復使用的電子表格,也是進行參數區間估計的主要方法。 前面的“樣本個數”這些名稱是要自己輸入的,這就是所謂的構建函數表單的方法。構建函數表單使我們更清晰的看到我們統計數據的結果是怎樣,也很容易地根據函數表單下結論。從使用“工具-數據分析”我們可以清晰的看出這十四個數據所代表的含義,從而推斷出大學生每月生活費到底是一種什么趨勢,他們讀完大學所用的生活費總共是多少呢等等一系列的問題。當然,小樣本是不能很正確的說明這些情況,那就需要大樣本來說明,由于我的數據只有14個,大樣本要求的是30個以上,所以在這里就用不上大樣本來分析數據了。 那么函數表單構建的基本思路是首先確定需要進行假設檢驗的總體參數,其次確定抽樣樣本統計量及其服從的分布,然后進行假設設計。在運行擴展函數的時候會計算到P值,P值通常被認為是觀察到的顯著性水平,是在給定的原假設正確的情況下,統計量等于或超過有樣本計算出來的統計量的值的概率。它是原假設能被接受的最小概率水平。如果P值大于等于α,接受原假設;如果P值小于α,則拒絕原假設。這里我們假設這十四位同學的月生活費平均為900,則原假設就是總體均值等于900,備擇假設就是總體均值不等于900。通過構建函數表單,然后運用公式來計算出結果,使我們省去了自己動手去計算的過程從而節約了我們的時間,提高了統計效率,而得到的分析結果也是準確的,除非是自己輸入公式輸錯了。 兩個方差的檢驗條件是要有兩組數據,而這里我們只有一組數據,所以不能進行兩個方差的檢驗。應用假設檢驗的方法,我們可以得出關于兩個總體差異的相關結論。但有的時候我們要分析的是多個總體(三個以上的總體)之間的差異,就需要使用方差分析。同樣的,我這里的數據也是只有一組數據,所以在方差分析中,我的數據毫無意義。但是在Excel使用“方差分析:單因素方差分析”分析工具擴展函數來完成單因素方差分析工作。最后也要使用“數據分析”來得出結果。當我們方差分析后進行相關與回歸分析,相關分析是分析兩個數值型變量聯系的方法之一,它通過計算相關系數測定兩個數值變量之間的線性相關強度。在這里,我們同樣也要用到“數據分析”此外,我們還要構建線性回歸模型,指數回歸模型返回結果第一行代表斜率,第二行代表標準誤差,第三行代表判決系數,第四行代表檢驗統計量值,第五行代表回歸平方和。根據求出來的結果我們就能得到想要的答案。而時間序列分析主要是動態的分析,即GDP、產值等等的分析。當然我們也可以用時間序列來分析這十四位同學的月生活費情況,但是我們沒有統計出他們每學期的生活費,所以在這里也就不能進行時間序列分析。通過上統計學實驗我了解到統計沒有像想象中那么困難,當我們把概念弄清楚后再來做這些統計工作后,就會發現不是那么枯燥無味,甚至還很有趣。所以,我們要不斷練習,加強對excel的運用,做到孰能生巧,這樣在以后做統計工作就會很有趣了。 (二)意見和建議1、2、大屏幕如果坐在后面基本上是看不清楚,有點影響聽課的效率,希望老師能把字體放大些; 有些步驟老師做得太快,沒有反映過來就進行下一個了,希望老師能讓我們跟上節奏。 統計學實驗報告 一、實驗步驟總結 (一)數據的搜集與整理 1.實驗一:數據的收集與整理 實驗步驟: 一、統計數據的整理 (一)數據的預處理 1、數據的編碼及錄入(1)數據的編碼(2)數據的錄入 2、數據的審核與篩選 3、數據的排序 (二)數據的整理 對數據進行整理的主要方式是統計分組,并形成頻數分布。既可以使用函數FREQUENCE進行統計分組,也可以借助直方圖工具進行統計分組。 二、統計數據的描述 (一)運用函數法進行統計描述 常用的統計函數 函數名稱 函數功能 Average 計算指定序列算數平均數 Geomean 計算數據區域的幾何平均數 Harmean 計算數據區域的調和平均數 Median 計算給定數據集合的中位數 Mode 計算給定數據集合的眾數 Max 計算最大值 Min 計算最小值 Quartile 計算四分位點 Stdev 計算樣本的標準差 Stdevp 計算總體的標準差 Var 計算樣本的方差 Varp 計算總體的方差 在Excel中有一組求標準差的函數,一個是求樣本標準差的函數Stdev,另一個是求總體標準差的函數Stdevp。Stdev與Stdevp的不同是:其根號下的分式的分母不是N,而是N-1。此外,還有兩個對包含邏輯值和字符串的數列樣本標準差和總體標準差的函數,分別是Stdeva和Stdevpa。 (二)運用“描述統計”工具進行數據描述 “描述統計”工具可以生成以下統計指標,按從上到下的順序為:平均值、標準誤差、中位數、眾數、樣本標準差、樣本方差、峰度值、偏度值、級差、最小值、最大值、樣本總和、樣本個數和一定顯著水平下總體均值的置信區間。 三、長期趨勢和季節變動測定 (一)直線趨勢的測定 1、移動平均法測定直線趨勢 2、最小二乘法測定直線趨勢 (二)曲線趨勢的測定 (三)季節變動測定 1、月(季)平均法 2、移動平均趨勢剔除法測地歸納季節變動 實驗數據: 2.實驗二: 實驗步驟:描述數據的圖表方法 (1)熟練掌握Excel 2003的統計制表功能(2)熟練掌握Excel 2003的統計制圖功能 (3)掌握各種統計圖、表的功能,并能準確的根據不同對象的特點加以應用 實驗數據: 二、實驗心得報告 成績: (一)心得體會 16個課時的課以來,在老師的幫助下,我進行了系統的統計學操作實驗,加深了對統計學各方面只是以及對EXCEL操作軟件的應用了解,同時能更好的把實踐與理論相結合。 統計學是應用數學的一個分支,主要通過利用概率論建立數學模型,收集所觀察系統的數據,進行量化的分析、總結,并進而進行推斷和預測,為相關決策提供依據和參考。它被廣泛的應用在各門學科之上,從物理和社會科學到人文科學,甚至被用來工商業及政府的情報決策之上。另外,觀察者以數據的形態簡歷一個用以解釋器隨即行和不確定性的數學模型,一只來推論研究中的步驟及字母。 統計學一腿短為特征的方法論科學,由部分推及整體的思想貫穿于統計學的始終。具體的說,他是研究如何搜集、整理、分析反應事物總體信息的數字資料,并以此為數據,對總體特征進行推斷的原理和方法。用統計來認識事物的步驟是:研究設計到抽樣調查 到統計推斷到結論。這里,研究設計就是制定調查研究和實驗研究的計劃,抽樣調查時搜集資料的過程,統計推斷哈斯分析資料的過程。顯然統計的主要功能是推斷,二推斷的方法是一種不完全歸納法,因為是用部分資料來推斷總體。增加定義:是關于收集,整理。分析和解釋統計數據的科學,是一門認識方法論性質的科學,起目的是探索數據內在的數量規律性,以達到對客觀事物的科學認識。統計學是收集分析表述和解釋數據的科學。 實驗過程中,遭確認excel安裝設置成功的前提下,首先進行的就是對統計數據的輸入與分析。這個輸入過程并不輕松,既要細心有藥用心。不僅僅是仔細的輸入一組數據就可以,還要考慮到整個數據模型的要求,合理而正確的分配輸入數據。因襲,輸入正確的數據也就成了整個統計學實驗的基礎。 數據輸入就是統計數據的描述與分析,這是整個統計實驗關鍵中的關鍵,對統計數據的眾數,中位數,均值的描述可以讓我們隊其有一個初步的印象和大體的了解,在此基礎上的概率分析,抽樣分析,方差分析,回歸問題以及時間序列分析等則更具體和深刻的向我們解釋了統計數據的內在規律性。在對數據進行描述和分析過程中,excel軟件的數據處理功能得到了極大地發揮,工具欄中的工具和數據功能對數據的處理時問題解決起來時事半功倍。 這次為期不長的統計學實驗課是我大學生活中不可或缺的重要經歷,它對我的學習以及就愛你剛來工作生活中都有很大的幫助。其一,我可以將自己所學的知識應用于實踐中,理論和實際是不可分的,在實踐中理論知識得到了鞏固與加強,解決問題的能力也受到了鍛煉得以提升;其次,本次試驗開闊了我的視野,是我對統計在現實中的運作有所了解每頁對統計有了進一步的掌握。 統計在現代化管理和社會生活中的地位日益重要。隨著社會、經濟和科學技術的發展,統計在現代化國家管理和企業管理中的地位,在社會生活中的地位,越來越重要了,統計學廣發吸收而活融合相關學科的新理論,不斷考法應用新技術和新方法門神畫和豐富了統計學傳統領域的理論和方法,并拓展了新的領域。今天的統計學一展現出強有力的生命力。人嫩的日常生活和一切社會生活都離不開統計。英國統計學科學家哈斯利特說:“統計方法的應用時這樣普遍,在我們的餓是哪個或和習慣中,統計的影響是這樣巨大,一直擁擠的重要性無論怎么強調都不過分。”甚至有的科學還把我們的時代叫做統計時代,先問意見,可以說統計學已經融入了我們的是哪個或中,因此,學號統計學及能流應用excel進行實際統計操作對我們來說至關重要。 通過實驗二的實驗操作與學習,我本著較熟練地掌握EXCEL在描述統計中的基本操作內容,利用EXCEL軟件計算描述統計特征值以及繪制統計圖形的目的進行學習和操作。這一次實驗操作讓我熟練掌握EXCEL軟件的基本操作方法;學會利用EXCEL的統計函數與宏程序求解統計分布特征值;掌握利用直方圖工具繪制頻數分布直方圖的方法。實驗操作過程中,我進行了如下操作內容: 1、EXCEL軟件的基本操作; 2、利用EXCEL函數進行描述統計特征值的計算; 3、利用宏程序進行描述統計特征值的計算; 4、利用FREQUENCY函數進行頻數統計; 5、利用直方圖工具繪制頻數分布直方圖。 【實驗目的】 較熟練地掌握EXCEL在統計整理和統計描述中的基本操作內容,利用EXCEL軟件計算描述統計特征值以及繪制統計圖形。 【實驗軟件】 EXCEL 【實驗要求】 要求熟練掌握EXCEL軟件的基本操作方法;學會利用EXCEL的統計函數與宏程序求解統計分布特征值;掌握利用直方圖工具繪制頻數分布直方圖的方法。 【實驗內容】 1、EXCEL軟件的基本操作; 2、利用EXCEL函數進行描述統計特征值的計算; 3、利用宏程序進行描述統計特征值的計算; 4、利用FREQUENCY函數進行頻數統計; 5、利用直方圖工具繪制頻數分布直方圖。【實驗過程】 1.輸入實驗數據: 某企業50名工人日加工零件數 108 110 112 137 122 131 118 134 114 124 125 123 127 120 129 117 126 123 128 139 122 133 119 124 107 133 134 113 115 117 126 127 120 139 130 122 123 123 128 122 118 118 127 124 125 108 112 135 121 2.計算:(1) 組距分組 Excel的FREQUENCY函數進行頻數統計時采用的是“上限在內”原則,為符合統計分組的“上限不在內”的原則,分組時相鄰組的組限不應重合。為此,我們進行了以下分組:105-114.9,115-124.9,125-134.9,135-144.9。 (2) 頻數 使用FREQUENCY函數,進行計算。FREQUENCY(B4:B53,D4:D7)頻數分別是:8、22、16、4(3) 頻數分布直方圖 點擊“工具”菜單,然后點擊“數據分析”,在“數據分析”中選擇“直方圖”。在“直方圖”中的“輸入區域”輸入“B4:B53”,“接收區域”輸入“D4:D7”,結果如下: (4)特征值計算 在相應方格中輸入命令,得到各特征值。 COUNT(B4:B53)并回車,得到50個數據中的單位總量50。SUM(B4:B53)并回車,得到50個數據中的標志總量6149。MAX(B4:B53)并回車,得到50個數據中的最大值139。MIN(B4:B53)并回車,得到50個數據中的最小值107。 AVERAGE(B4:B53)并回車,得到50個數據中的平均值122.98。MEDIAN(B4:B53)并回車,得到50個數據中的中位數123。 GEOMEAN(B4:B53)并回車,得到50個數據中的幾何平均數122.7222。HARMEAN(B4:B53)并回車,得到50個數據中的調和平均數122.4633。AVEDEV(B4:B53)并回車,得到50個數據中的變異統計的平均差6.2616。STDEV(B4:B53)并回車,得到50個數據中的變異統計的標準差8.026716。VAR(B4:B53)并回車,得到50個數據中的變異統計中的方差64.42816。KURT(B4:B53)并回車,得到50個數據中的變異統計中的峰度-0.40871。SKEW(B4:B53)并回車,得到50個數據中的變異統計中的偏度9.94E-05。當然,如果在計算特征值的時候使用宏程序,則可以使過程簡便很多。步驟如下: 點擊工具欄“數據分析”,再點擊“描述統計”,在對話框的輸入區域和輸出區域分別輸入相應區域,并選擇輸出“匯總統計”和“平均數置信度”,在“K個最大值”和“K個最小值”選擇中,選擇系統默認值“1”,表示選擇輸出第1個最大值和第1個最小值。然后按確定,可得到如下結果; 3.至此,整個實驗就結束了。 本次實驗操作,我能在規定的實驗時間內完成習題作業,并且完成的質量較高,使自己平時所學的理論知識能與實踐相結合。在此次實驗操作,我還是太過于依賴教材,沒能在掌握教材要點之后再進行操作,這是我在今后的實驗操作過程中應該提高和改進的地方。我相信在今后的實驗操作課中,我將如此次操作一樣認真,并且逐步改正自己的不足,爭取越做越好。 (二)意見和建議 總的來說,在短短16節課中,老師就將統計學原理實驗課程中所有要求掌握的八個實驗為我們細心講解了,但是,由于課時短,課程容量大,我們消化吸收的比較緩慢。希望以后的學習中能有充足的學習了解時間。 對喲我們自身來說,在學習當中,總是容易分神,對枯燥的數字總是缺乏興趣。希望老師能達利調動我們對統計實驗操作的興趣,是授課方式多元化。 最后,十分感謝老師的辛勤付出,您辛苦了。第三篇:統計學實驗報告
第四篇:統計學實驗報告
第五篇:統計學實驗報告