第一篇:多元統計分析實驗報告格式
多元統計分析實驗報告
姓名及學號:(例:張三20110000000)日期:
1、實驗內容
2、實驗目的(。。指出通過本實驗要了解或掌握什么)
3、實驗方案分析
(。。指出實驗內容屬于什么問題,說明用什么方法來實驗,如果是檢驗問題,那么原假設是什么)
4、操作過程
(。。給出有關操作過程)
5、實驗結果
(。。給出實驗得到的重要結果)
6、討論
(。。對上述得到的結果做出說明與討論)
7、結論
(。。根據以上的討論給出恰當的結論)
第二篇:多元統計分析實驗報告
多元統計分析得實驗報告 院系:數學系 班級:13級 B 班 姓名:陳翔 學號:20131611233 實驗目得:比較三大行業得優劣性 實驗過程 有如下得內容:(1)正態性檢驗;(2)主體間因子,多變量檢驗 a;(3)主體間效應得檢驗;(4)對比結果(K 矩陣);
(5)多變量檢驗結果;
(6)單變量檢驗結果;
(7)協方差矩陣等同性得 Box 檢驗a,誤差方差等同性得 Levene 檢驗 a;
(8)估計;
(9)成對比較,多變量檢驗;(10)單變量檢驗。
實驗結果:綜上所述,我們對三個行業得運營能力進行了具體得比較分析,所得數據表明,從總體來瞧,信息技術業要稍好于電力、煤氣及水得生產與供應業以及房地產業。
1。
正態性檢驗
Kolmogorov-Smirnova
Shapir o—Wilk 統計量 df Sig.統計量 df Sig、凈資產收益率。113 35、200*
。978 35。677 總資產報酬率。121 35、200*
。964 35、298 資產負債率。086 35。200*
.962 35、265 總資產周轉率.180 35、006。864 35。000 流動資產周轉率、164 35、018.885 35、002 已獲利息倍數、281 35.000。551 35、000 銷售增長率.103 35、200*
。949 35、104 資本積累率。251 35。000、655 35。000 *。
這就是真實顯著水平得下限。
a。
Lilliefors 顯著水平修正 此表給出了對每一個變量進行正態性檢驗得結果,因為該例中樣本中n=35<2000,所以此處選用 Shapiro—Wilk 統計量。由 Sig。值可以瞧到,總資產周轉率、流動資產周轉率、已獲利息倍數及資本積累率均明顯不遵從正態分布,因此,在下面得分析中,我們只對凈資產收益率、總資產報酬率、資產負債率及銷售增長率這四個指標進行比較,并認為這四個變量組成得向量遵從正態分布(盡管事實上并非如此)。這四個指標涉及公司得獲利能力、資本結構及成長能力,我們認為這四個指標可以對公司運營能力做出近似得度量。
2.
主體間因子
N 行業 電力、煤氣及水得生產與供應業 11 房地行業 15 信息技術業 9 多變量檢驗a a
效應 值 F 假設 df 誤差 df Sig。
截距 Pillai 得跟蹤.967 209。405b
4。000 29。000。000 Wilks 得 Lambda、033 209。405b
4.000 29、000、000 Hotelling 得跟蹤 28.883 209、405b
4.000 29。000.000 Roy 得最大根 28。883 209。405b
4.000 29.000、000 行業 Pillai 得跟蹤、481 2、373 8、000 60、000、027 Wilks 得 Lambda、563 2.411b
8、000 58。000.025 Hotelling 得跟蹤.698 2。443 8.000 56、000.024 Roy 得最大根、559 4、193c
4、000 30、000。008
a、設計 : 截距 + 行業 b、精確統計量 c、該統計量就是 F 得上限,它產生了一個關于顯著性級別得下限。
上面第一張表就是樣本數據分別來自三個行業得個數。第二張表就是多變量檢驗表,該表給出了幾個統計量,由Sig。值可以瞧到,無論從哪個統計量來瞧,三個行業得運營能力(從凈資產收益率、總資產報酬率、資產負債率及銷售增長率這四個指標得整體來瞧)都就是有顯著差別得。
3.主體間效應得檢驗 源 因變量 III 型平方與 df 均方 F Sig。
校正模型 凈資產收益率 306、300a153。150 4。000、028 總資產報酬率 69.464b34、732 3、320.049 資產負債率 302。366c151。183、680。514 銷售增長率 2904.588d1452。294 2、154.133 截距 凈資產收益率 615.338 1 615.338 16。073.000 總資產報酬率 218、016 1 218。016 20。841。000 資產負債率 105315。459 1 105315。459 473、833、000 銷售增長率 1.497 1 1。497.002。963 行業 凈資產收益率 306、300 2 153.150 4.000。028 總資產報酬率 69、464 2 34.732 3、320、049 資產負債率 302。366 2 151。183。680.514 銷售增長率 2904.588 2 1452、294 2.154、133 誤差 凈資產收益率 1225、054 32 38、283
總資產報酬率 334。753 32 10、461
資產負債率 7112、406 32 222.263
銷售增長率 21579、511 32 674、360
總計 凈資產收益率 2238、216 35
總資產報酬率 641.598 35
資產負債率 117585、075 35
銷售增長率 24585、045 35
校正得總計 凈資產收益率 1531。354 34
總資產報酬率 404.217 34
資產負債率 7414。772 34
銷售增長率 24484。099 34
a、R 方 =。200(調整 R 方 =、150)b.R 方 =.172(調整 R 方 =、120)c.R 方 =、041(調整 R 方 = -.019)d。
R 方 =。119(調整 R 方 =、064)此表給出了每個財務指標得分析結果,同時給出了每個財務指標得方差來源,包括
校正模型、截距、主效應(行業)、誤差及總得方差來源,還給出了自由度、均方、F統計量及Sig。值 4、對比結果((K 矩陣))行業 簡單對比a
因變量 凈資產收益率 總資產報酬率 資產負債率 銷售增長率 級別 1 與級別 3 對比估算值 -5、649 —3、070 7。259 -13、223 假設值 0 0 0 0 差分(估計-假設)—5。649 -3.070 7.259-13。223 標準 誤差 2、781 1.454 6、701 11、672 Sig、。051.043、287。266 差分得 95% 置信區間 下限-11。313-6。031 -6、390 -36、998 上限。016-、109 20。908 10、552 級別 2 與級別 3 對比估算值 1、054 —、057 1。791 -22。696 假設值 0 0 0 0 差分(估計-假設)1、054 —。057 1、791-22。696 標準 誤差 2、609 1、364 6.286 10。949 Sig、、689。967.778.046 差分得 95% 置信區間 下限-4.260 -2.834 -11.013 -44。999 上限 6。368 2、721 14、595-.394 a、參考類別 = 3 此表表示,在0.05得顯著水平下,第一行業(電力、煤氣及水得生產與供應業)與第三行業(信息技術業)得總資產報酬率指標存在顯著差別,凈資產收益率、資產負債率與銷售增長率等財務指標無明顯差別,但由第一欄可以瞧到,電力、煤氣及水得生產與供應業得凈資產收益率、總資產報酬率與銷售增長率均低于信息技術業,資產負債率高于信息技術業,似乎說明信息技術業作為新興行業,其成長能力要更高一些。第二行業(房地產業)與第三行業得銷售增長率指標有明顯得差別,第三行業大于第二行業,說明信息技術業得獲利能力高于房地產業。凈資產收益率、總資產報酬率與資產負債率等財務指標沒有顯著差別。
5、多變量檢驗結果
值 F 假設 df 誤差 df Sig、Pillai 得跟蹤、481 2。373 8。000 60。000、027 Wilks 得 lambda、563 2、411a
8.000 58。000.025 Hotelling 得跟蹤.698 2、443 8。000 56.000。024 Roy 得最大根。559 4。193b
4。000 30.000.008
a。
精確統計量 b、該統計量就是 F 得上限,它產生了一個關于顯著性級別得下限。
此表就是上面多重比較可信性得度量,由Sig、值可以瞧到,比較檢驗就是可信得。
6。
單變量檢驗結果 源 因變量平方與 df 均方 F Sig.對比 凈資產收益率 306.300 2 153。150 4。000、028 總資產報酬率 69、464 2 34、732 3。320.049 資產負債率 302。366 2 151.183。680、514 銷售增長率 2904。588 2 1452。294 2、154.133 誤差 凈資產收益率 1225。054 32 38.283
總資產報酬率 334。753 32 10、461
資產負債率 7112.406 32 222、263
銷售增長率 21579。511 32 674、360
此表就是對每一個指標在三個行業比較得結果、7。
協方差矩陣等同性得
B Box
檢驗a a
Box 得 M 29.207 F 1。172 df1 20 df2 2585。573 Sig、、269 檢驗零假設,即觀測到得因變量得協方差矩陣在所有組中均相等、a.設計 : 截距 + 行業 誤差方差等同性得
Lev en e 檢驗a a
F df1 df2 Sig。
凈資產收益率、500 2 32、611 總資產報酬率 1.759 2 32。188 資產負債率 4。537 2 32、018 銷售增長率 1、739 2 32、192 檢驗零假設,即在所有組中因變量得誤差方差均相等。
a。
設計 : 截距 + 行業 上面第一張表就是協方差陣相等得檢驗,檢驗統計量就是Box“s M,由Sig.值可以認為三個行業(總體)得協方差陣就是相等得、第二張表給出了各行業誤差平方相等得檢驗,在0、05得顯著性水平下,凈資產收益率、總資產報酬率以及銷售增長
率得誤差平方在三個行業間沒有顯著差別。這似乎說明,除了行業因素,對資產負債率有顯著影響得還有其她因素。這與此處均值比較沒有太大得關系。
8。
估計 因變量 行業 均值 標準 誤差 95% 置信區間 下限 上限 凈資產收益率 電力、煤氣及水得生產與供應業、169 1、866 —3、631 3、969 房地行業 6、871 1.598 3。617 10、125 信息技術業 5。818 2、062 1、617 10.019 總資產報酬率 電力、煤氣及水得生產與供應業、524.975 —1、463 2、510 房地行業 3。537。835 1.836 5.238 信息技術業 3。593 1.078 1.397 5、789 資產負債率 電力、煤氣及水得生產與供應業 60、315 4、495 51、158 69.471 房地行業 54.847 3.849 47、006 62.688 信息技術業 53。056 4.969 42。933 63.178 銷售增長率 電力、煤氣及水得生產與供應業-1.038 7.830-16.987 14.911 房地行業-10.512 6。705 -24。170 3、146 信息技術業 12、184 8.656 —5.448 29.816 此表給出了每一行業各財務指標描述統計量得估計、9、成對比較 因變量(I)行業(J)行業 均值差值(I-J)標準 誤差 Sig.b
差分得 95% 置信區間b
下限 上限 凈資產收益率 電力、煤氣及水得生產與供應業 房地行業 —6.702*
2。456。010 —11、705-1、699 信息技術業 —5.649 2。781。051 —11、313。016 房地行業 電力、煤氣及水得生產與供應業 6、702*
2。456。010 1.699 11.705 信息技術業 1、054 2。609。689 —4.260 6。368 信息技術業 電力、煤氣及水得生產與供應業 5.649 2、781。051 —.016 11。313 房地行業-1.054 2。609、689 —6。368 4。260
總資產報酬率 電力、煤氣及水得生產與供應業 房地行業 -3、013*
1、284 。025 —5.628-.398 信息技術業-3.070*
1、454 。043 —6、031 -、109 房地行業 電力、煤氣及水得生產與供應業 3。013*
1、284 。025.398 5、628 信息技術業 —。057 1、364。967 —2、834 2.721 信息技術業 電力、煤氣及水得生產與供應業 3、070*
1。454.043.109 6。031 房地行業。057 1.364、967 —2、721 2。834 資產負債率 電力、煤氣及水得生產與供應業 房地行業 5.468 5。918、362-6、587 17。523 信息技術業 7、259 6、701.287-6、390 20.908 房地行業 電力、煤氣及水得生產與供應業-5。468 5、918。362-17。523 6。587 信息技術業 1。791 6.286。778-11。013 14、595 信息技術業 電力、煤氣及水得生產與供應業 -7、259 6.701.287-20.908 6。390 房地行業-1。791 6。286、778-14、595 11。013 銷售增長率 電力、煤氣及水得生產與供應業 房地行業 9。474 10.308、365 —11.524 30。471 信息技術業-13。223 11、672、266 —36、998 10、552 房地行業 電力、煤氣及水得生產與供應業 -9。474 10、308、365-30、471 11.524 信息技術業 —22、696*
10、949 。046 -44、999 -。394 信息技術業 電力、煤氣及水得生產與供應業 13。223 11、672、266 —10。552 36.998 房地行業 22。696*
10。949。046、394 44、999 基于估算邊際均值 *、均值差值在。05 級別上較顯著、b。
對多個比較得調整: 最不顯著差別(相當于未作調整)。
多變量檢驗
值 F 假設 df 誤差 df Sig、Pillai 得跟蹤、481 2.373 8.000 60.000。027 Wilks 得 lambda.563 2、411a
8、000 58、000.025
Hotelling 得跟蹤。698 2、443 8、000 56、000.024 Roy 得最大根。559 4。193b
4、000 30。000、008 每個 F 檢驗 行業 得多變量效應、這些檢驗基于估算邊際均值間得線性獨立成對比較。
a.精確統計量 b、該統計量就是 F 得上限,它產生了一個關于顯著性級別得下限。
此兩張表給出了不同行業各財務指標得比較與檢驗及檢驗得可信性統計量。
10.單變量檢驗 因變量平方與 df 均方 F Sig。
凈資產收益率 對比 306。300 2 153。150 4、000。028 誤差 1225、054 32 38、283
總資產報酬率 對比 69、464 2 34.732 3。320。049 誤差 334。753 32 10、461
資產負債率 對比 302.366 2 151、183。680。514 誤差 7112.406 32 222.263
銷售增長率 對比 2904、588 2 1452。294 2、154。133 誤差 21579、511 32 674.360
F 檢驗 行業 得效應、該檢驗基于估算邊際均值間得線性獨立成對比較。
此表也就是對三個行業中各財務指標相等得假設得檢驗,可以瞧到在0.05得顯著性水平下,凈資產收益率與總資產報酬率在三個行業中有明顯得差別。
綜上所述,我們對三個行業得運營能力進行了具體得比較分析,所得數據表明,從總體來瞧,信息技術業要稍好于電力、煤氣及水得生產與供應業以及房地產業。
第三篇:多元統計分析思考題
《多元統計分析思考題》
第一章 回歸分析
1、回歸分析是怎樣的一種統計方法,用來解決什么問題?
2、線性回歸模型中線性關系指的是什么變量之間的關系?自變量與因變量之間一定是線性關系形式才能做線性回歸嗎?為什么?
3、實際應用中,如何設定回歸方程的形式?
4、多元線性回歸理論模型中,每個系數(偏回歸系數)的含義是什么?
5、經驗回歸模型中,參數是如何確定的?有哪些評判參數估計的統計標準?最小二乘估計兩有哪些統計性質?要想獲得理想的參數估計值,需要注意一些什么問題?
6、理論回歸模型中的隨機誤差項的實際意義是什么?為什么要在回歸模型中加入隨機誤差項?建立回歸模型時,對隨機誤差項作了哪些假定?這些假定的實際意義是什么?
7、建立自變量與因變量的回歸模型,是否意味著他們之間存在因果關系?為什么?
8、回歸分析中,為什么要作假設檢驗?檢驗依據的統計原理是什么?檢驗的過程是怎樣的?
9、回歸診斷可以大致確定哪些問題?回歸分析有哪些基本假定?如果實際應用中不滿足這些假定,將可能引起怎樣的后果?如何檢驗實際應用問題是否滿足這些假定?對于各種不滿足假定的情形,分別采用哪些改進方法?
10、回歸分析中的R2有何意義?它能用來衡量模型優劣嗎?
11、如何確定回歸分析中變量之間的交互作用?存在交互作用時,偏回歸系數的意義與不存在交互作用的情形下是否相同?為什么?
12、有哪些確定最優回歸模型的準則?如何選擇回歸變量?
13、在怎樣的情況下需要建立標準化的回歸模型?標準化回歸模型與非標準化模型有何關系?形式有否不同?
14、利用回歸方法解決實際問題的大致步驟是怎樣的?
15、你能夠利用哪些軟件實現進行回歸分析?能否解釋全部的軟件輸出結果?
第二章 判別分析
1、判別分析的目的是什么?
2、有哪些常用的判別分析方法?這些方法的基本原理或步驟是怎樣的?它們各有什么特點或優劣之處?
3、判別分析與回歸分析有何異同之處?
4、判別分析對變量與樣本規模有何要求?
5、如何度量判別效果?有哪些影響判別效果的因素?
6、逐步判別是如何選擇判別變量的?基本思想或步驟是什么?
7、判別分析有哪些現實應用?舉例說明。
第三章 聚類分析
1、聚類分析的目的是什么?與判別分析有何異同?這種方法有哪些局限或欠缺?
2、有哪些常用的聚類統計量?
3、系統(譜系)聚類法的基本思想是怎樣的?它包含哪些具體方法?
4、聚類分析對變量與樣本規模有何要求?有哪些因素影響分類效果?要想減少不利因素的影響,可以采取哪些改進方法?
5、實際應用問題,如何確定分類數目?
6、快速聚類法(K—均值法)的基本思想或步驟是怎樣的?
7、有序樣品的最優分別法的基本思想或步驟是怎樣的?
8、應用聚類分析解決實際問題的基本步驟是怎樣的?應該注意哪些方面的問題?
第四章 主成分分析與典型相關分析
1、主成分分析的基本思想是什么?在低維情況下,如何利用幾何圖形解釋主成分的意義?
2、什么是主成分的貢獻率與累計貢獻率?實際應用時,如何確定主成分的個數?
3、主成分有哪些基本性質?
4、對于任何情形的多個變量,都可以采取主成分方法降維嗎?為什么?
5、怎樣的情況下需要計算標準化的主成分?
6、主成分有哪些應用?
7、如何解釋主成分的實際含義?
8、典型相關分析的基本思想是什么?有何實際用途?
9、典型相關分析與回歸分析、判別分析、主成分分析、因子分析有何關聯?試比較這些方法的異同之處。
10、典型相關分析有哪些基本假定?
11、如何解釋典型相關函數的實際意義?
12、典型相關方法中冗余度分析的意義是什么?
第五章 因子分析與對應分析
1、因子分析是怎樣的一種統計方法?它的基本目的和用途是什么?
2、因子分子中的KMO統計量與巴特萊特球形性檢驗的目的是什么?
3、因子分析有哪些類型?它們有何區別?Q型因子分析與聚類分析有何異同?
4、因子分析中的變量類型是怎樣的?因子分析對變量數目有沒有要求?對樣本規模有沒有要求?
5、因子分析有怎樣的基本假定?對樣本特點(或性質)有何要求?
6、因子分析模型中,因子載荷、變量共同度、方差貢獻等統計量的統計意義是什么?
7、因子分析與主成分分析有何區別與聯系?它們分別適用于怎樣的情況?
8、如何確定公共因子數目?如何解釋公共因子的實際意義?
9、怎樣的情況下,需要作因子旋轉?
10、有哪些估計因子得分的方法?因子得分的估計是普通意義下的參數估計嗎?為什么?
11、對應分析的基本思想或原理是什么?試舉例說明它的應用。
12、對應分析中總慣量的意義是什么?
第四篇:多元統計分析選擇題
選擇題 下面哪一項不是判別分析的方法(C)
A.距離判別 B.貝葉斯判別 C.協方差陣判別 D.費歇判別 2 式子cov(AX,BY)=(C)
A.cov(X,Y)B B.cov(X,Y)C.Acov(X,Y)D.Acov(X,Y)B 3 如果正態隨機向量X=(1,2,……)的各分量是相互獨立的隨機變量,那么隨機變量X的協方差陣是(B)。A.零矩陣 B.對角陣 C.對稱陣 D.單位陣 4 利用主成分分析得到的各個主成分之間(D)
A.相互獨立 B.線性相關 C.不完全相關 D.互不相關 5 典型相關分析是研究(B)變量之間相關關系的多元統計方法。
A.一組 B.兩組 C.大于兩組 D.大于一組 6 典型相關分析的步驟不包括(C)
A.設計典型相關分析 B.確定典型相關分析的目標 C.給出典型相關分析方案 D.驗證模型 7 對數線性模型中表示兩個因素的交互效應,此模型為非飽和模型的條件是(C)
A.>0 B.<0 C.=0 D.=1 8 貝葉斯判別法中的判別規則所帶來的平均損失ECM達到(D)
A.0 B.1 C.一定數值 D.最小 9 一個p維變量的函數f(?)能作為中某個隨機向量的分布函數,當且僅當(B)
A.f x <0 B.f x >0 C.>0 D.<0 10 馬氏距離不需要符合下面哪一條基本公理(A)
A.d x,y ≤0 B.d x,y =d(y,x)C.d x,y ≤d x,z +d(z,y)D.d x,y =0,當且僅當x=y。
第五篇:《多元統計分析》習題
《多元統計分析》習題分為三部分:思考題、驗證題
和論文題
思 考 題
緒論
1﹑什么是多元統計分析?
2﹑多元統計分析能解決哪些類型的實際問題?
聚類分析
1﹑簡述系統聚類法的基本思路。2﹑寫出樣品間相關系數公式。
3﹑常用的距離及相似系數有哪些 ?它們各有什么特點? 4﹑利用譜系圖分類應注意哪些問題?
5﹑在SAS和SPSS中如何實現系統聚類分析?
判別分析
1﹑簡述距離判別法的基本思路,圖示其幾何意義。2﹑判別分析與聚類分析有何異同? 3﹑簡述貝葉斯判別的基本思路。4﹑簡述費歇判別的基本思路。5﹑簡述逐步判別法的基本思想。
6﹑在SAS和SPSS軟件中如何實現判別分析?
主成分分析
1﹑主成分分析的幾何意義是什么? 2﹑主成分分析的主要作用有那些?
3﹑什么是貢獻率和累計貢獻率,其意義何在?
4﹑為什么說貢獻率和累計貢獻率能反映主成分中所包含的原始變量的信息? 5﹑為什么要用標準化數據去估計V的特征向量與特征值? 6﹑證明:對于標準化數據有S=R。
7﹑主成分分析在SAS和SPSS中如何實現?
因子分析
1﹑因子得分模型與主成分分析模型有何不同? 2﹑因子載荷陣的統計意義是什么? 3﹑方差旋轉的目的是什么? 4﹑因子分析有何作用?
5﹑因子模型與回歸模型有何不同?
6﹑在SAS和SPSS中如何實現因子分析?
對應分析
1﹑簡述對應分析的基本思想。2﹑簡述對應分析的基本原理。
3﹑簡述因子分析中Q型與R 型的對應關系。4﹑對應分析如何在SAS和SPSS中實現?
典型相關分析
1﹑典型相關分析適合分析何種類型的數據? 2﹑簡述典型相關分析的基本思想。3﹑典型變量有哪些性質?
4﹑典型相關系數和典型變量有何意義? 5﹑典型相關分析有何作用? ﹑在SAS和SPSS中如何實現典型相關分析?
驗 證 題
聚類分析
1、為了更深入了解我國人口的文化程度,現利用1990年全國人口普查數據對全國30個省、直轄市、自治區進行聚類分析。分析選用了三個指標:(1)大學以上文化程度的人口占全部人口的比例(DXBZ);(2)初中文化程度的人都占全部人口的比例(CZBZ);(3)文盲半文盲人口占全部人口的比例(WMBZ),分別用來反映較高、中等、較低文化程度人口的狀況。計算樣品之間的相似系數,使用最長距離法、重心法和Ward法,將上機結果按樣品號畫出聚類圖,并根據聚類圖將30個樣品分為四類。
2、根據信息基礎設施的發展狀況,對世界20個國家和地區進行分類。只要采用6個指標:(1)Call—每千人擁有電話線數,(2)movecall—每千戶居民蜂窩移動電話數,(3)fee—高峰時期每三分鐘國際電話的成本,(4)Computer—每千人擁有的計算機數,(5)mips—每千人中計算機功率(每秒百萬指令),(6)net—每千人互聯網絡戶主數。計算樣本之間的距離采用歐式距離,用最長距離法、重心法、離差平方和法進行計算。
3、按照城鄉居民消費水平,對我國30個省市自治區分類。
判別分析
1、從1995年世界各國人文發展指數的排序中,選取高發展水平、中等發展水平的國家各五個作為兩組樣本,另選四個國家作為待判樣品做距離判別分析。
2、對全國30個省市自治區1994年影響各地區經濟增長差異的制度變量: —經濟增長率(%)、—非國有化水平(%)、—開放度(%)、—市場化程度(%)作判別分析。
3、為了解全國各地職工生活費用上漲水平,對29個省市自治區九項指標作判別分析。
主成分分析
1、對全國30個省市自治區經濟發展基本情況的八項指標作主成分分析。
2、對30個省市自治區工業企業經濟效益作綜合評價。
3、對我國城市居民生活費支出作主成分分析。
因子分析
1、利用1995年的數據對我國社會發展狀況進行綜合考察。
2、對我國30個省市自治區的農業生產情況作因子分析。從農業生產條件和生產結果濟效益出發,選取六項指標分別為: —鄉村勞動力人口(萬人),—人均經營耕地面積(畝),—戶均生產性固定資產原值(元),—家庭基本純收入(元),—人均農業總產值(千元/人),—增加值占總產值比重(%)。
3、對1979-1988年中國人民銀行資金來源的10項指標作因子分析。
對應分析
1、用對應分析研究我國部分省份的農村居民家庭人均消費支出結構。選取7個變量: —食品支出比重,—衣著支出比重,—居住支出比重,—家庭設備及服務支出比重,—醫療保健支出比重,—交通和通訊支出比重,—文教娛樂、用品及服務支出比重。樣品為10個:山西、內蒙古、遼寧、吉林、黑龍江、海南、四川、貴州、甘肅、青海。
2、對全國31個省市自治區按各種經濟類型資產占總資產比重(%),利用1997年數據作對應分析。選取6個變量: —國有經濟/總資產,—集體經濟/總資產,—聯營經濟/總資產,—股份制經濟/總資產,—外商投資經濟/總資產,—港澳臺經濟/總資產
3、用對應分析研究1991年全國各地區獨立核算工業企業的經濟效益情況。
典型相關分析
1、對某高中一年級男生38人進行體力測試(共有七項指標)及運動能力測試(共有五項指標),試對兩組指標作典型相關分析。體力測試指標: —反復橫向跳(次),—縱跳(cm),—背力(kg),—握力(kg),—臺階試驗(指數),—立定體前屈(cm),—俯臥上體后仰(cm)。運動能力測試的指標為:
—50米跑(秒),—跳遠(cm),—投球(m),—引體向上(次),—耐力跑(秒)。
2、全國30個省市自治區農村居民收入和支出的典型相關分析。反映農村居民收入的變量取4個: —勞動者報酬(元),—家庭經營收入(元),—轉移性收入(元),—財產性收入(元)。反映農村居民生活費支出的變量取8個: —食品支出(元),—衣著支出(元),—居住支出(元),—家庭設備及服務支出(元),—醫療保健支出(元),—交通和通訊支出(元),—文教、娛樂用品及服務支出(元),—其它商品及服務支出(元)。
3、社會經濟綜合發展水平與郵電發展狀況的典型相關分析。
論 文 題
通過論文題,可以讓學生掌握如何在圖書館查閱數據,錄入數據,并根據論文要求對數據進行預處理,使學生了解各分析方法適合解決的問題類型,能夠運用所學的多元統計分析方法解決實際數據分析問題。
1、自擬題目,論文中的數據處理方法至少選用對應分析、典型相關分析中的一種。
2、自擬題目,論文中的數據處理方法至少選用主成分分析、因子分析中的一種。
3、自擬題目,論文中的數據處理方法至少選用聚類分析、判別分析中的一種。