第一篇:《多元統計分析》習題
《多元統計分析》習題分為三部分:思考題、驗證題
和論文題
思 考 題
緒論
1﹑什么是多元統計分析?
2﹑多元統計分析能解決哪些類型的實際問題?
聚類分析
1﹑簡述系統聚類法的基本思路。2﹑寫出樣品間相關系數公式。
3﹑常用的距離及相似系數有哪些 ?它們各有什么特點? 4﹑利用譜系圖分類應注意哪些問題?
5﹑在SAS和SPSS中如何實現系統聚類分析?
判別分析
1﹑簡述距離判別法的基本思路,圖示其幾何意義。2﹑判別分析與聚類分析有何異同? 3﹑簡述貝葉斯判別的基本思路。4﹑簡述費歇判別的基本思路。5﹑簡述逐步判別法的基本思想。
6﹑在SAS和SPSS軟件中如何實現判別分析?
主成分分析
1﹑主成分分析的幾何意義是什么? 2﹑主成分分析的主要作用有那些?
3﹑什么是貢獻率和累計貢獻率,其意義何在?
4﹑為什么說貢獻率和累計貢獻率能反映主成分中所包含的原始變量的信息? 5﹑為什么要用標準化數據去估計V的特征向量與特征值? 6﹑證明:對于標準化數據有S=R。
7﹑主成分分析在SAS和SPSS中如何實現?
因子分析
1﹑因子得分模型與主成分分析模型有何不同? 2﹑因子載荷陣的統計意義是什么? 3﹑方差旋轉的目的是什么? 4﹑因子分析有何作用?
5﹑因子模型與回歸模型有何不同?
6﹑在SAS和SPSS中如何實現因子分析?
對應分析
1﹑簡述對應分析的基本思想。2﹑簡述對應分析的基本原理。
3﹑簡述因子分析中Q型與R 型的對應關系。4﹑對應分析如何在SAS和SPSS中實現?
典型相關分析
1﹑典型相關分析適合分析何種類型的數據? 2﹑簡述典型相關分析的基本思想。3﹑典型變量有哪些性質?
4﹑典型相關系數和典型變量有何意義? 5﹑典型相關分析有何作用? ﹑在SAS和SPSS中如何實現典型相關分析?
驗 證 題
聚類分析
1、為了更深入了解我國人口的文化程度,現利用1990年全國人口普查數據對全國30個省、直轄市、自治區進行聚類分析。分析選用了三個指標:(1)大學以上文化程度的人口占全部人口的比例(DXBZ);(2)初中文化程度的人都占全部人口的比例(CZBZ);(3)文盲半文盲人口占全部人口的比例(WMBZ),分別用來反映較高、中等、較低文化程度人口的狀況。計算樣品之間的相似系數,使用最長距離法、重心法和Ward法,將上機結果按樣品號畫出聚類圖,并根據聚類圖將30個樣品分為四類。
2、根據信息基礎設施的發展狀況,對世界20個國家和地區進行分類。只要采用6個指標:(1)Call—每千人擁有電話線數,(2)movecall—每千戶居民蜂窩移動電話數,(3)fee—高峰時期每三分鐘國際電話的成本,(4)Computer—每千人擁有的計算機數,(5)mips—每千人中計算機功率(每秒百萬指令),(6)net—每千人互聯網絡戶主數。計算樣本之間的距離采用歐式距離,用最長距離法、重心法、離差平方和法進行計算。
3、按照城鄉居民消費水平,對我國30個省市自治區分類。
判別分析
1、從1995年世界各國人文發展指數的排序中,選取高發展水平、中等發展水平的國家各五個作為兩組樣本,另選四個國家作為待判樣品做距離判別分析。
2、對全國30個省市自治區1994年影響各地區經濟增長差異的制度變量: —經濟增長率(%)、—非國有化水平(%)、—開放度(%)、—市場化程度(%)作判別分析。
3、為了解全國各地職工生活費用上漲水平,對29個省市自治區九項指標作判別分析。
主成分分析
1、對全國30個省市自治區經濟發展基本情況的八項指標作主成分分析。
2、對30個省市自治區工業企業經濟效益作綜合評價。
3、對我國城市居民生活費支出作主成分分析。
因子分析
1、利用1995年的數據對我國社會發展狀況進行綜合考察。
2、對我國30個省市自治區的農業生產情況作因子分析。從農業生產條件和生產結果濟效益出發,選取六項指標分別為: —鄉村勞動力人口(萬人),—人均經營耕地面積(畝),—戶均生產性固定資產原值(元),—家庭基本純收入(元),—人均農業總產值(千元/人),—增加值占總產值比重(%)。
3、對1979-1988年中國人民銀行資金來源的10項指標作因子分析。
對應分析
1、用對應分析研究我國部分省份的農村居民家庭人均消費支出結構。選取7個變量: —食品支出比重,—衣著支出比重,—居住支出比重,—家庭設備及服務支出比重,—醫療保健支出比重,—交通和通訊支出比重,—文教娛樂、用品及服務支出比重。樣品為10個:山西、內蒙古、遼寧、吉林、黑龍江、海南、四川、貴州、甘肅、青海。
2、對全國31個省市自治區按各種經濟類型資產占總資產比重(%),利用1997年數據作對應分析。選取6個變量: —國有經濟/總資產,—集體經濟/總資產,—聯營經濟/總資產,—股份制經濟/總資產,—外商投資經濟/總資產,—港澳臺經濟/總資產
3、用對應分析研究1991年全國各地區獨立核算工業企業的經濟效益情況。
典型相關分析
1、對某高中一年級男生38人進行體力測試(共有七項指標)及運動能力測試(共有五項指標),試對兩組指標作典型相關分析。體力測試指標: —反復橫向跳(次),—縱跳(cm),—背力(kg),—握力(kg),—臺階試驗(指數),—立定體前屈(cm),—俯臥上體后仰(cm)。運動能力測試的指標為:
—50米跑(秒),—跳遠(cm),—投球(m),—引體向上(次),—耐力跑(秒)。
2、全國30個省市自治區農村居民收入和支出的典型相關分析。反映農村居民收入的變量取4個: —勞動者報酬(元),—家庭經營收入(元),—轉移性收入(元),—財產性收入(元)。反映農村居民生活費支出的變量取8個: —食品支出(元),—衣著支出(元),—居住支出(元),—家庭設備及服務支出(元),—醫療保健支出(元),—交通和通訊支出(元),—文教、娛樂用品及服務支出(元),—其它商品及服務支出(元)。
3、社會經濟綜合發展水平與郵電發展狀況的典型相關分析。
論 文 題
通過論文題,可以讓學生掌握如何在圖書館查閱數據,錄入數據,并根據論文要求對數據進行預處理,使學生了解各分析方法適合解決的問題類型,能夠運用所學的多元統計分析方法解決實際數據分析問題。
1、自擬題目,論文中的數據處理方法至少選用對應分析、典型相關分析中的一種。
2、自擬題目,論文中的數據處理方法至少選用主成分分析、因子分析中的一種。
3、自擬題目,論文中的數據處理方法至少選用聚類分析、判別分析中的一種。
第二篇:多元統計分析思考題
《多元統計分析思考題》
第一章 回歸分析
1、回歸分析是怎樣的一種統計方法,用來解決什么問題?
2、線性回歸模型中線性關系指的是什么變量之間的關系?自變量與因變量之間一定是線性關系形式才能做線性回歸嗎?為什么?
3、實際應用中,如何設定回歸方程的形式?
4、多元線性回歸理論模型中,每個系數(偏回歸系數)的含義是什么?
5、經驗回歸模型中,參數是如何確定的?有哪些評判參數估計的統計標準?最小二乘估計兩有哪些統計性質?要想獲得理想的參數估計值,需要注意一些什么問題?
6、理論回歸模型中的隨機誤差項的實際意義是什么?為什么要在回歸模型中加入隨機誤差項?建立回歸模型時,對隨機誤差項作了哪些假定?這些假定的實際意義是什么?
7、建立自變量與因變量的回歸模型,是否意味著他們之間存在因果關系?為什么?
8、回歸分析中,為什么要作假設檢驗?檢驗依據的統計原理是什么?檢驗的過程是怎樣的?
9、回歸診斷可以大致確定哪些問題?回歸分析有哪些基本假定?如果實際應用中不滿足這些假定,將可能引起怎樣的后果?如何檢驗實際應用問題是否滿足這些假定?對于各種不滿足假定的情形,分別采用哪些改進方法?
10、回歸分析中的R2有何意義?它能用來衡量模型優劣嗎?
11、如何確定回歸分析中變量之間的交互作用?存在交互作用時,偏回歸系數的意義與不存在交互作用的情形下是否相同?為什么?
12、有哪些確定最優回歸模型的準則?如何選擇回歸變量?
13、在怎樣的情況下需要建立標準化的回歸模型?標準化回歸模型與非標準化模型有何關系?形式有否不同?
14、利用回歸方法解決實際問題的大致步驟是怎樣的?
15、你能夠利用哪些軟件實現進行回歸分析?能否解釋全部的軟件輸出結果?
第二章 判別分析
1、判別分析的目的是什么?
2、有哪些常用的判別分析方法?這些方法的基本原理或步驟是怎樣的?它們各有什么特點或優劣之處?
3、判別分析與回歸分析有何異同之處?
4、判別分析對變量與樣本規模有何要求?
5、如何度量判別效果?有哪些影響判別效果的因素?
6、逐步判別是如何選擇判別變量的?基本思想或步驟是什么?
7、判別分析有哪些現實應用?舉例說明。
第三章 聚類分析
1、聚類分析的目的是什么?與判別分析有何異同?這種方法有哪些局限或欠缺?
2、有哪些常用的聚類統計量?
3、系統(譜系)聚類法的基本思想是怎樣的?它包含哪些具體方法?
4、聚類分析對變量與樣本規模有何要求?有哪些因素影響分類效果?要想減少不利因素的影響,可以采取哪些改進方法?
5、實際應用問題,如何確定分類數目?
6、快速聚類法(K—均值法)的基本思想或步驟是怎樣的?
7、有序樣品的最優分別法的基本思想或步驟是怎樣的?
8、應用聚類分析解決實際問題的基本步驟是怎樣的?應該注意哪些方面的問題?
第四章 主成分分析與典型相關分析
1、主成分分析的基本思想是什么?在低維情況下,如何利用幾何圖形解釋主成分的意義?
2、什么是主成分的貢獻率與累計貢獻率?實際應用時,如何確定主成分的個數?
3、主成分有哪些基本性質?
4、對于任何情形的多個變量,都可以采取主成分方法降維嗎?為什么?
5、怎樣的情況下需要計算標準化的主成分?
6、主成分有哪些應用?
7、如何解釋主成分的實際含義?
8、典型相關分析的基本思想是什么?有何實際用途?
9、典型相關分析與回歸分析、判別分析、主成分分析、因子分析有何關聯?試比較這些方法的異同之處。
10、典型相關分析有哪些基本假定?
11、如何解釋典型相關函數的實際意義?
12、典型相關方法中冗余度分析的意義是什么?
第五章 因子分析與對應分析
1、因子分析是怎樣的一種統計方法?它的基本目的和用途是什么?
2、因子分子中的KMO統計量與巴特萊特球形性檢驗的目的是什么?
3、因子分析有哪些類型?它們有何區別?Q型因子分析與聚類分析有何異同?
4、因子分析中的變量類型是怎樣的?因子分析對變量數目有沒有要求?對樣本規模有沒有要求?
5、因子分析有怎樣的基本假定?對樣本特點(或性質)有何要求?
6、因子分析模型中,因子載荷、變量共同度、方差貢獻等統計量的統計意義是什么?
7、因子分析與主成分分析有何區別與聯系?它們分別適用于怎樣的情況?
8、如何確定公共因子數目?如何解釋公共因子的實際意義?
9、怎樣的情況下,需要作因子旋轉?
10、有哪些估計因子得分的方法?因子得分的估計是普通意義下的參數估計嗎?為什么?
11、對應分析的基本思想或原理是什么?試舉例說明它的應用。
12、對應分析中總慣量的意義是什么?
第三篇:多元統計分析選擇題
選擇題 下面哪一項不是判別分析的方法(C)
A.距離判別 B.貝葉斯判別 C.協方差陣判別 D.費歇判別 2 式子cov(AX,BY)=(C)
A.cov(X,Y)B B.cov(X,Y)C.Acov(X,Y)D.Acov(X,Y)B 3 如果正態隨機向量X=(1,2,……)的各分量是相互獨立的隨機變量,那么隨機變量X的協方差陣是(B)。A.零矩陣 B.對角陣 C.對稱陣 D.單位陣 4 利用主成分分析得到的各個主成分之間(D)
A.相互獨立 B.線性相關 C.不完全相關 D.互不相關 5 典型相關分析是研究(B)變量之間相關關系的多元統計方法。
A.一組 B.兩組 C.大于兩組 D.大于一組 6 典型相關分析的步驟不包括(C)
A.設計典型相關分析 B.確定典型相關分析的目標 C.給出典型相關分析方案 D.驗證模型 7 對數線性模型中表示兩個因素的交互效應,此模型為非飽和模型的條件是(C)
A.>0 B.<0 C.=0 D.=1 8 貝葉斯判別法中的判別規則所帶來的平均損失ECM達到(D)
A.0 B.1 C.一定數值 D.最小 9 一個p維變量的函數f(?)能作為中某個隨機向量的分布函數,當且僅當(B)
A.f x <0 B.f x >0 C.>0 D.<0 10 馬氏距離不需要符合下面哪一條基本公理(A)
A.d x,y ≤0 B.d x,y =d(y,x)C.d x,y ≤d x,z +d(z,y)D.d x,y =0,當且僅當x=y。
第四篇:多元統計分析實驗報告格式
多元統計分析實驗報告
姓名及學號:(例:張三20110000000)日期:
1、實驗內容
2、實驗目的(。。指出通過本實驗要了解或掌握什么)
3、實驗方案分析
(。。指出實驗內容屬于什么問題,說明用什么方法來實驗,如果是檢驗問題,那么原假設是什么)
4、操作過程
(。。給出有關操作過程)
5、實驗結果
(。。給出實驗得到的重要結果)
6、討論
(。。對上述得到的結果做出說明與討論)
7、結論
(。。根據以上的討論給出恰當的結論)
第五篇:多元統計分析學習心得總結
多元統計分析學習總結
多元統計分析方法現在已經廣泛的應用社會科學和自然科學的許多領域中。
通過對多元統計一個學期的學習,基本掌握了一些可以運用在學習、生活跟實踐中的方法比如多元統計分析中最常見的九種方法:回歸分析、時間序列分析、方差分析、判別分析、邏輯回歸、聯列表與相合性分析、因子分析、聚類分析和聯合分析,基本掌握了運用Spss軟件來分析數據從而找到分析問題中存在的疑問。
當然了通過短短的一個學期的學習學習很多的方法并且把所有的方法盡然掌握不切實際,但是在生活中運用最多的基本上掌握的很熟練,而且在上機操作的過程中有老師的指點迷津也讓自己很快的能夠把握問題的實質,如何分析所得到的實驗結果,如何與實際生活中所遇到的問題進行比對,然后得到的結果是不是跟實際有很大的出入等。
每次的上機操作的都會有一份相應的報告要提交,大多數情況下都是在老師幫助與指導下完成,自己獨立完成的部分相對較少,雖然如此但是收獲還是很多,在老師指導下完成一邊,自己然后再把整個過程再重復一遍這樣就能把所學的溫習一遍,不至于跟老師走一遍就完事兒,最后什么都沒有掌握,遇到問題也不會分析的局面,所以通過自己的不斷練習與操作能夠不斷熟悉掌握多元統計的方法。