第一篇:SPSS因子分析經(jīng)典案例
SPSS因子分析經(jīng)典案例
因子分析已經(jīng)被各行業(yè)廣泛應(yīng)用,各種案例琳瑯滿(mǎn)目,以前在百度空間發(fā)表過(guò)相關(guān)文章,是以每到4至6月,這些文章總會(huì)被高校畢業(yè)生扒拉一遍,也總能收到各種魅惑的留言,因此,有必要再次發(fā)布這經(jīng)典案例以饗讀者。
什么是因子分析?
因子分析又稱(chēng)因素分析,傳統(tǒng)的因子分析是探索性的因子分析,即因子分析是基于相關(guān)關(guān)系而進(jìn)行的數(shù)據(jù)分析技術(shù),是一種建立在眾多的觀(guān)測(cè)數(shù)據(jù)的基礎(chǔ)上的降維處理方法。其主要目的是探索隱藏在大量觀(guān)測(cè)數(shù)據(jù)背后的某種結(jié)構(gòu),尋找一組變量變化的共同因子。因子分析能做什么?
人的心理結(jié)構(gòu)具有層次性,即分為外顯和內(nèi)隱。但是作為具有同一性的個(gè)體來(lái)說(shuō),內(nèi)隱的方面總是和外顯的方面相互作用,內(nèi)隱方面制約著外顯特征。所以我們經(jīng)常說(shuō),一個(gè)人的內(nèi)在自我會(huì)在相當(dāng)程度上決定他的外在行為特征,表現(xiàn)為某些行為傾向具有高度的一致性或相關(guān)性。反過(guò)來(lái)說(shuō),我們可以通過(guò)對(duì)個(gè)體進(jìn)行系統(tǒng)的觀(guān)察和測(cè)量,從一組高度相關(guān)的行為傾向(可觀(guān)測(cè))中,探索到某種穩(wěn)定的內(nèi)在心理結(jié)構(gòu)(潛存在),這就是因子分析所能做的。具體來(lái)說(shuō)主要應(yīng)用于:
(1)個(gè)體的綜合評(píng)價(jià):按照綜合因子得分對(duì)case進(jìn)行排序;
(2)調(diào)查問(wèn)卷效度分析:?jiǎn)柧硭袉?wèn)題作為輸入變量,通過(guò)KMO、因子特征值貢獻(xiàn)率、因子命名等判斷調(diào)查問(wèn)卷架構(gòu)質(zhì)量;
(3)降維處理,結(jié)果再利用:因子得分作為變量,進(jìn)行 聚類(lèi) 或其他分析。
案例描述:
高中大家都讀過(guò)吧,那是一個(gè)以成績(jī)論英雄的時(shí)代,理科王子、文科小生是時(shí)代標(biāo)簽。為什么我們會(huì)將數(shù)學(xué)、物理、化學(xué)歸并為理科,其他的歸并為文科,有沒(méi)有數(shù)據(jù)支持?今天我們將用科學(xué)的方法找到答案。
100個(gè)學(xué)生數(shù)學(xué)、物理、化學(xué)、語(yǔ)文、歷史、英語(yǔ)成績(jī)?nèi)缦卤恚ú糠郑?qǐng)你來(lái)評(píng)價(jià)他們。
這是一個(gè)有趣的案例,你可以客觀(guān)的觀(guān)測(cè)到每一科目的成績(jī),但你可以直接看到理科、文科的情況嗎?6個(gè)科目的成績(jī)是我們觀(guān)測(cè)到的外在表現(xiàn),隱藏在其中的公共因子你找到了嗎?如果我們針對(duì)6科目做降維處理,會(huì)得到什么結(jié)果,拭目以待。
SPSS分析過(guò)程
6科目成績(jī)作為6個(gè)原始變量,利用SPSS進(jìn)行因子分析,具體步驟請(qǐng)參照各 因子分析教程,默認(rèn)亦可,不在討論范圍之內(nèi)。公共因子命名:解釋的清楚、有無(wú)實(shí)際意義
經(jīng)過(guò)SPSS降維,由公因子方差表看出,默認(rèn)提取兩個(gè)公因子,能夠解釋差異的81%,似乎暗合文科和理科。
我們?cè)噲D通過(guò)旋轉(zhuǎn)后進(jìn)行因子的命名與解釋?zhuān)@似乎一點(diǎn)也不難,因子1與語(yǔ)文、歷史、英語(yǔ)三科最相關(guān),均在0.8相關(guān)度以上,因子2與數(shù)學(xué)、物理、化學(xué)相關(guān),也基本達(dá)到0.8以上,這正好與我們經(jīng)常說(shuō)的文科和理科不謀而合,沒(méi)有理由不這樣命名。
因子得分排序:綜合評(píng)價(jià)
為公共因子合理命名之后,因子分析并沒(méi)有結(jié)束,一般可以將因子得分作為變量,用于后續(xù)分析步驟。
本例:100名學(xué)生按照文科和理科因子得分進(jìn)行排序,可以用(語(yǔ)文+歷時(shí)+英語(yǔ))及(數(shù)學(xué)+物理+化學(xué))平均值驗(yàn)證因子得分排序是否合理,同時(shí),也可以觀(guān)測(cè)因子得分為負(fù)值時(shí)是否影響排序。
第二篇:SPSS統(tǒng)計(jì)分析案例
一、事件
近日,教育部考試中心主任戴家干透露,今年高考的全國(guó)報(bào)名人數(shù)為946萬(wàn)余人,比2009年1020萬(wàn)的考生數(shù)減少74萬(wàn)人。950萬(wàn)人,1010萬(wàn)人,1050萬(wàn)人,1020萬(wàn)人,956萬(wàn)人??數(shù)據(jù)顯示,近5年來(lái),前3年全國(guó)高考人數(shù)一直在攀升。2006年首次突破千萬(wàn)大關(guān),2008年則達(dá)到頂峰--1050萬(wàn)人。去年高考人數(shù)急轉(zhuǎn)直下,比上一減少30萬(wàn)人,而今年更是減少74萬(wàn)人,是5年來(lái)人數(shù)減少最多的年份。
戴家干表示,高考報(bào)名人數(shù)的減少,主要原因是因?yàn)槲覈?guó)按毛入學(xué)率計(jì)算的適齡入學(xué)人口數(shù)量在逐年下降。
大約在去年這個(gè)時(shí)候,教育部也透露了高考報(bào)名人數(shù),隨即在全國(guó)范圍內(nèi),引爆了一條消息——應(yīng)屆高中畢業(yè)生84萬(wàn)棄考。這引發(fā)了持續(xù)較長(zhǎng)時(shí)間的討論與關(guān)注,或云大學(xué)生就業(yè)難嚇跑考生,或說(shuō)中國(guó)大學(xué)教育質(zhì)量不高難敵國(guó)外大學(xué)競(jìng)爭(zhēng)。今年,我很想再看教育部公布的數(shù)據(jù),得到棄考人數(shù)消息,以作分析(一年的情況往往并不能說(shuō)明問(wèn)題,需多年情況),但遺憾的是,教育部卻沒(méi)有公布。
戴主任把報(bào)名人數(shù)減少歸因于適齡人口減少,可我怎么計(jì)算,也只能得到這只是其中一方面原因。根據(jù)教育部公布的報(bào)名數(shù),今年的考生數(shù)比去年減少74萬(wàn),而再看應(yīng)屆畢業(yè)生數(shù),今年(803萬(wàn))比去年(834萬(wàn))減少31萬(wàn),兩者相差43萬(wàn)。這43萬(wàn)從何而來(lái)?
二、數(shù)據(jù)統(tǒng)計(jì)理論
這些數(shù)據(jù)采用了統(tǒng)計(jì)學(xué)中普查的方式,對(duì)象為全國(guó)參加高考的學(xué)生。
為了一定的目的而對(duì)考查對(duì)象進(jìn)行的全面調(diào)查,稱(chēng)為普查。
普查,統(tǒng)計(jì)調(diào)查的組織形式之一。對(duì)統(tǒng)計(jì)總體的全部單位進(jìn)行調(diào)查以搜集統(tǒng)計(jì)資料的工作。普查資料常被用來(lái)說(shuō)明現(xiàn)象在一定時(shí)點(diǎn)上的全面情況。如高考人數(shù)調(diào)查就是對(duì)全國(guó)報(bào)考參加高考的學(xué)生一一進(jìn)行調(diào)查統(tǒng)計(jì),通常一年一次,規(guī)定某個(gè)特定時(shí)點(diǎn)(某年某月某日某時(shí))作為全國(guó)統(tǒng)一的統(tǒng)計(jì)時(shí)點(diǎn),以反映高考人數(shù)的自然和社會(huì)的各類(lèi)特征。
普查的幾個(gè)特點(diǎn):
1.需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)時(shí)間(上例為2010年高考報(bào)名截止日)
2.通常是一次性或周期性的(上例為一年一次)
3.數(shù)據(jù)的規(guī)范化程度較高
4.普查適用的對(duì)象比較狹窄,只能調(diào)查一些最基本、最一般的現(xiàn)象。組織普查工作必須遵循的原則:
1.必須統(tǒng)一規(guī)定調(diào)查資料所屬的標(biāo)準(zhǔn)時(shí)點(diǎn)。
2.正確確定調(diào)查期限、選擇登記時(shí)間。為了提高資料的準(zhǔn)確性,一般應(yīng)選擇在調(diào)查對(duì)象變動(dòng)較小和登記、填報(bào)較為方便的時(shí)間,并盡可能在各普查地區(qū)同時(shí)進(jìn)行,力求最短時(shí)間完成;
3.規(guī)定統(tǒng)一的調(diào)查項(xiàng)目和計(jì)量單位。同種普查,各次基本項(xiàng)目應(yīng)力求—致,以便歷次普查資料的匯總和對(duì)比;
4.普查盡可能按一定周期進(jìn)行,以便于研究現(xiàn)象的發(fā)展趨勢(shì)及其規(guī)律性。
三、事件評(píng)析
以上事件只可能有兩種解釋?zhuān)皇菞壙既藬?shù)增加,二是復(fù)讀生人數(shù)減少。這兩個(gè)數(shù)據(jù),在教育部的賬本里都有的,教育部為何不公布,只會(huì)引起輿論更多的揣測(cè)。比如,有人就推測(cè)今年的棄考數(shù)可能遠(yuǎn)高于去年的84萬(wàn),理由是,如果是復(fù)讀生在全國(guó)范圍內(nèi)大幅減少,教育部定會(huì)公布復(fù)讀生減少消息,因?yàn)椋@幾年來(lái),教育部一直在治理高復(fù)班,2008年當(dāng)有媒體報(bào)道高考報(bào)名考生中復(fù)讀生比例高達(dá)三分之一時(shí),教育部有關(guān)官員還曾“辟謠”說(shuō)復(fù)讀生只占到15%。而去年教育部公布高考報(bào)名數(shù),卻泄露天機(jī),當(dāng)年的復(fù)讀生達(dá)到270萬(wàn),占到1020萬(wàn)高考考生的26%。假使那另外減少的43萬(wàn),主要來(lái)自高復(fù)班學(xué)生減少,那么,教育部是可以“驕傲”地宣布高復(fù)學(xué)生減少近兩成的。現(xiàn)在教育部沒(méi)有公布這一數(shù)據(jù),極有可能的原因是棄考的應(yīng)屆畢業(yè)生進(jìn)一步增加,或超過(guò)百萬(wàn)。而這勢(shì)必會(huì)引起媒體進(jìn)一步關(guān)注。質(zhì)疑大學(xué)生就業(yè)難、中國(guó)大學(xué)教育質(zhì)量的聲音會(huì)鋪天蓋地。教育部由此就把數(shù)據(jù)藏起來(lái)。
當(dāng)然,這些都是“揣測(cè)”。我想說(shuō)的是,引起這樣的揣測(cè),是教育部門(mén)的失職,而且,教育部門(mén)的做法,也違背《信息公開(kāi)條例》。全民關(guān)注的高考報(bào)名數(shù)據(jù),既非國(guó)家機(jī)密,也非商業(yè)秘密,應(yīng)該向社會(huì)公開(kāi),而且公開(kāi)之后有助于分
析教育發(fā)展中存在的問(wèn)題,同時(shí)以便考生選擇教育、選擇學(xué)校——針對(duì)棄考增多,需進(jìn)一步研究棄考的原因,是就業(yè)難,還是學(xué)費(fèi)貴,抑或是選擇境外高校,不同的原因反映出我國(guó)教育的不同問(wèn)題;針對(duì)復(fù)讀減少,需分析哪種原因,是平行志愿減少高分落榜可能由此減少?gòu)?fù)讀需求,還是實(shí)行新課改新高考增加復(fù)讀難度不再?gòu)?fù)讀,還是公辦高中禁辦復(fù)讀班增加復(fù)讀開(kāi)支。這不同的原因可檢驗(yàn)不同教育政策的實(shí)施效果。
教育的發(fā)展,離不開(kāi)研究。教育部門(mén)公開(kāi)教育信息,不僅是本身職責(zé)使然,也是進(jìn)行科學(xué)的教育決策的要求。把高考報(bào)名數(shù)據(jù)打悶包,用“適齡入學(xué)人口數(shù)量減少”歸納報(bào)名人數(shù)下降主因,這不是科學(xué)、負(fù)責(zé)的教育發(fā)展態(tài)度。這只能掩蓋教育的問(wèn)題,更可能釀成教育發(fā)展的危機(jī)——需要提醒的是,假如高復(fù)學(xué)生大幅減少,適齡學(xué)生數(shù)也大幅減少,高考招生人數(shù)將大于應(yīng)屆畢業(yè)生報(bào)考人數(shù)的局面,在不久的將來(lái)馬上出現(xiàn)。以今年應(yīng)屆畢業(yè)生803萬(wàn),棄考規(guī)模與去年持平(84萬(wàn))計(jì)算,應(yīng)屆高考畢業(yè)生報(bào)考數(shù)為719萬(wàn),高復(fù)學(xué)生則為227萬(wàn),應(yīng)屆畢業(yè)生報(bào)考數(shù)只比高考招生數(shù)657萬(wàn)多62萬(wàn)(如果棄考學(xué)生增多達(dá)到100萬(wàn),這一數(shù)據(jù)則為46萬(wàn))。我國(guó)高校需要立即著手應(yīng)對(duì)即將到來(lái)的嚴(yán)重的生源危機(jī)。
從上述事件可以看出,正確運(yùn)用統(tǒng)計(jì)學(xué)原理就能分析事物的本質(zhì),抓住問(wèn)題的關(guān)鍵,才能做到未雨綢繆,防范于未然。
第三篇:因子分析方法
因子分析法
1.因子分析(Factor Analysis)
因子分析的基本目的就是用少數(shù)幾個(gè)因子去描述許多指標(biāo)或因素之間的聯(lián)系,即將相關(guān)比較密切的幾個(gè)變量歸在同一類(lèi)中,每一類(lèi)變量就成為一個(gè)因子(之所以稱(chēng)其為因子,是因?yàn)樗遣豢捎^(guān)測(cè)的,即不是具體的變量),以較少的幾個(gè)因子反映原資料的大部分信息。運(yùn)用這種研究技術(shù),我們可以方便地找出影響消費(fèi)者購(gòu)買(mǎi)、消費(fèi)以及滿(mǎn)意度的主要因素是哪些,以及它們的影響力(權(quán)重)運(yùn)用這種研究技術(shù),我們還可以為市場(chǎng)細(xì)分做前期分析。
因子分析法與其他一些多元統(tǒng)計(jì)方法的區(qū)別:
2.主成分分析
主成分分析主要是作為一種探索性的技術(shù),在分析者進(jìn)行多元數(shù)據(jù)分析之前,用主成分分析來(lái)分析數(shù)據(jù),讓自己對(duì)數(shù)據(jù)有一個(gè)大致的了解是非常重要的。主成分分析一般很少單獨(dú)使用:a,了解數(shù)據(jù)。(screening the data),b,和cluster analysis一起使用,c,和判別分析一起使用,比如當(dāng)變量很多,個(gè)案數(shù)不多,直接使用判別分析可能無(wú)解,這時(shí)候可以使用主成份發(fā)對(duì)變量簡(jiǎn)化。(reduce dimensionality)d,在多元回歸中,主成分分析可以幫助判斷是否存在共線(xiàn)性(條件指數(shù)),還可以用來(lái)處理共線(xiàn)性。
1、因子分析中是把變量表示成各因子的線(xiàn)性組合,而主成分分析中則是把主成分表示成個(gè)變量的線(xiàn)性組合。
2、主成分分析的重點(diǎn)在于解釋各變量的總方差,而因子分析則把重點(diǎn)放在解釋各變量之間的協(xié)方差。
3、主成分分析中不需要有假設(shè)(assumptions),因子分析則需要一些假設(shè)。因子分析的假設(shè)包括:各個(gè)共同因子之間不相關(guān),特殊因子(specific factor)之間也不相關(guān),共同因子和特殊因子之間也不相關(guān)。
4、主成分分析中,當(dāng)給定的協(xié)方差矩陣或者相關(guān)矩陣的特征值是唯一的時(shí)候,的主成分一般是獨(dú)特的;而因子分析中因子不是獨(dú)特的,可以旋轉(zhuǎn)得到不同的因子。
5、在因子分析中,因子個(gè)數(shù)需要分析者指定(spss根據(jù)一定的條件自動(dòng)設(shè)定,只要是特征值大于1的因子進(jìn)入分析),而指定的因子數(shù)量不同而結(jié)果不同。在主成分分析中,成分的數(shù)量是一定的,一般有幾個(gè)變量就有幾個(gè)主成分。和主成分分析相比,由于因子分析可以使用旋轉(zhuǎn)技術(shù)幫助解釋因子,在解釋方面更加有優(yōu)勢(shì)。大致說(shuō)來(lái),當(dāng)需要尋找潛在的因子,并對(duì)這些因子進(jìn)行解釋的時(shí)候,更加傾向于使用因子分析,并且借助旋轉(zhuǎn)技術(shù)幫助更好解釋。而如果想把現(xiàn)有的變量變成少數(shù)幾個(gè)新的變量(新的變量幾乎帶有原來(lái)所有變量的信息)來(lái)進(jìn)入后續(xù)的分析,則可以使用主成分分析。當(dāng)然,這種情況也可以使用因子得分做到。所以這種區(qū)分不是絕對(duì)的。
總得來(lái)說(shuō),主成分分析主要是作為一種探索性的技術(shù),在分析者進(jìn)行多元數(shù)據(jù)分析之前,用主成分分析來(lái)分析數(shù)據(jù),讓自己對(duì)數(shù)據(jù)有一個(gè)大致的了解是非常重要的。主成分分析一般很少單獨(dú)使用:a,了解數(shù)據(jù)。(screening the data),b,和cluster analysis一起使用,c,和判別分析一起使用,比如當(dāng)變量很多,個(gè)案數(shù)不多,直接使用判別分析可能無(wú)解,這時(shí)候可以使用主成份發(fā)對(duì)變量簡(jiǎn)化。(reduce dimensionality)d,在多元回歸中,主成分分析可以幫助判斷是否存在共線(xiàn)性(條件指數(shù)),還可以用來(lái)處理共線(xiàn)性。
在算法上,主成分分析和因子分析很類(lèi)似,不過(guò),在因子分析中所采用的協(xié)方差矩陣的對(duì)角元素不在是變量的方差,而是和變量對(duì)應(yīng)的共同度(變量方差中被各因子所解釋的部分)。
3.聚類(lèi)分析(Cluster Analysis)
聚類(lèi)分析是直接比較各事物之間的性質(zhì),將性質(zhì)相近的歸為一類(lèi),將性質(zhì)差別較大的歸入不同的類(lèi)的分析技術(shù)。
在市場(chǎng)研究領(lǐng)域,聚類(lèi)分析主要應(yīng)用方面是幫助我們尋找目標(biāo)消費(fèi)群體,運(yùn)用這項(xiàng)研究技術(shù),我們可以劃分出產(chǎn)品的細(xì)分市場(chǎng),并且可以描述出各細(xì)分市場(chǎng)的人群特征,以便于客戶(hù)可以有針對(duì)性的對(duì)目標(biāo)消費(fèi)群體施加影響,合理地開(kāi)展工作。
4.判別分析(Discriminatory Analysis)
判別分析(Discriminatory Analysis)的任務(wù)是根據(jù)已掌握的1批分類(lèi)明確的樣品,建立較好的判別函數(shù),使產(chǎn)生錯(cuò)判的事例最少,進(jìn)而對(duì)給定的1個(gè)新樣品,判斷它來(lái)自哪個(gè)總體。根據(jù)資料的性質(zhì),分為定性資料的判別分析和定量資料的判別分析;采用不同的判別準(zhǔn)則,又有費(fèi)歇、貝葉斯、距離等判別方法。
費(fèi)歇(FISHER)判別思想是投影,使多維問(wèn)題簡(jiǎn)化為一維問(wèn)題來(lái)處理。選擇一個(gè)適當(dāng)?shù)耐队拜S,使所有的樣品點(diǎn)都投影到這個(gè)軸上得到一個(gè)投影值。對(duì)這個(gè)投影軸的方向的要求是:使每一類(lèi)內(nèi)的投影值所形成的類(lèi)內(nèi)離差盡可能小,而不同類(lèi)間的投影值所形成的類(lèi)間離差盡可能大。貝葉斯(BAYES)判別思想是根據(jù)先驗(yàn)概率求出后驗(yàn)概率,并依據(jù)后驗(yàn)概率分布作出統(tǒng)計(jì)推斷。所謂先驗(yàn)概率,就是用概率來(lái)描述人們事先對(duì)所研究的對(duì)象的認(rèn)識(shí)的程度;所謂后驗(yàn)概率,就是根據(jù)具體資料、先驗(yàn)概率、特定的判別規(guī)則所計(jì)算出來(lái)的概率。它是對(duì)先驗(yàn)概率修正后的結(jié)果。
距離判別思想是根據(jù)各樣品與各母體之間的距離遠(yuǎn)近作出判別。即根據(jù)資料建立關(guān)于各母體的距離判別函數(shù)式,將各樣品數(shù)據(jù)逐一代入計(jì)算,得出各樣品與各母體之間的距離值,判樣品屬于距離值最小的那個(gè)母體。
5.對(duì)應(yīng)分析(Correspondence Analysis)
對(duì)應(yīng)分析是一種用來(lái)研究變量與變量之間聯(lián)系緊密程度的研究技術(shù)。
運(yùn)用這種研究技術(shù),我們可以獲取有關(guān)消費(fèi)者對(duì)產(chǎn)品品牌定位方面的圖形,從而幫助您及時(shí)調(diào)整營(yíng)銷(xiāo)策略,以便使產(chǎn)品品牌在消費(fèi)者中能樹(shù)立起正確的形象。
這種研究技術(shù)還可以用于檢驗(yàn)廣告或市場(chǎng)推廣活動(dòng)的效果,我們可以通過(guò)對(duì)比廣告播出前或市場(chǎng)推廣活動(dòng)前與廣告播出后或市場(chǎng)推廣活動(dòng)后消費(fèi)者對(duì)產(chǎn)品的不同認(rèn)知圖來(lái)看出廣告或市場(chǎng)推廣活動(dòng)是否成功的向消費(fèi)者傳達(dá)了需要傳達(dá)的信息。
6.典型相關(guān)分析
典型相關(guān)分析是分析兩組隨機(jī)變量間線(xiàn)性密切程度的統(tǒng)計(jì)方法,是兩變量間線(xiàn)性相關(guān)分析的拓廣。各組隨機(jī)變量中既可有定量隨機(jī)變量,也可有定性隨機(jī)變量(分析時(shí)須F6說(shuō)明為定性變量)。本法還可以用于分析高維列聯(lián)表各邊際變量的線(xiàn)性關(guān)系。
注意:
1.嚴(yán)格地說(shuō),一個(gè)典型相關(guān)系數(shù)描述的只是一對(duì)典型變量之間的相關(guān),而不是兩個(gè)變量組之間的相關(guān)。而各對(duì)典型變量之間構(gòu)成的多維典型相關(guān)才共同揭示了兩個(gè)觀(guān)測(cè)變量組之間的相關(guān)形式。
2.典型相關(guān)模型的基本假設(shè)和數(shù)據(jù)要求
要求兩組變量之間為線(xiàn)性關(guān)系,即每對(duì)典型變量之間為線(xiàn)性關(guān)系;
每個(gè)典型變量與本組所有觀(guān)測(cè)變量的關(guān)系也是線(xiàn)性關(guān)系。如果不是線(xiàn)性關(guān)系,可先線(xiàn)性化:如經(jīng)濟(jì)水平和收入水平與其他一些社會(huì)發(fā)展水之間并不是線(xiàn)性關(guān)系,可先取對(duì)數(shù)。即log經(jīng)濟(jì)水平,log收入水平。
3.典型相關(guān)模型的基本假設(shè)和數(shù)據(jù)要求
所有觀(guān)測(cè)變量為定量數(shù)據(jù)。同時(shí)也可將定性數(shù)據(jù)按照一定形式設(shè)為虛擬變量后,再放入典型相關(guān)模型中進(jìn)行分析。
7.多維尺度分析(Multi-dimension Analysis)
多維尺度分析(Multi-dimension Analysis)是市場(chǎng)研究的一種有力手段,它可以通過(guò)低維空間(通常是二維空間)展示多個(gè)研究對(duì)象(比如品牌)之間的聯(lián)系,利用平面距離來(lái)反映研究對(duì)象之間的相似程度。由于多維尺度分析法通常是基于研究對(duì)象之間的相似性(距離)的,只要獲得了兩個(gè)研究對(duì)象之間的距離矩陣,我們就可以通過(guò)相應(yīng)統(tǒng)計(jì)軟件做出他們的相似性知覺(jué)圖。
在實(shí)際應(yīng)用中,距離矩陣的獲得主要有兩種方法:一種是采用直接的相似性評(píng)價(jià),先所有評(píng)價(jià)對(duì)象進(jìn)行兩兩組合,然后要求被訪(fǎng)者所有的這些組合間進(jìn)行直接相似性評(píng)價(jià),這種方法我們稱(chēng)之為直接評(píng)價(jià)法;另一種為間接評(píng)價(jià)法,由研究人員根據(jù)事先經(jīng)驗(yàn),找出影響人們?cè)u(píng)價(jià)研究對(duì)象相似性的主要屬性,然后對(duì)每個(gè)研究對(duì)象,讓被訪(fǎng)者對(duì)這些屬性進(jìn)行逐一評(píng)價(jià),最后將所有屬性作為多維空間的坐標(biāo),通過(guò)距離變換計(jì)算對(duì)象之間的距離。
多維尺度分析的主要思路是利用對(duì)被訪(fǎng)者對(duì)研究對(duì)象的分組,來(lái)反映被訪(fǎng)者對(duì)研究對(duì)象相似性的感知,這種方法具有一定直觀(guān)合理性。同時(shí)該方法實(shí)施方便,調(diào)查中被訪(fǎng)者負(fù)擔(dān)較小,很容易得到理解接受。當(dāng)然,該方法的不足之處是犧牲了個(gè)體距離矩陣,由于每個(gè)被訪(fǎng)者個(gè)體的距離矩陣只包含1與0兩種取值,相對(duì)較為粗糙,個(gè)體距離矩陣的分析顯得比較勉強(qiáng)。但這一點(diǎn)是完全可以接受的,因?yàn)閷?duì)大多數(shù)研究而言,我們并不需要知道每一個(gè)體的空間知覺(jué)圖。
多元統(tǒng)計(jì)分析是統(tǒng)計(jì)學(xué)中內(nèi)容十分豐富、應(yīng)用范圍極為廣泛的一個(gè)分支。在自然科學(xué)和社會(huì)科學(xué)的許多學(xué)科中,研究者都有可能需要分析處理有多個(gè)變量的數(shù)據(jù)的問(wèn)題。能否從表面上看起來(lái)雜亂無(wú)章的數(shù)據(jù)中發(fā)現(xiàn)和提煉出規(guī)律性的結(jié)論,不僅對(duì)所研究的專(zhuān)業(yè)領(lǐng)域要有很好的訓(xùn)練,而且要掌握必要的統(tǒng)計(jì)分析工具。對(duì)實(shí)際領(lǐng)域中的研究者和高等院校的研究生來(lái)說(shuō),要學(xué)習(xí)掌握多元統(tǒng)計(jì)分析的各種模型和方法,手頭有一本好的、有長(zhǎng)久價(jià)值的參考書(shū)是非常必要的。這樣一本書(shū)應(yīng)該滿(mǎn)足以下條件:首先,它應(yīng)該是“淺入深出”的,也就是說(shuō),既可供初學(xué)者入門(mén),又能使有較深基礎(chǔ)的人受益。其次,它應(yīng)該是既側(cè)重于應(yīng)用,又兼顧必要的推理論證,使學(xué)習(xí)者既能學(xué)到“如何”做,而且在一定程度上了解“為什么”這樣做。最后,它應(yīng)該是內(nèi)涵豐富、全面的,不僅要基本包括各種在實(shí)際中常用的多元統(tǒng)計(jì)分析方法,而且還要對(duì)現(xiàn)代統(tǒng)計(jì)學(xué)的最新思想和進(jìn)展有所介紹、交代。
因子分析的核心問(wèn)題有兩個(gè):
一是如何構(gòu)造因子變量;二是如何對(duì)因子變量進(jìn)行命名解釋。因此,因子分析的基本步驟和解決思路就是圍繞這兩個(gè)核心問(wèn)題展開(kāi)的。
(i)因子分析常常有以下四個(gè)基本步驟:
(1)確認(rèn)待分析的原變量是否適合作因子分析。
(2)構(gòu)造因子變量。
(3)利用旋轉(zhuǎn)方法使因子變量更具有可解釋性。
(4)計(jì)算因子變量得分。
(ii)因子分析的計(jì)算過(guò)程:
(1)將原始數(shù)據(jù)標(biāo)準(zhǔn)化,以消除變量間在數(shù)量級(jí)和量綱上的不同。
(2)求標(biāo)準(zhǔn)化數(shù)據(jù)的相關(guān)系數(shù)矩陣;
(3)求相關(guān)矩陣的特征值和特征向量;
(4)計(jì)算方差貢獻(xiàn)率與累積方差貢獻(xiàn)率;
(5)確定因子:
設(shè)F1,F(xiàn)2,…,F(xiàn)p為p個(gè)因子,其中前m個(gè)因子包含的數(shù)據(jù)信息總量(即其累積貢獻(xiàn)率)不低于80%時(shí),可取前m個(gè)因子來(lái)反映原評(píng)價(jià)指標(biāo);
(6)因子旋轉(zhuǎn):
若所得的m個(gè)因子無(wú)法確定或其實(shí)際意義不是很明顯,這時(shí)需將因子進(jìn)行旋轉(zhuǎn)以獲得較為明顯的實(shí)際含義。
(7)用原指標(biāo)的線(xiàn)性組合來(lái)求各因子得分:
采用回歸估計(jì)法,Bartlett估計(jì)法或Thomson估計(jì)法計(jì)算因子得分。
(8)綜合得分
以各因子的方差貢獻(xiàn)率為權(quán),由各因子的線(xiàn)性組合得到綜合評(píng)價(jià)指標(biāo)函數(shù)。
F =(w1F1+w2F2+…+wmFm)/(w1+w2+…+wm)
此處wi為旋轉(zhuǎn)前或旋轉(zhuǎn)后因子的方差貢獻(xiàn)率。
(9)得分排序:利用綜合得分可以得到得分名次。
在采用多元統(tǒng)計(jì)分析技術(shù)進(jìn)行數(shù)據(jù)處理、建立宏觀(guān)或微觀(guān)系統(tǒng)模型時(shí),需要研究以下幾個(gè)方面的問(wèn)題:
· 簡(jiǎn)化系統(tǒng)結(jié)構(gòu),探討系統(tǒng)內(nèi)核。可采用主成分分析、因子分析、對(duì)應(yīng)分析等方法,在眾多因素中找出各個(gè)變量最佳的子集合,從子集合所包含的信息描述多變量的系統(tǒng)結(jié)果及各個(gè)因子對(duì)系統(tǒng)的影響。“從樹(shù)木看森林”,抓住主要矛盾,把握主要矛盾的主要方面,舍棄次要因素,以簡(jiǎn)化系統(tǒng)的結(jié)構(gòu),認(rèn)識(shí)系統(tǒng)的內(nèi)核。
· 構(gòu)造預(yù)測(cè)模型,進(jìn)行預(yù)報(bào)控制。在自然和社會(huì)科學(xué)領(lǐng)域的科研與生產(chǎn)中,探索多變量系統(tǒng)運(yùn)動(dòng)的客觀(guān)規(guī)律及其與外部環(huán)境的關(guān)系,進(jìn)行預(yù)測(cè)預(yù)報(bào),以實(shí)現(xiàn)對(duì)系統(tǒng)的最優(yōu)控制,是應(yīng)用多元統(tǒng)計(jì)分析技術(shù)的主要目的。在多元分析中,用于預(yù)報(bào)控制的模型有兩大類(lèi)。一類(lèi)是預(yù)測(cè)預(yù)報(bào)模型,通常采用多元線(xiàn)性回歸或逐步回歸分析、判別分析、雙重篩選逐步回歸分析等建模技術(shù)。另一類(lèi)是描述性模型,通常采用聚類(lèi)分析的建模技術(shù)。
· 進(jìn)行數(shù)值分類(lèi),構(gòu)造分類(lèi)模式。在多變量系統(tǒng)的分析中,往往需要將系統(tǒng)性質(zhì)相似的事物或現(xiàn)象歸為一類(lèi)。以便找出它們之間的聯(lián)系和內(nèi)在規(guī)律性。過(guò)去許多研究多是按單因素進(jìn)行定性處理,以致處理結(jié)果反映不出系統(tǒng)的總的特征。進(jìn)行數(shù)值分類(lèi),構(gòu)造分類(lèi)模式一般采用聚類(lèi)分析和判別分析技術(shù)。
如何選擇適當(dāng)?shù)姆椒▉?lái)解決實(shí)際問(wèn)題,需要對(duì)問(wèn)題進(jìn)行綜合考慮。對(duì)一個(gè)問(wèn)題可以綜合運(yùn)用多種統(tǒng)計(jì)方法進(jìn)行分析。例如一個(gè)預(yù)報(bào)模型的建立,可先根據(jù)有關(guān)生物學(xué)、生態(tài)學(xué)原理,確定理論模型和試驗(yàn)設(shè)計(jì);根據(jù)試驗(yàn)結(jié)果,收集試驗(yàn)資料;對(duì)資料進(jìn)行初步提煉;然后應(yīng)用統(tǒng)計(jì)分析方法(如相關(guān)分析、逐步回歸分析、主成分分析等)研究各個(gè)變量之間的相關(guān)性,選擇最佳的變量子集合;在此基礎(chǔ)上構(gòu)造預(yù)報(bào)模型,最后對(duì)模型進(jìn)行診斷和優(yōu)化處理,并應(yīng)用于生產(chǎn)實(shí)際。
第四篇:因子分析讀書(shū)筆記
因子分析是指研究從變量群中提取共性因子的統(tǒng)計(jì)技術(shù)。最早由英國(guó)心理學(xué)家
C.E.斯皮爾曼提出。他發(fā)現(xiàn)學(xué)生的各科成績(jī)之間存在著一定的相關(guān)性,一科成績(jī)好的學(xué)生,往往其他各科成績(jī)也比較好,從而推想是否存在某些潛在的共性因子,或稱(chēng)某些一般智力條件影響著學(xué)生的學(xué)習(xí)成績(jī)。因子分析可在許多變量中找出隱藏的具有代表性的因子。將相同本質(zhì)的變量歸入一個(gè)因子,可減少變量的數(shù)目,還可檢驗(yàn)變量間關(guān)系的假設(shè)。
因子分析的主要目的是用來(lái)描述隱藏在一組測(cè)量到的變量中的一些更基本的,但又無(wú)法直接測(cè)量到的隱性變量(latent variable, latent factor)。比如,如果要測(cè)量學(xué)生的學(xué)習(xí)積極性(motivation),課堂中的積極參與,作業(yè)完成情況,以及課外閱讀時(shí)間可以用來(lái)反應(yīng)積極性。而學(xué)習(xí)成績(jī)可以用期中,期末成績(jī)來(lái)反應(yīng)。在這里,學(xué)習(xí)積極性與學(xué)習(xí)成績(jī)是無(wú)法直接用一個(gè)測(cè) 度(比如一個(gè)問(wèn)題)測(cè)準(zhǔn),它們必須用一組測(cè)度方法來(lái)測(cè)量,然后把測(cè)量結(jié)果結(jié)合起來(lái),才能更準(zhǔn)確地來(lái)把握。換句話(huà)說(shuō),這些變量無(wú)法直接測(cè)量。可以直接測(cè)量的可能只是它所反映的一個(gè)表征(manifest),或者是它的一部分。在這里,表征與部分是兩個(gè)不同的概念。表征是由這個(gè)隱性變量直接決定的。隱性變量是因,而表征是果,比如學(xué)習(xí)積極性是課堂參與程度(表征測(cè)度)的一個(gè)主要決定因素。
因子分析的方法約有10多種,如重心法、影像分析法,最大似然解、最小平方法、阿爾發(fā)抽因法、拉奧典型抽因法等等。這些方法本質(zhì)上大都屬近似方法,是以相關(guān)系數(shù)矩陣為基礎(chǔ)的,所不同的是相關(guān)系數(shù)矩陣對(duì)角線(xiàn)上的值,采用不同的共同性□2估值。在社會(huì)學(xué)研究中,因子分析常采用以主成分分析為基礎(chǔ)的反覆法
第五篇:spss案例分析報(bào)告
Spss分析身高與體重的相互影響
姓名:劉海艷
班級(jí):11電商班
學(xué)號(hào):14113201683
序號(hào):26
一、案例介紹:這是某幼兒園學(xué)生的身高體重?cái)?shù)據(jù),數(shù)據(jù)中主要包括編號(hào),學(xué)生姓名,性別,學(xué)生年齡,每個(gè)學(xué)生的體重以及身高數(shù)值。主要是看下幼兒園學(xué)生體重與身高的相互關(guān)系。
二、研究案例的目的:分析幼兒園學(xué)生身高體重的相互關(guān)系和影響。
三、下面是數(shù)據(jù)來(lái)源:
四、研究的方法:主要是使用spss中的描述統(tǒng)計(jì)分析和線(xiàn)性回歸分析;在描述統(tǒng)計(jì)分析中主要是分析出身高體重的最大值和最小值、均值,在圖表中可以看出身高的最大值;在線(xiàn)性回歸分析中主要是采用身高為自變量,體重為因變量來(lái)進(jìn)行分析的。
五、研究的結(jié)果:
1)描述分析:
打開(kāi)文件“某班23名同學(xué)的身高、體重、年齡數(shù)據(jù)”,通過(guò)菜單蘭中的分析選項(xiàng),進(jìn)行描述性分析,選擇體重和身高,求最大值最小值和均值,得到如下結(jié)果:
從結(jié)果看出,該班學(xué)生樣本數(shù)為23,體重最小值為13.7kg,最大值為23kg,平均體重為17.7167kg。身高最小值為105cm,最大值為116cm,平均身高為108.85cm。
以身高為例子,選擇描述中的頻率選項(xiàng)可以得出分布,在頻率對(duì)話(huà)框的圖形選項(xiàng)中,選擇條形圖,即可用圖形直觀(guān)看到結(jié)果。
從圖形中可以很直觀(guān)的看出不同身高段的人數(shù)分布情況,其中108cm左右的人數(shù)最多。從表格中則可以清楚地看到具體數(shù)目。
2)線(xiàn)性回歸分析:
選擇分析——回歸——線(xiàn)性,在彈出的對(duì)話(huà)框中,以身高作為自變量,體重作為因變量,結(jié)果如下:
從表中可以得出。R=0.223,即兩者具有弱相關(guān)性。
從圖表中,可以看出它們之間的線(xiàn)性關(guān)系大概可以表示為y=-0.139x+2.617
六、研究結(jié)論:
從描述分析和回歸分析可以身高和體重的相關(guān)性是相對(duì)比較弱的,也就是弱相關(guān)性。