第一篇:SPSS檢驗(yàn)步驟總結(jié)
檢驗(yàn)步驟總結(jié):
1、t檢驗(yàn)
2、方差分析
3、卡方檢驗(yàn)
4、秩和檢驗(yàn)
5、相關(guān)分析
6、線性回歸
1、t檢驗(yàn)(要求數(shù)據(jù)來自正態(tài)總體,可能需要先做正態(tài)檢驗(yàn))
(1)單一樣本t檢驗(yàn)
數(shù)據(jù)特征:單一樣本變量均數(shù)與某固定已知均數(shù)進(jìn)行比較 方法:ANALYZE-COMPARE MEANS-ONE SAMPLE t TEST
(2)獨(dú)立樣本t檢驗(yàn)
數(shù)據(jù)特征:兩個獨(dú)立、沒有配對關(guān)系的樣本(有專門變量表示組數(shù))方法:ANALYZE-COMPARE MEANS-INDEPENDENT SAMPLES t TEST 注意觀察方差分析結(jié)果,判斷查看的數(shù)據(jù)是哪一行!
(3)配對樣本t檢驗(yàn)
數(shù)據(jù)特征:兩個不獨(dú)立的,有配對關(guān)系的樣本(沒有專門變量表示組數(shù))方法:ANALYZE-COMPARE MEANS-PAIRED SAMPLES t TEST 不需要方差分析結(jié)果
檢驗(yàn)步驟:
(1)正態(tài)性檢驗(yàn)1(有同學(xué)推薦,老師沒有強(qiáng)調(diào),但依據(jù)理論應(yīng)進(jìn)行)(2)建立假設(shè)(H0:。。來自同一樣本。H1:。。不來自同一樣本)(3)確定檢驗(yàn)水準(zhǔn)
(4)計(jì)算統(tǒng)計(jì)量(依據(jù)上面不同樣本類型選擇檢驗(yàn)方法,注意獨(dú)立樣本t檢驗(yàn)要先注明方差分析結(jié)果)
(5)確定概率值P(6)得出結(jié)論
2、方差分析(要求數(shù)據(jù)來自正態(tài)總體,可能需要先做正態(tài)檢驗(yàn))
(1)單因素方差分析
數(shù)據(jù)特征:相互獨(dú)立、來自正態(tài)總體、隨機(jī)、方差齊性的多樣本(有專門變量表示組數(shù),且組數(shù)大于2)
方法:ANALYZE-COMPARE MEANS-ONE WAY ANOVA 注意需要在options 里面選擇 homogeneity variance test 做方差分析 符合方差齊性才可以得出結(jié)論!(>0.1)
(2)雙因素方差分析 1 正態(tài)性檢驗(yàn)方法:analyze-explore-plot里面選擇normality test 數(shù)據(jù)特征:有三列數(shù)據(jù),1列是主要研究因素,1列是配伍組因素,1列是研究數(shù)據(jù)。方法:GENERAL LINEAR MODEL-UNIVARIATE(注意選擇model里的custom,type是main effect,注意把兩個因素選擇為fixed factor)
檢驗(yàn)步驟:
(1)正態(tài)性檢驗(yàn)(有同學(xué)推薦,老師沒有強(qiáng)調(diào),但依據(jù)理論應(yīng)進(jìn)行)(2)建立假設(shè)(H0:。。來自同一樣本。H1:。。不全來自同一樣本或全不來自同一樣本)
(3)確定檢驗(yàn)水準(zhǔn)
(4)計(jì)算統(tǒng)計(jì)量(依據(jù)上面不同樣本類型選擇檢驗(yàn)方法,注意單因素方差分析要先注明方差分析結(jié)果)
(5)確定概率值P(6)得出結(jié)論
3、卡方檢驗(yàn)
(1)Crosstabs 數(shù)據(jù)特征:單個或多個樣本率的比較。加權(quán)數(shù)據(jù)有三列數(shù)據(jù),注意將最后一列數(shù)字加權(quán)(其不參與運(yùn)算,僅是說明前兩列數(shù)據(jù)的數(shù)量)。不加權(quán)數(shù)據(jù)有兩列。其中運(yùn)算列中通常第一列表述組數(shù),可以大于二;第二列表述陽性或陰性,通常為1或2。
檢驗(yàn)方法:ANALYZE-DESCRIPTIVE STASTICS-CROSS TABS-注意加選statistics里面的chi-square復(fù)選框
得到檢驗(yàn)結(jié)果后,根據(jù)樣本量以及每框的數(shù)據(jù)選擇查看的數(shù)據(jù)行(詳見課件)如果要看有無線性趨勢,直接查看linear行
(2)非參數(shù)檢驗(yàn)
數(shù)據(jù)特征:如果針對的是明確兩種檢測疾病手段的差異性,那么兩種手段的陽性結(jié)果都要被剔除,此時選擇非參數(shù)檢驗(yàn)(具體理論不詳)
檢驗(yàn)方法:NONPARAMETIC TESTS-TWO RELATED SAMPLES-勾選MC MEAR復(fù)選框
檢驗(yàn)步驟:
(1)建立假設(shè)(H0:。。來自同一樣本。H1:。。)(2)確定檢驗(yàn)水準(zhǔn)(3)計(jì)算統(tǒng)計(jì)量(注意cross tabs檢驗(yàn)依據(jù)樣本量以及單元格數(shù)據(jù)大小選擇適宜的數(shù)據(jù)讀取)
(4)確定概率值P(5)得出結(jié)論
4、秩和檢驗(yàn)
T檢驗(yàn)以及方差分析中,不滿足條件的資料,可以進(jìn)行秩和檢驗(yàn)即非參數(shù)檢驗(yàn)獲得結(jié)論(參數(shù)檢驗(yàn)以及非參數(shù)檢驗(yàn)范圍詳見課件),依據(jù)特征可以分為4類(1)兩獨(dú)立樣本 數(shù)據(jù)特征:兩列,類似獨(dú)立樣本T檢驗(yàn),一列表明組數(shù),一列是數(shù)據(jù) 檢驗(yàn)方法:NONPARAMETIC TESTS-2 INDEPENDENT SAMPLES-復(fù)選框勾選KOMOLGOROV(2)兩配對樣本
數(shù)據(jù)特征:兩列,類似獨(dú)立樣本T檢驗(yàn),分別是不同組數(shù)據(jù)
檢驗(yàn)方法:NONPARAMETIC TESTS-2 related SAMPLES-復(fù)選框勾選wilcoxon(3)多組獨(dú)立隨機(jī)樣本
數(shù)據(jù)特征:兩列,類似單因素方差分析
檢驗(yàn)方法:NONPARAMETIC TESTS-k INDEPENDENT SAMPLES-復(fù)選框勾選 Krushal—Wallis H(4)多組配對樣本
數(shù)據(jù)特征:多列,1列說明分組,其余多列都為數(shù)據(jù)
檢驗(yàn)方法:NONPARAMETIC TESTS-k related SAMPLES-復(fù)選框勾選Friedman
檢驗(yàn)步驟:
(1)建立假設(shè)(H0:。。來自同一樣本。H1:。。)(2)確定檢驗(yàn)水準(zhǔn)(3)計(jì)算統(tǒng)計(jì)量(4)確定概率值P(5)得出結(jié)論
5、相關(guān)分析
(1)制作散點(diǎn)圖:
數(shù)據(jù)特點(diǎn):雙變量,兩列數(shù)據(jù)
方法: graphs------scatter,可利用雙擊左鍵方式選擇繪出相關(guān)直線
(2)雙變量(正態(tài)分布且連續(xù))相關(guān)性分析:
數(shù)據(jù)特點(diǎn):雙變量,兩列
計(jì)算方法:一定要檢驗(yàn)正態(tài)性,首先對兩者進(jìn)行正態(tài)性檢驗(yàn),兩個正態(tài)結(jié)果 CORRELATE-BIVARIATE-勾選Pearson
(3)等級資料相關(guān)性分析:
數(shù)據(jù)特點(diǎn):明顯等級資料,三列(一列是編號,但不入計(jì)算)CORRELATE-BIVARIATE-勾選spearman
(4)雙變量(非正態(tài)。。)
數(shù)據(jù)特點(diǎn):檢驗(yàn)后非正態(tài) CORRELATE-BIVARIATE-勾選kendall 檢驗(yàn)步驟: 非等級資料:
(1)正態(tài)性檢驗(yàn)(2)計(jì)算相關(guān)系數(shù)r(3)建立相關(guān)系數(shù)的假設(shè)檢驗(yàn)(H0:p=0, 兩變量間無直線相關(guān)關(guān)系H1:p≠0,兩變量間有直線相關(guān)關(guān)系)
(4)確定檢驗(yàn)水準(zhǔn)(a=0.05)
(5)計(jì)算統(tǒng)計(jì)量(其實(shí)表中會直接給出)(6)確定p值
(7)得出結(jié)論 等級資料:
(1)計(jì)算相關(guān)系數(shù)r(2)建立相關(guān)系數(shù)的假設(shè)檢驗(yàn)(H0:p=0, H1:p≠0,)(3)確定檢驗(yàn)水準(zhǔn)(a=0.05)
(4)計(jì)算統(tǒng)計(jì)量(其實(shí)表中會直接給出)(5)確定p值(6)得出結(jié)論
6、一元線性回歸(需建立擬合方程)(是否需要正態(tài)檢驗(yàn)、相關(guān)分析鋪墊?)
數(shù)據(jù)類型:類似相關(guān)分析
計(jì)算方法:regression-linear-勾選好后,選enter模式 擬合步驟:
1)計(jì)算回歸系數(shù)(系數(shù)表內(nèi)看,通常<1)
2)對回歸系數(shù)b進(jìn)行假設(shè)檢驗(yàn)(系數(shù)表內(nèi),最后1列)
??3)建立回歸方程(系數(shù)表內(nèi))
y?a?bx或y?0?1x4)評價回歸方程(模型匯總表內(nèi)R2)
bb
第二篇:SPSS總結(jié)
SPSS的基本統(tǒng)計(jì)功能
1、數(shù)據(jù)的預(yù)處理
2、描述性統(tǒng)計(jì)和探索性統(tǒng)計(jì)
3、假設(shè)檢驗(yàn)(包括參數(shù)檢驗(yàn)、非參數(shù)檢驗(yàn)等)
4、方差分析(包括一般的方差分析和多元方差分析)
5、相關(guān)分析
6、回歸分析
7、多元統(tǒng)計(jì)分析,包括聚類分析、判別分析、因子分析、對應(yīng)分析、主成分分析等
8、時間序列分析
9、信度分析
10、數(shù)據(jù)挖掘:決策樹與神經(jīng)網(wǎng)絡(luò)
SPSS 統(tǒng)計(jì)分析的一般步驟
1、建立SPSS數(shù)據(jù)文件: 在【變量視圖】定義SPSS數(shù)據(jù)文件的結(jié)構(gòu),在【數(shù)據(jù)視圖】進(jìn)行錄入數(shù)據(jù)文件的錄入。
2、SPSS數(shù)據(jù)的管理數(shù)據(jù)的預(yù)處理 :
集中于【數(shù)據(jù)】和【轉(zhuǎn)換】兩個菜單項(xiàng)。
3、SPSS數(shù)據(jù)的統(tǒng)計(jì)分析階段
: 在【分析】菜單中選擇正確的統(tǒng)計(jì)方法。
4、SPSS分析結(jié)果的閱讀和解釋
: 讀懂SPSS輸出窗口中的分析結(jié)果
5、明確其統(tǒng)計(jì)含義,并結(jié)合背景知識做出合理的解釋。
第2章 SPSS統(tǒng)計(jì)分析前的準(zhǔn)備
一、SPSS數(shù)據(jù)文件的特點(diǎn)
1、SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件(一般文本文件僅有純數(shù)據(jù)部分,而沒有關(guān)于結(jié)構(gòu)的描述);
2、由數(shù)據(jù)的結(jié)構(gòu)和內(nèi)容兩部分構(gòu)成;
3、其中數(shù)據(jù)的結(jié)構(gòu)記錄數(shù)據(jù)類型、取值說明、數(shù)據(jù)缺失等必要信息(在【變量視圖】,每一列大家都要明白你在定義什么,有什么用);
4、數(shù)據(jù)的內(nèi)容是那些待分析的具體數(shù)據(jù);
5、在【數(shù)據(jù)視圖】每一列代表一個變量(variable),變量名顯示在表格頂部;
6、在【數(shù)據(jù)視圖】的每一行代表一個記錄(case)(即一個案例,或稱一個對象、一個觀察、一個個體),記錄序號顯示在表格的左側(cè);
7、在【數(shù)據(jù)視圖】可以輸入和編輯數(shù)據(jù),但是不能輸入數(shù)學(xué)表達(dá)式和函數(shù)
二、定義變量
1、【數(shù)據(jù)視圖】是進(jìn)行數(shù)據(jù)輸入、數(shù)據(jù)編輯的界面,對應(yīng)的表格用于查看、錄入和修改數(shù)據(jù)。
2、【變量視圖】 是定義數(shù)據(jù)文件的變量的界面,對應(yīng)的表格用于輸入和修改變量的定義。
3、用SPSS讀取其他格式的數(shù)據(jù):
1)數(shù)據(jù)文件:*。sav
語法文件:*。sps 結(jié)果文件:*。spo
腳本文件: *。sbs 2)文件-打開-數(shù)據(jù),可打開多種文件類型(。sav、。xls、。dbf、。txt、。dat等)
注:要想順利打開txt文檔,txt文檔最好有固定的分隔符,如一個空格或一個逗號等。
三、數(shù)據(jù)的編輯
在SPSS中,數(shù)據(jù)文件的編輯、整理等功能被集中在了【數(shù)據(jù)】和【轉(zhuǎn)換】兩個菜單項(xiàng)中:
1、數(shù)據(jù)的增刪、復(fù)制、剪切、粘貼;
2、數(shù)據(jù)的排序,Sort Cases排序便于數(shù)據(jù)的瀏覽,快捷找到最大值或最小值,迅速發(fā)現(xiàn)數(shù)據(jù)的異常值;
四、文件的拆分:文件的拆分相當(dāng)于統(tǒng)計(jì)學(xué)中的數(shù)據(jù)分組,即將數(shù)據(jù)按一個或幾個分組變量分組。
五、數(shù)據(jù)選取 :
數(shù)據(jù)選取(個案選取)的基本方式
按指定條件選取(If condition is satisfied)
隨機(jī)抽樣(Random sample of cases)選取某一區(qū)域內(nèi)(Based on time or case range)
六、個案加權(quán):記錄加權(quán)是對觀測數(shù)據(jù)賦以權(quán)重,常用于頻數(shù)表資料;
七、文件的合并:合并文件是指將外部數(shù)據(jù)中的記錄或變量合并到當(dāng)前的數(shù)據(jù)文件中去。合并數(shù)據(jù)文件包括兩種方式:
從外部數(shù)據(jù)文件增加記錄到當(dāng)前數(shù)據(jù)文件中——縱向合并或稱追加記錄。從外部數(shù)據(jù)文件增加變量到當(dāng)前數(shù)據(jù)文件中——橫向合并或稱追加變量。
八、變量的計(jì)算和變換:【轉(zhuǎn)換】-【計(jì)算變量】
九、數(shù)據(jù)的重新編碼recode 統(tǒng)計(jì)分組
將字符型變量轉(zhuǎn)換為數(shù)值型變量 將幾個小類別合為一個類別 將數(shù)值型變量轉(zhuǎn)換為字符型
十、統(tǒng)計(jì)結(jié)果的保存為word文件:【文件】-【導(dǎo)出】
第3章
SPSS描述性統(tǒng)計(jì)
1.Frequencies(頻率)過程的特色是產(chǎn)生頻數(shù)表;功能 產(chǎn)生頻數(shù)分布表;
繪制條形圖、餅圖、直方圖;
計(jì)算集中趨勢與離散程度、分布形狀(峰度和偏度的意義)等統(tǒng)計(jì)量; 按要求給出分位數(shù);
對數(shù)據(jù)的分布趨勢進(jìn)行初步分析
(注:對于定性變量來說,一般來說產(chǎn)生頻數(shù)分布表,制作條形圖,餅圖即可);
2.描述分析(Descriptives過程)
適用的分析對象:定量變量,測度為scale。功能:
調(diào)用此過程對變量進(jìn)行描述性統(tǒng)計(jì)分析,計(jì)算均值、標(biāo)準(zhǔn)差、全距和均值標(biāo)準(zhǔn)誤差等; 并可將原始數(shù)據(jù)轉(zhuǎn)換成Z分?jǐn)?shù)((原始值-均值)/標(biāo)準(zhǔn)差)。
3.Explore(探索)過程用于對數(shù)據(jù)概況不清時的探索性分析,定量變量; 在一般描述性統(tǒng)計(jì)分析的基礎(chǔ)上,增加有關(guān)數(shù)據(jù)其他特征的文字與圖形描述。提供莖葉圖、箱線圖、PP圖、QQ圖等;
指出異常值(Outliers),可檢查數(shù)據(jù)是否有錯誤,剔除異常值和錯誤數(shù)據(jù); 進(jìn)行點(diǎn)估計(jì)和區(qū)間估計(jì),計(jì)算均值的置信區(qū)間,; 檢驗(yàn)一組數(shù)據(jù)是否呈正態(tài)分布; 4.列聯(lián)表分析
(1)列聯(lián)表分析的適用條件
對一個定量變量的描述和分析,一般用頻數(shù)分析(頻數(shù)分布表、餅圖、直方圖、條形圖); 對兩個定性變量的描述和分析,通常使用列聯(lián)表、對應(yīng)分析,或使用卡方檢驗(yàn); 對兩個以上定性變量的描述和分析,通常使用高維列聯(lián)表。(2)期望頻數(shù)的分布
如果行變量和列變量是獨(dú)立的,可以計(jì)算出列聯(lián)表中每個格子里的頻數(shù)應(yīng)該是多少,稱為期望頻數(shù);
(3)列聯(lián)表分析的基本思路
檢驗(yàn)列聯(lián)表中的行變量與列變量之間是否獨(dú)立(或是否相關(guān))。原假設(shè)為行變量與列變量之間獨(dú)立(或不相關(guān))。比較觀察頻數(shù)與期望頻數(shù)的差。
如果兩者的差越大,表明實(shí)際情況與原假設(shè)相去甚遠(yuǎn);如果差越小,表明實(shí)際情況與原假設(shè)越相近。
對于這個假設(shè)的檢驗(yàn),可以采用卡方分布,進(jìn)行卡方檢驗(yàn)。
(4)列聯(lián)表分析的步驟
檢驗(yàn)列聯(lián)表中的行變量與列變量之間是否獨(dú)立(是否相關(guān))提出假設(shè)
H0:行變量與列變量獨(dú)立(不相關(guān))H1:行變量與列變量不獨(dú)立(相關(guān) 計(jì)算檢驗(yàn)的統(tǒng)計(jì)量 統(tǒng)計(jì)決策
進(jìn)行決策:P值決策
P<0。05,則拒絕原假設(shè)H0,否則,接收原假設(shè)。(5)Pearson卡方檢驗(yàn)的應(yīng)用條件
所有單元的期望頻數(shù)應(yīng)該大于1,或不應(yīng)有大量的期望頻數(shù)小于5的單元格。
如果列聯(lián)表中有20%以上的單元格中的期望頻數(shù)小于5,則一般不宜用卡方檢驗(yàn)。Pearson卡方檢驗(yàn)最普遍
第4章
SPSS的均值比較過程 1。Means過程
對準(zhǔn)備比較的各組計(jì)算描述指標(biāo),進(jìn)行預(yù)分析,也可直接比較,定量變量。(1)Means過程是專門計(jì)算各種平均數(shù),并對平均數(shù)進(jìn)行簡單比較的;(2)雖然Descriptive Statistics(描述統(tǒng)計(jì))菜單項(xiàng)中的幾個過程也能計(jì)算均數(shù),但Means過程的輸出結(jié)果是將各組的描述指標(biāo)放在一起的,便于相互比較;
(3)Means過程必須設(shè)置分組變量,若沒有分組變量的話,可以使用Descriptive Statistics菜單項(xiàng)中的幾個過程。
(4)適用于測度水平為SCALE的變量。
2。單樣本T檢驗(yàn)(1)目的
檢驗(yàn)?zāi)匙兞康目傮w均值與指定的檢驗(yàn)值之間是否存在顯著差異。(2)適用條件
樣本來自的總體服從正態(tài)分布(3)基本步驟
H0: μ=μ0 H1: μ≠μ0
構(gòu)造檢驗(yàn)統(tǒng)計(jì)量 統(tǒng)計(jì)決策
如果P值<α(α一般取值為0。05),拒絕原假設(shè); 如果P值>α,接受原假設(shè);
3。
獨(dú)立樣本T 檢驗(yàn)(1)目的
通過比較兩個樣本均值差的大小來確定兩個總體的均值是否相等。(2)適用條件
獨(dú)立性:兩個樣本相互獨(dú)立,且均為大樣本;
正態(tài)性:如果兩個樣本相互獨(dú)立但都是小樣本,或有一個樣本是小樣本,則要求總體服從正態(tài)分布;
方差齊性
(3)基本步驟
a、方差齊性F檢驗(yàn)
原假設(shè):兩個總體方差相等; 備則假設(shè):兩個總體方差不相等;
P值<0。05 時,拒絕原假設(shè),說明方差不齊;否則兩個總體方差無顯著性差異。b、對兩總體的均值提出假設(shè) H0: μ1=μ2
H1: μ1≠μ2 c、統(tǒng)計(jì)決策
在SPSS中進(jìn)行兩獨(dú)立樣本t檢驗(yàn)時,應(yīng)首先對F檢驗(yàn)作判斷。如果方差相等,觀察分析結(jié)果中Equal variances assumed列的t檢驗(yàn)相伴概率值;如果方差不相等,觀察Equal variances not assumed列的t檢驗(yàn)相伴概率值。如果P值<α,拒絕原假設(shè); 如果P值>α,不能拒絕原假設(shè);
4.配對樣本的T 檢驗(yàn)
配對樣本是指對同一樣本的某個變量進(jìn)行前后兩次測試所獲得的兩組數(shù)據(jù),或是對兩個完全相同的樣本在不同條件下進(jìn)行測試所獲得的兩組數(shù)據(jù)。其差別在于抽樣不是相互獨(dú)立的,而是互相關(guān)聯(lián)的。(1)配對樣本通常有兩個特征: 第一,兩組樣本的樣本數(shù)相同;
第二,兩個樣本記錄的先后順序一一對應(yīng),不能隨意更改。(2)適用條件
兩樣本數(shù)據(jù)必須兩兩配對 兩總體服從正態(tài)分布
配對樣本的錄入方式是:每對數(shù)據(jù)在同一個case的兩個配對的變量上(3)檢驗(yàn)步驟 a、提出假設(shè) H0: μ1=μ2
H1: μ1≠μ2 b、統(tǒng)計(jì)決策
如果P值<α,拒絕原假設(shè); 如果P值>α,不能拒絕原假設(shè);
第5章 方差分析
如何對一個或兩個總體的均值進(jìn)行檢驗(yàn),我們可以用均值比較,如果要討論多個總體均值是否相等,我們所采用的方法是方差分析。
方差分析中有以下幾個重要概念。(1)因素(Factor):是指所要研究的變量,它可能對因變量產(chǎn)生影響。如果方差分析只針對一個因素進(jìn)行,稱為單因素方差分析。如果同時針對多個因素進(jìn)行,稱為多因素方差分析。
(2)水平(Level):水平指因素的具體表現(xiàn),如銷售的四種方式就是因素的不同取值等級。
(3)單元(Cell):指因素水平之間的組合。(4)元素(Element):指用于測量因變量的最小單位。一個單元里可以只有一個元素,也可以有多個元素。
(5)交互作用(Interaction):如果一個因素的效應(yīng)大小在另一個因素不同水平下明顯不同,則稱兩因素間存在交互作用。
1.單因素方差分析
單因素方差分析也叫一維方差分析,它用來研究一個因素的不同水平是否對觀測變量產(chǎn)生了顯著影響,即檢驗(yàn)由單一因素影響的一個(或幾個相互獨(dú)立的)因變量由因素各水平分組的均值之間的差異是否具有統(tǒng)計(jì)意義。(1)適用條件
在各個水平之下觀察對象是獨(dú)立隨機(jī)抽樣,即獨(dú)立性;
各個水平的因變量服從正態(tài)分布,即正態(tài)性;
各個水平下的總體具有相同的方差,即方差齊性;(2)基本原理
SST(總的離差平方和)=SSA(組間離差平方和)+SSE(組內(nèi)離差平方和)
如果在總的離差平方和中,組間離差平方和所占比例較大,說明觀測變量的變動主要是由因素的不同水平引起的,可以主要由因素的變動來解釋,系統(tǒng)性差異給觀測變量帶來了顯著影響;反之,如果組間離差平方和所占比例很小,說明觀測變量的變動主要由隨機(jī)變量因素引起的。
SPSS將自動計(jì)算檢驗(yàn)統(tǒng)計(jì)量和相伴概率P值,若P<α,則拒絕原假設(shè),認(rèn)為因素的不同水平對觀測變量產(chǎn)生顯著影響;反之,接受零假設(shè),認(rèn)為因素的不同水平?jīng)]有對觀測變量產(chǎn)生顯著影響。
另外,SPSS還提供了多重比較方法,多重比較是通過對總體均值之間的配對比較來進(jìn)一步檢驗(yàn)到底哪些均值之間存在差異,最常用的多重比較方法是LSD。(3)檢驗(yàn)步驟 a、提出假設(shè)
H0: 各個總體的均值無顯著性差異。
H1: 各個總體的均值有顯著性差異。b、統(tǒng)計(jì)決策
方差齊性檢驗(yàn)結(jié)果,P值>0。05,方差齊,否則,方差不齊;
單因素方差分析表,P值>α,接受H0,都則,拒絕H0,接受H1。
2.多因素方差分析
多因素方差分析是對一個獨(dú)立變量是否受一個或多個因素或變量影響而進(jìn)行的方差分析。它不僅能夠分析多個因素對觀測變量的獨(dú)立影響,更能夠分析多個因素的交互作用能否對觀測變量產(chǎn)生顯著影響。(2)基本原理
由于多因素方差分析中觀察變量不僅要受到多個因素獨(dú)立作用的影響,而且因素其交互作用和一些隨機(jī)因素都會對變量產(chǎn)生影響。因此觀測變量值的波動要受到多個控制變量獨(dú)立作用、控制變量交互作用及隨機(jī)因素等三方面的影響。以兩個因素為例,可以表示為:
Q總=Q控1+Q控2+Q控1控2+Q隨其中,Q表示各部分對應(yīng)的離差平方和。多因素方差分析比較
Q
控
1、Q 控
2、Q 控 1 控
Q
隨
占 Q
總 的比例,以此推斷不同因素以及因素之間的交互作用
2、是否給觀測變量帶來顯著影響。
(3)基本術(shù)語
a、Dependent Variable 觀測變量或因變量 主要指研究中的定量變量
如:移動話費(fèi)、學(xué)生成績、銷售量、畝產(chǎn)量等
b、Fixed Factor 固定效應(yīng)因素,固定因素,控制因素
主要指研究中的定性變量
如:資費(fèi)等級、客戶類型、漫游類型、促銷策略等 c、Random Factor 隨機(jī)效應(yīng)因素、隨機(jī)因素
人為無法對其水平值進(jìn)行準(zhǔn)確控制,只是能夠直觀觀測到
如:話費(fèi)水平、收入水平、消費(fèi)習(xí)慣等
d、Interaction 交互作用、交互效應(yīng)
如果一個因素的效應(yīng)大小在另一個因素不同水平下明顯不同,則稱為兩因素間存在交互作用。
當(dāng)存在交互作用時,單純研究某個因素的作用是沒有意義的,必須分另一個因素的不同水平研究該因素的作用大小。例如:飲食習(xí)慣、適量運(yùn)動對減肥的作用; e、main effect 與交互效應(yīng)相對應(yīng)的
主效應(yīng)就是每個因素對因變量的單獨(dú)影響(main effect)f、Covariates 協(xié)變量
指對應(yīng)變量可能有影響,需要在分析時對其作用加以控制的連續(xù)性定量變量 當(dāng)模型中存在協(xié)變量時,一般是通過找出它與因變量的回歸關(guān)系來控制其影響(3)應(yīng)用條件
等方差;
各樣本的獨(dú)立性:只有各樣本為相互獨(dú)立的隨機(jī)樣本,才能保證變異的可加性(可分解性);
正態(tài)性:即所有觀察值系從正態(tài)總體中抽樣得出;(4)基本步驟
提出假設(shè)
H0:因素A中的r個水平的均值相等(因素A 對因變量無顯著性影響)H1:因素A中的r個水平的均值不全相等(因素A 對因變量有顯著性影響)統(tǒng)計(jì)決斷 P值檢驗(yàn)法
依次查看各F值的P值,p-值<α,應(yīng)拒絕原假設(shè); 如果其P值大于顯著性水平,則不能拒絕H0,可以認(rèn)為相應(yīng)不同水平的控制變量或交互影響沒有造成均值的顯著差異;
第6章
非參數(shù)檢驗(yàn)
非參數(shù)檢驗(yàn)(nonparametric test),又稱為任意分布檢驗(yàn)(distribution-free test); 不依賴于總體的分布類型,對樣本所來自總體的分布不作嚴(yán)格假定的統(tǒng)計(jì)推斷方法,稱為非參數(shù)檢驗(yàn)(nonparametric test)
它不考慮研究對象總體分布的具體形式,也不對總體參數(shù)進(jìn)行統(tǒng)計(jì)推斷;
而是通過檢驗(yàn)樣本所代表的總體分布位置及分布形狀是否一致來得出統(tǒng)計(jì)結(jié)論。特點(diǎn)
參數(shù)檢驗(yàn)條件不滿足時的處理方法
不對均數(shù)等參數(shù)檢驗(yàn),而是檢驗(yàn)分布是否相同
在總體分布未知的情況下,利用樣本數(shù)據(jù)對總體的分布形態(tài)進(jìn)行推斷。非參數(shù)檢驗(yàn)的著眼點(diǎn)不是總體參數(shù),而是總體的分布情況 非參數(shù)檢驗(yàn)研究目標(biāo)總體的分布是否與已知理論分布相同 非參數(shù)檢驗(yàn)研究各樣本所在總體的分布位置,形狀是否相同 優(yōu)點(diǎn)
第一,具有較好的穩(wěn)健性;
第二,受限條件少:對數(shù)據(jù)要求不像參數(shù)檢驗(yàn)?zāi)菢訃?yán)格
第三,適用范圍廣:可應(yīng)用于各種不同的情況,不受總體分布形狀的限制,適合處理無法精確數(shù)量化的定性數(shù)據(jù)和小樣本數(shù)據(jù) 第四,計(jì)算通常較簡單,且容易理解 缺點(diǎn)
第一,將定量數(shù)據(jù)轉(zhuǎn)換為定性數(shù)據(jù)時,漏失了數(shù)據(jù)的一些信息
第二,檢驗(yàn)的敏感度和效果,均不如參數(shù)檢驗(yàn)好。檢驗(yàn)效率低于參數(shù)檢驗(yàn),主要是犯第二類錯誤的可能性加大。
第三,參數(shù)檢驗(yàn)適用的數(shù)據(jù),非參數(shù)方法會降低檢驗(yàn)效能;當(dāng)數(shù)據(jù)滿足參數(shù)檢驗(yàn)條件時,效能低于參數(shù)法,不滿足參數(shù)法條件時,處于“優(yōu)勢” 非參數(shù)檢驗(yàn)的應(yīng)用場合
定量數(shù)據(jù),不滿足參數(shù)檢驗(yàn)的條件,且無適當(dāng)?shù)淖兞孔儞Q方法解決此問題; 定量數(shù)據(jù),其分布類型無法獲知,且為小樣本; 定量數(shù)據(jù),極度偏態(tài),或個別數(shù)值偏離過大; 各組離散度相差懸殊
一端或兩端存在不確定數(shù)值的定量數(shù)據(jù)
定序數(shù)據(jù),比較各組間等級強(qiáng)度的差別; 非參數(shù)檢驗(yàn)的主要方法 單個樣本的非參數(shù)檢驗(yàn)
卡方檢驗(yàn)(Chi-Square過程)
二項(xiàng)檢驗(yàn)(Binomial過程)
游程檢驗(yàn)(Runs過程)
柯爾莫哥洛夫—斯米諾夫檢驗(yàn)(l-Sample K-S過程)兩個獨(dú)立樣本的非參數(shù)檢驗(yàn) 多個獨(dú)立樣本的非參數(shù)檢驗(yàn) 兩個配對樣本的非參數(shù)檢驗(yàn) 多個配對樣本的非參數(shù)檢驗(yàn) 順序統(tǒng)計(jì)量
通過對數(shù)據(jù)從小到大的排序(即排隊(duì)),并由數(shù)據(jù)的大小排序號(排隊(duì)號)代替原始數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。
秩(Rank):排序號(排隊(duì)號)在統(tǒng)計(jì)學(xué)上稱為秩
結(jié)(ties):絕對值相等稱為結(jié),又稱同秩,則取平均秩次。
一般來說,秩就是該組數(shù)據(jù)按照升序排列之后,每個數(shù)據(jù)的位置。
1.單個樣本的非參數(shù)檢驗(yàn) 卡方檢驗(yàn)(Chi-Square過程)
用卡方檢驗(yàn)來檢驗(yàn)定性變量的幾個取值(分類數(shù)據(jù),或類別)所占比例是否和理論的比例沒有統(tǒng)計(jì)學(xué)差異。檢驗(yàn)分類變量的分布
適合于定性數(shù)據(jù)及頻數(shù)資料的分析
要求樣本足夠大,要求樣本容量一般大于50; 應(yīng)用領(lǐng)域
如病人經(jīng)治療后治愈、好轉(zhuǎn)、有效和無效的人數(shù)總的說來是否相同(實(shí)為治愈、好轉(zhuǎn)、有效和無效的概率或機(jī)會是否相同)成績優(yōu)、良、中、差的學(xué)生人數(shù)是否相同 贊同某種觀點(diǎn)的人數(shù)是否達(dá)到80%,等等。
比如在人群中抽取了一個樣本,可以用該方法來分析四種血型所占的比例是否相同(都是25%),或者是否符合我們所給出的一個比例(如分別為10%、30%、40%和20%)。Chi-Square檢驗(yàn)的基本思路
先按照已知總體的構(gòu)成比例分布,計(jì)算出樣本中定性數(shù)據(jù)(即各類別)的期望頻數(shù)然后求出觀測頻數(shù)和期望頻數(shù)的差值,最后計(jì)算出卡方統(tǒng)計(jì)量 利用卡方分布求出P值,假設(shè)檢驗(yàn)的H0是樣本中某指標(biāo)的比例與已知比例一致 得出檢驗(yàn)結(jié)論
2.二項(xiàng)檢驗(yàn)(Binomial過程)檢驗(yàn)二項(xiàng)分類變量分布
用于檢測所給的變量是否符合二項(xiàng)分布,變量可以是兩分類的,也可以使連續(xù)性變量,然后按你給出的分界點(diǎn)一刀兩斷。
Binomial過程對二項(xiàng)分類變量的單個樣本作檢驗(yàn),推斷總體中兩個分類數(shù)據(jù)的比例是否分別為π和(1-π)應(yīng)用領(lǐng)域
射擊時,擊中與未擊中;學(xué)生成績,及格與不及格;疾病診斷,陰性與陽性;硬幣,正面與反面;人群性別,男和女;產(chǎn)品質(zhì)量,合格和不合格 定量數(shù)據(jù)、符號檢驗(yàn)(SING TEST)與Binomial過程
定量數(shù)據(jù):大樣本;或小樣本,總體服從正態(tài)分布,總體方差已知; 參數(shù)檢驗(yàn):單個樣本的均值檢驗(yàn)
定量數(shù)據(jù),不滿足參數(shù)檢驗(yàn)的條件,且無適當(dāng)?shù)淖兞孔儞Q方法解決此問題;
極度偏態(tài),或個別數(shù)值偏離過大;
一端或兩端存在不確定數(shù)值
3.游程檢驗(yàn)(Runs過程)
Runs過程借助樣本序列的順序推斷總體序列的順序是否是隨機(jī)的,屬隨機(jī)性檢驗(yàn) 二分類數(shù)據(jù)和定量數(shù)據(jù)(連續(xù)數(shù)據(jù))均可
對于一個取兩個值的分類變量,游程檢驗(yàn)方法是檢驗(yàn)這兩個值的出現(xiàn)是否是隨機(jī)的。游程檢驗(yàn)還可以用于某個連續(xù)變量的取值小于某個值及大于該值的個數(shù)(類似于0和1的個數(shù))是否隨機(jī)的問題 游程檢驗(yàn)的作用
1、檢驗(yàn)總體分布是否相同
將從兩個總體中獨(dú)立抽取的兩個樣本的觀察值混合后,觀察游程個數(shù),進(jìn)行比較。
2、檢驗(yàn)樣本的隨機(jī)性
將取自某一總體的樣本的觀察值按從小到大順序排列,找出中位數(shù),分為大于中位數(shù)的小于中位數(shù)的兩個部分。用上下交錯形成的游程個數(shù)來檢驗(yàn)樣本是否是隨機(jī)的。應(yīng)用范圍
生產(chǎn)過程是否需要調(diào)整,即不合格產(chǎn)品是否隨機(jī)產(chǎn)生; 獎券的購買是否隨機(jī);
期貨價格的變化是否隨機(jī)等等。
若事物的發(fā)生并非隨機(jī),即有某種規(guī)律,則往往可尋找規(guī)律,建立相應(yīng)模型,進(jìn)行分析,作出適宜的決策。
當(dāng)樣本按某種順序排列(如按抽取時間先后排列)時,一個或者一個以上相同符號連續(xù)出現(xiàn)的段,就被稱作游程 ;
4.(l-Sample K-S過程)
柯爾莫諾夫-斯米爾諾夫檢驗(yàn),考察某個連續(xù)性變量是否符合理論分布 利用樣本數(shù)據(jù)推斷總體是否服從某種分布
可以檢驗(yàn)的分布有正態(tài)分布、均勻分布、Poission分布和指數(shù)分布。數(shù)據(jù)要求:定量數(shù)據(jù),Scale
5。
獨(dú)立樣本的非參數(shù)檢
檢驗(yàn)兩個或多個獨(dú)立樣本所在總體是否相同
在不了解總體分布的情況下,通過分析樣本數(shù)據(jù)均值或中位數(shù)的差異,推斷樣本來自的兩/多個獨(dú)立總體的分布存在的顯著性差異。Independent Samples過程:主要用于檢驗(yàn)兩個獨(dú)立樣本所在總體分布是否相同 K Independent Samples過程:主要用于檢驗(yàn)多個獨(dú)立樣本所在總體分布是否相同 界面上基本相同
(1)兩個獨(dú)立樣本的非參數(shù)檢驗(yàn)
含義:由樣本數(shù)據(jù),推斷兩個獨(dú)立總體的分布是否存在顯著差異(或兩樣本是否來自同一總體)分析對象:定量數(shù)據(jù)或定序數(shù)據(jù) 對分布的形狀不加考慮
分布形狀相同或類似的兩個總體分布位置比較,可以簡化地理解為兩總體中位數(shù)的比較 應(yīng)用范圍
兩種訓(xùn)練方法中哪一種更出成績 兩種汽 油中哪一個污染更少 兩種市場營銷策略中那種更有效
與獨(dú)立樣本t檢驗(yàn)的區(qū)別
對于定量數(shù)據(jù),如果方差相等,且服從正態(tài)分布
兩個獨(dú)立樣本的非參數(shù)檢驗(yàn)的過程
定序數(shù)據(jù);對于定量數(shù)據(jù),不滿足兩個獨(dú)立樣本t檢驗(yàn)的條件
曼-惠特尼U檢驗(yàn)(Mann-Whitney U)
為檢驗(yàn)兩總體的中位數(shù)是否相等,常用Mann-Whitney U 檢驗(yàn),或稱Wilcoxon秩和檢驗(yàn)(Wilcoxon rank sum test);
這兩種方法是獨(dú)立提出的,檢驗(yàn)結(jié)果完全等價的; 分析步驟
建立檢驗(yàn)假設(shè),確定顯著性水平α :
H0:兩個總體的分布位置相同,即高中生和大學(xué)生的每周平均上網(wǎng)時間的總體分布相同;
H1:兩個總體的分布位置不同,即高中生和大學(xué)生的每周平均上網(wǎng)時間的總體分布不同。或:
H0:M1=M2;
H1:M1>M2
2、編秩,將兩組數(shù)據(jù)由小到大統(tǒng)一編秩,編秩時如遇有相同數(shù)據(jù),取平均秩次。
3、求秩和,兩組秩次分別相加。
4、確定統(tǒng)計(jì)量
若兩組樣本容量相等,則任取一組的秩和為統(tǒng)計(jì)量;
若兩組樣本容量不等,則以樣本樣本容量較小者對應(yīng)的秩和為統(tǒng)計(jì)量。
5、查表確定P值,作出推斷結(jié)論。若P>α,不能拒絕原假設(shè)。
若則P<α,拒絕原假設(shè),認(rèn)為兩總體的分布不相同。
(2)多獨(dú)立樣本非參數(shù)檢驗(yàn)
對三個或三個以上的總體的均值是否相等進(jìn)行檢驗(yàn),使用的方法是單因素方差分析 ; 單因素方差分析過程需要假定條件,F(xiàn)檢驗(yàn)才有效; 有時候所采集的數(shù)據(jù)常常不能滿足這些條件,K Independent Samples過程 K Independent Samples過程
含義:由樣本數(shù)據(jù),推斷多個獨(dú)立總體的分布是否存在顯著差異(或多個樣本是否來自同一總體)分析對象:定量數(shù)據(jù)或定序數(shù)據(jù) 對分布的形狀不加考慮
分布形狀相同或類似的多個總體分布位置比較,可以簡化地理解為多個總體中位數(shù)的比較。應(yīng)用范圍
各城市兒童身高分布一致嗎?
不同收入的居民存(取)款金額分布一致嗎?
電信公司人力資源部門比較3所大學(xué)雇員的管理業(yè)績是否存在差異? 檢驗(yàn)方法
Kruskal-Wallis H :克魯斯卡爾-沃利斯單因素方差分析最常用,原理同Wilcoxon檢驗(yàn) 多個樣本間的兩兩比較 多組獨(dú)立樣本;
每組5個觀察值,樣本量小,分布類型未知;
考慮采用秩轉(zhuǎn)換的非參數(shù)檢驗(yàn)方法——Kruskal-Wallis秩和檢驗(yàn)。
(3)兩/多個配對樣本非參數(shù)檢驗(yàn)
檢驗(yàn)兩個或多個配對樣本所在總體位置是否相同
在不了解總體分布的情況下,通過分析兩/多個配對樣本,推斷樣本來自的兩/多個總體的分布是否存在顯著性差異。Related Samples過程:主要用于檢驗(yàn)兩個配對樣本所在總體分布是否相同 K Related Samples過程:主要用于檢驗(yàn)多個配對樣本所在總體分布是否相同 界面上基本相同
兩個配對樣本的非參數(shù)檢驗(yàn)
含義:由樣本數(shù)據(jù)推斷兩配對總體分布是否存在顯著差異。數(shù)據(jù)要求
兩組配對的樣本數(shù)據(jù);
兩組數(shù)據(jù)的樣本容量相同,先后次序不能任意改變,一一對應(yīng); 統(tǒng)計(jì)分析步驟
提出基本假設(shè)
H0:兩配對總體分布無顯著差異 H1:兩配對總體分布有顯著差異 統(tǒng)計(jì)決斷
P值>α,不能拒絕原假設(shè)
P值<α,拒絕原假設(shè)
多個配對樣本非參數(shù)檢驗(yàn)
含義:由樣本數(shù)據(jù)推斷多個配對總體分布是否存在顯著差異。
數(shù)據(jù)要求:多組配對的樣本數(shù)據(jù),多組數(shù)據(jù)的樣本容量相同,先后次序不能任意改變,一一對應(yīng); 應(yīng)用范圍
三種促銷形式的銷售額分布一致嗎? 收集乘客對多家航空公司是否滿意的數(shù)據(jù),分析航空公司的服務(wù)水平是否存在顯著差異 評委打分一致嗎? 三種檢驗(yàn)方法
Friedman M檢驗(yàn):最常用
Kendall W檢驗(yàn) :和諧系數(shù)檢驗(yàn)
Cochran Q:要求樣本數(shù)據(jù)為二分類數(shù)據(jù)(1-滿意
0-不滿意)檢驗(yàn)方法的選擇
1)單個樣本:若來自正態(tài)總體,可用t檢驗(yàn),若來自非正態(tài)總體或總體分布無法確定,可用二項(xiàng)檢驗(yàn)(二項(xiàng)檢驗(yàn))2)配對樣本:
二分類變量,可用McNemar檢驗(yàn);
連續(xù)型變量,若來自正態(tài)總體,可用配對t檢驗(yàn),否則可用Wilcoxon符號秩和檢驗(yàn)。
3)兩組獨(dú)立樣本:連續(xù)型變量,若來自正態(tài)總體,可用t檢驗(yàn),否則,可用 Wilcoxon秩和檢驗(yàn);
二分類變量或無序多分類變量,可用卡方檢驗(yàn);
有序多分類變量,宜用Wilcoxon秩和檢驗(yàn)。4)多組獨(dú)立樣本
連續(xù)型變量值,來自正態(tài)總體且方差相等,可用方差分析;否則,進(jìn)行數(shù)據(jù)變換使其滿足正態(tài)性或方差齊的要求后,采用方差分析;數(shù)據(jù)變換仍不能滿足條件時,可用Kruskal-Wallis秩和檢驗(yàn)。
二分類變量或無序多分類變量,可用卡方檢驗(yàn)。
有序多分類變量宜用Kruskal-Wallis秩和檢驗(yàn)。
第7章 相關(guān)分析 概念
相關(guān)關(guān)系反映出變量之間雖然相互影響,具有依存關(guān)系,但彼此之間是不能一一對應(yīng)的。例如,學(xué)生成績與其智力因素、各科學(xué)習(xí)成績之間的關(guān)系、教育投資額與經(jīng)濟(jì)發(fā)展水平的關(guān)系、社會環(huán)境與人民健康的關(guān)系等等,都反映出客觀現(xiàn)象中存在的相關(guān)關(guān)系。相關(guān)關(guān)系的類型
1)根據(jù)相關(guān)程度的不同,相關(guān)關(guān)系可分為完全相關(guān)、不完全相關(guān)和無相關(guān)。2)根據(jù)變量值變動方向的趨勢,相關(guān)關(guān)系可分為正相關(guān)和負(fù)相關(guān)。3)根據(jù)變量關(guān)系的形態(tài),相關(guān)關(guān)系可分為直線相關(guān)和曲線相關(guān)。4)根據(jù)研究變量的多少,可分為單相關(guān)、復(fù)相關(guān)。相關(guān)分析的作用
1)判斷變量之間有無聯(lián)系
2)確定選擇相關(guān)關(guān)系的表現(xiàn)形式及相關(guān)分析方法 3)把握相關(guān)關(guān)系的方向與密切程度
4)相關(guān)分析不但可以描述變量之間的關(guān)系狀況,而且用來進(jìn)行預(yù)測。5)相關(guān)分析還可以用來評價測量量具的信度、效度以及項(xiàng)目的區(qū)分度等 相關(guān)系數(shù)
相關(guān)系數(shù)是在直線相關(guān)條件下,說明兩個變量之間相關(guān)程度以及相關(guān)方向的統(tǒng)計(jì)分析指標(biāo)。相關(guān)系數(shù)一般可以通過計(jì)算得到。作為樣本相關(guān)系數(shù),常用字母r表示;作為總體相關(guān)系數(shù),常用字母ρ表示。相關(guān)系數(shù)的數(shù)值范圍是介于–1與 +1之間(即–1≤ r ≤1),常用小數(shù)形式表示,一般要取小數(shù)點(diǎn)后兩位數(shù)字來表示,以便比較精確地描述其相關(guān)程度。
兩個變量之間的相關(guān)程度用相關(guān)系數(shù)r的絕對值表示,其絕對值越接近1,表明兩個變量的相關(guān)程度越高;其絕對值越接近于0,表明兩個變量相關(guān)程度越低。如果其絕對值等于零1,則表示兩個變量完全直線相關(guān)。如果其絕對值為零,則表示兩個變量完全不相關(guān)(不是直線相關(guān))。
相關(guān)系數(shù)的注意事項(xiàng)
1)相關(guān)系數(shù)只是一個比率值,并不具備與相關(guān)變量相同的測量單位。2)相關(guān)系數(shù)r 受變量取值區(qū)間大小及樣本數(shù)目多少的影響比較大。
3)來自于不同群體且不同質(zhì)的事物的相關(guān)系數(shù)不能進(jìn)行比較。4)對于不同類型的數(shù)據(jù),計(jì)算相關(guān)系數(shù)的方法也不相同
1.簡單相關(guān)分析的基本原理
簡單相關(guān)分析是研究兩個變量之間關(guān)聯(lián)程度的統(tǒng)計(jì)方法。它主要是通過計(jì)算簡單相關(guān)系數(shù)來反映變量之間關(guān)系的強(qiáng)弱。一般它有圖形(散點(diǎn)圖)和數(shù)值(一方面應(yīng)觀察相關(guān)系數(shù)的大小,另一方面,應(yīng)觀察概率P值,其原假設(shè)為**不相關(guān))兩種表示方式。簡單相關(guān)系數(shù)
1)皮爾遜(Pearson)相關(guān)系數(shù)
常稱為積差相關(guān)系數(shù),適用于研究連續(xù)變量之間的相關(guān)程度。例如,收入和儲蓄存款、身高和體重等變量間的線性相關(guān)關(guān)系。注意Pearson相關(guān)系數(shù)適用于線性相關(guān)的情形,對于曲線相關(guān)等更為復(fù)雜的情形,系數(shù)的大小并不能代表其相關(guān)性的強(qiáng)弱。2)Spearman等級相關(guān)系
Spearman等級相關(guān)系數(shù)是用來度量順序水準(zhǔn)變量間的線性相關(guān)關(guān)系。它是利用兩變量的秩次大小作線性相關(guān)分析,適用條件為:
① 兩個變量的變量值是以等級次序表示的資料;
②
一個變量的變量值是等級數(shù)據(jù),另一個變量的變量值是等距或比率數(shù)據(jù),且其兩總體不要求是正態(tài)分布,樣本容量n不一定大于30。
從斯皮爾曼等級相關(guān)適用條件中可以看出,等級相關(guān)的應(yīng)用范圍要比積差相關(guān)廣泛,它的突出優(yōu)點(diǎn)是對數(shù)據(jù)的總體分布、樣本大小都不做要求。但缺點(diǎn)是計(jì)算精度不高。3)Kendall’s等級相關(guān)系數(shù)
它是用于反映分類變量相關(guān)性的指標(biāo),適用于兩個變量均為有序分類的情況。這種指標(biāo)采用非參數(shù)檢驗(yàn)方法測度變量間的相關(guān)關(guān)系。它利用變量的秩計(jì)算一致對數(shù)目和非一致對數(shù)目。
2.偏相關(guān)分析的基本原理
方法概述
簡單相關(guān)分析計(jì)算兩個變量之間的相互關(guān)系,分析兩個變量間線性關(guān)系的程度。但是現(xiàn)實(shí)中,事物之間的聯(lián)系可能存在于多個主體之間,因此往往因?yàn)榈谌齻€變量的作用使得相關(guān)系數(shù)不能真實(shí)地反映兩個變量間的線性相關(guān)程度。基本原理
偏相關(guān)分析是在相關(guān)分析的基礎(chǔ)上考慮了兩個因素以外的各種作用,或者說在扣除了其他因素的作用大小以后,重新來測度這兩個因素間的關(guān)聯(lián)程度。這種方法的目的就在于消除其他變量關(guān)聯(lián)性的傳遞效應(yīng)。3.距離分析的基本原理
簡單相關(guān)分析和偏相關(guān)分析有一個共同點(diǎn),那就是對所分析的數(shù)據(jù)背景應(yīng)當(dāng)有一定程度的了解。但在實(shí)際中有時會遇到一種情況,在分析前對數(shù)據(jù)所代表的專業(yè)背景知識尚不充分,本身就屬于探索性的研究。這時就需要先對各個指標(biāo)或者案例的差異性、相似程度進(jìn)行考察,以先對數(shù)據(jù)有一個初步了解,然后再根據(jù)結(jié)果考慮如何進(jìn)行深入分析。
距離分析是對觀測量之間或變量之間相似或不相似的程度的一種測度,是計(jì)算一對變量之間或一對觀測量之間的廣義的距離。根據(jù)變量的不同類型,可以有許多距離、相似程度測量指標(biāo)供用戶選擇。但由于本模塊只是一個預(yù)分析過程,因此距離分析并不會給出常用的P值,而只能給出各變量/記錄間的距離大小,以供用戶自行判斷相似性。
第8章 SPSS的回歸分析 1。一元線性回歸 方法概述
線性回歸模型側(cè)重考察變量之間的數(shù)量變化規(guī)律,并通過線性表達(dá)式,即線性回歸方程,來描述其關(guān)系,進(jìn)而確定一個或幾個變量的變化對另一個變量的影響程度,為預(yù)測提供科學(xué)依據(jù)。
一般線性回歸的基本步驟如下。
① 確定回歸方程中的自變量和因變量。
② 從收集到的樣本數(shù)據(jù)出發(fā)確定自變量和因變量之間的數(shù)學(xué)關(guān)系式,即確定回歸方程。
③ 建立回歸方程,在一定統(tǒng)計(jì)擬合準(zhǔn)則下,估計(jì)出模型中的各個參數(shù),得到一個確定的回歸方程。
④ 對回歸方程進(jìn)行各種統(tǒng)計(jì)檢驗(yàn)。
⑤ 利用回歸方程進(jìn)行預(yù)測。
注:一元線性回歸的經(jīng)驗(yàn)?zāi)P褪牵篩=β0+β1X 統(tǒng)計(jì)檢驗(yàn)
在求解出了回歸模型的參數(shù)后,一般不能立即將結(jié)果付諸于實(shí)際問題的分析和預(yù)測,通常要進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),例如擬合優(yōu)度檢驗(yàn)、回歸方程和回歸系數(shù)的顯著性檢驗(yàn)和殘差分析等。
1)輸出結(jié)果的模型摘要
其實(shí)就是對方程擬合情況的描述。通過這張表可以知道相關(guān)系數(shù)的取值(R),相關(guān)系數(shù)的平方即可決系數(shù)(R Square),校正后的可決系數(shù)(adjusted R Square)和回歸系數(shù)的標(biāo)準(zhǔn)誤(Std。Error of the Estimate)。注意這里的相關(guān)系數(shù)大小和前面相關(guān)分析中計(jì)算出的結(jié)果完全相同。可決系數(shù)R Square的取值介于0和1之間,它的含義就是自變量所能解釋的方差在總方差中所占的百分比,取值越大說明模型的效果越好。
2)輸出結(jié)果中的方差分析表
它是回歸模型顯著性檢驗(yàn)的結(jié)果,所用方法為F檢驗(yàn),其零假設(shè)為原方程無效,通過P值來判斷原方程是否有效。3)輸出結(jié)果中的回歸系數(shù)表
應(yīng)特別關(guān)注回歸系數(shù)β1 的T檢驗(yàn),它的零假設(shè)為β1 =0,通過P值來判斷β1 是否有實(shí)際意義。
2.多元線性回歸
在回歸分析中,如果有兩個或兩個以上的自變量,就稱為多元回歸。
其基本步驟與一元回歸幾乎一致,只是在輸出結(jié)果的模型摘要中通過觀察調(diào)整R2 來判斷方程的擬合情況,另外,同樣可通過折線圖來觀察模型擬合效果。
3.曲線擬合
實(shí)際中,變量之間的關(guān)系往往不是簡單的線性關(guān)系,而呈現(xiàn)為某種曲線或非線性的關(guān)系。此時,就要選擇相應(yīng)的曲線去反映實(shí)際變量的變動情況。為了決定選擇的曲線類型,常用的方法是根據(jù)數(shù)據(jù)資料繪制出散點(diǎn)圖,通過圖形的變化趨勢特征并結(jié)合專業(yè)知識和經(jīng)驗(yàn)分析來確定曲線的類型,即變量之間的函數(shù)關(guān)系。
在確定了變量間的函數(shù)關(guān)系后,需要估計(jì)函數(shù)關(guān)系中的未知參數(shù),并對擬合效果進(jìn)行顯著性檢驗(yàn)。雖然這里選擇的是曲線方程,在方程形式上是非線性的,但可以采用變量變換的方法將這些曲線方程轉(zhuǎn)化為線性方程來估計(jì)參數(shù)。
在選擇模型的時候可以結(jié)合專業(yè)知識多選幾種,如同時選擇“指數(shù)分布”、“逆模型”和“冪函數(shù)”,然后在模型匯總中比較R2 的大小,選擇最大的一個,同時,注意觀察各自的P值,其原假設(shè)為其模型無統(tǒng)計(jì)學(xué)意義。
4.非線性回歸分析
非線性回歸分析是探討因變量和一組自變量之間的非線性相關(guān)模型的統(tǒng)計(jì)方法。線性回歸模型要求變量之間必須是線性關(guān)系,曲線估計(jì)只能處理能夠通過變量變換化為線性關(guān)系的非線性問題,因此這些方法都有一定的局限性。相反的,非線性回歸可以估計(jì)因變量和自變量之間具有任意關(guān)系的模型,用戶根據(jù)自身需要可隨意設(shè)定估計(jì)方程的具體形式。通過散點(diǎn)圖觀察,如果自變量和應(yīng)變量不能通過線性回歸或區(qū)縣估計(jì)來實(shí)現(xiàn),則可以在SPSS通過【分析】-【回歸】-【非線性】來實(shí)現(xiàn)。
以下是SPSS處理問卷的總結(jié)
當(dāng)我們的調(diào)查問卷在把調(diào)查數(shù)據(jù)拿回來后,我們該做的工作就是用相關(guān)的統(tǒng)計(jì)軟件進(jìn)行處理,在此,我們以SPSS為處理軟件,來簡要說明一下問卷的處理過程,它的過程大致可分為四個過程:定義變量﹑數(shù)據(jù)錄入﹑統(tǒng)計(jì)分析和結(jié)果保存。下面將從這四個方面來對問卷的處理做詳細(xì)的介紹。
SPSS處理:
第一步:定義變量
大多數(shù)情況下我們需要從頭定義變量,在打開SPSS后,我們可以看到和excel相似的界面,在界面的左下方可以看到Data View,Variable View兩個標(biāo)簽,只需單擊左下方的Variable View標(biāo)簽就可以切換到變量定義界面開始定義新變量。在表格上方可以看到一個變量要設(shè)置如下幾項(xiàng):name(變量名)、type(變量類型)、width(變量值的寬度)、decimals(小數(shù)位)、label(變量標(biāo)簽)、Values(定義具體變量值的標(biāo)簽)、Missing(定義變量缺失值)、Colomns(定義顯示列寬)、Align(定義顯示對齊方式)、Measure(定義變量類型是連續(xù)、有序分類還是無序分類)。
我們知道在SPSS中,我們可以把一份問卷上面的每一個問題設(shè)為一個變量,這樣一份問卷有多少個問題就要有多少個變量與之對應(yīng),每一個問題的答案即為變量的取值。現(xiàn)在我們以問卷第一個問題為例來說明變量的設(shè)置。為了便于說明,可假設(shè)此題為:
1。請問你的年齡屬于下面哪一個年齡段()? A:20—29 B:30—39 C:40—49 D:50--59 那么我們的變量設(shè)置可如下: name即變量名為1,type即類型可根據(jù)答案的類型設(shè)置,答案我們可以用1、2、3、4來代替A、B、C、D,所以我們選擇數(shù)字型的,即選擇Numeric,width寬度為4,decimals即小數(shù)位數(shù)位為0(因?yàn)榇鸢笡]有小數(shù)點(diǎn)),label即變量標(biāo)簽為“年齡段查詢”。Values用于定義具體變量值的標(biāo)簽,單擊Value框右半部的省略號,會彈出變量值標(biāo)簽對話框,在第一個文本框里輸入1,第二個輸入20—29,然后單擊添加即可。同樣道理我們可做如下設(shè)置,即1=20—
29、2=30—
39、3=40—
49、4=50--59;Missing,用于定義變量缺失值,單擊missing框右側(cè)的省略號,會彈出缺失值對話框,界面上有一列三個單選鈕,默認(rèn)值為最上方的“無缺失值”;第二項(xiàng)為“不連續(xù)缺失值”,最多可以定義3個值;最后一項(xiàng)為“缺失值范圍加可選的一個缺失值”,在此我們不設(shè)置缺省值,所以選中第一項(xiàng)如圖;Colomns,定義顯示列寬,可自己根據(jù)實(shí)際情況設(shè)置;Align,定義顯示對齊方式,有居左、居右、居中三種方式;Measure,定義變量類型是連續(xù)、有序分類還是無序分類。
以上為問卷中常見的單項(xiàng)選擇題型的變量設(shè)置,下面將對一些特殊情況的變量設(shè)置也作一下說明。
1。開放式題型的設(shè)置:諸如你所在的省份是_____這樣的填空題即為開放題,設(shè)置這些變量的時候只需要將Value、Missing兩項(xiàng)不設(shè)置即可。
2。多選題的變量設(shè)置:這類題型的設(shè)置有兩種方法即多重二分法和多重分類法,在這里我們只對多重二分法進(jìn)行介紹。這種方法的基本思想是把該題每一個選項(xiàng)設(shè)置成一個變量,然后將每一個選項(xiàng)拆分為兩個選項(xiàng),即選中該項(xiàng)和不選中該項(xiàng)。現(xiàn)在舉例來說明在SPSS中的具體操作。比如如下一例:
請問您通常獲取新聞的方式有哪些()1 報紙 2 雜志 3 電視 4 收音機(jī) 5 網(wǎng)絡(luò)
在SPSS中設(shè)置變量時可為此題設(shè)置五個變量,假如此題為問卷第三題,那么變量名分別為3_
1、3_
2、3_
3、3_
4、3_5,然后每一個選項(xiàng)有兩個選項(xiàng)選中和不選中,只需在Value一項(xiàng)中為每一個變量設(shè)置成1=選中此項(xiàng)、0=不選中此項(xiàng)即可。
使用該窗口,我們可以把一個問卷中的所有問題作為變量在這個窗口中一次定義。到此,我們的定義變量的工作就基本上可以結(jié)束了。下面我們要作就是數(shù)據(jù)的錄入了。首先,我們要回到數(shù)據(jù)錄入窗口,這很簡單,只要我們點(diǎn)擊軟件左下方的Data View標(biāo)簽就可以了。
第二步:數(shù)據(jù)錄入
SPSS數(shù)據(jù)錄入有很多方式,大致有一下幾種: 1。讀取SPSS格式的數(shù)據(jù) 2。讀取Excel等格式的數(shù)據(jù)
3。讀取文本數(shù)據(jù)(Fixed和Delimiter)4。讀取數(shù)據(jù)庫格式數(shù)據(jù)(分如下兩步)(1)配置ODBC(2)在SPSS中通過ODBC和數(shù)據(jù)庫進(jìn)行
但是對于問卷的數(shù)據(jù)錄入其實(shí)很簡單,只要在SPSS的數(shù)據(jù)錄入窗口中直接輸入就可以了,只是在這里有幾點(diǎn)注意的事項(xiàng)需要說明一下。
1。在數(shù)據(jù)錄入窗口,我們可以看到有一個表格,這個表格中的每一行代表一份問卷,我們也稱為一個個案。
2。在數(shù)據(jù)錄入窗口中,我們可以看到表格上方出現(xiàn)了1、2、3、4、5??。的標(biāo)簽名,這其實(shí)是我們在第一步定義變量中,我們?yōu)閱柧淼拿恳粋€問題取的變量名,即1代表第一題,2代表第二題。以次類推。我們只需要在變量名下面輸入對應(yīng)問題的答案即可完成問卷的數(shù)據(jù)錄入。比如上述年齡段查詢的例題,如果問卷上勾選了A答案,我們在1下面輸入1就行了(不要忘記我們通常是用1、2、3、4來代替A、B、C、D的)。
3。我們知道一行代表一份問卷,所以有幾分問卷,就要有幾行的數(shù)據(jù)。在數(shù)據(jù)錄入完成后,我們要做的就是我們的關(guān)鍵部分,即問卷的統(tǒng)計(jì)分析了,因?yàn)檫@時我們已經(jīng)把問卷中的數(shù)據(jù)錄入我們的軟件中了。
第三步:統(tǒng)計(jì)分析
有了數(shù)據(jù),可以利用SPSS的各種分析方法進(jìn)行分析,但選擇何種統(tǒng)計(jì)分析方法,即調(diào)用哪個統(tǒng)計(jì)分析過程,是得到正確分析結(jié)果的關(guān)鍵。這要根據(jù)我們的問卷調(diào)查的目的和我們想要什么樣的結(jié)果來選擇。SPSS有數(shù)值分析和作圖分析兩類方法。
1。作圖分析:
在SPSS中,除了生存分析所用的生存曲線圖被整合到Analyze菜單中外,其他的統(tǒng)計(jì)繪圖功能均放置在graph菜單中。該菜單具體分為以下幾部分::
(1)Gallery:相當(dāng)于一個自學(xué)向?qū)В瑢⒔y(tǒng)計(jì)繪圖功能做了簡單的介紹,初學(xué)者可以通過它對SPSS的繪圖能力有一個大致的了解。
(2)Interactive:交互式統(tǒng)計(jì)圖。(3)Map:統(tǒng)計(jì)地圖。
(4)下方的其他菜單項(xiàng)是我們最為常用的普通統(tǒng)計(jì)圖,具體來說有: 條圖 散點(diǎn)圖 線圖 直方圖 餅圖 面積圖 箱式圖
正態(tài)Q-Q圖 正態(tài)P-P圖 質(zhì)量控制圖 Pareto圖
自回歸曲線圖 高低圖 交互相關(guān)圖 序列圖 頻譜圖 誤差線圖
作圖分析簡單易懂,一目了然,我們可根據(jù)需要來選擇我們需要作的圖形,一般來講,我們較常用的有條圖,直方圖,正態(tài)圖,散點(diǎn)圖,餅圖等等,具體操作很簡單,大家可參閱相關(guān)書籍,作圖分析更多情況下是和數(shù)值分析相結(jié)合來對試卷進(jìn)行分析的,這樣的效果更好。
2。數(shù)值分析:
SPSS 數(shù)值統(tǒng)計(jì)分析過程均在Analyze菜單中,包括:
(1)、Reports和Descriptive Statistics:又稱為基本統(tǒng)計(jì)分析。基本統(tǒng)計(jì)分析是進(jìn)行其他更深入的統(tǒng)計(jì)分析的前提,通過基本統(tǒng)計(jì)分析,用戶可以對分析數(shù)據(jù)的總體特征有比較準(zhǔn)確的把握,從而選擇更為深入的分析方法對分析對象進(jìn)行研究。Reports和Descriptive Statistics命令項(xiàng)中包括的功能是對單變量的描述統(tǒng)計(jì)分析。
Descriptive Statistics包括的統(tǒng)計(jì)功能有:
Frequencies(頻數(shù)分析):作用:了解變量的取值分布情況
Descriptives(描述統(tǒng)計(jì)量分析):功能:了解數(shù)據(jù)的基本統(tǒng)計(jì)特征和對指定的變量值進(jìn)行標(biāo)準(zhǔn)化處理
Explore(探索分析):功能:考察數(shù)據(jù)的奇異性和分布特征
Crosstabs(交叉分析):功能:分析事物(變量)之間的相互影響和關(guān)系 Reports包括的統(tǒng)計(jì)功能有:
OLAP Cubes(OLAP報告摘要表):功能: 以分組變量為基礎(chǔ),計(jì)算各組的總計(jì)、均值和其他統(tǒng)計(jì)量。而輸出的報告摘要則是指每個組中所包含的各種變量的統(tǒng)計(jì)信息。
Case Summaries(觀測量列表):察看或打印所需要的變量值 Report Summaries in Row:行形式輸出報告 Report Summaries in Columns:列形式輸出報告
(2)、Compare Means(均值比較與檢驗(yàn)):能否用樣本均值估計(jì)總體均值?兩個變量均值接近的樣本是否來自均值相同的總體?換句話說,兩組樣本某變量均值不同,其差異是否具有統(tǒng)計(jì)意義?能否說明總體差異?這是各種研究工作中經(jīng)常提出的問題。這就要進(jìn)行均值比較。
以下是進(jìn)行均值比較及檢驗(yàn)的過程:
MEANS過程:不同水平下(不同組)的描述統(tǒng)計(jì)量,如男女的平均工資,各工種的平均工資。目的在于比較。術(shù)語:水平數(shù)(指分類變量的值數(shù),如sex變量有2個值,稱為有兩個水平)、單元Cell(指因變量按分類變量值所分的組)、水平組合
T test 過程:對樣本進(jìn)行T檢驗(yàn)的過程
單一樣本的T檢驗(yàn):檢驗(yàn)單個變量的均值是否與給定的常數(shù)之間存在差異。
獨(dú)立樣本的T檢驗(yàn):檢驗(yàn)兩組不相關(guān)的樣本是否來自具有相同均值的總體(均值是否相同,如男女的平均收入是否相同,是否有顯著性差異)
配對T檢驗(yàn):檢驗(yàn)兩組相關(guān)的樣本是否來自具有相同均值的總體(前后比較,如訓(xùn)練效果,治療效果)one-Way ANOVA:一元(單因素)方差分析,用于檢驗(yàn)幾個(三個或三個以上)獨(dú)立的組,是否來自均值相同的總體。
(3)、ANOVA Models(方差分析):方差分析是檢驗(yàn)多組樣本均值間的差異是否具有統(tǒng)計(jì)意義的一種方法。例如:醫(yī)學(xué)界研究幾種藥物對某種疾病的療效;農(nóng)業(yè)研究土壤、肥料、日照時間等因素對某種農(nóng)作物產(chǎn)量的影響;不同飼料對牲畜體重增長的效果等,都可以使用方差分析方法去解決
(4)、Correlate(相關(guān)分析):它是研究變量間密切程度的一種常用統(tǒng)計(jì)方法,常用的相關(guān)分析有以下幾種:
1、線性相關(guān)分析:研究兩個變量間線性關(guān)系的程度。用相關(guān)系數(shù)r來描述。
2、偏相關(guān)分析:它描述的是當(dāng)控制了一個或幾個另外的變量的影響條件下兩個變量間的相關(guān)性,如控制年齡和工作經(jīng)驗(yàn)的影響,估計(jì)工資收入與受教育水平之間的相關(guān)關(guān)系
3、相似性測度:兩個或若干個變量、兩個或兩組觀測量之間的關(guān)系有時也可以用相似性或不相似性來描述。相似性測度用大值表示很相似,而不相似性用距離或不相似性來描述,大值表示相差甚遠(yuǎn)
(5)、Regression(回歸分析):功能:尋求有關(guān)聯(lián)(相關(guān))的變量之間的關(guān)系在回歸過程中包括:Liner:線性回歸;Curve Estimation:曲線估計(jì);Binary Logistic:二分變量邏輯回歸;Multinomial Logistic:多分變量邏輯回歸;Ordinal 序回歸;Probit:概率單位回歸;Nonlinear:非線性回歸;Weight Estimation:加權(quán)估計(jì);2-Stage Least squares:二段最小平方法;Optimal Scaling 最優(yōu)編碼回歸;其中最常用的為前面三個。
(6)、Nonparametric Tests(非參數(shù)檢驗(yàn)):是指在總體不服從正態(tài)分布且分布情況不明時,用來檢驗(yàn)數(shù)據(jù)資料是否來自同一個總體假設(shè)的一類檢驗(yàn)方法。由于這些方法一般不涉及總體參數(shù)故得名。
非參數(shù)檢驗(yàn)的過程有以下幾個: 1。Chi-Square test 卡方檢驗(yàn) 2。Binomial test 二項(xiàng)分布檢驗(yàn) 3。Runs test 游程檢驗(yàn)
4。1-Sample Kolmogorov-Smirnov test 一個樣本柯爾莫哥洛夫-斯米諾夫檢驗(yàn) 5。2 independent Samples Test 兩個獨(dú)立樣本檢驗(yàn) 6。K independent Samples Test K個獨(dú)立樣本檢驗(yàn) 7。2 related Samples Test 兩個相關(guān)樣本檢驗(yàn) 8。K related Samples Test 兩個相關(guān)樣本檢驗(yàn)(7)、Data Reduction(因子分析)(8)、Classify(聚類與判別)等等
以上就是數(shù)值統(tǒng)計(jì)分析Analyze菜單下幾項(xiàng)用于分析的數(shù)值統(tǒng)計(jì)分析方法的簡介,在我們的變量定義以及數(shù)據(jù)錄入完成后,我們就可以根據(jù)我們的需要在以上幾種分析方法中選擇若干種對我們的問卷數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,來得到我們想要的結(jié)果。
第四步:結(jié)果保存
我們的SPSS軟件會把我們統(tǒng)計(jì)分析的多有結(jié)果保存在一個窗口中即結(jié)果輸出窗口(output),由于SPSS軟件支持復(fù)制和粘貼功能,這樣我們就可以把我們想要的結(jié)果復(fù)制﹑粘貼到我們的報告中,當(dāng)然我們也可以在菜單中執(zhí)行file->save來保存我們的結(jié)果,一般情況下,我們建議保存我們的數(shù)據(jù),結(jié)果可不保存。因?yàn)橹灰辛藬?shù)據(jù),如果我們想要結(jié)果的,我們可以隨時利用數(shù)據(jù)得到結(jié)果。
總結(jié):
以上便是SPSS處理問卷的四個步驟,四個步驟結(jié)束后,我們需要SPSS軟件做的工作基本上也就結(jié)束了,接下來的任務(wù)就是寫我們的統(tǒng)計(jì)報告了。值得一提的是。SPSS是一款在社會統(tǒng)計(jì)學(xué)應(yīng)用非常廣泛的統(tǒng)計(jì)類軟件,學(xué)好它將對我們以后的工作學(xué)習(xí)產(chǎn)生很大的意義和作用。
第三篇:實(shí)習(xí)總結(jié)spss
實(shí)習(xí)總結(jié)
這次實(shí)習(xí)使用的是spss17.0版本的軟件,通過這次實(shí)習(xí),我了解到SPSS具有完整的數(shù)據(jù)輸入、編輯、統(tǒng)計(jì)分析、圖形制作等功能。平日課下進(jìn)行統(tǒng)計(jì)調(diào)查技能培訓(xùn)的時候,分析數(shù)據(jù)所用的軟件是Excel。雖然使用Excel可以對數(shù)據(jù)進(jìn)行透視、分類、篩選以及計(jì)算相關(guān)系數(shù)等,但是這些操作都需要自己每一步每一步的進(jìn)行手動操作,而使用SPSS軟件在對數(shù)據(jù)進(jìn)行整理時,只需對軟件某選項(xiàng)內(nèi)設(shè)置變量條件,系統(tǒng)便自動的進(jìn)行整理。通過這次spss實(shí)習(xí),我又入門了一項(xiàng)非常實(shí)用的軟件,會為以后統(tǒng)計(jì)分析提供多一種的選擇。下面我會從以下四方面分別闡述這次實(shí)習(xí)的收獲與總結(jié)。
做問卷調(diào)查
根據(jù)指導(dǎo)老師的安排,我需要獨(dú)自完成6份 《廣東高校在校大學(xué)生消費(fèi)使用數(shù)碼產(chǎn) 品情況》的調(diào)查問卷。去廣工、廣財聽宣講會并且在那里做了兩份問卷調(diào)查,剩下的4份是以電子版的形式做的問卷調(diào)查。在做問卷調(diào)查的過程中,為了保證問卷的有效性和準(zhǔn)確性,我會認(rèn)真審核每一份問卷是否填寫完整以及前后是否合邏輯。在我的六份問卷調(diào)查中,比較容易出現(xiàn)問題的主要在每天使用數(shù)碼產(chǎn)品的時間,也是在做問卷調(diào)查中叮囑最多的。這都是值得的,因?yàn)楸WC問卷的客觀和有效是后面做統(tǒng)計(jì)分析的基礎(chǔ)。這次實(shí)訓(xùn)是全班合作完成問卷,如果是一個人完成30幾份的問卷,那么真是一項(xiàng)不容小覷的任務(wù)。
Spss入門操作
這一部分主要是根據(jù)老師編制的指導(dǎo)書展開。Spss入門操作主要涉及到數(shù)據(jù)的輸入、描述統(tǒng)計(jì)分析、假設(shè)檢驗(yàn)、相關(guān)與回歸分析。針對每一項(xiàng)都有專門的案例以及相應(yīng)的練習(xí)。個人認(rèn)為最難的是假設(shè)檢驗(yàn)這一塊,因?yàn)椤督y(tǒng)計(jì)學(xué)原理》是在之前的學(xué)期學(xué)習(xí)的,統(tǒng)計(jì)分析的原理基本上都記不起來,對于輸出假設(shè)檢驗(yàn)結(jié)果對問題進(jìn)行分析方面問題比較大。我自己也回去看了相應(yīng)的統(tǒng)計(jì)學(xué)原理,有一定的了解后,進(jìn)行實(shí)操也比較順利。假設(shè)檢驗(yàn)主要是
單樣本T檢驗(yàn)、獨(dú)立樣本T檢驗(yàn)、配對樣本T檢驗(yàn)。獨(dú)立樣本與配對樣本的區(qū)分很重要,這決定著我需要進(jìn)行哪種檢驗(yàn)以及得出什么樣的結(jié)論。假設(shè)檢驗(yàn)中通常都需要先進(jìn)行方差齊性的F檢驗(yàn),F(xiàn)值小,相應(yīng)的p值越大,就可以說方差齊性,再進(jìn)行均值差異是否顯著的T檢驗(yàn),T檢驗(yàn)中,相應(yīng)的p值小于顯著性水平,就可以認(rèn)為兩個樣本的均值存在顯著差異。
問卷分析
這部分需要設(shè)置多個變量,輸入至少30份數(shù)據(jù),我選擇跟舍友分工合作,我們的數(shù)據(jù)輸入降低到20份左右,彼此共享一部分?jǐn)?shù)據(jù)合起來達(dá)到30份以上的樣本量。對于問卷的分析,主要從以下三方面進(jìn)行: 大學(xué)生基本情況 運(yùn)用描述性統(tǒng)計(jì)分析對大學(xué)生每月生活費(fèi)支出做頻率分析、計(jì)算均值及離散程度,發(fā)現(xiàn)大學(xué)生的月生活費(fèi)支出主要集中在800—1200范圍。
運(yùn)用交叉表分析得出手機(jī)、電腦這兩種數(shù)碼產(chǎn)品樣本中全部大學(xué)生都擁有,其他數(shù)碼產(chǎn)品的擁有比率各有不同。在這學(xué)期當(dāng)中更換意愿最強(qiáng)的數(shù)碼產(chǎn)品是手機(jī),并且主要是高年級的學(xué)生有更換的打算。
對大學(xué)生月生活費(fèi)支出與月消費(fèi)數(shù)碼產(chǎn)品支出做相關(guān)與回歸分析,發(fā)現(xiàn)這兩個變量存在較為顯著的相關(guān)性,一般情況下,大學(xué)生月生活費(fèi)越高,每月在數(shù)碼產(chǎn)品方面的消費(fèi)相應(yīng)也會越高。
數(shù)碼產(chǎn)品的購買情況
對樣本中大學(xué)生對數(shù)碼產(chǎn)品的了解途徑、購買方式、傾向性選擇、感興趣的促銷手段、能否接受分期付款做頻率分析,就目前來講,大學(xué)生主要通過網(wǎng)絡(luò)了解數(shù)碼產(chǎn)品,傾向于大陸行貨以及港澳臺行貨,對于打折促銷比較感興趣,大部分大學(xué)生還是會選擇實(shí)體店購買較大宗數(shù)碼產(chǎn)品,并且對分期付款方式較為能接受。
對所有在用數(shù)碼產(chǎn)品購買支出、月生活費(fèi)支出以及月消費(fèi)數(shù)碼產(chǎn)品支出做相關(guān)與回歸分析,發(fā)現(xiàn)所有在用數(shù)碼產(chǎn)品購買支出與月消費(fèi)數(shù)碼產(chǎn)品支出存在較強(qiáng)的正相關(guān)性,可以說,月消費(fèi)數(shù)碼產(chǎn)品支出越高,大學(xué)期間夠買數(shù)碼產(chǎn)品總支出越高的可能性就越大。
數(shù)碼產(chǎn)品的使用情況
對樣本中 使用數(shù)碼產(chǎn)品對作息時間的影響、上課玩手機(jī)的頻率、數(shù)碼產(chǎn)品使用時間最長的用途 做描述統(tǒng)計(jì)頻率分析,發(fā)現(xiàn)男生中有更大比例會因?yàn)槭褂脭?shù)碼產(chǎn)品而影響作息時間,數(shù)碼產(chǎn)品使用時間最長的用途占比最大的是娛樂,基本上所有人都會在課堂上使用數(shù)碼產(chǎn)品,經(jīng)常使用的頻率達(dá)到25.8%。
對使用數(shù)碼產(chǎn)品對學(xué)習(xí)的影響利弊進(jìn)行頻率分析,并且對每天花在數(shù)碼產(chǎn)品上的時間、學(xué)生績點(diǎn)做相關(guān)回歸分析,大部分學(xué)生認(rèn)為數(shù)碼產(chǎn)品對學(xué)習(xí)的影響利弊平衡或者利大于弊。相關(guān)性分析顯示,大學(xué)生每天使用數(shù)碼產(chǎn)品的時間與學(xué)生績點(diǎn)相關(guān)性不強(qiáng),兩者之間沒有必然的聯(lián)系。
通過這次實(shí)習(xí),對于spss軟件有了一個基本的認(rèn)識,會對樣本進(jìn)行一些簡單的描述性統(tǒng)計(jì)分析、假設(shè)檢驗(yàn)、相關(guān)與回歸分析,能夠?qū)⒁恍?shù)據(jù)信息轉(zhuǎn)換成可以直觀理解并運(yùn)用的實(shí)用信息,對于以后的學(xué)習(xí)和工作大有好處。數(shù)碼產(chǎn)品帶給我們極大的便利。基于調(diào)查問卷的分析,大學(xué)生每天都會花相當(dāng)一部分時間使用電子產(chǎn)品。學(xué)習(xí)績點(diǎn)與每天使用數(shù)碼產(chǎn)品的時長沒有必然聯(lián)系,不過,的確有一部分同學(xué)承認(rèn)因過度使用數(shù)碼產(chǎn)品影響作息,同時也會在不同程度上受到他人使用數(shù)碼產(chǎn)品的影響。大學(xué)生應(yīng)該學(xué)會合理控制分配使用數(shù)碼產(chǎn)品的時間,讓自己最大程度地受益。
第四篇:個人總結(jié)SPSS
第一章 界面介紹
1、數(shù)據(jù)編輯窗口
2、結(jié)果瀏覽/輸出窗口
3、程序編輯器窗口:語法 編寫
4、腳本編寫窗口
系統(tǒng)參數(shù)設(shè)置 編輯-選項(xiàng)
第二章 數(shù)據(jù)挖掘 省略
OLAP on-line analytical processing 在線分析處理
第三章 數(shù)據(jù)文件、變量與函數(shù)
數(shù)據(jù)的編輯(插入個案、插入變量)
SPSS函數(shù) 即生成新變量
算數(shù)函數(shù)(軟件中的“算術(shù)”)當(dāng)然還包括類似計(jì)算器的簡單加減乘除
統(tǒng)計(jì)函數(shù)(軟件中的“統(tǒng)計(jì)量”)變異系數(shù) 滯后變量 最大值平均值 最小值 缺失數(shù)量 標(biāo)準(zhǔn)差 方差 和累積和
我們發(fā)現(xiàn)主要是橫向比較 對一個“個案”而言 所以函數(shù)式中的括號必須包含至少兩個變量以上
邏輯函數(shù)(軟件中的“檢索”)
Any 判斷
Range(變量名,下限、上限)數(shù)值型變量在下限和上限中為1 true 否則為0
時期和時間函數(shù) 數(shù)值型函數(shù)
定義時間格式(軟件中的“日期創(chuàng)建”)
DMY 日/月/年 括號中(日、月、年)
XDATE.??難點(diǎn)
隨機(jī)變量函數(shù)(軟件中的“隨機(jī)數(shù)字”)
RV.分布名(參數(shù))
缺失值函數(shù)
第四章 預(yù)處理
數(shù)據(jù)編輯、整理幾張?jiān)贒數(shù)據(jù)和T轉(zhuǎn)換兩個菜單
D標(biāo)題欄中 分組、合并、加權(quán)等
橫向/縱向合并 一般是從外部加入 兩者進(jìn)行綜合
第五篇:SPSS學(xué)習(xí)總結(jié)
學(xué)習(xí)SPSS感想
以前學(xué)統(tǒng)計(jì)學(xué)的時候就聽老師講過SPSS有非常強(qiáng)大的統(tǒng)計(jì)功能,對我們學(xué)習(xí)、工作有很大的幫助,所以我一直認(rèn)為SPSS很神秘。通過這個學(xué)期周老師的課讓我對此清楚了許多,也學(xué)到了SPSS強(qiáng)大的統(tǒng)計(jì)功能,更加讓我明白了SPSS與Excel的區(qū)別。
SPSS是“社會科學(xué)統(tǒng)計(jì)軟件包”(Statistical Package for the Social Science)的簡稱,是一種集成化的計(jì)算機(jī)數(shù)據(jù)處理應(yīng)用軟件。1968年,美國斯坦福大學(xué)H.Nie等三位大學(xué)生開發(fā)了最早的SPSS統(tǒng)計(jì)軟件,并于1975年在芝加哥成立了SPSS公司,已有30余年的成長歷史,全球約有25萬家產(chǎn)品用戶,廣泛分布于通訊、醫(yī)療、銀行、證券、保險、制造、商業(yè)、市場研究、科研、教育等多個領(lǐng)域和行業(yè)。SPSS是世界上公認(rèn)的三大數(shù)據(jù)分析軟件之一(SAS、SPSS和SYSTAT)。
在學(xué)習(xí)SPSS期間,我主要遇到的問題是后面幾章,SPSS的參數(shù)檢驗(yàn)、方差分析、相關(guān)分析、線性回歸分析、聚類分析、因子分析等。
在參數(shù)檢驗(yàn)中我不知道原假設(shè)是什么,導(dǎo)致分析的時候不知道該拒絕原假設(shè)還是接受原假設(shè),不能分析出統(tǒng)計(jì)結(jié)果。不會區(qū)分單樣本t檢驗(yàn)和兩配對樣本t檢驗(yàn)的區(qū)別,現(xiàn)在懂得了它們都要服從正態(tài)分布,基本思想是小概率反證法,反證法思想是先提出假設(shè)(檢驗(yàn)假設(shè)H0),再用適當(dāng)?shù)慕y(tǒng)計(jì)方法確定假設(shè)成立的可能性大小,如果可能性小,則認(rèn)為假設(shè)不成立,否則,還不能認(rèn)為假設(shè)不成立。
在學(xué)習(xí)方差分析中,開始常常把觀測變量和控制變量弄混淆,在分析的時候應(yīng)分別送入哪個對應(yīng)框中,如果反了的話會導(dǎo)致結(jié)果的不準(zhǔn)確。其次,對LSD、Bonferroni、Tukey、Scheffe等方法的使用不清楚,現(xiàn)在基本掌握了多重比較方法選擇:一般如果存在明確的對照組,要進(jìn)行的是驗(yàn)證性研究,即計(jì)劃好的某兩個或幾個組間(和對照組)的比較。宜用Bonferroni(LSD)法;若需要進(jìn)行多個均數(shù)間的兩兩比較,且各組個案數(shù)相等,適宜用Tukey法;其他情況宜用Scheffe法。最后,對方差齊性檢驗(yàn)、多重比較檢驗(yàn)、趨勢檢驗(yàn)理解不夠透徹,在方差檢驗(yàn)中,Post Hoc鍵有LSD的選項(xiàng):當(dāng)方差分析F檢驗(yàn)否定了原假設(shè),即認(rèn)為至少有兩個總體的均值存在顯著性差異時,須進(jìn)一步確定是哪兩個或哪幾個均值顯著地不同,則需要進(jìn)行多重比較來檢驗(yàn)。LSD即是一種多因變量的三個或三個以上水平下均值之間進(jìn)行的兩兩比較檢驗(yàn)。
在學(xué)習(xí)相關(guān)分析的過程中,在繪制散點(diǎn)圖時,不知道哪個該做橫坐標(biāo),哪個該做縱坐標(biāo),明白了橫坐標(biāo)是解釋變量,縱坐標(biāo)是被解釋變量,還有對相關(guān)系數(shù)的種類分析不熟練等。在學(xué)習(xí)回歸分析的過程中,對DW可檢驗(yàn)的含義不理解,不記得對應(yīng)的DW表示的殘差序列的相關(guān)性。對解釋變量向前篩選、向后篩選、逐步帥選策略不能熟練掌握,特別是對向前向后篩選時到處的結(jié)果不會進(jìn)行分析。
學(xué)習(xí)聚類分析中,變量的選擇分不清,無關(guān)變量有時會引起嚴(yán)重的錯分,應(yīng)當(dāng)只引入在不同類間有顯著差別的變量,盡量只使用相同類型的變量進(jìn)行分析。分類數(shù)不明確,從實(shí)用角度講,2~8 類比較合適。掌握了K-means Cluster 分析,樣本量大于100時有必要考慮,只能使用連續(xù)性變量。
學(xué)習(xí)因子分析的過程中,對提取出來的因子的實(shí)際含義不清晰,不能使因子具有命名解釋性。
學(xué)習(xí)了SPSS后,我不禁想到了SPSS與Excel的區(qū)別,這一點(diǎn)是針對像我這樣開始只懂得用EXCEL的人來說。從個人的體會來說,二種軟件有一定相似,操作都簡便,同時又有一些可以互補(bǔ)的地方。但是SPSS又比Excel更加強(qiáng)大:
一、圖型的表現(xiàn)力是SPSS的主要優(yōu)點(diǎn)之一
應(yīng)該說,Excel的圖型表現(xiàn)主要是簡便,對許多的人來說基本夠用,但對于科學(xué)的表現(xiàn),SPSS就更為詳細(xì)和準(zhǔn)確,這一點(diǎn)據(jù)說在所有統(tǒng)計(jì)軟件中都突出。
二、通過SPSS檢驗(yàn)方差齊性和數(shù)據(jù)分布
假設(shè)檢驗(yàn)中,采用的t檢驗(yàn)和方差檢驗(yàn)都需要滿足二個要求,即
1.樣本方差齊性
2.樣本總體呈正態(tài)分布
在Excel中,提供了F檢驗(yàn)來檢驗(yàn)方差齊性問題,也就是可以先通過F檢驗(yàn)確定方差齊性與否來選擇下一步用哪個T檢驗(yàn)或方差檢驗(yàn)分析工具。但只要數(shù)據(jù)多于二組則無從下手;通過描述統(tǒng)計(jì)大約能從峰度和偏度來了解樣本的分布實(shí)際工作中,只要分布單峰且近似對稱分布,也可應(yīng)用,但要具體確定樣本的分布也有難度。這二個問題在SPSS就可以解決
最后,在感嘆它的方便與快捷的同時,對軟件開發(fā)人員的智慧到了肅然起敬的地步。一直覺得計(jì)算機(jī)語言是最難的一門外語。雖然本科時曾經(jīng)對這種邏輯性很強(qiáng)的東西很感興趣,并在編程課上取得不錯的成績,但一直覺得這似乎不是我能掌控的東西。SPSS的神奇之處在于,它省去了使用者巨大的計(jì)算量,并提高準(zhǔn)確性。它開發(fā)了開發(fā)者的智慧,卻弱化了使用者的大腦。