久久99精品久久久久久琪琪,久久人人爽人人爽人人片亞洲,熟妇人妻无码中文字幕,亚洲精品无码久久久久久久

spss統計分析實習心得3篇(精選5篇)

時間:2019-05-12 08:11:17下載本文作者:會員上傳
簡介:寫寫幫文庫小編為你整理了多篇相關的《spss統計分析實習心得3篇》,但愿對你工作學習有幫助,當然你在寫寫幫文庫還可以找到更多《spss統計分析實習心得3篇》。

第一篇:spss統計分析實習心得3篇

spss統計分析實習心得3篇

五天的SPSS軟件實訓終于結束了,雖然實訓過程充滿了酸甜苦辣,但實訓結果卻是甜的。看著小組的課題報告,心里有種說不出來的感觸。高老師在對統計理論及 SPSS 軟件功能模塊的講解的同時更側重于統計分析在各項工作中的實際應用,使我們不僅掌握 SPSS 軟件及技術原理而且學會運用統計方法解決工作和學習中的實際問題這個實訓。我真真正正學到了不少知識,另外,也提高了自己分析問題解決問題的能力。

小組中每個人完成不同的任務,我的任務是用獨立樣本T檢驗的方法分析市、縣及縣以下的分類對社會消費品零售總額的影響,分析方差,均值,P值,顯著性如何并進行T檢驗,得出結論報告。結果中比較有用的值為差值變量的均值Mean和Sig顯著性在初級統計中,通常都要求所分析的數據呈現正態分布。通過對spss軟件對數據的實踐處理,我感覺顯著性檢驗問題還是比較簡單的,但對具體數據分析的目的性,實用性以及自己在做研究時如何使用,還有待進一步實踐和提高。

SPSS 有具體的使用者要求的分析深度,同時是一個可視化的工具,使我們非常容易使用,這樣我們可以自己對結果進行檢查。電算化老師曾經說過,學習軟件其實只是學習軟件的操作流程,而要真正掌握整個軟件,就得自己摸索探究,真真正正弄懂它,還要下一定的功夫的。我也深刻體會到了這點。前幾次實訓都是關于會計實驗的,雖然時間安排比此次實訓緊,任務量大,但實訓結束后,基本的試訓內容都完全掌握。而這次實訓,雖然時間安排較為輕松,內容也不多,操作起來也有一定的難度,另外受外界因素的影響,根本就聽不見看不見老師講的,即便后來老師一講就去前面,由于沒有條件跟著操作,導致一部分內容總是不熟練,請教同學他們也不會,不過,問題也總會用解決的辦法。經過我堅持不懈的努力,在本次實訓結束之前,我終于彌補了自己不熟練的那部分內容。

學習SPSS軟件,對于我們這些將來要時刻與數據打交道的人是有很大的幫助的,它主要的是運用SPSS軟件結合所學統計知識對數據進行需要的處理,相對于EXCEL處理,SPSS軟件處理不僅效率高,而且操作簡單。我個人覺得,SPSS軟件是一門專業性較強的課程,對于我們財務管理專業的學生是一門必備的課程,也是一門必須熟練掌握的課程,很慶幸,我是抱著將來要學習運用SPSS軟件進行此次實訓的。這次實訓,使我對統計工作的過程和 SPSS應用的流程取得一定的感性認識,拓展了視野,鞏固所學理論知識,提高了分析問題、解決問題的能力,也增強了我的職業意識、勞動觀點以及適應社會的能力,最重要的是它使我獲得了思想和課題分析處理上的雙豐收。

在SPSS學習中,我對它的認識由淺入深,循序漸進,在實踐中遇到的各種問題也能逐個攻克。學習這種在日常工作中有價值的分析方法,會使我們更能輕易應付日后的社會的信息工作;掌握這種高級的技能,對我們工作就業也提供了競爭優勢.但是,軟件的學習并不是一蹴而就的,在這個科技高速發達和知識不斷更新的時代,我們應該不斷學習不斷更新自己的知識體系,爭取做一名國家所需要的優秀的統計者。

本學期一周的SPSS軟件實訓結束了,我感觸很深,因為本次實訓過程是在共同努力下完成的。實訓結果是可喜的。老師在對統計理論及 SPSS 軟件功能模塊的講解的同時更側重于統計分析在各項工作中的實際應用,使我們不僅掌握 SPSS 軟件及技術原理而且學會運用統計方法解決工作和學習中的實際問題這個實訓。我真真正正學到了不少統計知識,另外,也提高了自己分析問題和解決問題的能力。

SPSS 軟件有具體的使用者要求的分析深度,同時是一個可視化的工具,使我們非常容易使用,這樣我們可以自己對結果進行檢查。我記得老師曾經說過,學習軟件其實只是學習軟件的操作流程,而要真正掌握整個軟件,就得自己摸索探究,真真正正弄懂它,還要下一定的功夫的。我也深刻體會到了這點。這次實訓,雖然時間安排較為輕松,內容也不多,操作起來也有一定的難度,一部分內容總是不熟練,請教同學他們也不會,不過,問題也總會用解決的辦法。經過我堅持不懈的努力,在本次實訓結束之前,我終于彌補了不熟練的那部分內容。

在SPSS學習中,我對它的認識由淺入深,循序漸進,在實踐中遇到的各種問題也能逐個攻克。學習這種在日常工作中有價值的分析方法,會使我們更能輕易應付日后的社會的信息工作,掌握這種高級的技能,對我們工作就業也提供了競爭優勢。

學習SPSS軟件,對于我們這些將來要時刻與數據打交道的人是有很大的幫助的,它主要的是運用SPSS軟件結合所學統計知識對數據進行需要的處理,相對于EXCEL處理,SPSS軟件處理不僅效率高,而且操作簡單。

我個人覺得,SPSS軟件是一門專業性較強的課程,對于我們國際經濟與貿易專業的學生是一門必備的課程,也是一門必須熟練掌握的課程,我是很喜歡本次的SPSS軟件實訓的。這次實訓,使我對統計工作的過程和 SPSS應用的流程取得一定的感性認識,拓展了視野,鞏固所學理論知識,提高了分析問題、解決問題的能力,也增強了我的職業意識、勞動觀點以及適應社會的能力,最重要的是它使我獲得了思想和課題分析處理上的雙豐收。但是,軟件的學習并不是一蹴而就的,在這個科技高速發達和知識不斷更新的時代,我們應該不斷學習不斷更新自己的知識體系。最后,要感謝老師的認真指導。

通過本次的教學實習,使我們對統計工作有了一個初步的認識,以及統計軟件在

統計工作中應用的重要性和方便性,認識實習的目的認識實習的目的就在于讓同學們初步了解企業的基本情況,了解信息收集,處理過程加強感性認識,為以后專業理論課程的學習特別是畢業設計奠定必要的實踐基礎。就是要我們把所學的知識運用到實踐中。學習了統計學軟件SPSS,有力的將理論知識與實踐聯系在一起,并且進一步掌握了理論知識;其次,通過老師對普查與政府統計機構的講解,使我對統計的了解更加深刻。這次認識實習可以說是理論與實踐的聯系,校園與社會的聯系,使我了解社會統計工作的輪廓,使我對統計在現實中的運作有所了解,也對統計也有了進一步的掌握。使同學們對統計工作的過程和 SPSS應用的流程取得一定的感性認識,拓展了視野,鞏固所學理論知識,提高了分析問題、解決問題的能力,增強了學生職業意識、勞動觀點以及適應社會的能力,使學生獲得業務和思想雙豐收。

現在我將近期的實習的過程感受匯總如下:SPSS 有具體的使用者要求的分析深度,同時是一個可視化的工具,使我們非常容易使用,這樣我們可以自己對結果進行檢查。我覺得我們可以在全校范圍內把 SPSS 作為數據分析工具進行推廣,向學生提供日常工作需要的有價值的分析技術。如果我們能夠掌握這種高級技術,畢業后就能夠輕易地應付來信息社會和商業世界的挑戰。在這次短學期實習中,我第一次接觸到了統計分析軟件spss,并對其進行了基本的學習。

首先,我們學習了數據編輯窗口的幾個部分:窗口主菜單、工具欄、數據編輯區、系統狀態顯示區等,并先后學習了這幾個部分的操作步驟及計算出的數據所表示的意義。通過學習,我深刻的體會到要想學會一套軟件的操作,遠沒有我想象的那么容易,尤其是這套spss統計軟件。學習軟件的基本操作相對來講是容易的,但要理解每一個步驟的意義及每一組所計算出來的數據的代表內容,就要付出更多的精力和時間。在學習過程中,細心和耐心是很必要的。在某些操作中,比如說spss線形回歸的操作步驟,只要稍微馬虎一些,就會弄錯,導致操作結果錯誤。通過這次在實驗室的認識實習,我們不僅對spss這套統計軟件有了初步的認識,而且掌握了一些基本的spss的操作,但更重要的是,我學會了如何去學習一種操作軟件,如何去理解統計學這門學科。

近兩周的短學期實習,使我對統計學有了更深刻的理解,并且更加深刻的體會到了一位統計工作人員所必備的嚴謹的態度和一絲不茍的精神。正所謂實踐出真知,通過實踐,我發現自己在課堂上所掌握的理論知識還很不扎實,專業英語也不是很過關。在應用軟件分析出的數據中,有很多都不知道是什么意思,還有的數據概念模糊,這都是在今后的學習中需要改進和加強的。我想,這對我今后的學習是有何大幫助的。總之,這次的短學期學習給我們很大的感觸,對今后的學習還是將來的工作都有了一定的幫助,統計是一門理論性很強的課程,要求我們一定要統計知識的重要性,才能在將來做一名合格的統計工作者,為國家奉賢。

第二篇:SPSS統計分析案例

一、事件

近日,教育部考試中心主任戴家干透露,今年高考的全國報名人數為946萬余人,比2009年1020萬的考生數減少74萬人。950萬人,1010萬人,1050萬人,1020萬人,956萬人??數據顯示,近5年來,前3年全國高考人數一直在攀升。2006年首次突破千萬大關,2008年則達到頂峰--1050萬人。去年高考人數急轉直下,比上一減少30萬人,而今年更是減少74萬人,是5年來人數減少最多的年份。

戴家干表示,高考報名人數的減少,主要原因是因為我國按毛入學率計算的適齡入學人口數量在逐年下降。

大約在去年這個時候,教育部也透露了高考報名人數,隨即在全國范圍內,引爆了一條消息——應屆高中畢業生84萬棄考。這引發了持續較長時間的討論與關注,或云大學生就業難嚇跑考生,或說中國大學教育質量不高難敵國外大學競爭。今年,我很想再看教育部公布的數據,得到棄考人數消息,以作分析(一年的情況往往并不能說明問題,需多年情況),但遺憾的是,教育部卻沒有公布。

戴主任把報名人數減少歸因于適齡人口減少,可我怎么計算,也只能得到這只是其中一方面原因。根據教育部公布的報名數,今年的考生數比去年減少74萬,而再看應屆畢業生數,今年(803萬)比去年(834萬)減少31萬,兩者相差43萬。這43萬從何而來?

二、數據統計理論

這些數據采用了統計學中普查的方式,對象為全國參加高考的學生。

為了一定的目的而對考查對象進行的全面調查,稱為普查。

普查,統計調查的組織形式之一。對統計總體的全部單位進行調查以搜集統計資料的工作。普查資料常被用來說明現象在一定時點上的全面情況。如高考人數調查就是對全國報考參加高考的學生一一進行調查統計,通常一年一次,規定某個特定時點(某年某月某日某時)作為全國統一的統計時點,以反映高考人數的自然和社會的各類特征。

普查的幾個特點:

1.需要規定統一的標準時間(上例為2010年高考報名截止日)

2.通常是一次性或周期性的(上例為一年一次)

3.數據的規范化程度較高

4.普查適用的對象比較狹窄,只能調查一些最基本、最一般的現象。組織普查工作必須遵循的原則:

1.必須統一規定調查資料所屬的標準時點。

2.正確確定調查期限、選擇登記時間。為了提高資料的準確性,一般應選擇在調查對象變動較小和登記、填報較為方便的時間,并盡可能在各普查地區同時進行,力求最短時間完成;

3.規定統一的調查項目和計量單位。同種普查,各次基本項目應力求—致,以便歷次普查資料的匯總和對比;

4.普查盡可能按一定周期進行,以便于研究現象的發展趨勢及其規律性。

三、事件評析

以上事件只可能有兩種解釋,一是棄考人數增加,二是復讀生人數減少。這兩個數據,在教育部的賬本里都有的,教育部為何不公布,只會引起輿論更多的揣測。比如,有人就推測今年的棄考數可能遠高于去年的84萬,理由是,如果是復讀生在全國范圍內大幅減少,教育部定會公布復讀生減少消息,因為,這幾年來,教育部一直在治理高復班,2008年當有媒體報道高考報名考生中復讀生比例高達三分之一時,教育部有關官員還曾“辟謠”說復讀生只占到15%。而去年教育部公布高考報名數,卻泄露天機,當年的復讀生達到270萬,占到1020萬高考考生的26%。假使那另外減少的43萬,主要來自高復班學生減少,那么,教育部是可以“驕傲”地宣布高復學生減少近兩成的。現在教育部沒有公布這一數據,極有可能的原因是棄考的應屆畢業生進一步增加,或超過百萬。而這勢必會引起媒體進一步關注。質疑大學生就業難、中國大學教育質量的聲音會鋪天蓋地。教育部由此就把數據藏起來。

當然,這些都是“揣測”。我想說的是,引起這樣的揣測,是教育部門的失職,而且,教育部門的做法,也違背《信息公開條例》。全民關注的高考報名數據,既非國家機密,也非商業秘密,應該向社會公開,而且公開之后有助于分

析教育發展中存在的問題,同時以便考生選擇教育、選擇學校——針對棄考增多,需進一步研究棄考的原因,是就業難,還是學費貴,抑或是選擇境外高校,不同的原因反映出我國教育的不同問題;針對復讀減少,需分析哪種原因,是平行志愿減少高分落榜可能由此減少復讀需求,還是實行新課改新高考增加復讀難度不再復讀,還是公辦高中禁辦復讀班增加復讀開支。這不同的原因可檢驗不同教育政策的實施效果。

教育的發展,離不開研究。教育部門公開教育信息,不僅是本身職責使然,也是進行科學的教育決策的要求。把高考報名數據打悶包,用“適齡入學人口數量減少”歸納報名人數下降主因,這不是科學、負責的教育發展態度。這只能掩蓋教育的問題,更可能釀成教育發展的危機——需要提醒的是,假如高復學生大幅減少,適齡學生數也大幅減少,高考招生人數將大于應屆畢業生報考人數的局面,在不久的將來馬上出現。以今年應屆畢業生803萬,棄考規模與去年持平(84萬)計算,應屆高考畢業生報考數為719萬,高復學生則為227萬,應屆畢業生報考數只比高考招生數657萬多62萬(如果棄考學生增多達到100萬,這一數據則為46萬)。我國高校需要立即著手應對即將到來的嚴重的生源危機。

從上述事件可以看出,正確運用統計學原理就能分析事物的本質,抓住問題的關鍵,才能做到未雨綢繆,防范于未然。

第三篇:統計分析與SPSS的應用實習報告

廣東海洋大學

統計分析與SPSS的應用實習報告

學院(系)專業名稱 使用班級 實習地點 起止時間

姓名:班級:

學號:

統計分析與SPSS的應用實習報告

學院(系)

學生姓名

學號 專業實習地點 班級

實習要求:

1、掌握SPSS 軟件使用基礎;

2、熟練使用 SPSS 進行描述統計、頻數分析;

3、使用SPSS進行參數估計,假設檢驗;

4、使用SPSS進行方差分析;

5、使用SPSS進行相關分析——包括相關圖和相關系數;

6、使用SPSS進行一般的回歸分析——理解模型的選定、估計、系數及方程的顯著性檢驗、簡單的殘差分析、預測。

實習目的:

本課程從加強基礎、培養學生動手能力、提高素質的教學目標出發,建立一個科學的、合理的統計分析與SPSS的應用這一實驗教學課程體系。使學生通過本課程實驗教學,不只是加深理解和鞏固所學理論知識,而且更能切實掌握各種統計分析方法在統計軟件SPSS中的實現,并能正確解釋SPSS的運行結果。在實驗教學中,同時加強對學生進行科學素質和良好的實驗室工作習慣的訓練,培養學生的時間意識,為培養具有創新精神和實踐能力的高素質人才奠定良好的基礎。

實習時間:

實習地點:

實習內容:(對實習過程的描述)

實習體會:

成績指導教師

日期 第頁,共頁注:請用A4紙書寫,不夠另附紙。

※ 打印時刪除后面的內容

實習報告撰寫的要求

(一)實習報告內容組成:實習報告應包括題目和正文兩方面內容。

(二)實習報告撰寫內容要求

1、題目:實習報告題目應該簡短、明確、有概括性;字數要適當。如有特殊要求,可

加注副標題。

2、正文:正文一般包括序言、實習內容與過程、實習心得體會與收獲幾部分組成。

(三)實習報告撰寫規范

1、實習報告按規定要求,用計算機打印。漢字必須使用國家公布的規范字。紙張選用A4。

2、使用計算機完成實習報告,必須按照如下統一格式打印:(1)封頁內容一律按照統一封面的樣張式樣打印,必須正確無誤。(2)題目和標題:①實習報告題目為3號黑體字,可以分為1或2行居中打印。②題目下空二行為實習報告正文。(3)標題:一級標題以三號字黑體居中打印;副標題以四號黑體左起空二格打印。(4)正文:采用小四號宋體字打印。

(四)實習報告的裝訂:實習報告必須按規定的要求進行裝訂,裝訂順序為:第一頁:封面,第二頁:題目、正文

第四篇:spss 17中文版統計分析典型實例精粹

第3章 SPSS基礎統計描述

SPSS基礎統計描述是進行統計分析的基礎和前提。使用一些數學統計量來直觀地描述原始數據的集中程度、離散狀況和分布情況,之后就可以對數據的總體特征進行較為準確的歸納,從而便于選擇合適的統計分析方法。基礎統計描述主要包括數據描述、頻數分析、探索分析、交叉列聯表分析、P-P圖、Q-Q圖等,下面將具體介紹。

3.1 數理統計量概述

SPSS在描述性統計分析中,提供了多個統計量來描述數據特征,這些統計量包括均值、中位數、眾數、方差、標準差、四分位數、十分位數、百分位數、峰度系數、偏度系數等。在進行描述性統計分析之前,首先要對這些統計量在統計學上的定義及其計算公式有所了解。

3.1.1 均值(Mean)和均值標準誤差(S.E.Mean)

均值(平均數、平均值)表示的是某個變量所有取值的集中趨勢或平均水平。例如,某班學生數學考試的平均成績、公司員工的平均收入、某年級學生的平均身高、某高校高招錄取平均分等。

平均數有總體平均數和樣本平均數之分。

總體平均數:若一組數據X1,X2,……,XN代表一個大小為N的有限總體,則其總體平均數為:

樣本平均數:若一組數據x1,x2,……,xn代表一個大小為n的有限樣本,則其樣本平均數為: 樣本數據是從總體數據中抽取出來的,但在不同次抽樣中得到的樣本是不同的。雖然在一定程度上,樣本數據可以反映總體數據的特征,但由于抽樣等原因,樣本數據是總體數據的隨機變量。同樣,雖然樣本均值可以反映總體數據的特征,但在不同次抽樣中所得的樣本均值是不同的,并且它們與總體均值間存在差異。

均值標準誤差(Standard Error of Mean,S.E.Mean,簡稱標準誤)就是描述這些樣本均值與總體均值之間平均差異程度的統計量。

3.1.2 中位數(Median)

中位數是將總體數據的各個數值按大小順序排列,居于中間位置的變量,用Median表示。中位數將所有的數據等分成兩半,中位數兩端的數據個數相同,因此它也被稱為二分位數。中位數的確定,僅僅取決于它在數列中的位置,不受極端值的影響,因此可以用它表示總體的一般水平。同時,中位數比算術平均數具有更好的穩定性。

一個大小為N的數列,要求其中位數,首先應把該數列按大小順序排列,如果N為奇數,那么該數列的中位數就是 位置上的數;如果N為偶數,中位數則是該數列中第 與第 位置上的兩個數值的平均數。3.1.3 眾數(Mode)

眾數是指總體數據中出現次數最多的變量,用Mode表示。它同樣不受數據極端值的影響,從而在一定程度上提高了平均水平的代表性。例如,制衣廠可以根據消費者所需服裝尺碼的眾數來安排生產。此外,如果眾數的值出現的頻數或頻率較大,那么說明眾數的代表性就越高,數列的集中趨勢也就越顯著。

確定眾數沒有明確的公式,一般只能用手工統計,故較為煩瑣。SPSS所提供的統計功能可以減少諸如此類煩瑣的過程。

眾數、中位數與算術平均數之間存在一定的關系,這種關系決定于總體分布的狀況。當總體分布呈對稱的鐘形分布時,算術平均數位于分布曲線的對稱點上,而該點又是曲線的最高點和中心點,因此,眾數、中位數和算術平均數三者相等。當總體分布呈非對稱的鐘形分布時,由于這三種平均數受極端數值影響程度的不同,因而它們的數值就存在一定的差別,但三者之間仍有一定的關系。當分布右偏時,算術平均數受偏高數值影響較大,其位置必然在眾數之右,中位數在眾數與算術平均數之間。反之,當次數分布左偏時,算術平均數受偏小數值的影響較大,其位置在眾數之左,中位數仍在眾數與算術平均數之間。以上的均值、中位數和眾數都是反映數據集中趨勢的統計量。3.1.4 全距(Range)

全距,又稱極差,是數據的最大值(Maximum)與最小值(Minimum)之間的絕對差,借以表明總體標志值最大可能的差異范圍。全距越長,說明數據越離散;反之,全距越小,說明數據越集中。

用符號表示全距的計算公式為:

全距的缺點在于其方法過于粗略,因為它只考慮總體兩端數值的差異,沒有考慮中間數值差異的情況,因而它是測定離散程度的一種粗略的方法,不能全面反映總體數據的差異程度。要充分利用每一個數據的信息,就需要利用方差和標準差。

3.1.5 方差(Variance)和標準差(Standard Deviation)

方差是總體所有變量值與其算術平均數偏差平方的平均值,它表示了一組數據分布的離散程度的平均值。標準差是方差的平方根,它表示了一組數據關于平均數的平均離散程度。

其中,為總體平均數,為樣本平均數,N為總體的個數,n為樣本的個數。雖然標準差有計量單位,而方差無計量單位,但兩者的作用一樣,故在此僅介紹標準差。標準差用平方的方法消除了正負號,因而它是最常用、最重要的離散趨勢統計量。標準差越大,表示變量值之間的差異越大,各數據距離均值越遠,則平均數的代表性就越低。反之,標準差越小,表示變量值之間的差異越小,各數據距離均值較近,則平均數的代表性就越高。

標準差在實際生活中也有廣泛的應用。例如,可以用標準差來測定居民收入分配的差異程度,還可以用來反映平均收支、平均結余、平均產量等經濟變量的代表性等。

全距、方差和標準差都是反映數據離散趨勢的統計量。3.1.6 峰度(Kurtosis)和偏度(Skewness)

峰度是描述總體中所有取值分布形態陡緩程度的統計量。這個統計量需要與正態分布相比較,峰度為0表示該總體數據分布與正態分布的陡緩程度相同;峰度大于0表示該總體數據分布與正態分布相比較為陡峭,為尖頂峰;峰度小于0表示該總體數據分布與正態分布相比較為平坦,為平頂峰。峰度的絕對值數值越大表示其分布形態的陡緩程度與正態分布的差異程度越大。

峰度的具體計算公式為:

偏度與峰度類似,它也是描述數據分布形態的統計量,其描述的是某總體取值分布的對稱性。這個統計量同樣需要與正態分布相比較,偏度為0表示其數據分布形態與正態分布的偏斜程度相同;偏度大于0表示其數據分布形態與正態分布相比為正偏或右偏,即有一條長尾巴拖在右邊,數據右端有較多的極端值;偏度小于0表示其數據分布形態與正態分布相比為負偏或左偏,即有一條長尾拖在左邊,數據左端有較多的極端值。偏度的絕對值數值越大表示其分布形態的偏斜程度越大。

偏度的具體計算公式為:

3.1.7 四分位數(Quartiles)、十分位數(Deciles)和百分位數(Percentiles)四分位數是將一組數據由小到大(或由大到小)排序后,用3個點將全部數據分為4等份,與這3個點位置上相對應的數值稱為四分位數,分別記為Q1(第一四分位數)、Q2(第二四分位數,即中位數)、Q3(第三四分位數)。其中,Q3到Q1之間的距離的一半又稱為四分位差,記為Q。四分位差越小,說明中間部分的數據越集中;四分位數越大,則意味著中間部分的數據越分散。

與四分位數類似,十分位數是將一組數據由小到大(或由大到小)排序后,用9個點將全部數據分為10等份,與這9個點位置上相對應的數值稱為十分位數,分別記為D1,D2,……,D9,表示10%的數據落在D1下,20%的數據落在D2下,……,90%的數據落在D9下。

同理,百分位數是將一組數據由小到大(或由大到小)排序后分割為100等份,與99個分割點位置上相對應的數值稱為百分位數,分別記為P1,P2,……,P99,表示1%的數據落在P1下,2%的數據落在P2下,……,99%的數據落在P99下。

通過四分位數、十分位數和百分位數,可以大體看出總體數據在哪個區間內更為集中,也就是說,它們在一定程度上可以反映數據的分布情況。

上面的峰度系數、偏度系數和四分位數、十分位數、百分位數,都是反映數據分布狀況的統計量。3.2 數據描述

描述性統計分析是對數據進行基礎性的描述。通過得出的數據的平均值(Mean)、和(Sum)、標準差(Std deviation)、最大值(Max)、最小值(Min)、方差(Variance)、全距(Range)、均值標準誤差(S.E.Mean)、峰度(Kurtosis)、偏度(Skewness)等統計量,來估計原始數據的集中程度、離散狀況和分布情況。

數據描述功能的操作步驟如下:

打開【分析】(Analyze)菜單,選擇【描述統計】(Descriptive Statistics)命令下的【描述】(Descriptives)命令,如圖3-1所示。

這里,需要提醒的是如果數據文件尚未打開,【分析】(Analyze)菜單下的任一功能都不能使用,SPSS會彈出一個對話框,如圖3-2所示,提醒用戶打開文件。打開文件后,【分析】(Analyze)菜單下的統計功能才能正常使用。選擇【描述】(Descriptives)命令后,SPSS將打開“描述性”(Descriptives)對話框,如圖3-3所示。在該主對話框中,用戶可以通過單擊 按鈕從左邊原變量中選擇一個或者幾個變量進入右邊的“變量”(Variable(s))列表框中。

對話框底部有一個“將標準化得分另存為變量”(Save standardized values as variables)復選框,選擇該項,將對“變量”(Variable(s))列表框中被選中變量的數據進行標準化,然后將標準化的結果保存到新變量中。新變量的變量名為原變量的變量名前面添加字母“z”,并被添加在數據編輯窗口中變量的最后一列。

數據標準化的計算公式為:

通過標準化,可以將均值為、標準差為 的原變量轉化成均值為0、標準差為1的新變量。

“描述性”(Descriptives)主對話框的下端有5個按鈕,如果還未將左邊原變量中的變量添加至“變量”(Variable(s))列表框中,則【確定】(OK)和【粘貼】(Paste)按鈕為灰白顯示,不可單擊,但【重置】(Reset)、【取消】(Cancel)和【幫助】(Help)按鈕可以單擊。通過單擊【重置】(Reset)按鈕,用戶可以將已進入右框的變量全部轉移至左框的變量列表中,重新進行選擇。

單擊【選項】(Options)按鈕,將打開“描述:選項”(Descriptives:Options)對話框,如圖3-4所示。在該對話框中,用戶可以選擇所要統計的統計量和圖表輸出方式。具體對話框中各選項的意義如下:

(1)在對話框中最上面一行是均值(Mean)和合計(Sum)。

(2)離散(Dispersion)欄中的統計量包括:

標準差(Std Deviation)最小值(Minimum)

方差(Variance)最大值(Maximum)

范圍(極差)(Range)均值的標準誤(S.E.Mean)

(3)分布(Distribution)欄中的統計量包括:

峰度(Kurtosis)偏度(Skewness)

(4)顯示順序(Display Order)欄中,用戶可以自行選擇輸出變量的排序方式,包括: 變量列表(Variable List):在結果輸出窗口中,用戶選擇輸出的變量將按照變量在數據編輯窗口中原來的排列順序進行排列。

字母順序(Alphabetic):在結果輸出窗口中,用戶選擇輸出的變量將按照變量名的字母排列順序進行排列。

按均值的升序排序(Ascending Means):SPSS將計算每個輸出變量的平均值,并按照平均值從小到大對輸出變量的順序進行排列。

按均值的降序排序(Descending Means):SPSS將計算每個輸出變量的平均值,并按照平均值從大到小對輸出變量的順序進行排列。

用戶可在“選項”(Options)對話框第一行、離散(Dispersion)欄和分布(Distribution)欄中,選中所需統計的統計量(可多項選擇)。SPSS默認的描述統計量包括均值、標準差、最小值、最大值。在“顯示順序”(Display Order)一欄里,用戶只可選擇一種變量排序方式,SPSS的默認選項為“變量列表”(Variable List)。

進行選擇后,單擊【繼續】(Continue)按鈕,即可返回“描述性”(Descriptives)主對話框。

單擊【確定】(OK)按鈕,即可在結果輸出窗口中得到描述性統計分析結果輸出表格。

3.3 頻數分析

對于一組數據,考察不同的數值出現的頻數,或者是數據落入指定區域內的頻數,可以了解數據的分布狀況。從SPSS15.0開始就提供了“頻數分析”這一功能。通過頻數分析,用戶在得到描述性統計結果的同時,還能了解變量取值的分布情況,從而使總體數據的分布通過頻數分析得到更為清晰、準確的輸出。

頻數分析的具體操作步驟如下:

打開數據文件,選擇【分析】(Analyze)菜單,單擊【描述統計】(Descriptive Statistics)命令下的【頻率】(Frequencies)命令。SPSS將彈出“頻率”(Frequencies)主對話框,如圖3-5所示。在該主對話框中,同樣可以通過單擊 按鈕從左邊的原變量中選擇一個或者幾個變量進入右邊的“變量”(Variable(s))列表框中。

對話框底部有一項“顯示頻率表格”(Display frequency tables)復選框,SPSS默認選擇此項。選擇此項后,輸出結果將顯示頻數分布表,否則只顯示直方圖,不顯示頻數分布表。

“頻率”主對話框的右方有3個按鈕,從上到下依次為【統計量】(Statistics)按鈕、【圖表】(Charts)按鈕和【格式】(Format)按鈕。單擊可進入對應對話框。

單擊【統計量】按鈕,打開“頻率:統計量”(Frequencies:Statistics)對話框,如圖3-6所示。在該對話框中,用戶可以選擇所要統計的統計量。對話框中各選項的具體意義如下:

(1)百分位值(Percentile Values)欄為復選項,在此欄中可選擇多項。

四分位數(Quartile)

割點(Cut points):選擇此項,在后面的文本框中輸入數值,假設為N(N為在2 100之間的整數),則計算并顯示N分位數。

百分位數(Percentile(s)):選擇此項,在后面的文本框中輸入數值,可以有選擇地顯示百分位數。在文本框中可以輸入0到100之間的數,輸入后,單擊【添加】(Add)按鈕,將對應的百分位數添加到方框內的列表框中,利用【更改】(Change)按鈕和【刪除】(Remove)按鈕,可以對列表框中的選項進行修改和刪除。

(2)離散(Dispersion)欄(復選項):

標準差(Std Deviation)最小值(Minimum)方差(Variance)最大值(Maximum)

范圍(極差)(Range)均值的標準誤(S.E.Mean)

(3)集中趨勢(Central Tendency)欄(復選項):

均值(Mean)、中位數(Median)、眾數(Mode)、合計(Sum)。

“集中趨勢”欄下方有一個“值為組的中點”(Values are group midpoints)復選框,如果假設數據已經分組,而且數據取值為初始分組的中點,選擇此項,將計算百分位數統計和數據的中位數。

(4)分布欄(Distribution)(復選項):

峰度(Kurtosis)、偏度(Skewness)。

用戶在“頻率:統計量”對話框中單擊選中所要統計的統計量后,單擊【繼續】(Continue)按鈕,即可返回主對話框。

單擊【圖表】(Charts)按鈕,打開“頻率:圖表”(Frequencies:Charts)對話框,如圖3-7所示。

在該對話框中,用戶可以選擇頻數分析的圖表類型。該對話框中各選項的具體意義如下:

(1)圖表類型(Chart Type)(單選項):無(None)(系統默認選項)、條形圖(Bar charts)、餅形圖(Pie charts)、直方圖(Histograms)。

如果選擇輸出“直方圖”,可以選擇是否在輸出的直方圖中添加正態分布曲線。如果需要輸出正態分布曲線,則可勾選“帶正態曲線”(With normal curve)復選框。(2)圖表值(Chart Values)(單選項組):可選擇圖形中分類值的表現形式。

頻率(Frequencies):如果圖表類型是直方圖,則直方圖的縱軸為頻數;如果圖表類型是餅形圖,則餅形圖中每塊表示屬于該組觀測值的頻數。

百分比(Percentage):如果圖表類型是直方圖,則直方圖的縱軸為百分比;如果圖表類型是餅形圖,則餅形圖中每塊表示該組的觀測量數占總數的百分比。

用戶在“頻率:圖表”對話框中選擇圖表類型和圖表分類值后,單擊【繼續】(Continue)按鈕,即可返回主對話框。

單擊【格式】(Format)按鈕,打開“頻率:格式”(Frequencies:Format)對話框,如圖3-8所示。在該對話框中,用戶可以設置頻率分布表的輸出格式。對話框中各選項的意義如下:

(1)排序方式(Order by)欄:單選項組,用戶可以選擇頻數分布表中數值及其對應頻率的排列順序。

按值的升序排序(Ascending values):系統默認選項,頻數分布表中將按照數值從小到大排列。

按值的降序排序(Descending values):頻數分布表中將按照數值從大到小排列。

按計數的升序排序(Ascending counts):頻數分布表中將按照計數從小到大排列。

按計數的降序排序(Descending counts):頻數分布表中將按照計數從大到小排列。

如果用戶在“頻率:圖表”對話框中選擇輸出直方圖,頻數分布表將按照數值順序排列。

(2)多個變量(Multiple Variables)欄:單選項組,當“頻率(Frequencies)”主對話框的“變量”(Variable(s))列表框中有多個變量時,利用“多個變量”欄可以設置表格的顯示方式。

比較變量(Compare variables):系統默認選項,SPSS將所有變量的描述統計的結果顯示在同一張表格中,方便用戶進行比較分析。

按變量組織輸出(Organize output by variable):SPSS將對應每個變量分別輸出單獨的描述統計表格。

在“頻率:格式”對話框的底端,有一個“最大類別數”(Suppress tables with more than n categories)文本框。通過輸入數值,確定頻數表輸出的方位,即輸出數據的組數不得大于窗口中輸入的數值。分類數最大參數的默認值是10。用戶在“頻率:格式”對話框中進行選擇后,單擊【繼續】(Continue)按鈕,即可返回“頻率”主對話框。一般情況下,對“頻率:格式”對話框的選項都默認為系統默認值,不作調整。

單擊【確定】(OK)按鈕,即可在結果輸出窗口中得到頻數分布表、描述性統計分析輸出表格和用戶選擇的對應的輸出圖形。

3.4 探索分析

探索分析是在對數據的基本特征統計量有初步了解的基礎上,對數據進行的更為深入詳細的描述性觀察分析。它在一般描述性統計指標的基礎上,增加了有關數據其他特征的文字與圖形描述,顯得更加細致與全面,有助于用戶思考對數據進行進一步分析的方案。主要的分析如下:

(1)觀察數據的分布特征:通過繪制箱鎖圖和莖葉圖等圖形,直觀地反映數據的分布形式和數據的一些規律,包括考察數據中是否存在異常值等。過大或過小的數據均有可能是奇異值、影響點或錯誤數據。尋找異常值,并分析原因,然后決定是否從分析中刪除這些數據。因為奇異值和影響點往往對分析的影響較大,不能真實地反映數據的總體特征。

(2)正態分布檢驗:檢驗數據是否服從正態分布。很多檢驗能夠進行的前提即總體數據分布服從正態分布。因此,檢驗數據是否符合正態分布,就決定了它們是否能用只對正態分布數據適用的分析方法。

(3)方差齊性檢驗:用Levene檢驗比較各組數據的方差是否相等,以判定數據的離散程度是否存在差異。例如在進行獨立右邊的T檢驗之前,就需要事先確定兩組數據的方差是否相同。如果通過分析發現各組數據的方差不同,還需要對數據進行方差分析,那么就需要對數據進行轉換使得方差盡可能相同。Levene檢驗進行方差齊性檢驗時,不強求數據必須服從正態分布,它先計算出各個觀測值減去組內均值的差,然后再通過這些差值的絕對值進行單因素方差分析。如果得到的顯著性水平(Significance)小于0.05,那么就可以拒絕方差相同的假設。

探索分析的具體操作步驟如下:

打開數據文件,選擇【分析】(Analyze)菜單,單擊【描述統計】(Descriptive Statistics)命令下的【探索】(Explore)命令,SPSS將彈出“探索”(Explore)對話框,如圖3-9所示。

在“探索”(Explore)對話框中,左邊的變量列表為原變量列表,通過單擊 按鈕可選擇一個或者幾個變量進入右邊的“因變量列表”(Dependent List)框、“因子列表”(Factor List)框和“標注個案”(Label Cases by)列表框。因變量是用戶所研究的目標變量。因子變量是影響因變量的因素,例如分組變量。標注個案是區分每個觀測量的變量,如雇員的ID等。例如,研究同一班級男生和女生的身高差距時,就可將“身高”變量列入“因變量列表”(Dependent List)框中,將“性別”列入“因子列表”(Factor List)框中,同時將學生的“學號”變量列入“標注個案”(Label Cases by)列表框中。

如果有多個分組變量進入“因子列表”列表框中,那么會以分組變量的各種取值進行組合分組。如兩個分組變量各有2種取值,那么輸出的結果就會有4種組合分組。

在對話框下端的“輸出”(Display)框中有三個選項:

兩者都(Both):默認選項,表示同時輸出描述統計量的統計表格和圖形。選擇此項將激活右邊的【統計量】(Statistics)和【繪制】(Plots)按鈕。

統計量(Statistics):表示只輸出統計表格,不輸出圖表。選擇此項將激活右邊的【統計量】(Statistics)按鈕,【繪制】(Plots)按鈕不被激活。

圖(Plots):表示只輸出圖表,不輸出統計表格。選擇此項將激活右邊的【繪制】(Plots)按鈕,【統計量】(Statistics)按鈕不被激活。

單擊【統計量】(Statistics)按鈕,打開“探索:統計量(Explore:Statistics)”對話框,如圖3-10所示。在該對話框中,4個選擇項分別如下:

描述性(Descriptives):選擇此項,將生成描述性統計表格。表中顯示樣本數據的描述統計量,包括平均值、中位數、5%調整平均數、標準誤、方差、標準差、最大值、最小值、組距、四分位數、峰度、偏度及峰度和偏度的標準誤。此項為默認選項,在下面的“均值的置信區間”(Confidence Interval for Mean)文本框中,用戶還可輸入數值指定均值的置信區間的置信度,系統默認的置信度為95%。

M-估計量(M-estimators):選擇此項,將計算并生成穩健估計量。M估計在計算時對所有觀測量賦予權重,隨觀測量距分布中心的遠近而變化,通過給遠離中心值的數據賦予較小的權重來減小異常值的影響。

界外值(Outliers):選擇此項,將輸出分析數據中的5個最大值和5個最小值作為異常嫌疑值。

百分位數(Percentiles):選擇此項,將計算并顯示指定的百分位數,包括5%、10%、25%、50%、75%、90%和95%等。

“探索:統計量”對話框中的4個選項為復選框,用戶可進行多項選擇,單擊【繼續】(Continue)按鈕,即可返回“探索”主對話框。

單擊【繪制】(Plots)按鈕,打開“探索:圖”(Explore:Plots)對話框,如圖3-11所示。“探索:圖”對話框中有如下4個選擇組:

(1)箱圖(Boxplots)欄(單選項組):箱圖,又稱箱鎖圖。如果用戶在“探索”主對話框的“因變量列表”(Dependent List)框中輸入了多個變量名,則在此選擇組中進行選擇,可確定箱鎖圖的生成方式。箱鎖圖中,底部的水平線段是數據的最小值(異常點除外),頂部的水平線段是數據的最大值(異常點除外),中間矩形箱子的底所在的位置是數據的第一個四分位數(即25%分位數),箱子頂部所在位置是數據的第三個四分位數據(即75%分位數)。箱子中間的水平線段刻畫的是數據的中位數(即50%分位數)。

按因子水平分組(Factor levels together,系統默認):選擇此項,將為每個因變量創建一個箱鎖圖,在每個箱鎖圖內根據分組變量的不同水平的取值創建箱形單元。

不分組(Dependents together):選擇此項,將為每個分組變量的水平創建一個箱鎖圖,在每個箱鎖圖內用不同的顏色區分不同因變量所對應的箱形單元,方便用戶進行比較。

無(None):選擇此項,不創建箱圖。

(2)描述性(Descriptive)欄(復選項):選擇該組內的選項,可以生成莖葉圖和(或)直方圖。在箱圖(Boxplots)組內選擇的選項不同,則生成的莖葉圖和直方圖也不相同。選擇“按因子水平分組”單選按鈕時,在創建莖葉圖和(或)直方圖時,首先會根據因變量的不同進行分類,為每一個因變量對應的不同分組變量的不同水平創建一個莖葉圖和(或)直方圖;選擇“不分組”單選按鈕時,在創建莖葉圖和(或)直方圖時,則首先根據不同分組變量水平的不同,為每一個因變量創建一個莖葉圖和(或)直方圖。

莖葉圖(Stem-and-leaf,系統默認):莖葉圖主要由3個部分組成,即頻率(Frequency)、莖(Stem)和葉(Leaf),在圖中按從左到右的順序依次排列,在圖的底端,注明了莖的寬度(Stem Width)和每一葉所代表的觀測量數(Each Leaf)。莖葉圖中,莖表示數據的整數部分,葉表示數據的小數部分(小數位數只有一位,頻數的數值有多大,則對應的小數就有多少個),將莖和葉的數值組合起來再乘以莖寬,便是該數據的值。由于莖葉圖不僅僅能表示數據的頻數分布,還能近似地表示數據的大小,因此它比直方圖表達的信息更全面。

直方圖(Histogram):直接繪制直方圖的步驟詳見第10章。

(3)帶檢驗的正態圖(Normality plots with test,復選框):選擇此項,將進行正態性檢驗,并生成正態Q-Q概率圖和無趨勢正態Q-Q概率圖。

(4)伸展與級別Levene檢驗(Spread vs level with Levene Test)欄(單選項組):對所有的展布-水平圖進行方差齊性檢驗和數據轉換,同時輸出回歸直線的斜率及方差齊性的Levene檢驗,但如果沒有指定分組變量,則此選項無效。

無(None):不進行Levene檢驗,系統默認。選擇此項,SPSS將不產生回歸直線的斜率和方差齊性檢驗。

冪估計(Power Estimation):對每組數據產生一個中位數的自然對數及四個分位數的自然對數的散點圖。

已轉換(Transformed):變換原始數據,用戶可在后面的參數框中選擇數據變換類型。

未轉換(Untransformed):不變換原始數據時選擇此項。

用戶在“探索:圖”對話框中進行選擇后,單擊【繼續】(Continue)按鈕,即可返回“探索”主對話框。

單擊【選項】(Options)按鈕,打開“探索:選項”(Explore:Options)對話框,如圖3-12所示。在該對話框中,可選擇缺失值的處理方式,SPSS提供了3種處理方式:

按列表排除個案(Exclude cases listwise,系統默認):選擇此項,對所有的分析過程剔除分組變量和因變量中所有帶有缺失值的觀測量數據;

按對排除個案(Exclude cases pairwise):同時剔除帶缺失值的觀測量及與缺失值有成對關系的觀測量。在當前分析過程中用到的變量數據中剔除帶有缺失值的觀測量數據,在其他分析過程中可能包含缺失值;

報告值(Report values):選擇此項,將分組變量的缺失值單獨分為一組,在輸出頻數表的同時輸出缺失值。

用戶在“探索:選項”對話框中進行選擇后,單擊【繼續】(Continue)按鈕,即可返回“探索”主對話框。

單擊【確定】(OK)按鈕,即可在結果輸出窗口中得到探索分析過程的數據概述、基本統計描述表、極端值列表、正態分布檢驗、方差齊性檢驗、莖葉圖、直方圖、箱鎖圖、正態分布Q-Q圖、離散正態分布Q-Q圖等圖表。

3.5 交叉列聯表分析

在實際分析中,除了需要對單個變量的數據分布情況進行分析外,還需要掌握多個變量在不同取值情況下的數據分布情況,從而進一步深入分析變量之間的相互影響和關系,這種分析就稱為交叉列聯表分析。當所觀察的現象同時與兩個因素有關時,如某種服裝的銷量受價格和居民收入的影響,某種產品的生產成本受原材料價格和產量的影響等,通過交叉列聯表分析,可以較好地反映出這兩個因素之間有無關聯性及兩個因素與所觀察現象之間的相關關系。

因此,數據交叉列聯表分析主要包括兩個基本任務:一是根據收集的樣本數據,產生二維或多維交叉列聯表;二是在交叉列聯表的基礎上,對兩個變量間是否存在相關性進行檢驗。要獲得變量之間的相關性,僅僅靠描述性統計的數據是不夠的,還需要借助一些表示變量間相關程度的統計量和一些非參數檢驗的方法。

常用的衡量變量間相關程度的統計量是簡單相關系數,但在交叉列聯表分析中,由于行列變量往往不是連續變量,不符合計算簡單相關系數的前提條件。因此,需要根據變量的性質選擇其他的相關系數,如Kendall等級相關系數、Eta值等。

SPSS提供了多種適用于不同類型數據的相關系數表達,這些相關性檢驗的零假設都是:行和列變量之間相互獨立,不存在顯著的相關關系。根據SPSS檢驗后得出的相伴概率(Concomitant Significance)判斷是否存在相關關系。如果相伴概率小于顯著性水平0.05,那么拒絕零假設,行列變量之間彼此相關;如果相伴概率大于顯著性水平0.05,那么接受原假設,行列變量之間彼此獨立。

在交叉列聯表分析中,SPSS所提供的相關關系的檢驗方法主要有以下3種:

(1)卡方(χ2)統計檢驗:常用于檢驗行列變量之間是否相關。計算公式為:

其中,f0表示實際觀察頻數,fe表示期望頻數。

卡方統計量服從(行數 1)(列數 1)個自由度的卡方統計。SPSS在計算卡方統計量時,同時給出相應的相伴概率,由此判斷行列變量之間是否相關。

(2)列聯系數(Contingency coefficient):常用于名義變量之間的相關系數計算。計算公式由卡方統計量修改而得,公式如下:(3)系數(Phi and Cramer's V):常用于名義變量之間的相關系數計算。計算公式由卡方統計量修改而得,公式如下:

系數介于0和1之間,其中,K為行數和列數較小的實際數。

交叉列聯表分析的具體操作步驟如下:

打開數據文件,選擇【分析】(Analyze)菜單,單擊【描述統計】(Descriptive Statistics)命令下的【交叉表】(Crosstabs)命令。“交叉表”(Crosstabs)主對話框如圖3-13所示。

在該主對話框中,左邊的變量列表為原變量列表,通過單擊 按鈕可選擇一個或者幾個變量進入右邊的“行”(Row(s))變量列表框、“列”(Column(s))變量列表框和“層”(Layer)變量列表框中。如果是二維列聯表分析,只需選擇行列變量即可,但如進行三維以上的列聯表分析,可以將其他變量作為控制變量選到“層”(Layer)變量列表框中。有多個層控制變量時,可以根據實際的分析要求確定它們的層次,既可以是同層次的也可以是逐層疊加的。

在“交叉表”對話框底端有兩個可選擇項:

顯示復式條形圖(Display clustered bar chart):指定繪制各個變量不同交叉取值下關于頻數分布的柱形圖;

取消表格(Suppress table):不輸出列聯表的具體表格,而直接顯示交叉列聯表分析過程中的統計量,如果沒有選中統計量,則不產生任何結果。所以,一般情況下,只有在分析行列變量間關系時選擇此項。

該對話框的右端有4個按鈕,從上到下依次為【精確】(Exact)按鈕、【統計量】(Statistics)按鈕、【單元格】(Cells)按鈕和【格式】(Format)按鈕。單擊可進入對應的對話框。

單擊【精確】(Exact)按鈕,打開“精確檢驗”(Exact Tests)對話框,如圖3-14所示。

該對話框提供了3種用于不同條件的檢驗方式來檢驗行列變量的相關性。用戶可選擇以下3種檢驗方式之一:

僅漸近法(Asymptotic only):適用于具有漸近分布的大樣本數據,SPSS默認選擇該項。

Monte Carlo(蒙特卡羅法):此項為精確顯著性水平值的無偏估計,無需數據具有漸近分布的假設,是一種非常有效的計算確切顯著性水平的方法。在“置信水平”(Confidence Level)參數框內輸入數據,可以確定置信區間的大小,一般為90、95、99。在“樣本數”(Number of samples)參數框中可以輸入數據的樣本容量。

精確(Exact):觀察結果概率,同時在下面的“每個檢驗的時間限制為”(Time limit per test)的參數框內,選擇進行精確檢驗的最大時間限度。

用戶在本對話框內進行選擇后,單擊【繼續】(Continue)按鈕即可返回“交叉表”主對話框。一般情況下,“精確檢驗”(Exact Tests)對話框的選項都默認為系統默認值,不作調整。單擊【統計量】(Statistics)按鈕,打開“交叉表:統計量”(Crosstabs:Statistics)對話框,如圖3-15所示。

在該對話框中,用戶可以選擇輸出合適的統計檢驗統計量。對話框中各選項的意義如下:

(1)卡方(Chi-square)檢驗復選框:檢驗列聯表行列變量的獨立性檢驗,也被稱為Pearson chi-square檢驗、χ2檢驗。

(2)相關性(Correlations)檢驗復選框:輸出列聯表行列變量的Pearson相關系數或Spearman相關系數。

(3)名義(Nominal)欄:適用于名稱變量統計量。

相依系數(Contingency coefficient):即Pearson相關系數或Spearman相關系數。

Phi 和Cramer變量(系數):常用于名義變量之間的相關系數計算。計算公式由卡方統計量修改而得,如公式(3.13)所示。ψ系數介于0和1之間,其中,K為行數和列數較小的實際數。Lambda(λ系數):在自變量預測中用于反映比例縮減誤差,其值為1時表明自變量預測因變量好,為0時表明自變量預測因變量差。

不定性系數(Uncertainty coefficient):以熵為標準的比例縮減誤差,其值接近1時表明后一變量的信息很大程度上來自前一變量,其值接近0時表明后一變量的信息與前一變量無關。

(4)有序(Ordinal)欄:適用于有序變量的統計量。

Gamma(伽馬系數,γ系數):兩有序變量之間的關聯性的對稱檢驗。其數值界于0和1之間,所有觀察實際數集中于左上角和右下角時,取值為1,表示兩個變量之間有很強的相關;取值為0時,表示兩個變量之間相互獨立。

Somers'd值:兩有序變量之間的關聯性的檢驗,取值范圍為[-1,1]。

Kendall s tau-b值:考慮有結的秩或等級變量關聯性的非參數檢驗,相同的觀察值選入計算過程中,取值范圍為[-1,1]。Kendall s tau-c值:忽略有結的秩或等級變量關聯性的非參數檢驗,相同的觀察值不選入計算過程,取值范圍界為[-1,1]。

(5)按區間標定(Nominal by interval)欄:適用于一個名義變量與一個等距變量的相關性檢驗。

Kappa系數:檢驗數據內部的一致性,僅適用于具有相同分類值和相同分類數量的變量交叉表。

Eta值:其平方值可認為是因變量受不同因素影響所致方差的比例。

風險(相對危險度):檢驗事件發生和某因素之間的關聯性。

McNemar檢驗:主要用于檢驗配對的資料率(相當于配對卡方檢驗)。

(6)Cochran's and Mantel-Haenszel統計量復選框:適用于在一個二值因素變量和一個二值響應變量之間的獨立性檢驗。

用戶在“交叉表:統計量”對話框中進行選擇后,單擊【繼續】(Continue),即可返回“交叉表”(Crosstabs)主對話框。一般情況下,對“交叉表:統計量”對話框內的選項不作選擇或選擇較為常用的卡方檢驗。

單擊【單元格】(Cells)按鈕,打開“交叉表:單元顯示”(Crosstabs:Cell Display)對話框,如圖3-16所示。在該對話框中,用戶可以指定列聯表單元格中的輸出內容。SPSS17.0默認在交叉列聯表中輸出實際的觀察值,但觀察值有時候不能確切地反映事物的實質,因此還需要輸出其他的數據項。對話框中各選項的具體意義如下:

(1)計數(Counts)欄:

觀察值(Observed):系統默認選項,表示輸出為實際觀察值。

期望值(Expected):表示輸出為理論值。

(2)百分比(Percentages)欄:

行(Row)百分比:以行為單元,統計行變量的百分比。

列(Column)百分比:以列為單元,統計列變量的百分比。

總計(Total)百分比:行列變量的百分比都進行輸出。

(3)殘差(Residuals)欄: 未標準化(Unstandardized):輸出非標準化殘差,為實際數與理論數的差值。

標準化(Standardized):輸出標準化殘差,為實際數與理論數的差值除以理論數。

調節的標準化(Adjusted standardized):輸出修正標準化殘差,為標準誤確定的單元格殘差。

(4)非整數權重(Noninteger Weights)欄:

四舍五入單元格計數(Round cell counts,系統默認):將單元格計數的非整數部分的尾數四舍五入為整數。

截短單元格計數(Truncate cell counts):將單元格計數的非整數部分的尾數舍去,直接化為整數。

四舍五入個案權重(Round case Weights):將觀測量權數的非整數部分的尾數四舍五入為整數。

截短個案權重(Truncate case Weights):將觀測量權數的非整數部分的尾數舍去,化為整數。

無調節(No adjustments):不對計數數據進行調整。

用戶在“交叉表:單元顯示”對話框中進行選擇后,單擊【繼續】(Continue)按鈕,即可返回“交叉表”主對話框。一般情況下,對“交叉表:單元顯示”對話框的選項都默認為系統默認值,不作調整。

單擊【格式】(Format)按鈕,打開“交叉表:表格格式”(Crosstabs:Table Format)對話框,如圖3-17所示。

在該對話框中,用戶可以指定列聯表的輸出排列順序。對話框中各選項的具體意義如下:

在行序(Row Order)欄中有如下兩個選項: 升序(Ascending):系統默認,以升序顯示各變量值;

降序(Descending):以降序顯示各變量值。

用戶在該對話框中進行選擇后,單擊【繼續】(Continue)按鈕,即可返回“交叉表”主對話框。

在“交叉表”對話框中單擊【確定】(OK)按鈕,可在輸出窗口中得到數據概述、交叉列聯表、卡方檢驗表、交叉分組下頻率分布柱形圖、相對危險性估計等圖表。

3.6 比率分析

比率分析主要用于對兩個變量間變量值的比率變化進行描述分析,適用于定距型變量(scale)。例如,可以對受處分的學生和沒受處分的學生的上網時間與用計算機的時間進行比率分析。

比率分析生成比率變量,并對該比率變量計算基本描述性統計量(如均值、中位數、標準差、全距等),進而刻畫出比率變量的集中趨勢和離散程度。除此之外,SPSS17.0還提供了其他對比描述指標,大致也屬于集中趨勢描述指標和離散程度描述指標的范疇。

打開數據文件,選擇【分析】(Analyze)菜單,單擊【描述統計】(Descriptive Statistics)命令下的【比率】(Ratio)命令。打開“比值統計量”(Ratio Statistics)對話框(軟件翻譯為“比值”,但準確的術語應是“比率”),如圖3-18所示。在該主對話框中,左邊的變量列表為原變量列表,通過單擊 按鈕可選擇一個或者幾個變量進入右邊的“分子”(Numerator)變量列表框、“分母”(Denominator)變量列表框和“組變量”(Group Variable)列表框中。進行不同組間的比率比較時,需要將變量分組,將變量選擇到“組變量”(Group Variable)列表框中后,可以選擇將變量按照分組變量進行升序或者降序排列。

“比值統計量”對話框的左下角有如下兩個復選框:

顯示結果(Display results,系統默認)

將結果保存到外部文件(Save results to external file):如果選擇該項,【文件】(File)按鈕被激活,單擊【文件】(File)按鈕可將輸出結果保存至用戶指定的位置。

該對話框的右下角是【統計量】(Statistics)按鈕,單擊它將打開“比率統計量:統計量”(Ratio Statistics:Statistics)對話框。

單擊【統計量】(Statistics)按鈕,打開“比率統計量:統計量”對話框,如圖3-19所示。在該對話框中,用戶可以選擇比率變量計算基本描述性統計量(如均值、中位數、標準差、全距等),并描述比率變量的集中趨勢和離散程度。對話框中各選項的具體意義如下:

(1)集中趨勢(Central Tendency)欄(復選項):

中位數(Median)

均值(Mean)

權重均值(Weighted Mean):指兩變量均值的比。

置信區間(Confidence intervals):默認置信區間的置信度為95%。

(2)離散(Dispersion)欄(復選項)

AAD(Average Absolute Deviation,平均絕對離差),其計算公式為:

其中,Ri是比率數,M是比率變量的中位數,N為樣本數。

COD(Coefficient of Dispersion,離散系數),其計算公式為:

PRD(Price-related Differential,相關價格微分):是比率均值與加權比率均值的比。

中位數居中COV(Median Centered COV):計算公式為: 均值居中COV(Mean Centered COV):通常意義下的變異系數,即標準差除以均值。

(3)集中指數(Concentration Index)欄:

在以下比例之間(Ratios Between):通過在低比例(Low Proportion)和高比例(High Proportion)后面的文本框中輸入數值,可以控制比率的范圍。輸入后,單擊【添加】(Add)按鈕,將對應的比率范圍添加到方框內的列表框中,利用【更改】(Change)按鈕和【刪除】(Remove)按鈕,可以對列表框中的選項進行修改和刪除。

在以下比例之內(Ratios Within):通過在中位數的%(% of median)前面的文本框中輸入數值,可以控制比率相對于中位數的范圍。輸入后,單擊【添加】(Add)按鈕,將對應的比率限制條件添加到方框內的列表框中,利用【更改】(Change)按鈕和【刪除】(Remove)按鈕,可以對列表框中的選項進行修改和刪除。

用戶在本對話框中進行選擇后,單擊【繼續】(Continue)按鈕,即可返回“比值統計量”(Ratio Statistics)主對話框。

在“比值統計量”主對話框中單擊【確定】(OK)按鈕,可在輸出窗口中得到分組描述結果和比率分析結果等圖表。

3.7 P-P圖和Q-Q圖

P-P圖是根據變量的累積比例與指定分布的累積比例之間的關系所繪制的圖形。通過P-P圖可以檢驗數據是否符合指定的分布。當數據符合指定分布時,P-P圖中各點近似呈一條直線。如果P-P圖中各點不呈直線,但有一定規律,可以對變量數據進行轉換,使轉換后的數據更接近指定分布。

Q-Q圖同樣可以用于檢驗數據的分布,所不同的是,Q-Q圖是用變量數據分布的分位數與所指定分布的分位數之間的關系曲線來進行檢驗的。

由于P-P圖和Q-Q圖的用途完全相同,只是檢驗方法存在差異,SPSS17.0中用于做出P-P圖的對話框和用于做出Q-Q圖的對話框完全一致,下面將對兩者統一加以說明。具體操作步驟如下:

打開數據文件,選擇【分析】(Analyze)菜單,單擊【描述統計】(Descriptive Statistics)命令下的【P-P圖】(P-P Plots)或【Q-Q圖】(Q-Q Plots)命令。“P-P圖”(P-P Plots)、“Q-Q圖”(Q-Q Plots)的對話框分別如圖3-20和圖3-21所示。

在“P-P圖”(P-P Plots)或“Q-Q圖”(Q-Q Plots)對話框中,最左邊的變量列表為原變量列表,通過單擊 按鈕可選擇一個或者幾個變量進入位于對話框中間的“變量”(Variables)列表框中。根據這些變量數據可創建P-P圖或Q-Q圖,并進行分布檢驗。

“P-P圖”或“Q-Q圖”對話框的中下方和右方有5個選項欄,選項欄中各選項的意義如下:

(1)轉換(Transform)欄(復選項):

自然對數轉換(Natural log transform):選擇此項,對當前變量的數據取自然對數,即將原有變量轉換成以自然數e為底的對數變量。

標準值(Standardize values):選擇此項,將當前變量的數據轉換為標準值,即轉換后變量數據的均值為0,方差為1。差分(Difference):選擇此項,對當前變量的數據進行差分轉換,即利用變量中連續數據之間的差值來轉換數據。選擇此項以后,后面的文本框變為可用,在其中輸入一個正整數,以確定轉換的差分度,默認值為1。

季節性差分(Seasonally difference):用于確定指明計算時間序列的季節差分。只有在對當前變量的數據序列定義了周期(通過主菜單中的【數據】(Data)菜單中的【定義日期】(Define Dates)選項定義)以后才可用,如果當前周期為0,將不能計算季節差分。選擇此項,在后面的文本框中輸入正整數,然后根據該正整數所確定的范圍來計算該范圍內數據的差值,并用該差值來轉換原數據。

需要注意的是,這些數據轉換并不改變變量中的變量值,只影響正態概率圖。

(2)檢驗分布(Test Distribution)欄:可選擇不同的分布類型,檢驗變量數據是否符合所選分布。單擊選項分布欄下的箭頭可選擇不同的分布類型。SPSS默認的檢驗分布是正態分布(Normal)。

P-P圖(或Q-Q圖)可檢驗的分布包括:

貝塔分布(Beta)T分布(Student t)

卡方分布(Chi-square)伽馬分布(Gamma)

指數分布(Exponential)半正態分布(Half-normal)

Logistic分布(Logistic)拉普拉斯分布(Laplace)

對數正態分布(Lognormal)威布爾分布(Weibull)

正態分布(Normal)均勻分布(Uniform)

帕累托分布(Pareto)

dt:在該文本框中輸入正整數,表示所選分布的自由度。

(3)分布參數(Distribution Parameters)欄:在該欄中可輸入所選分布類型的參數,選擇的分布不同,參數輸入窗口也不同。

從數據中估計(Estimate from data):為系統默認選項。選擇此項,系統將自動從數據中推測數據分布的參數,否則就要在該選項下方的參數框中根據需要自行指定。位置(Location)參數窗口:選擇正態分布時,用戶自行輸入位置參數。

比例(Scale)參數窗口:選擇正態分布時,用戶自行輸入比例參數。

(4)比例估計公式(Proportion Estimation Formula)欄(單選項組)

以上公式中,n表示觀測量的數目,r是從1到n的秩次。

(5)為結指定的秩(Rank Assigned to Ties)欄(單選項組):

均值(Mean):用連接值的平均秩指定順序。

高(High):用連接值的最大秩指定順序。

低(High):用連接值的最小秩指定順序。

強制打開結(Break ties arbitrarily):忽略觀測量權重的影響。

3.8 圖表繪制

進行數字統計分析時,有時我們需要繪制統計圖表,把資料所反映的變化趨勢、數量多少、分布狀態和相互關系等形象直觀地表現出來,以便于讀者的閱讀、比較和分析。SPSS的【圖形】(Graphs)菜單提供了繪制圖表的功能,主要包括3個子菜單:【圖表建立】(Chart Builder)命令相當于圖表向導,它對SPSS的繪圖功能作了粗略的介紹,初學者可以大致了解SPSS的繪圖能力;【交互圖表】(Interactive)命令主要涵蓋了SPSS各種復雜的交互性圖表;【舊對話框】(Legacy Dialogs)命令主要包括多種SPSS傳統的常用的統計報表,下面重點講解。

3.8.1 條形圖

條形圖(Bar Charts),又稱帶形圖或柱形圖,它是利用相同寬度的條形的長短或高低來表現統計數據大小或變動的統計圖。

繪制條形圖的具體操作步驟如下:

打開【圖形】(Graphs)菜單,選擇【舊對話框】(Legacy Dialogs)命令下的【條形圖】(Bar Charts)命令,SPSS將彈出“條形圖”(Bar Charts)導航對話框,如圖3-22所示。

在該導航對話框中,用戶可以選擇條形圖的類型,并定義條形圖中數據的表達方式。

SPSS將條形圖大致分為3種類型:

簡單(Simple):單式條形圖,各個條形相互獨立; 復式條形圖(Clustered):分組條形圖,每組的相鄰兩個或多個條形左右連接,以方便進行組間比較;

堆積面積圖(Stacked):分段條形圖,同一組的條形圖上下連接,以方便進行組與組之間的互相比較。

在圖3-22下部的“圖表中的數據為”(Data in Chart are)欄,用戶可以選擇的條形圖中數據的表達類型如下:

個案組摘要(Summaries for groups of cases):用分類值作圖,條形圖中每一條代表觀測量的一個分類;

各個變量的摘要(Summaries of separate variables):用變量值作圖,條形圖中每一條代表一個變量;

個案值(Values of individual cases):用單元值作圖,條形圖中每一條代表一個觀察值。

通過以上3個條形圖類型和3個數據的表達方式的不同搭配,SPSS可以生成9種不同的條形圖。本書以用戶選擇“簡單”(Simple)條形圖和“個案組摘要”(Summaries for groups of cases)為例,闡述條形圖的繪制步驟,如果用戶需要制作其他類型的條形圖,請參看簡單條形圖繪制的類似步驟。

單擊【定義】(Define)按鈕,進入正式的條形圖定義對話框“定義簡單條形圖:個案組摘要”(Define Simple Bar:Summaries for groups of cases)對話框,如圖3-23所示。根據用戶所選的條形圖類型和數據表達方式的不同,出現的對話框名稱也不同,但對話框的主體內容大致相同。

在該對話框中,用戶可以選擇條形圖繪制的相關細節。

“條的表征”(Bar Present)欄中,用戶可以選擇以下條形圖中條所代表的統計量:

個案數(N of cases):按照分組變量分組后各組的觀測量個數;

個案數的%(% of cases):按照分組變量分組后各組的觀測量個數占總觀測量個數的百分比;

累積個數:觀測量數的累計數目;

累積%:觀測量數的累計百分比;

其他統計量(Other statistics):用戶可以自行定義條形圖中的統計量。選中該選項,下面的“變量”(Variable)列表框被激活,用戶需要通過單擊 按鈕從左邊原變量中選擇一個分析變量進入“變量”(Variable)列表框中,然后單擊【更改統計量】(Change Statistics)按鈕,SPSS將彈出“統計量”(Statistic)對話框,如圖3-24所示。

在該對話框中,用戶可以選擇需要計算的描述統計量作為條形圖中的統計量。對話框中的描述統計量包括:

值的均值(Mean of values):按照分組變量分組后,以分析變量的均值作為條形圖中的統計量;

值的中位數(Median of values):按照分組變量分組后,以分析變量的中位數作為條形圖中的統計量;

值的眾數(Mode of values):按照分組變量分組后,以分析變量的眾數作為條形圖中的統計量;

個案數(Number of cases):按照分組變量分組后,以分析變量的樣本個數作為條形圖中的統計量;

值的和(Sum of values):按照分組變量分組后,以分析變量數據的總和作為條形圖中的統計量;

標準差(Standard deviation):按照分組變量分組后,以分析變量的標準差作為條形圖中的統計量;

方差(Variance):按照分組變量分組后,以分析變量的方差作為條形圖中的統計量; 最小值(Minimum value):按照分組變量分組后,以分析變量的最小值作為條形圖中的統計量;

最大值(Maximum value):按照分組變量分組后,以分析變量的最大值作為條形圖中的統計量;

累計求和(Calculative sum):按照分組變量分組后,以分析變量的累計總和作為條形圖中的統計量。

在該對話框的中部,用戶可以在“值”(Value)文本框中輸入數值或者百分數,然后選擇相關選項,SPSS將對數值或百分數上側或下側的觀測量按照大小進行篩選。

在該對話框的下部,用戶可以在“低”(Low)和“高”(High)文本框中輸入數值或者百分數,然后選擇對應選項,SPSS將按照大小對觀測量在限定范圍內進行篩選。

對話框底部的“值是組中點”(Values are grouped midpoints)復選框只有在用戶選擇“值的中位數”(Median of values)或者“百分位”(Percentile)時,才被激活。選中該選項,則表明數據分布為頻數分布表的格式,輸出的條形圖中的統計量為分組的中值。

選擇條形圖中的統計量后,單擊【繼續】(Continue)按鈕,即可返回到“定義簡單條形圖:個案組摘要”主對話框中。

接下來,需要指定做圖變量。在“類別軸”(Category Axis)列表框中,用戶需要通過單擊 按鈕從左邊原變量中選擇一個變量作為分類變量(也稱為分組變量)。條形圖中每個條形的長度分別代表對應各組的統計量的值。

模板(Template):用戶可以選中該選項,并單擊【文件】(File)按鈕選擇模板文件,作為散點圖的格式模板。

單擊【標題】(Titles)按鈕,打開“標題”(Titles)對話框,如圖3-25所示。在該對話框中,用戶可以定義散點圖的標題、子標題和腳注。

(1)標題(Title)和子標題(Subtitle):通過輸入,用戶可以定義兩行標題和一行子標題。標題和子標題將在散點圖上方顯示。用戶也可以在結果輸出窗口中定義標題。

(2)腳注(Footnote):通過輸入,用戶可以定義兩行腳注,腳注將在散點圖下方顯示。

輸入標題后,單擊【繼續】(Continue)按鈕,即可返回“定義簡單條形圖:個案組摘要”主對話框中。

單擊【選項】(Options)按鈕,打開“選項”(Options)對話框,如圖3-26所示。

在該對話框中,用戶可以指定缺失值的處理方式和誤差條的設定形式。

(1)缺失值(Missing Values)欄:用戶可以定義分析中對缺失值的處理方式,包括按列表排除個案(Exclude cases listwise)和按變量順序排除個案(Exclude cases variable by variable)。為盡可能充分利用數據,SPSS默認選擇前者。

(2)誤差條圖的表征(Error Bars Represent)欄:用戶可以選擇設定置信區間(Confidence intervals)、標準誤(Standard Error)或者標準差(Standard deviation)條件,并顯示誤差條圖。

指定缺失值的處理方式和誤差條的設定形式后,單擊【繼續】(Continue)按鈕,即可返回“定義簡單條形圖:個案組摘要”主對話框中。

在“定義簡單條形:個案組摘要”主對話框中,單擊【確定】(OK)按鈕,即可在結果輸出窗口中得到簡單條形圖。

3.8.2 線圖 線圖(Line Charts),又稱曲線圖,它是利用點的高低來表明數據升降情況的一種統計圖。通過將不同階段的數據點連接,可以更清晰地表明數據的變化趨勢。線圖主要用于時間序列分析、數據分配情況比較和兩變量依存關系的分析等。

繪制線圖的具體操作步驟如下:

打開【圖形】(Graphs)菜單,選擇【舊對話框】(Legacy Dialogs)命令下的【線圖】(Line Charts)命令,SPSS將彈出“線圖”(Line Charts)導航對話框,如圖3-27所示。

在該導航對話框中,用戶可以選擇線圖的類型,并定義線圖中數據的表達方式。

SPSS將線圖大致分為3種類型:

(1)簡單(Simple):單線圖,一個圖形中只有一條水平走向的折線;

(2)多線線圖(Multiple):多線圖,一個圖形中有多條水平走向的折線;

(3)垂直線圖(Drop-line):垂線圖,一個圖形中有多組水平走向的數據,但在水平方向上不予以連接,而只是在垂直方向上將同一時間點的數據予以連接。

圖表中的數據為(Data in Chart are)欄:用戶可以選擇以下的條形圖中的數據表達類型: 個案組摘要(Summaries for groups of cases):用分類值作圖,線圖中每一條線代表觀測量的一個分類;

各個變量的摘要(Summaries of separate variables):用變量值作圖,線圖中每一條線代表一個變量;

個案值(Values of individual cases):用單元值作圖,線圖中每一條線代表一個觀察值。

通過以上3個線圖類型和3個數據表達類型的不同搭配,SPSS可以生成9種不同的線圖。本書以用戶選擇“簡單”線圖和“個案組摘要”為例,闡述線圖的繪制步驟。

單擊【定義】(Define)按鈕,進入正式的定義對話框“定義簡單線圖:個案組摘要”(Define Simple Line:Summaries for groups of cases)對話框,如圖3-28所示。根據用戶所選的線圖類型和數據表達類型的不同,出現的對話框名稱也不同。

在該對話框中,用戶首先需要指定繪圖變量,即通過單擊 按鈕從左邊原變量中選擇多個需要繪制折線圖的變量進入右邊的“線的表征”(Lines Represent)中。繪圖變量的數值將在線圖的縱軸上表示。同時,用戶需要指定分類變量。用戶可以選擇以“個案數”(Case number),即觀測量的編號作為分類變量,也可以選中“變量”(Variable)選項,然后單擊 按鈕選擇一個變量作為分類變量。例如,在時間序列分析中,用戶就可以將時間變量作為分類變量。分類變量的數值將在線圖的橫軸上表示。

本對話框的其他部分及單擊【標題】(Title)按鈕所彈出的“標題”(Title)對話框都與“定義簡單條形圖:個案組摘要”(Define Simple Bar:Summaries for Groups of Cases)對話框完全相同,此處不再贅述。

在“定義簡單線圖:個案組摘要”主對話框中,單擊【確定】(OK)按鈕,即可在結果輸出窗口中得到線圖。

3.8.3 面積圖

面積圖(Area Charts),又稱區域圖,是用面積來表現連續性的頻數分布的統計圖。面積越大,頻數越多,反之亦然。制作面積圖的原始數據大多為頻數分布表。

繪制面積圖的具體操作步驟如下:

打開【圖形】(Graphs)菜單,選擇【舊對話框】(Legacy Dialogs)命令下的【面積圖】(Area Charts)命令,SPSS將彈出“面積圖”(Area Charts)導航對話框,如圖3-29所示。

在該導航對話框中,用戶可以選擇面積圖的類型,并定義面積圖中數據的表達方式。

SPSS將面積圖大致分為以下兩種類型:

(1)簡單(Simple):簡單面積圖,圖形中只有一個區域表示頻數大小;

(2)堆積面積圖(Stacked):圖形由多個不同顏色的區域從下到上堆積而成,不同的區域表示不同類型的頻率大小。

“面積圖”(Area Charts)導航對話框中的“圖表中的數據為”(Data in Chart are)欄與條形圖、線圖的導航對話框該欄的內容相同,不再贅述。

通過以上兩個面積圖類型和三個數據表達類型的不同搭配,SPSS可以生成6種不同的面積圖。本書以用戶選擇“簡單”面積圖和“個案組摘要”為例,闡述面積圖的繪制步驟。單擊【定義】(Define)按鈕,進入“定義簡單面積圖:個案組摘要”(Define Simple Area:Summaries for groups of cases)對話框,如圖3-30所示。根據用戶所選的面積圖類型和數據表達方式的不同,出現的對話框名稱也不同。

本對話框與“定義簡單條形圖:個案組摘要”(Define Simple Bar:Summaries for Groups of Cases)對話框幾乎完全相同,此處不再贅述。

在本主對話框中,單擊【確定】(OK)按鈕,即可在結果輸出窗口中得到面積圖。

3.8.4 餅形圖

餅形圖(Pie Charts)是用扇形的大小來表示數值大小的統計圖。餅形圖簡單易懂,并且便于比較,因此,餅形圖的制圖過程使用最為廣泛。

繪制餅形圖的具體操作步驟如下:

打開【圖形】(Graphs)菜單,選擇【舊對話框】(Legacy Dialogs)命令下的【餅圖】(Pie Charts)命令,SPSS將彈出“餅圖”(Pie Charts)導航對話框,如圖3-31所示。在該導航對話框中,用戶可以定義餅形圖中數據的表達方式。

“餅圖”導航對話框中只有“圖表中的數據為”(Data in Chart are)一欄,并且與條形圖、線圖、面積圖的導航對話框該欄的內容相同,此處不再贅述。

根據3個不同的數據表達方式,SPSS可以生成3種不同的面積圖。本書以用戶選擇“個案組的摘要”(Summaries for groups of cases)為例,闡述餅形圖的繪制步驟,如果用戶需要制作其他類型的餅圖,請舉一反三學習類似的步驟。

單擊【定義】(Define)按鈕,進入“定義餅圖:個案組摘要”(Define Pie:Summaries for groups of cases)對話框,如圖3-32所示。根據用戶所選的數據表達方式的不同,出現的對話框名稱也不同。

在本對話框中,用戶可以選擇餅形圖繪制的相關細節。

分區的表征(Bar Present)欄:用戶可以選擇餅形圖中扇形切片所代表的統計量。

個案數(N of cases):按照分組變量分組后各組的觀測量個數。個案數的%(% of cases):按照分組變量分組后各組的觀測量個數占總觀測量個數的百分比。

變量和(Sum of variables):按照分組變量分組后,用戶可以選擇另一變量并以該變量的總和作為切片統計量的表達方式。選中該選項,下面的“變量”(Variable)列表框被激活,用戶需要通過單擊 按鈕從左邊原變量中選擇一個計算總和的變量進入“變量”(Variable)列表框中。

在“定義分區”(Define Slices by)列表框中,用戶需要單擊 按鈕從左邊原變量列表中指定一個分類變量作為不同扇形的識別變量。

該對話框的其他部分及【標題】(Title)按鈕、【選項】(Options)按鈕都與“定義簡單條形圖:個案組摘要”(Define Simple Bar:Summaries for Groups of Cases)對話框完全相同,此處不再贅述。

在本對話框中,單擊【確定】(OK)按鈕,即可在結果輸出窗口中得到餅形圖。

3.8.5 高低圖

高低圖(High-Low Charts)是用多個垂直線段來表示數值區域的統計圖,例如一組測定值的范圍(最小值-最大值)、95%置信區間(下限-上限)、±1.96·SD(低值-均值-高值)等。

繪制高低圖的具體操作步驟如下:

打開【圖形】(Graphs)菜單,選擇【舊對話框】(Legacy Dialogs)下的【高低圖】(High-Low Charts)命令,SPSS將彈出“高-低圖”(High-Low Charts)導航對話框,如圖3-33所示。

在該導航對話框中,用戶可以選擇高低圖的類型,并定義高低圖中數據的表達方式。

第五篇:實習總結spss

實習總結

這次實習使用的是spss17.0版本的軟件,通過這次實習,我了解到SPSS具有完整的數據輸入、編輯、統計分析、圖形制作等功能。平日課下進行統計調查技能培訓的時候,分析數據所用的軟件是Excel。雖然使用Excel可以對數據進行透視、分類、篩選以及計算相關系數等,但是這些操作都需要自己每一步每一步的進行手動操作,而使用SPSS軟件在對數據進行整理時,只需對軟件某選項內設置變量條件,系統便自動的進行整理。通過這次spss實習,我又入門了一項非常實用的軟件,會為以后統計分析提供多一種的選擇。下面我會從以下四方面分別闡述這次實習的收獲與總結。

做問卷調查

根據指導老師的安排,我需要獨自完成6份 《廣東高校在校大學生消費使用數碼產 品情況》的調查問卷。去廣工、廣財聽宣講會并且在那里做了兩份問卷調查,剩下的4份是以電子版的形式做的問卷調查。在做問卷調查的過程中,為了保證問卷的有效性和準確性,我會認真審核每一份問卷是否填寫完整以及前后是否合邏輯。在我的六份問卷調查中,比較容易出現問題的主要在每天使用數碼產品的時間,也是在做問卷調查中叮囑最多的。這都是值得的,因為保證問卷的客觀和有效是后面做統計分析的基礎。這次實訓是全班合作完成問卷,如果是一個人完成30幾份的問卷,那么真是一項不容小覷的任務。

Spss入門操作

這一部分主要是根據老師編制的指導書展開。Spss入門操作主要涉及到數據的輸入、描述統計分析、假設檢驗、相關與回歸分析。針對每一項都有專門的案例以及相應的練習。個人認為最難的是假設檢驗這一塊,因為《統計學原理》是在之前的學期學習的,統計分析的原理基本上都記不起來,對于輸出假設檢驗結果對問題進行分析方面問題比較大。我自己也回去看了相應的統計學原理,有一定的了解后,進行實操也比較順利。假設檢驗主要是

單樣本T檢驗、獨立樣本T檢驗、配對樣本T檢驗。獨立樣本與配對樣本的區分很重要,這決定著我需要進行哪種檢驗以及得出什么樣的結論。假設檢驗中通常都需要先進行方差齊性的F檢驗,F值小,相應的p值越大,就可以說方差齊性,再進行均值差異是否顯著的T檢驗,T檢驗中,相應的p值小于顯著性水平,就可以認為兩個樣本的均值存在顯著差異。

問卷分析

這部分需要設置多個變量,輸入至少30份數據,我選擇跟舍友分工合作,我們的數據輸入降低到20份左右,彼此共享一部分數據合起來達到30份以上的樣本量。對于問卷的分析,主要從以下三方面進行: 大學生基本情況 運用描述性統計分析對大學生每月生活費支出做頻率分析、計算均值及離散程度,發現大學生的月生活費支出主要集中在800—1200范圍。

運用交叉表分析得出手機、電腦這兩種數碼產品樣本中全部大學生都擁有,其他數碼產品的擁有比率各有不同。在這學期當中更換意愿最強的數碼產品是手機,并且主要是高年級的學生有更換的打算。

對大學生月生活費支出與月消費數碼產品支出做相關與回歸分析,發現這兩個變量存在較為顯著的相關性,一般情況下,大學生月生活費越高,每月在數碼產品方面的消費相應也會越高。

數碼產品的購買情況

對樣本中大學生對數碼產品的了解途徑、購買方式、傾向性選擇、感興趣的促銷手段、能否接受分期付款做頻率分析,就目前來講,大學生主要通過網絡了解數碼產品,傾向于大陸行貨以及港澳臺行貨,對于打折促銷比較感興趣,大部分大學生還是會選擇實體店購買較大宗數碼產品,并且對分期付款方式較為能接受。

對所有在用數碼產品購買支出、月生活費支出以及月消費數碼產品支出做相關與回歸分析,發現所有在用數碼產品購買支出與月消費數碼產品支出存在較強的正相關性,可以說,月消費數碼產品支出越高,大學期間夠買數碼產品總支出越高的可能性就越大。

數碼產品的使用情況

對樣本中 使用數碼產品對作息時間的影響、上課玩手機的頻率、數碼產品使用時間最長的用途 做描述統計頻率分析,發現男生中有更大比例會因為使用數碼產品而影響作息時間,數碼產品使用時間最長的用途占比最大的是娛樂,基本上所有人都會在課堂上使用數碼產品,經常使用的頻率達到25.8%。

對使用數碼產品對學習的影響利弊進行頻率分析,并且對每天花在數碼產品上的時間、學生績點做相關回歸分析,大部分學生認為數碼產品對學習的影響利弊平衡或者利大于弊。相關性分析顯示,大學生每天使用數碼產品的時間與學生績點相關性不強,兩者之間沒有必然的聯系。

通過這次實習,對于spss軟件有了一個基本的認識,會對樣本進行一些簡單的描述性統計分析、假設檢驗、相關與回歸分析,能夠將一些數據信息轉換成可以直觀理解并運用的實用信息,對于以后的學習和工作大有好處。數碼產品帶給我們極大的便利。基于調查問卷的分析,大學生每天都會花相當一部分時間使用電子產品。學習績點與每天使用數碼產品的時長沒有必然聯系,不過,的確有一部分同學承認因過度使用數碼產品影響作息,同時也會在不同程度上受到他人使用數碼產品的影響。大學生應該學會合理控制分配使用數碼產品的時間,讓自己最大程度地受益。

下載spss統計分析實習心得3篇(精選5篇)word格式文檔
下載spss統計分析實習心得3篇(精選5篇).doc
將本文檔下載到自己電腦,方便修改和收藏,請勿使用迅雷等下載。
點此處下載文檔

文檔為doc格式


聲明:本文內容由互聯網用戶自發貢獻自行上傳,本網站不擁有所有權,未作人工編輯處理,也不承擔相關法律責任。如果您發現有涉嫌版權的內容,歡迎發送郵件至:645879355@qq.com 進行舉報,并提供相關證據,工作人員會在5個工作日內聯系你,一經查實,本站將立刻刪除涉嫌侵權內容。

相關范文推薦

    SPSS學習報告總結心得

    應用統計分析學習報告 本科的時候有概率統計和數理分析的基礎,但是從來沒有接觸過應用統計分析的東西,SPSS也只是聽說過,從來沒有學過。一直以為這一塊兒會比較難,這學期最初學......

    撰寫統計分析報告心得

    撰寫統計分析報告心得 撰寫統計分析報告,對于好多人來說,最大的困難是面對一大堆統計數字不知從何處著手,不知如何對這些數字進行歸納、分析、整理,并運用語言文字把這些數字......

    關于統計分析報告培訓心得

    統計分析報告培訓心得 2016年11月份對我是一個難忘的日子,因為我有幸成為國家統計局統計教育培訓中心組織的關于舉辦國家統計局部分重點支持地區統計干部培訓班的一名學員。......

    SPSS學習心得(大全)

    社會調查課程學習心得 大四的時候,學過spss相關課程,初步了解到它有非常強大的統計功能,對我們的學習、工作都會有很大的幫助,所以一直想學好這門課程。通過這個學期顏老師的課,......

    SPSS總結

    SPSS的基本統計功能 1、數據的預處理 2、描述性統計和探索性統計 3、假設檢驗(包括參數檢驗、非參數檢驗等) 4、方差分析(包括一般的方差分析和多元方差分析) 5、相關分析 6、......

    spss學習心得

    學院:傳播學院 專業:10級廣播電視新聞學 學號:129012010023 姓名:許咪咪 學習SPSS有感——與EXCEL之比較 在學習SPSS軟件的過程中,自己不敢有絲毫松懈,但同時感到學習壓力很大,有一......

    統計學SPSS軟件實操實習報告

    實習報告 本學期專業開設了統計學課程, 通過一學期的學習我們對統計學應用領域及 其類型基本概念有了基本了解,掌握了數據的收集、展示、分析的技術。但這都 是些書本上的......

    SPSS實驗報告,[精選五篇]

    S SPSS 軟件應用實驗報告長春工業大學人文學院 140906班 成昊 3 實驗報告 1一、實驗目得:掌握 SPSS 基本統計分析基本操作 ?二、實驗內容:1、根據上面得數據,制作莖葉圖,并計算出......

主站蜘蛛池模板: 中文字幕av伊人av无码av| 久久综合五月丁香久久激情| 国产午夜无码视频免费网站| 国产孩cao大人xxxx| 老子午夜精品888无码不卡| 亚洲色大成网站www永久| 熟妇与小伙子matur老熟妇e| 香港三级韩国三级日本三级| 国产成人精品福利一区二区| 人人妻人人添人人爽欧美一区| 日韩免费无码人妻波多野| 亚洲欧美日本中文字不卡| 日韩精品久久久久久久电影蜜臀| 国产成人av在线免播放观看更新| 人妻中文字幕av无码专区| 久久久久亚洲av无码网站| 国产成人无码视频一区二区三区| 国产激情无码一区二区三区| 狠狠色综合激情丁香五月| 国产成人av大片在线观看| 又污又爽又黄的网站| 久久精品高清一区二区三区| 高清无码在线视频| 人人做人人妻人人精| 免费无码高h视频在线观看| 久久综合久色欧美综合狠狠| 国产午夜亚洲精品理论片不卡| 亚洲成av人片在一线观看| 特级a做爰全过程片| 亚洲精品国产精品乱码不卡√| 老熟妻内射精品一区| 7878成人国产在线观看| 免费无码的av片在线观看| 国产69精品久久久久9999apgf| 欧美老熟妇乱子伦牲交视频| 色婷婷狠狠久久综合五月| 亚洲精品久久久蜜桃| 爆乳喷奶水无码正在播放| 国产av无码专区亚洲av果冻传媒| 亚洲在线观看| 免费人成视频欧美|