第一篇:spss學習第四天
Spss Spss學習第四天
我主要以課上的順序來一步步操作
一元回歸
兩個或兩個以上自變量對一個因變量的數量變化關系,稱為多元線性回歸分析,表現這一數量關系的數學公式,稱為多元線性回歸模型。
多元線性回歸模型是一元線性回歸模型的擴展,其基本原理與一元線性回歸模型類似,只是在計算上更為復雜,一般需借助計算機來完成。
(2)回歸方程的顯著性檢驗(F檢驗)
多元線性回歸方程的顯著性檢驗一般采用F檢驗,利用方差分析的方法進行。
(3)回歸系數的顯著性檢驗(t檢驗)
回歸系數的顯著性檢驗是檢驗各自變量x1,x2,…,對因變量y的影響是否顯著,從而找出哪些自變量對y的影響是重要的,哪些是不重要的。
與一元線性回歸一樣,要檢驗解釋變量對因變量y的線性作用是否顯著,要使用t檢驗。
課上實例:
Next 在這里可以針對不同的自變量設置不同的篩選引入方法。Options 下一步:設置變量引入剔除的標準規則 Methot
自變量篩選的方法: Enter:所選變量全部引入模型 Stepwise:逐步引入法 Remove:剔除變量 Backward:向后消去法 Forward:向前消去法
結果:
第一個表格是
描述統計量 第二個表格是 相關系數矩陣
第三個表格是 列出模型引入以及剔除的變量,這里是強制引入法,所有變量引入模型 第四個表格是 模型擬合優度統計量 第五個表格是 模型顯著性F檢驗
第六個表格是 每個回歸系數顯著性的t檢驗
第七個表格是 共線性診斷特征根有些接近0,有個別值特別大有嚴重共線性。條件指數如有個別維度值大于30,也說明有嚴重共線性!第八個表格是 關于殘差的描述統計量 第九個表格是 殘差的正態性診斷
多元回歸
虛擬變量
前面幾節所討論的回歸模型中,因變量和自變量都是可以直接用數字計量的,即可以獲得其實際觀測值(如收入、支出、產量、國內生產總值等),這類變量稱作數值型變量。然而,在實際問題的研究中,經常會碰到一些非數值型的變量,如性別、民族、職業、文化程度、地區、正常年份與干旱年份、改革前與改革后等定性變量。
在回歸分析中,對一些自變量是定性變量的先作數量化處理,處理的方法是引進只取“0”和“1”兩個值的0?1型虛擬(dummy)自變量。當某一屬性出現時,虛擬變量取值為“1”,否則取值為“0”。例如,令“1”表示改革開放以后的時期,“0”則表示改革開放以前的時期。再如,用“l”表示某人是男性,“0”則表示某人是女性。虛擬變量也稱為啞變量。需要指出的是,雖然虛擬變量取某一數值,但這一數值沒有任何數量大小的意義,它僅僅用來說明觀察單位的性質和屬性。
課上實列:
建立虛擬變量DU。設置邏輯運算,如果AREA==1時,DU=1,否則DU=0.結果:
邏輯回歸
稱為logistic模型(邏輯回歸模型)。
我們的邏輯回歸模型得到的只是關于P{Y=1|x}的預測。
但是,我們可以根據模型給出的Y=1的概率(可能性)的大小來判斷預測Y的取值。一般,以0.5為界限,預測p大于0.5時,我們判斷此時Y更可能為1,否則認為Y=0。如果該p值小于給定的顯著性水平(如=0.05),則拒絕因變量的觀測值與模型預測值不存在差異的零假設,表明模型的預測值與觀測值存在顯著差異。如果值大于,我們沒有充分的理由拒絕零假設,表明在可接受的水平上模型的估計擬合了數據
課上實例:
將因變量放入dependent欄,自變量放入covariates欄中 可以把幾個變量的乘積作為自變量引入模型作為交互影響項
線性回歸一樣,我們可以通過next按鈕把自變量分成不同的組塊,使不同的組塊按順序以不同的方式分步進入模型
Classification plots:制作分類圖,通過比較因變量的觀測值與預測值的關系,反映回歸模型的擬合效果。
Hosmer-Lemeshow goodness-of-fit: H-L檢驗。
Casewise listing of residuals:顯示個案的殘差值(顯示標準化殘差超過兩倍標準方差的個案或顯示所有個案)
Correlations of estimates:輸出模型中各參數估計的相關矩陣。
Iteration history:輸出最大似然估計迭代過程中的系數以及log似然值。CI for exp(B):輸出exp(beta)的置信區間,默認置信度為95% 在save選項中,我們可以選擇需要保存的數據文件中的統計量。包括殘差值、個案影響度統計量、預測概率值等等
結果:
第一部分有兩個表格,第一個表格說明所有個案(28個)都被選入作為回歸分析的個案。
第二個表格說明初始的因變量值(0,1)已經轉換為邏輯回歸分析中常用的0、1數值。
(2)第二部分(Block 0)輸出結果有4個表格。(組塊0里只有常數項,沒有自變量)
(3)Omnibus Tests of Model Coefficients表格列出了模型系數的Omnibus Tests結果。
(4)Model Summary表給出了-2 對數似然值、Cox和Snell的R2以及Nagelkerke的R2檢驗統計結果。
(5)Hosmer and Lemeshow Test P值大于0.05,說明模型有一定的解釋能力(6)Classification Table分類表說明第一次迭代結果的擬合效果,從該表格可以看出對于y=0,有86.7%的準確性;對于y=1,有76.9%準確性,因此對于所有個案總共有82.1%的準確性。
(7)Variables in the Equation表格列出了Step 1中各個變量對應的系數,以及該變量對應的Wald 統計量值和它對應的相伴概率。從該表格中可以看出x3相伴概率最小,Wald統計量最大,可見該變量在模型中很重要。B是回歸系數的估計值 Wald系數的wald檢驗
Exp(beta)的估計值以及區間估計
(8)Correlation Matrix表格列出了常數Constant、系數之間的相關矩陣。常數與x2之間的相關性最大,x1和x3之間的相關性最小。
(9)圖7-26所示是觀測值和預測概率分布圖。該圖以0和1為符號,每四個符號代表一個個案。橫坐標是個案屬于1的錄屬度,這里稱為預測概率(Predicted Probability)??v坐標是個案分布頻數,反映個案的分布。
(10)邏輯回歸的最后一個輸出表格是Casewise List,列出了殘差大于2的個案。
第二篇:第四天學習反思
第四天學習反思
今天學習了電子白板的應用方法,先是感覺很難,但經過一天的學習,基本了掌握白板的使用方法,相信在以后的具體應用中會越來越得心應手。電子白板具有直觀、形象和生動的特點,所以使用起來,很大程度上激發了學生的學習興趣,培養了學生的創新思維,進而產生濃厚的對話興趣和熱情,學習效果當然有很大的提高。
第三篇:SPSS學習心得體會
應用統計分析學習報告
本科的時候有概率統計和數理分析的基礎,但是從來沒有接觸過應用統計分析的東西,spss也只是聽說過,從來沒有學過。一直以為這一塊兒會比較難,這學期最初學的時候,因為沒有認真看老師給的英文教材,課下也沒有認真搜集相關資料,所以學起來有些吃力,總感覺聽起來一頭霧水。老師說最后的考核是通過提交學習報告,然后我從圖書館里借了些教材查了些資料,發現很多問題都弄清楚了。結合軟件和書上的例子,實戰一下,發現spss的功能相當強大。最后總結出這篇報告,以鞏固所學。spss,全稱是statistical product and service solutions,即“統計產品與服務解決方案”軟件,是ibm公司推出的一系列用于統計學分析運算、數據挖掘、預測分析和決策支持任務的軟件產品及相關服務的總稱,也是世界上公認的三大數據分析軟件之一。spss具有統計分析功能強大、操作界面友好、與其他軟件交互性好等特點,被廣泛應用于經濟管理、醫療衛生、自然科學等各個領域。具體到管理方面,spss也是一個進行數據分析和預測的強大工具。這門課中也會用到amos軟件。
關于spss的書,很多都是首先介紹軟件的。這個軟件易于安裝,我裝的是19.0的,雖然20.0有一些改變和優化,但是主體都是一樣的,而且都是可視化界面,用起來很方面且容易上手。所以,我學習的重點是卡方檢驗和t檢驗、方差分析、相關分析、回歸分析、因子分析、結構方程模型等方法的適用范圍、應用價值、計算方式、結果的解釋和表述。
首先是t檢驗這一部分。由于參數檢驗的基礎不牢固,這部分也是最初開始接觸應用統計的東西,學起來很多東西拿不準,比如說原假設默認的是什么。結果出來后依然分不清楚是接受原假設還是拒絕原假設。不過現在弄懂了。這部分很有用的是t檢驗。t檢驗應用于當樣本數較小時,且樣本取自正態總體同時做兩樣本均數比較時,還要求兩樣本的總體方差相等時,已知一個總體均數u,可得到一個樣本均數及該樣本標準差,樣本來自正態或近似正態總體。t檢驗分為單樣本t檢驗、獨立樣本t檢驗、配對樣本t檢驗。其中,單樣本t 檢驗是樣本均數與總體均數的比較的t檢驗,用于推斷樣本所代表的未知總體 均數μ與已知的總體均數uo有無差別;獨立樣本t檢驗主要用于檢驗兩個樣本是否來自具有相同均值的總體,即比較兩個樣本的均值是否相同,要求兩個樣本是相互獨立的;配對樣本t檢驗中,要正確理解“配對”的含義,主要用于檢驗兩個有聯系的正態總體的均值是否有顯著差異,跟獨立檢驗的區別就是樣本是否是配對樣本。這幾個方法用軟件操作起來都是相對簡單的,關鍵是分清楚什么時候用這個什么時候用那個。
然后是方差分析。方差分析就是將索要處理的觀測值作為一個整體,按照變異的不同來源把觀測值總變異的平方和以及自由度分解為兩個或多個部分,獲得不同變異來源的均值與誤差均方,通過比較不同變異來源的均方與誤差均方,判斷各樣本所屬總體方差是否相等。方差分析主要包括單因素方差分析、多因素方差分析和協方差分析等。這一部分在學習的過程中出現一些問題,就是用spss來操作的時候分不清觀測變量和控制變量,如果反了的話會導致結果的不準確。其次,對bonferroni、tukey、scheffe等方法的使用目的不清楚,現在基本掌握了多重比較方法選擇:一般如果存在明確的對照組,要進行的是驗證性研究,即計劃好的某兩個或幾個組間(和對照組)的比較。宜用bonferroni(lsd)法;若需要進行多個均數間的兩兩比較,且各組個案數相等,適宜用tukey法;其他情況宜用scheffe法。最后,對方差齊性檢驗、多重比較檢驗、趨勢檢驗理解不夠透徹,在方差檢驗中,post hoc鍵有lsd的選項:當方差分析f檢驗否定了原假設,即認為至少有兩個總體的均值存在顯著性差異時,須進一步確定是哪兩個或哪幾個均值顯著地不同,則需要進行多重比較來檢驗。lsd即是一種多因變量的三個或三個以上水平下均值之間進行的兩兩比較檢驗。相關分析是研究現象之間是否存在某種依存關系,并對具體有依存關系的現象探討其相關方向以及相關程度,是研究隨機變量之間的相關關系的一種統計方法。相關分析研究現象之間是否相關、相關的方向和密切程度,一般不區別自變量或因變量。主要有雙變量相關分析、偏相關、距離相關幾個方法。雙變量相關分析是相關分析中最常使用的分析過程,主要用于分析兩個變量之間的線性相關分析,可以根據不同的數據類型和條件,選用pearson積差相關、spearman等級相關和kendall的tau-b等級相關。當數據文件包括多個變量時,直接對兩個變量進行相關分析往往不能真實反映二者之間的關系,此時就需要用到偏相關分析,從中剔除其他變量的線性影響。距離相關分析是對觀測變量之間差異度或相似程度進行的測量,其中距離需要弄清楚,距離分析是對觀測量之間相似或不相似程度的一種測度,是計算一對觀測量之間的廣義距離。這些相似性或距離測度可以用于其他分析過程,例如因子分析、聚類分析或多維定標分析,有助于分析復雜的數據集。接著是回歸分析。相關分析研究的是現象之間是否相關、相關的方向和密切程度,一般不區別自變量或因變量。而回歸分析則要分析現象之間相關的具體形式,確定其因果關系,并用數學模型來表現其具體關系。比如說,從相關分析中我們可以得知“質量”和“用戶滿意度”變量密切相關,但是這兩個變量之間到底是哪個變量受哪個變量的影響,影響程度如何,則需要通過回歸分析方法來確定?;貧w分析的目的在于了解兩個或多個變量間是否相關、相關方向與強度,并建立數學模型以便觀察特定變量來預測研究者感興趣的變量。運用十分廣泛,回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關系類型,可分為線性回歸分析和非線性回歸分析。如果在回歸分析中,只包括一個自變量和一個因變量,且二者的關系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個或兩個以上的自變量,且因變量和自變量之間是線性關系,則稱為多元線性回歸分析。應用回歸分析時應首先確定變量之間是否存在相關關系,如果變量之間不存在相關關系,對這些變量應用回歸預測法就會得出錯誤的結果。正確應用回歸分析預測時應注意:①用定性分析判斷現象之間的依存關系;②避免回歸預測的任意外推;③應用合適的數據資料; 接下來是因子分析。因子分析是指研究從變量群中提取共性因子的統計技術。最早由英國心理學家c.e.斯皮爾曼提出。他發現學生的各科成績之間存在著一定的相關性,一科成績好的學生,往往其他各科成績也比較好,從而推想是否存在某些潛在的共性因子,或稱某些一般智力條件影響著學生的學習成績。因子分析可在許多變量中找出隱藏的具有代表性的因子。將相同本質的變量歸入一個因子,可減少變量的數目,還可檢驗變量間關系的假設。因子分析的主要目的是用來描述隱藏在一組測量到的變量中的一些更基本的,但又無法直接
測量到的隱性變量。從顯性的變量中得到因子的方法有兩類。一類是探索性因子分析,另一類是驗證性因子分析。探索性因子分析不事先假定因子與測度項之間的關系,而讓數據“自己說話”。而驗證性因子分析假定因子與測度項的關系是部分知道的,即哪個測度項對應于哪個因子,雖然我們尚且不知道具體的系數。這一部分不能用spss來操作,要用amos,用起來也很方便。
最后一部分學習的是結構方程模型。結構方程模型是一種融合了因素分析和路徑分析的多元統計技術。它的強勢在于對多變量間交互關系的定量研究。在近三十年內,其大量應用于社會科學及行為科學的領域里,并在近幾年開始逐漸應用于市場研究中。結構方程模型是對顧客滿意度的研究采用的模型方法之一。其目的在于探索事物間的因果關系,并將這種關系用因果模型、路徑圖等形式加以表述。結構方程模型與傳統的回歸分析不同,結構方程分析能同時處理多個因變量,并可比較及評價不同的理論模型。與傳統的探索性因子分析不同,在結構方程模型中,我們可以提出一個特定的因子結構,并檢驗它是否吻合數據。通過結構方程多組分析,我們可以了解不同組別內各變量的關系是否保持不變,各因子的均值是否有顯著差異。
這門課要學習完了,整個學習的過程是充滿曲折和挑戰的,我見證了自己從一無所知到困惑迷茫再到略懂再到會用的過程。甚至學完之后有些問題還沒有徹底搞清楚,自己接下來還會不斷的探索的。spss是個很神奇的工具,結合amos和excel更是如虎添翼,相信學習了spss在以后的論文和數據分析中很有用。這門課給我的感覺是看起來很難,但是實際學起來就好很多,因為當我結合具體實例和軟件的時候,很多抽象的問題就豁然開朗了。但是想給老師一個建議,這門課需要很強的統計和概率論的基礎,要不然就會很難聽懂或者聽得半懂。然后這門課的很多方法的相關資料都是用在醫療衛生、自然科學領域的,在管理中的應用的資料不怎么多。老師希望我們上課的時候結合在管理中的應用來學習,但是資料有限,希望老師在這個方面多給學生一些引導。篇二:spss心得體會
學習spss在教育統計中的應用心得體會
一、什么是spss?為什么要學習spss?
新學期開始時,在信息化教育測量與評價的課程中第一次接觸
到spss這個軟件,作為本科是計算機專業出身的我,當時只知道spss是一套統計軟件,就是一套根據統計學原理所編寫出來的統計分析軟件,至于統計什么?分析什么?我一無所知,尤其是看到老師推薦的《spss在教育統計中的應用》這本書的時候,就簡單的把它理解為用spss軟件來統計、分析與教育相關的數據,最終得出想要的結論而已,而現在看來,我當初的想法未免有點簡單與無知。下面就來讓我們了解一下spss。spss軟件是一組專業的、通用的統計軟件包,同時它也是一個組合式軟件包,兼有數據管理、統計分析、統計繪圖和統計報表功能。它廣泛用于教育、心理、醫學、市場、人口、保險等研究領域,也用于產品質量控制、人事檔案管理和日常統計報表等。spss軟件對計算機硬件系統的要求較低;對運行的軟件環境要求寬松,有各種版本可運行在windows xp、win7系統環境下,spss統計軟件采用電子表格的方式輸入與管理數據,能方便地從其他數據庫中讀入數據(如dbase,excel,lotus等)。
我為什么要學習spss呢?其實很簡單,一方面,做為一名 研究生,要具備一定的科研能力,如今量化研究的方法大行其道,一切要以事實說話、要以數據說話,有了數據支持的研究才能更容易被認可、被推論。另一方面,根據對aect94定義的理解,教育技術
學研究的對象是學習過程和學習資源,包含大量的偶然現象和非精確現象。因此,要深入研究教育技術現象及其規律,必須運用統計描述、統計分析方法和模糊數學分析方法,才可能使這門學科達到真正完善的地步。教育技術學研究的現象多數是偶然的現象,其變化發展往往具有幾種不同的可能性,究竟出現哪一種結果,那是帶有偶然性的,是隨機的。這類偶然現象是遵循統計規律的,當隨機現象是由大量的成份組成,或者隨機現象出現大量的次數時,就能體現統計平均規律。我們只有對數據資料作統計處理,才可能可以發現它們的內在規律,掌握現象的特征,檢驗研究的假設,才能得出準確的、可靠的研究結果。
二、對本spss各章節學習的心得
新課程老師帶領下,采取一種新的學習方式,老師講解了基礎部分后,全班同學采取小組分工、協作學習,然后對全班同學進行講解學習內容,教師進行當堂指導,這種方法改變了同學們的學習態度,同學們不再是課前不預習,課下不復習的狀態,每組都有自己的任務,課前有一定的壓力,同學間的討論也明顯的增多,例如:一次課下同學們在一起吃飯,有幾位同學還在調侃說“兩個菜之間用spss進行分析后得出的結果不接受h0假設,也就是兩個菜之間不相關”,雖然這只是一個課下的玩笑,但是這也可以體現出對學習的態度的轉變。下面就本學期的所學spss的各章節做一下歸納,這些歸納也是基于本人平時在課前預習,課上及課后的一些所思所想,也許會有一些理解上的偏頗在內,但這僅限于心得而已。本學期學習各個章節
及分工如下表: 章節名稱
1.spss的認識
及數據文件的處理
2.數據清理與
基本統計及測
量質量分析 3.t檢驗 4.方差分析1、2人 3人 7.聚類分析 8.統計圖形 2人 1人 2人 6.卡方檢驗 3人 2人 5.相關分析 3人 分工人數 章節名稱 分工人數 spss的認識及數據文件的處理心得體會
可能是由于是同學們第一次講,萬事開頭難,壓力很大,在大家認為最為簡單的內容講解上,兩位同學并沒有完全展現出二人實際水平,大家在這一節課上都感覺到很壓抑,總的感覺是這節內容很簡單,但是內容又很松散,可講的東西太多,講的東西多就沒有突出重點和難點,所以聽過之后就有種無數的碎片漂浮在腦海中一樣,很難將知識系統化,課后總結一下無非就是兩塊,一塊是了解spss軟件的歷史及基本功能,還有一塊就是spss軟件當中一個模塊叫做數據文件的處理,在認識spss軟件當中了解到它是一組社會科學統計軟件包,誕生于1968年,當時美國的3位大學生開發出了它,經過這么多年的后續開發,spss已經有了很多的版本,具有了更的兼容性、和更友好的操作界面,也在很多的學科領域得到了應用,而在教育中的應用
只是它的一個分支。此外它對硬件的要求也很低,當前一般的電腦都能安裝它,安裝的過程中也沒有什么特殊的方法,傻瓜式的安裝方式完全就可以滿足。在數據文件的處理方面,主要是要學會定義變量、處理變量兩方面;定義變量是要注意根據自己實際采集的數據來定義變量,例如是數值型的變量還是文本型的變量及變量的長度,小數點保留尾數等,總之就是一句話,根據實際調查的數據要求來定義相應變量。變量定義只有只要細心的將實際調查的數據錄入到spss當中即可,當然也可以在spss軟件之外進行數據編制,可以通過execel等編輯后可以直接導入到spss中。在處理變量模塊當中,可以對變量進行添加、刪除、拆分與合并等操作,只要根據實際調查數據,細心調整變量,使操作更加簡便和明了。
2、數據清理與基本統計及測量質量分析的心得體會
數據的清理與基本統計及測量質量分析由兩名同學進行講解,由于吸取了上節課兩名同學的經驗,本節講授的明顯好于上節課,這里我也是把它分為兩塊進行學習,一塊是數據的清理,另一塊是相關統計理論的學習。在數據清理方面主要學習了奇異數據的檢查與清理,在這里本人覺得非常有必要進行數據清理,在實際的調查數據時難免會出現錯誤或者碰到極為特殊的典型案例,所以這些數據很難符合大眾規律,在統計、分析過程中可能會造成分析結果異常,從而直接影響最終的結論。所以覺得非常有必要進行數據檢查與清理。而我認為本節的難點不是怎樣熟練運用spss軟件,而是在第二塊中的,相關統計理論的學習,學習這些理論需要一定的數學基礎,只有明確這些
理(論如均值、標準誤差、中數、眾數、全距、四分位等)原理,知其然,知其所以然,這才是關鍵,在spss中想要實現對數據進行以上分析只需要輕輕點擊一下按鈕就可以是輕松實現,但是如果不清楚到底用它們來做什么就無從談起做數據分析了,所以本節內容知道分析原理的重要性要遠遠大用spss對數據做出相關分析的重要性??偨Y為一句話“知道它們是做什么的后才會讓它們去做該做的工作”。
3、t檢驗的心得體會 t檢驗由兩名同學講解,在學習t檢驗時,首先要明確什么樣的數據適合t檢驗,t檢驗的結果要說明什么問題?經過學習可以知道,t檢驗是對兩組數據間的平均水平或均數的比較,通過比較可以得出兩組數據間的顯著性水平,而這兩組數據都要符合正態分布,方差具有齊同性,t檢驗由兩種情況,一種配對提檢驗,要求兩組數據不可以獨立顛倒順序,如果顛倒順序就會改變問題的性質,這種t檢驗稱為配對t檢驗;另一種情況下的t檢驗是兩組數據可以任意顛倒順的檢驗稱為獨立樣本的t檢驗。但是這兩種情況都必須符合最先的要求,即都是符合正態分布,方差都具有齊同性。通過spss的相關操作可以輕松完成檢驗,但是在檢驗的過程中必須設置置信區間,一般設置為95%,在設置置信區間時必須要考慮到所做分析的數據,如果像要得到顯著性差異的結果則可盡量將置信區間設置小些,如果想要得到不顯著差異就要將置信區間甚至大些,本人的理解為若置信區間小,則可以理解為在小范圍內是可以相信的,但如果將分析結果的置信區間值調大則說明在很大的范圍內這個結果可信,反之則不可信,篇三:spss學習總結
學習spss感想
以前學統計學的時候就聽老師講過spss有非常強大的統計功能,對我們學習、工作有很大的幫助,所以我一直認為spss很神秘。通過這個學期周老師的課讓我對此清楚了許多,也學到了spss強大的統計功能,更加讓我明白了spss與excel的區別。spss是“社會科學統計軟件包”(statistical package for the social science)的簡稱,是一種集成化的計算機數據處理應用軟件。1968年,美國斯坦福大學h.nie等三位大學生開發了最早的spss統計軟件,并于1975年在芝加哥成立了spss公司,已有30余年的成長歷史,全球約有25萬家產品用戶,廣泛分布于通訊、醫療、銀行、證券、保險、制造、商業、市場研究、科研、教育等多個領域和行業。spss是世界上公認的三大數據分析軟件之一(sas、spss和systat)。
在學習spss期間,我主要遇到的問題是后面幾章,spss的參數檢驗、方差分析、相關分析、線性回歸分析、聚類分析、因子分析等。在參數檢驗中我不知道原假設是什么,導致分析的時候不知道該拒絕原假設還是接受原假設,不能分析出統計結果。不會區分單樣本t檢驗和兩配對樣本t檢驗的區別,現在懂得了它們都要服從正態分布,基本思想是小概率反證法,反證法思想是先提出假設(檢驗假設h0),再用適當的統計方法確定假設成立的可能性大小,如果可能性小,則認為假設不成立,否則,還不能認為假設不成立。
在學習方差分析中,開始常常把觀測變量和控制變量弄混淆,在分析的時候應分別送入哪個對應框中,如果反了的話會導致結果的不準確。其次,對lsd、bonferroni、tukey、scheffe等方法的使用不清楚,現在基本掌握了多重比較方法選擇:一般如果存在明確的對照組,要進行的是驗證性研究,即計劃好的某兩個或幾個組間(和對照組)的比較。宜用bonferroni(lsd)法;若需要進行多個均數間的兩兩比較,且各組個案數相等,適宜用tukey法;其他情況宜用scheffe法。最后,對方差齊性檢驗、多重比較檢驗、趨勢檢驗理解不夠透徹,在方差檢驗中,post hoc鍵有lsd的選項:當方差分析f檢驗否定了原假設,即認為至少有兩個總體的均值存在顯著性差異時,須進一步確定是哪兩個或哪幾個均值顯著地不同,則需要進行多重比較來檢驗。lsd即是一種多因變量的三個或三個以上水平下均值之間進行的兩兩比較檢驗。
在學習相關分析的過程中,在繪制散點圖時,不知道哪個該做橫坐標,哪個該做縱坐標,明白了橫坐標是解釋變量,縱坐標是被解釋變量,還有對相關系數的種類分析不熟練等。在學習回歸分析的過程中,對dw可檢驗的含義不理解,不記得對應的dw表示的殘差序列的相關性。對解釋變量向前篩選、向后篩選、逐步帥選策略不能熟練掌握,特別是對向前向后篩選時到處的結果不會進行分析。
學習聚類分析中,變量的選擇分不清,無關變量有時會引起嚴重的錯分,應當只引入在不同類間有顯著差別的變量,盡量只使用相同類型的變量進行分析。分類數不明確,從實用角度講,2~8 類比較合適。掌握了k-means cluster 分析,樣本量大于100時有必要考慮,只能使用連續性變量。
學習因子分析的過程中,對提取出來的因子的實際含義不清晰,不能使因子具有命名解釋性。
學習了spss后,我不禁想到了spss與excel的區別,這一點是針對像我這樣開始只懂得用excel的人來說。從個人的體會來說,二種軟件有一定相似,操作都簡便,同時又有一些可以互補的地方。但是spss又比excel更加強大:
一、圖型的表現力是spss的主要優點之一
應該說,excel的圖型表現主要是簡便,對許多的人來說基本夠用,但對于科學的表現,spss就更為詳細和準確,這一點據說在所有統計軟件中都突出。
二、通過spss檢驗方差齊性和數據分布
假設檢驗中,采用的t檢驗和方差檢驗都需要滿足二個要求,即 1.樣本方差齊性
2.樣本總體呈正態分布
在excel中,提供了f檢驗來檢驗方差齊性問題,也就是可以先通過f檢驗確定方差齊性與否來選擇下一步用哪個t檢驗或方差檢驗分析工具。但只要數據多于二組則無從下手;通過描述統計大約能從峰度和偏度來了解樣本的分布實際工作中,只要分布單峰且近似對稱分布,也可應用,但要具體確定樣本的分布也有難度。這二個問題在spss就可以解決
最后,在感嘆它的方便與快捷的同時,對軟件開發人員的智慧到了肅然起敬的地步。一直覺得計算機語言是最難的一門外語。雖然本科時曾經對這種邏輯性很強的東西很感興趣,并在編程課上取得不錯的成績,但一直覺得這似乎不是我能掌控的東西。spss的神奇之處在于,它省去了使用者巨大的計算量,并提高準確性。它開發了開發者的智慧,卻弱化了使用者的大腦。篇四:spss學習心得
學院:傳播學院 專業:10級廣播電視新聞學 學號:129012010023 姓名:許咪咪
學習spss有感——與excel之比較
在學習spss軟件的過程中,自己不敢有絲毫松懈,但同時感到學習壓力很大,有一定的學習難度,軟件的操作可以通過短時間內熟悉,但對數據的結果分析還需要很大很大的提高。在掌握了spss相關技能和熟知了spss之于excel的優越性之后,spss成了往后我進行數據分析、調查的首選軟件,如若能自由地結合二者使用,便是更佳選擇。excel的基本功能中包括了比較強大的數據處理功能,還提供了豐富的工作表函數,可以完成很多類型的數據處理和分析任務。除了工作表函數以外,excel還提供了一個稱為“分析工具庫”的加載宏。excel應用的普及性,許多人都把它作為最常用的統計軟件來使用。excel提供的統計功能包括數據管理、描述統計、概率計算、假設檢驗、方差分析和回歸分析等等,對于統計學原理所涉及的大部分內容已經足夠了。然而,在學習excel的統計功能以前我們有必要先交待一下excel在統計分析方面的局限性。
1、就統計學原理所涉及的統計方法而言,excel沒有直接提供的方法包括:箱線圖(boxplot)、莖葉圖、相關系數的p-值、無交互作用可重復的雙因素方差分析、方差分析中的多重比較、非參數檢驗方法、質量控制圖等。
2、按照優秀圖形的標準,excel做出的很多圖形都不合格。excel的有些圖形可能適合于普通大眾,但不適合用于科學報告中。例如二維圖形的三維表示,圓柱圖,圓錐圖等等。excel提供的有些圖形可能永遠不應該使用。
3、excel不能很好的處理缺失值(missing data)問題。總體來說excel對缺失值的處理方式遠不如專門的統計軟件恰當。
4、雖然大部分情況下excel的計算結果都是可靠的,但在一些極端情況下excel的計算程序不夠穩定和準確(特別是excel2003以前的版本中);有些自動功能可能會導致意想不到地結果。
總體來說,excel為我們輸入和管理數據、描述數據特征、制作統計表和統計圖都提供了強大的支持,但在處理復雜的計算時有時候誤差相對較大,因而一些數據處理專家建議人們避免采用excel處理復雜的統計問題。spss能在簡單操作基礎上,解決excel存在的這些問題,甚至非統計學相關專業的人員也可以利用這個軟件對復雜的統計問題進行處理、分析。平時我慣常使用的數據分析軟件也是excel。雖然使用excel可以對數據進行透視、分類、篩選以及計算相關系數等,但是這些操作都需要自己每一步每一步的進行手動操作,而使用spss軟件在對數據進行整理時,只需對軟件某選項內設
置變量條件,系統便自動的進行整理。而且,在學習與應用spss過程中,我了解到應用spss軟件只要了解統計分析的原理無需知曉統計方法的各種算法就能得到自己所需要的統計分析結果。另外對于常見的統計方法,spss的命令語句、子命令及選擇項的選擇絕大部分在軟件內的對話框操作完成,我們無需花費大量的時間記憶大量的命令和選擇項。在這方面,spss軟件的應用可以使我們節省大量時間,而且軟件操作比較容易上手,在當今這個時間就是金錢的社會上,我們掌握spss軟件的應用,也就是為自己賺取了不少金錢。
另外在與spss的接觸中,我逐漸了解到spss軟件的強大與方便。spss提供了從簡單的統計描述到復雜的多因素統計分析方法,其中有數據的統計分析、統計描述、交叉表分析、二維相關、方差分析、多元回歸、因子分析、聚類分析、降維等分析方法。利用這些方法可以得出計算數據和統計圖形,看出數據的離散程度、集中趨勢和分散程度,單變量的比重,還有對數據進行標準化處理。利用這個軟件對問卷數據進行分析是極好的。雖然,這些方法大部分我還是不會使用,能夠讓我利用并成功分析的方法只有寥寥幾種,但是這種簡單便捷的操作讓我對spss的興趣卻是越來越濃。spss 像手槍,對于社會統計應用spss,足夠精度了。exce對初級統計技術也差不多了,里面有很多類型的圖,配之以數據透視表,模擬運算表,宏,高級篩選,窗體,而且方便的單元格和變量操作這些優點都使得excel 更利于小規模,低精度,邏輯關系簡單的數據,但是簡單的圖和表,有時不需要通過假設檢驗,也能看出很多關系或結論,這些直觀的現象有的時候比spss的假設檢驗更有說服力(spss的假設檢驗雖然精確,但是成本是很多模型假定)其統計思想易于被日常生活所接受,所以execl用得好,更能顯出使用者諳熟研究背景和統計思想,這個修煉層次更高,就像武功最高深的人更最簡單的工具,最簡潔的招式,實而不華一樣。
了解了excel和spss的這個比較后,可以看出spss的統計思想體現了更多數理統計的味道,而excel 則更多體現了描述統計的味道,所以了解spss更重要的是了解不同模型背后的統計想法,當然這些在使用spss的過程中會慢慢的積累的。一個和學習統計思想無關的,但是在學習spss中必須學會的是“數據組織方式和數據測度”,這個對于那些學習信息的人容易理解,對文科出身的人不容易理解。但是這個問題對于初學者很重要。在實際使用spss時,就得按部就班地按照先定義變量,調測度,在錄入(導入數據),再分析。分析并不是整個流程。不注意數據的組織方式和數據測度會使很多統計模型誤用(實際上不能用,但是軟件輸出了統計結果),這種誤用不是統計模型用得好不好的問題,而是能不能用的問題!
現在,學期即將結束,同樣的這門課程也到了尾期,在這學期學到了很多,并且還有很多沒有學到。我們學習時所操作的軟件是英文版,這對英語基礎不好的我來說是個考驗。同時,由于我們所學專業并非必須擁有計算機,導致我們平時能夠練習的機會比較少,造成了掌握不牢固,前學后忘現象比較嚴重?,F在呢,很是希望能夠把spss的應用熟練操作,并且能把它變為自己的一種本能,使自己在今后的工作與學習中,可以輕松運用。篇五:spss學習總結
隨著速度越來越快,計算機的功能越來越多,計算統計功能反而已經成為了計 算機的一個次要部分。不過,對于我們這些從事社會學學習和研究的人來說,快速 的計算和統計仍舊是我們使用計算機的主要功能,所以我們平日的工作總是離不開 spss(statistical package for the social science社會科學統計軟件)。s pss雖然好用,但是學起來并不容易,特別是在目前高校的教育體制下,教材的過時 以及課程設置的不合理,使得spss的學習成為了社會學、統計學以及其他社會科學 學科學生極為頭痛的一件事情。更為棘手的是:往往在學生還沒有學會spss之前,一些調查研究任務卻又強迫他們使用spss進行分析工作,使得他們十分苦惱。
本教程就是為那些已經學習過統計學,并且粗通計算機,但尚未學習過spss的 社會科學學科的學生準備的,運用面向問題的教學方法,通過一個調查問卷的具體 分析過程使學生們對spss有一個感性認識,并能夠再沒有完全掌握spss的前提下利 用spss完成一些分析任務。因此,本文不強調面面俱到只強調讀者能夠完成調查分 析的任務,所以會故意忽略spss一些十分重要但未必會用到的功能,還請讀者 見諒。如果讀者確實需要使用這些功能,建議參考一本好一點的輔導書。
相信大家知道:依次完整的利用計算機輔助的問卷調查包括問卷設計、問卷訪 問、數據輸入、數據分析、數據輸出、調查報告的撰寫六大部分。spss軟件參與的 主要是數據輸入、數據分析和數據輸出這三個部分。接著,本文就將分成這三塊,分別介紹spss的使用以及一些技巧、經驗。
1、數據輸入
在完成了問卷訪問這個部分之后,我們手中便擁有了數百至上萬份調查問卷,這些問卷計算機是無法直接識別處理的,我們必須將它們進行適當的編碼。由于采 用計算機分析,問卷在設計階段就應該考慮到今后的編碼問題,所以應該將問卷設 計地以客觀題為主,被訪問者填寫的應該只是注入數字、選項這些計算機能夠處理 的信息。我們首先要為問卷的每一個填寫項都起一個代號,并決定它的數據屬性(主要是區分為字符串、邏輯串還是數字)。筆者的習慣是首先用英文字母表示填寫 項的大題號,接著用阿拉伯數字表示填寫項的小題號,然后再用英文字母表示填寫 項是本小題的第幾項,最后再加上表示數據屬性的后綴,比如說第二大題第三小題 的第四個字符串填寫項的代號便為b3d_s。在以后的所有分析過程中便利用這個代號 來表示數據的具體內容。接下來,便是具體的輸入過程了。首先,我們要對spss的數據文件有一個大致的 了解,這對以后的學習十分關鍵。打開spss之后,我們便會看到一個類似excel電子 表格的東西,但如果你因此便把spss的數據文件理解為是類似于excel的東西那么就 錯了,雖然spss數據的表現形式酷似excel,但就實質而言它更接近于一個數據庫文 件,每一個數據列都有它的列名稱(也就是我們剛剛起的代號)、列屬性(也就是 剛剛我們決定的數據屬性),這些都類似于數據庫中的字段名稱、字段屬性,如果 讀者以前學習過數據庫的相關知識,那里理解起來就十分簡單了。由于數據繁多,所以我們的輸入過程往往不是由本人進行,而是請專業的數據 錄入人員代勞,而那些人員往往是不會使用spss的,所以我們在實際使用過程中數
2、數據分析
對于外行人來說。spss最為難學的部分便是它analyze菜單下十多項子菜單以及 這之下四五十項孫菜單的統計功能,每一項統計功能的用法和功能對于外行人來說 就像是天書一般。但是對于學習過統計學的讀者來說,這應該不是問題。再加上sp ss在操作的簡易性上還是十分優秀的,每一項統計功能一般只需要在窗口下選擇統 計用的變量,然后設置一下必要的選項,最后按下ok便可以了。所以在這里,具體 的操作就不再介紹了。在這里,筆者覺得有必要先介紹一下spss的viewer。在下面 的數據分析和數據輸出過程中,我們調用spss的數據分析和制圖模塊所得到的結果 都會由spss自動輸出到一個名為viewer的程序中,并且可以以spo為后綴名保存成為 專門的文件。這樣做的好處是如果你的分析和制圖工作一次沒有完成,那么利用保 存的spo文件,就不必下一次重新作過了。同時,將所有的分析和制圖的結果都保存 在一個spo文件中,并隨調查報告作為電子附件一起陳送給客戶,一來有利于客戶檢 驗分析的可靠性,二來也適合于今后電子化、網絡化的趨勢。
根據筆者的經驗,spss的學習者在這一階段(數據分析階段)最主要的問題在于以往 學習的統計指標總是中文的,而spss中的統計指標是英文的,指標的中文和英文往 往無法一一對應,因此,在這一部分中,筆者主要是附上一張統計指標的中英文對 照表,如下: summarize菜單項 數值分析過程
??frequencies子菜單項 單變量的頻數分布統計
??descriptives子菜單項 單變量的描述統計
??explore子菜單項 指定變量的綜合描述統計
??crosstabs子菜單項 雙變量或多變量的各水平組合的頻數分布統計
??means子菜單項 單變量的綜合描述統計
??independent sample t test子菜單項 獨立樣本的t檢驗
??paired sample t test子菜單項 配對樣本的t檢驗
??one-way anova子菜單項 一維方差分析(單變量方差分析)anova models菜單項 多元方差分析過程
??simple factorial子菜單項 因子設計的方差分析
??general factorial子菜單項 一般方差分析
??multivariate子菜單項 雙因變量或多因變量的方差分析
??repeated factorial子菜單項 因變量均值校驗 correlate菜單項 相關分析
??bivariate子菜單項 pearson積矩相關矩陣
和kendall、spearman非參數相關分析
??partial子菜單項 雙變量相關分析
??distance子菜單項 相似性、非相似性分析 regression菜單項 回歸分析
??liner子菜單項 線性回歸分析
??logistic子菜單項 二分變量回歸分析(邏輯回歸分析)
??probit子菜單項 概率分析
??nonlinear子菜單項 非線性回歸分析
??weight estimation子菜單項 不同權數的線性回歸分析
??2-stage least squares子菜單項 二階最小平方回歸分析 loglinear菜單項 對數線性回歸分析
??general子菜單項 一般對數線性回歸分析
??hierarchical子菜單項 多維交叉變量對數回歸分析
??logit子菜單項 單因變量多自變量回歸分析 classify菜單項 聚類和判別分析
??k-means cluster子菜單項 指定分類數聚類分析
??hierarchical cluster子菜單項 未知分類數聚類分析 ??discriminent子菜單項 聚類判別函數分析 data reduction菜單項 降維、簡化數據過程
??factor子菜單項 因子分析
??correspondence analysis子菜單項 對應表(交叉表)分析
??homogeneity analysis子菜單項 多重對應分析
??overals子菜單項 非線性典則相關分析 scale菜單項
??reliability ananlysis子菜單項 加性等級的項目分析
??multidimensional scaling子菜單項 多維等級分析 nonparametric tests菜單項
??chi-square子菜單項 相對比例假設檢驗
??binomial子菜單項 特定時間發生概率檢驗
??run子菜單項 隨即序列檢驗
??1-sample kolmogorov smirnov子菜單項 樣本分布檢驗
??2-independent samples子菜單項 雙不相關組分布分析(轉載于:spss學習心得體會)??k independent samples子菜單項 多不相關組分布分析
??2 related samples子菜單項
雙相關變量分布分析
??mcnemar test子菜單項 相關樣本比例變化分析
??k related samples子菜單項 相關變量分布分析
??cocharns q test子菜單項 二分變量均數檢驗
??kendalls w子菜單項 一致性判定 time series菜單項
??exponential smoothing子菜單項平衡序列的隨機分量
??curve estimation子菜單項 數據擬合??autoregression子菜單項 一階自回歸誤差線性方差檢驗
??arima子菜單項 綜合自回歸移動平均分析
??xii arima子菜單項 增倍和加性季節因子分析 survival菜單項
??life tables 生命表分析
??kaplan-meier 雙事件分布檢驗
??cox regression 事件與時間變量相互分析
??cox w/time deep cov 時間函數cox分析
有了這一張表,相信讀者便可以很容易的利用spss進行各類分析了。實際 上,數據分析這一階段,就使用spss上沒有什么難度,關鍵是在于究竟你能夠怎樣 最好的利用spss提供的分析模塊從數據中挖掘出更多的東西來,這可就要依靠你的 不斷摸索了。最后,還要介紹一個小技巧:
如果讀者所在學校今后學習的spss軟件為dos版本的話,那么今后你就必 須利用命令行來駕馭spss,所以你在利用spss的windows版本進行數據分析 的過程中,可以利用每一項統計功能窗口ok按鈕下的paster按鈕將本統計功能的命 令行復制到剪貼板,然后再仔細研究。
第四篇:SPSS學習感想范文
SPSS學習感想
在這學期以前我并沒有學過統計學,甚至沒有接觸過它,因此對它的認識可謂是從零開始的,但經過這一段的學習,也算是受益良多,下面我就簡單說下感想吧。
第一節課老師簡單講述了下這門課的概況,給了我們英文版和中文版教材便讓我們開始分組講授各個部分,當時只覺得毫無頭緒,對于沒接觸過的事物人總有莫名的恐懼,這門課看似還很難,就比較擔憂。但看了分到的關于方差分析部分的英文版書后,覺得老師推薦的這本書真的很好,雖然看英文比較痛苦,但勝在通俗對于我這種從未接觸過的人來說也是讀的懂得,這大概也是許多外國教材的優點,會有很實際的舉例幫助理解,語言讀起來也是簡單易懂,不像許多中國教材那么晦澀。后期在看英文文獻的時候看到不懂得SPSS模型便會再翻出這本書來看,許多的中文版的教材也看了但總是較難迅速找到想看的知識點,且理解起來也很困難。
說完對于教材的整體心得,就來說說講課方面的心得吧,起初大家對于老師讓學生講授的方式不是很認同,覺得自己能力有限,問題太難,不一定能看得明白更勿論講了。但經過后來自己看教材做PPT,發現其實做起來并沒有看起來那么難,雖然花了不少時間但最后也算是基本了解大意及步驟,并且自己花了時間做出來的東西會特別記憶深刻,因此做完后對于方差分析這一塊也算是有了整體的認識和了解,之后在看論文中這部分的模型來也輕松許多。所以這種講課方式其實也確實能幫助同學們更積極的學習這門課程。
接著說說學習過后對SPSS的整體認識吧,我專門去百度了下它的全稱,定義為SPSS是“社會科學統計軟件包”(Statistical Package for the Social Science)的簡稱,是一種集成化的計算機數據處理應用軟件。之前看論文的時候會經常看到各種表格圖形,各種結果輸出,當時并不明白,以前也沒見過,因此總會跳過實驗整個設計直接看結果。在學了這門課后總算對其有了初步的認識。它其實大致分為兩個大部分,一是簡要介紹描述性和推斷性統計,包括描述性統計、推斷性統計原理與推斷性統計機制;二是統計分析方法,包括卡方檢驗、獨立樣本t檢驗、配對樣本t檢驗、方差分析等檢驗差異的統計方法,和多元回歸分析、因子分析和結構方程模型等檢驗聯系的統計方法。利用這些方法可以得出計算數據和統計圖形,看出數據的離散程度、集中趨勢和分散程度,單變量的比重,還有對數據進行標準化處理。利用這個軟件對問卷數據進行分析是極好的。統計分析也主要有兩大類,一類是驗證差異的,另一類是驗證相關性的。驗證差異的主要有t檢驗和方差分析,驗證相關性的主要有回歸分析、因子分析和結構方程模型。通過課程的學習我基本知道了他們的區別和應用場景,如t檢驗適合兩個變量之間的差異比較,而方差分析則在變量較多時使用,從而達到便捷的效果。
在學習方差分析時,我剛開始常常把因變量和自變量弄混淆,在分析的時候應分別送入哪個對應框中,如果反了的話會導致結果的不準確。接著,對LSD、Bonferroni、Tukey、Scheffe等方法的使用不清楚,現在基本掌握了多重比較方法選擇:一般如果存在明確的對照組,要進行的是驗證性研究,即計劃好的某兩個或幾個組間(和對照組)的比較,宜用Bonferroni(LSD)法;若需要進行多個均數間的兩兩比較,且各組個案數相等,適宜用Tukey法;其他情況宜用Scheffe法。因為經?;煜?,所以這些都被我記錄在PPT中,好讓自己以后方便查看。還有,當時對方差齊性檢驗、多重比較檢驗的理解也存在困難,但經過小組討論對他們也基本有了了解。當方差分析F檢驗否定了原假設,即認為至少有兩個總體的均值存在顯著性差異時,須進一步確定是哪兩個或哪幾個均值顯著地不同,則需要進行多重比較來檢驗。LSD即是一種多因變量的三個或三個以上水平下均值之間進行的兩兩比較檢驗,最靈敏,但會較易犯假陽性的錯誤。在聽別的小組講述相關分析時,對于在繪制散點圖時的橫坐標和縱坐標的區分剛開始不太明白,但經過同學的講授明白了橫坐標是解釋變量,縱坐標是被解釋變量。在學習回歸分析的過程中,對解釋變量向前篩選、向后篩選、逐步帥選策略不能熟練掌握,特別是對向前向后篩選時到處的結果不會進行分析。在學習因子分析的時,剛開始對提取出來的因子的實際含義不清晰,但這些問題都都一一在講授和之后的討論中得到了解析,從而對于他們都算是有了大致的了解。
雖然整個學習過程經歷了很多困難,但小組成員在一起,大家一起克服困難,集思廣益,最后的結果還算是成功的,每個人對于自己的部分都很認真在準備希望能給大家講的清楚明晰,這個學習的過程對我們都意義非凡。現在這門課要結束了,但對于SPSS的學習卻沒有,現有的知識感覺只是對他有個初步的了解,離熟練運用還有些距離,論文中的模型分析的結果還不能很快的看出,因此還需要不斷地看書看文獻運用。但這門課顯然給我們打下了很好的基礎,在這結束的時刻,我希望謝謝這些陪我一起走過這個歷程的人,我的老師,小組的成員以及其他組的成員們,感謝你們同我一起成長。
第五篇:SPSS學習總結
學習SPSS感想
以前學統計學的時候就聽老師講過SPSS有非常強大的統計功能,對我們學習、工作有很大的幫助,所以我一直認為SPSS很神秘。通過這個學期周老師的課讓我對此清楚了許多,也學到了SPSS強大的統計功能,更加讓我明白了SPSS與Excel的區別。
SPSS是“社會科學統計軟件包”(Statistical Package for the Social Science)的簡稱,是一種集成化的計算機數據處理應用軟件。1968年,美國斯坦福大學H.Nie等三位大學生開發了最早的SPSS統計軟件,并于1975年在芝加哥成立了SPSS公司,已有30余年的成長歷史,全球約有25萬家產品用戶,廣泛分布于通訊、醫療、銀行、證券、保險、制造、商業、市場研究、科研、教育等多個領域和行業。SPSS是世界上公認的三大數據分析軟件之一(SAS、SPSS和SYSTAT)。
在學習SPSS期間,我主要遇到的問題是后面幾章,SPSS的參數檢驗、方差分析、相關分析、線性回歸分析、聚類分析、因子分析等。
在參數檢驗中我不知道原假設是什么,導致分析的時候不知道該拒絕原假設還是接受原假設,不能分析出統計結果。不會區分單樣本t檢驗和兩配對樣本t檢驗的區別,現在懂得了它們都要服從正態分布,基本思想是小概率反證法,反證法思想是先提出假設(檢驗假設H0),再用適當的統計方法確定假設成立的可能性大小,如果可能性小,則認為假設不成立,否則,還不能認為假設不成立。
在學習方差分析中,開始常常把觀測變量和控制變量弄混淆,在分析的時候應分別送入哪個對應框中,如果反了的話會導致結果的不準確。其次,對LSD、Bonferroni、Tukey、Scheffe等方法的使用不清楚,現在基本掌握了多重比較方法選擇:一般如果存在明確的對照組,要進行的是驗證性研究,即計劃好的某兩個或幾個組間(和對照組)的比較。宜用Bonferroni(LSD)法;若需要進行多個均數間的兩兩比較,且各組個案數相等,適宜用Tukey法;其他情況宜用Scheffe法。最后,對方差齊性檢驗、多重比較檢驗、趨勢檢驗理解不夠透徹,在方差檢驗中,Post Hoc鍵有LSD的選項:當方差分析F檢驗否定了原假設,即認為至少有兩個總體的均值存在顯著性差異時,須進一步確定是哪兩個或哪幾個均值顯著地不同,則需要進行多重比較來檢驗。LSD即是一種多因變量的三個或三個以上水平下均值之間進行的兩兩比較檢驗。
在學習相關分析的過程中,在繪制散點圖時,不知道哪個該做橫坐標,哪個該做縱坐標,明白了橫坐標是解釋變量,縱坐標是被解釋變量,還有對相關系數的種類分析不熟練等。在學習回歸分析的過程中,對DW可檢驗的含義不理解,不記得對應的DW表示的殘差序列的相關性。對解釋變量向前篩選、向后篩選、逐步帥選策略不能熟練掌握,特別是對向前向后篩選時到處的結果不會進行分析。
學習聚類分析中,變量的選擇分不清,無關變量有時會引起嚴重的錯分,應當只引入在不同類間有顯著差別的變量,盡量只使用相同類型的變量進行分析。分類數不明確,從實用角度講,2~8 類比較合適。掌握了K-means Cluster 分析,樣本量大于100時有必要考慮,只能使用連續性變量。
學習因子分析的過程中,對提取出來的因子的實際含義不清晰,不能使因子具有命名解釋性。
學習了SPSS后,我不禁想到了SPSS與Excel的區別,這一點是針對像我這樣開始只懂得用EXCEL的人來說。從個人的體會來說,二種軟件有一定相似,操作都簡便,同時又有一些可以互補的地方。但是SPSS又比Excel更加強大:
一、圖型的表現力是SPSS的主要優點之一
應該說,Excel的圖型表現主要是簡便,對許多的人來說基本夠用,但對于科學的表現,SPSS就更為詳細和準確,這一點據說在所有統計軟件中都突出。
二、通過SPSS檢驗方差齊性和數據分布
假設檢驗中,采用的t檢驗和方差檢驗都需要滿足二個要求,即
1.樣本方差齊性
2.樣本總體呈正態分布
在Excel中,提供了F檢驗來檢驗方差齊性問題,也就是可以先通過F檢驗確定方差齊性與否來選擇下一步用哪個T檢驗或方差檢驗分析工具。但只要數據多于二組則無從下手;通過描述統計大約能從峰度和偏度來了解樣本的分布實際工作中,只要分布單峰且近似對稱分布,也可應用,但要具體確定樣本的分布也有難度。這二個問題在SPSS就可以解決
最后,在感嘆它的方便與快捷的同時,對軟件開發人員的智慧到了肅然起敬的地步。一直覺得計算機語言是最難的一門外語。雖然本科時曾經對這種邏輯性很強的東西很感興趣,并在編程課上取得不錯的成績,但一直覺得這似乎不是我能掌控的東西。SPSS的神奇之處在于,它省去了使用者巨大的計算量,并提高準確性。它開發了開發者的智慧,卻弱化了使用者的大腦。