第一篇:運(yùn)用統(tǒng)計(jì)軟件stata進(jìn)行數(shù)據(jù)分析的基本步驟和思想
運(yùn)用統(tǒng)計(jì)軟件stata進(jìn)行數(shù)據(jù)分析的基本步驟和思想
經(jīng)過陶四海老師對(duì)stata統(tǒng)計(jì)軟件運(yùn)用的教導(dǎo),我對(duì)stata這個(gè)十分簡便實(shí)用的統(tǒng)計(jì)軟件有了初步入門的認(rèn)識(shí),并且通過對(duì)stata軟件的學(xué)習(xí)與思考運(yùn)用,加深了我對(duì)于統(tǒng)計(jì)學(xué)的概念及思想的認(rèn)識(shí)。
統(tǒng)計(jì)學(xué)和統(tǒng)計(jì)軟件是相輔相成的,沒有統(tǒng)計(jì)學(xué)做統(tǒng)計(jì)基礎(chǔ)思想個(gè)思維方式,統(tǒng)計(jì)軟件對(duì)數(shù)據(jù)分析的運(yùn)用將會(huì)是“盲人摸象”。而沒有統(tǒng)計(jì)軟件為大量的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行快速準(zhǔn)確有意義的分析和處理,我們光掌握了統(tǒng)計(jì)思想和統(tǒng)計(jì)方法,也不能駕輕就熟的應(yīng)對(duì)龐雜繁多的數(shù)據(jù),將會(huì)造成統(tǒng)計(jì)結(jié)果偶然的偏差,影響到統(tǒng)計(jì)結(jié)果的可靠性。
正如陶老師說的,當(dāng)今社會(huì)快速的經(jīng)濟(jì)、社會(huì)、文化等的發(fā)展,勢必會(huì)需要大量的統(tǒng)計(jì)運(yùn)用分析,而隨著統(tǒng)計(jì)運(yùn)用的需求也會(huì)造就許多優(yōu)秀的統(tǒng)計(jì)軟件。國外的統(tǒng)計(jì)軟件發(fā)展是超過國內(nèi)甚多的,spss,sas和stata,都是國外的優(yōu)秀統(tǒng)計(jì)學(xué)家和軟件工程師認(rèn)可的優(yōu)秀的統(tǒng)計(jì)軟件。
統(tǒng)計(jì)軟件重要的是統(tǒng)計(jì)思想來駕馭其迅速、高效,和其他的統(tǒng)計(jì)軟件相比,stata的優(yōu)點(diǎn)甚多。
運(yùn)用stata進(jìn)行統(tǒng)計(jì)數(shù)據(jù)的分析在步驟上和其他的統(tǒng)計(jì)軟件是相類似的,在得到了相關(guān)的數(shù)據(jù)之后,軟件運(yùn)用者需要首先對(duì)數(shù)據(jù)進(jìn)行的就是觀察分析。在stata讀取了數(shù)據(jù)之后,軟件用戶需要了解到數(shù)據(jù)的結(jié)構(gòu),數(shù)據(jù)的總體信息,如數(shù)據(jù)文件的路徑和名稱,大小規(guī)模,最后生成時(shí)間等等,軟件用戶需要對(duì)數(shù)據(jù)有個(gè)大概的認(rèn)識(shí),并對(duì)即將進(jìn)行的統(tǒng)計(jì)數(shù)據(jù)分析思路進(jìn)行有效的開展。
變量與變量的取值。可以用codebook命令來知道具體變量的取值編碼,然后使用list命令來以更接近數(shù)據(jù)表格的形勢查看數(shù)據(jù)。
第二篇:Stata數(shù)據(jù)分析的基本思想和步驟2
簡述stata數(shù)據(jù)分析的基本思路和步驟
數(shù)據(jù)分析的過程包括數(shù)據(jù)收集、整理和分析。Stata是數(shù)據(jù)分析的主要工具,其功能全面,系統(tǒng)集成多種統(tǒng)計(jì)分析方法,有完善的數(shù)據(jù)定義,操作和管理功能并且能生成各種統(tǒng)計(jì)圖和統(tǒng)計(jì)圖表,功能非常強(qiáng)大。下面是一個(gè)簡單的stata分析流程。
1、首先要讀取與生成數(shù)據(jù)文件,按照研究目的對(duì)數(shù)據(jù)進(jìn)行相應(yīng)處理,如加標(biāo)簽、數(shù)值變量與字符變量的轉(zhuǎn)換等。
2、其次要了解數(shù)據(jù)結(jié)構(gòu)(describe)
包括數(shù)據(jù)庫和變量的基本信息,如樣本含量、變量個(gè)數(shù)、數(shù)據(jù)庫標(biāo)簽、變量標(biāo)簽、數(shù)據(jù)存儲(chǔ)格式等等。
3、描述數(shù)據(jù)(summarize)
了解數(shù)據(jù)的算數(shù)平均數(shù)、標(biāo)準(zhǔn)差、最小值和最大值,如有需要還何以進(jìn)行詳細(xì)描述(summarizevar,detail)。
4、列表(tabulate):
對(duì)于一些類別變量可以列表顯示頻數(shù)、頻率、累計(jì)頻率。
5、繪制圖形
使用者可根據(jù)需要使用繪圖命令,生成直觀形象的圖形對(duì)數(shù)據(jù)進(jìn)行描述。
6、統(tǒng)計(jì)描述結(jié)束后,就要進(jìn)行統(tǒng)計(jì)推斷
包括求置信區(qū)間和假設(shè)檢驗(yàn),根據(jù)數(shù)據(jù)的特點(diǎn)和研究目的選擇相應(yīng)的檢驗(yàn)方法。單樣本t-檢驗(yàn)、兩樣本t-檢驗(yàn)、配對(duì)t-檢驗(yàn)、方差分析、卡方檢驗(yàn)、秩和檢驗(yàn)等等。
7、相關(guān)分析和回歸分析以及進(jìn)行模型擬合。
第三篇:利用統(tǒng)計(jì)軟件SPSS進(jìn)行試卷質(zhì)量分析
分 類 號(hào): 密 級(jí): 學(xué)校代碼: 10638 學(xué) 號(hào):
碩 士 學(xué) 科 論 文
利用統(tǒng)計(jì)軟件Spss進(jìn)行試卷質(zhì)量分析
姓 名
敬曉萍
指 導(dǎo) 教 師 馮長煥 教授
培 養(yǎng) 單 位
數(shù)學(xué)與信息學(xué)院
學(xué) 科 專 業(yè)
教育統(tǒng)計(jì)與測評(píng)
研 究 方 向 數(shù)學(xué)教育
學(xué) 位 類 別
教育碩士
年 級(jí) 2010級(jí)
西華師范大學(xué)學(xué)位評(píng)定委員會(huì)
四川·南充
利用統(tǒng)計(jì)軟件Spss進(jìn)行試卷質(zhì)量分析
摘 要
試卷分析是教學(xué)工作中的重要組成部分,同時(shí)也是每個(gè)教師必須完成的工作。通過對(duì)試卷進(jìn)行分析,可以反饋學(xué)生學(xué)習(xí)結(jié)果和教師教學(xué)效果,幫助教師發(fā)現(xiàn)教學(xué)活動(dòng)中的薄弱環(huán)節(jié),提高教學(xué)質(zhì)量。課程期末考試的試題應(yīng)該如何命題,怎樣組卷?如何把握一份試卷的整體難度和分量,使考試成績及其成績的分布符合正態(tài),防止平均成績的大起大落,避免不及格率的過高過低,以適應(yīng)大眾教育的需要等,這對(duì)穩(wěn)定學(xué)校正常的教學(xué)秩序,保證學(xué)生正常的學(xué)習(xí)心態(tài)和情緒,直至就業(yè)應(yīng)聘是否順利等都會(huì)產(chǎn)生直接的影響。本文利用統(tǒng)計(jì)軟件Spss對(duì)試卷分析的各項(xiàng)指標(biāo)進(jìn)行了定量分析,介紹了操作方法,以便為廣大教師進(jìn)行試卷分析提供一種模式參考,從而科學(xué)地進(jìn)行試卷質(zhì)量分析,提高教學(xué)質(zhì)量和效率。
關(guān)鍵字:成績統(tǒng)計(jì);試卷分析;難度;區(qū)分度;信度
考試是教育評(píng)價(jià)的有效辦法,隨著高職高專技能教學(xué)改革的深入開展,對(duì)教學(xué)評(píng)價(jià)的要求越來越客觀,對(duì)教學(xué)結(jié)果的分析越來越依賴于統(tǒng)計(jì)理論和方法。本文的目的是借助統(tǒng)計(jì)學(xué)軟件Spss,介紹對(duì)試卷質(zhì)量定量分析的方法。
一、考試試卷的統(tǒng)計(jì)分析[1]
(一)試卷難度的分析
所謂難度是指考試中試題或者試卷的難易程度,是考試題目對(duì)學(xué)生知識(shí)和能力水平適合程度的指標(biāo)。
1.難度的計(jì)算
以往教師在考試中對(duì)試題難度的測定大部分是憑感覺。這種方法本身比較模糊,對(duì)有經(jīng)驗(yàn)的教師也并不是非常有效。根據(jù)難度的概念,得到如下公式:
若第i題全部答對(duì),則di=0;若第i題全部答錯(cuò),則di=1;當(dāng)di=0.5,說明此題難度適中。
試卷難度:
試卷難度的測定建立在試題難度的基礎(chǔ)上,以試題難度為變量,以試題滿分值為權(quán)數(shù)的加權(quán)算數(shù)平均數(shù):
一般而言,試卷都是以100分為滿分,于是:
對(duì)于學(xué)校的常規(guī)考試,目的在于測量個(gè)體差異。當(dāng)d=0或d=0.5時(shí),即試題全部答對(duì)或答錯(cuò),該題便無法提供個(gè)體差異的信息。而只有當(dāng)d=0.5時(shí),題目才能做最大程度的區(qū)分度。但在實(shí)際工作中要使每題難度均達(dá)到0.5有一定的困難。
因此,一般要求試卷平均難度為0.5左右,各試題的難度控制在0.5±02之間。
2.難度的比較
按以上公式計(jì)算的試題及試卷難度,只能看出不同試題或不同試卷的難易程度,但卻不能分析題目或試卷之間的相對(duì)難度。如某試卷中,第一,第二,第三題的難度分別是0.3,0.4,0.5。從難度數(shù)據(jù)中可以看出,第一題相對(duì)較容易,第三題較難。但第二題與第一題的難度差和第三題與第二題的難度差是否相等?這卻不一定。原因是不同試題的難度位于不同的等距量表,因而不具有可比性。為解決試題及試卷之間難度的相互對(duì)比,需要將以上公式計(jì)算的難度,通過正態(tài)分布表,轉(zhuǎn)化為標(biāo)準(zhǔn)分。如:d=0.3,z=-1.88;d=0.4,z=-1.75;d=0.5,z= 0。顯然,第二題與第一題的難度差為0.13,第三題與第二題的難度差為1.75,難度差并不相等。
(二)試卷區(qū)分度的分析
區(qū)分度也叫鑒別力,就是通過一次考試將不同程度,不同能力的學(xué)生區(qū)分開來的重要指標(biāo)。比如一道題目,水平高、能力好的同學(xué)都答對(duì),而水平低、能力差的同學(xué)都答錯(cuò),那么這道題就有好的區(qū)分度。
計(jì)算公式:
1.試題的區(qū)分度:
式中:Hi為班級(jí)中高分組同學(xué)第i題的平均成績;Li為班級(jí)中低分組同學(xué)第i題的平均成績。(一般而言,高分組與低分組的同學(xué)人數(shù)是以班級(jí)同學(xué)人數(shù)10%-15%確定)
當(dāng)高分組平均成績與低分組平均成績差距較大時(shí),Gi較大,這時(shí)對(duì)試題的區(qū)分度評(píng)價(jià)就比較好。
2.試卷區(qū)分度
區(qū)分度的評(píng)價(jià)標(biāo)準(zhǔn):
(三)常用指標(biāo)簡介[2]
平均值:反映一組數(shù)據(jù)的總體情況。方差:反映一組數(shù)據(jù)的波動(dòng)大小。
峰度:用來描述某變量所有取值分布形態(tài)趨勢程度的統(tǒng)計(jì)量,是與正態(tài)分布相比較的量。峰度為0表示其數(shù)據(jù)與正態(tài)分布的趨勢程度相同;峰度大于0表示比正態(tài)分布更加陡峭;峰度小于0表示比正態(tài)分布更加平坦。
偏度:用來描述數(shù)據(jù)的對(duì)稱性的統(tǒng)計(jì)量。偏度大于0表示正偏差數(shù)值較大;偏度小于0表示負(fù)偏差數(shù)值較大。而偏度的絕對(duì)值越大表示分布形態(tài)的偏差程度越大。
二、具體操作步驟[3] 1.原始數(shù)據(jù)錄入
下面我們以我校數(shù)學(xué)與信息學(xué)院《統(tǒng)計(jì)分析》期末考試試卷為例來說明各個(gè)指標(biāo)的實(shí)現(xiàn)方法。
1.1試卷結(jié)構(gòu)
本試卷(滿分100分)有兩個(gè)部分組成:客觀性試題與主觀性試題,其中客觀性試題共40分,占40%,主觀性試題共60分,占60%。具體情況見下表。
分值分布圖
注:q1是填空題、q2是選擇題、q3是判斷題、q4是簡答題、q5是問答題、q6是計(jì)算題。
1.2數(shù)據(jù)定義
圖1 變量定義窗口
圖2 試卷質(zhì)量分析數(shù)據(jù)窗口
在SPSS軟件中,點(diǎn)擊Variable View標(biāo)簽,在Name標(biāo)題下定義:學(xué)號(hào)、題號(hào)、總成績、平時(shí)成績,其中總成績定義為total,平時(shí)成績定義為daily,然后在相應(yīng)的標(biāo)簽名中進(jìn)行注釋。在Type標(biāo)題下定義各個(gè)項(xiàng)目的類型,其中學(xué)號(hào)定義為String類型、題號(hào)和平時(shí)成績定義為Numeric類型,其余選項(xiàng)使用默認(rèn)即可。如圖1所示。
1.3數(shù)據(jù)錄入 點(diǎn)擊Data View標(biāo)簽,將47份試卷按照各部分得分情況和他們的總成績、平
時(shí)成績輸入到相應(yīng)的表格中。如圖2所示。
2.基本描述性統(tǒng)計(jì)分析
主要包括參加考試的學(xué)生總數(shù)、缺考人數(shù)、每個(gè)部分的最高分、最低分、極差、平均分、標(biāo)準(zhǔn)偏差(方差)等。
在試卷質(zhì)量分析數(shù)據(jù)中,運(yùn)行菜單:Analyze→Descriptive Statistics→Descriptives,把除平時(shí)成績外的所有變量加入到Variables中,點(diǎn)擊Options選項(xiàng)對(duì)話框,選中Mean、Minimum、Maximum、Range、Std.deviation、Variance。點(diǎn)擊Continue,再點(diǎn)擊OK。運(yùn)行后得到結(jié)果如下表所示。
描述性統(tǒng)計(jì)分析表
3.難度分析
試題難度是指測驗(yàn)題目的難易程度,難度系數(shù)一般用字母P表示,且0≤P≤1。對(duì)是非題和論文型的題目,我們可以統(tǒng)一為P=M/W(M:全體學(xué)生某題的平均得分;W:某題規(guī)定的最高得分)。對(duì)于選擇題我們先計(jì)算得出難度系數(shù)P,然后再根據(jù)公式cp=(kp-1)/(k-1)(k為選項(xiàng)個(gè)數(shù))算出矯正難度系數(shù)cp。(單項(xiàng)選擇題學(xué)生可能隨機(jī)猜測,此公式能排除這種影響)試題難度系數(shù)與試題實(shí)際難易程度正好相反,越大表示能夠正確解答該題的學(xué)生越多試題越容易,而越小則試題越難。一般認(rèn)為,難度適中更能客觀地反映出學(xué)生的學(xué)習(xí)效果情況,多數(shù)試題應(yīng)分布在0.3~0.7之間,選拔性測試為0.5左右為宜,通常期末考試為目標(biāo)參照性考試,可適當(dāng)偏高,全卷平均難度以0.7左右為宜,0.6~0.8為正常。
根據(jù)上表,很容易得到各個(gè)部分的難度系數(shù),如下所示。
各個(gè)部分的難度系數(shù)
注:q2的難度系數(shù)為矯正難度系數(shù) 4.區(qū)分度分析
對(duì)于客觀題來說,使用等級(jí)相關(guān)分析,在此使用斯皮爾曼(Spearman)等級(jí)相關(guān)分析。對(duì)于主觀題來說,樣本數(shù)為47,大于30,可以看成非等間距測度的連續(xù)變量,在此采用皮爾遜(Pearson)相關(guān)分析對(duì)試題進(jìn)行分析。
具體操作如下:Analyze→Correlate→Bivariate。在彈出對(duì)話框中選擇各個(gè)客觀題題號(hào)變量和總成績進(jìn)入Variables,然后在Correlation Coefficients中單擊Spearman,完成后即可得到客觀題的區(qū)分度。主觀題的區(qū)分度分析方法同上,只需選擇主觀題和總成績進(jìn)入,然后選擇Pearson即可。得到每個(gè)部分的區(qū)分度,見下圖:
各個(gè)部分的區(qū)分度
三、分析結(jié)果
(1)基本描述統(tǒng)計(jì)數(shù)據(jù)上來看,學(xué)生總數(shù)為47人,無人缺考,學(xué)生的的卷面總成績平均分為82.83分,最高分為99分,最低分為59分,分?jǐn)?shù)極差為40分,標(biāo)準(zhǔn)差為10.538,標(biāo)準(zhǔn)差比較大,說明學(xué)生個(gè)體間存在較大的差異,主要影響因素是他們?nèi)雽W(xué)時(shí)學(xué)歷結(jié)構(gòu)、上課聽講、作業(yè)完成、課后復(fù)習(xí)等。對(duì)一部分后進(jìn)學(xué)生,在今后的教學(xué)過程中應(yīng)當(dāng)充分關(guān)注,努力調(diào)動(dòng)他們的學(xué)習(xí)積極性,經(jīng)常鼓勵(lì)他們,從而達(dá)到提高學(xué)習(xí)成績的目的。(2)從難度上來看,第二題(0.983)、第三題(0.996)難度系數(shù)過大,說明此題出的太容易,建議此題不宜進(jìn)入題庫,在修改后參加下一輪的遴選。(3)從區(qū)分度上來看,除了第二題、第三題區(qū)分度較低,其余都比較好,基本達(dá)到了考試要求。
四、成績考試的信度分析[4]
“考試信度對(duì)于任何一種有效考試來說都是必不可少的,只有信度高的考試才能使教師對(duì)學(xué)生的評(píng)價(jià)客觀、可靠,考試成績才能正確地反映被試者的程度”。[5]教育測量學(xué)、教育統(tǒng)計(jì)學(xué)在理論上為考試的科學(xué)化和現(xiàn)代化奠定了基礎(chǔ),使得考試分析數(shù)量化,而SPSS統(tǒng)計(jì)軟件又使廣大教師使用計(jì)算機(jī)進(jìn)行學(xué)業(yè)成績考試信度的定量分析成為可能。
(一)考試分?jǐn)?shù)的信度系數(shù)
衡量一次考試的可靠性指標(biāo)叫做信度,表明信度大小的量叫做信度系數(shù)。雖然教育測量和統(tǒng)計(jì)書上介紹計(jì)算考試分?jǐn)?shù)的信度系數(shù)有多種方法,但因?yàn)閷W(xué)科或?qū)W業(yè)成績考試具有一般不進(jìn)行前測和復(fù)測的特點(diǎn),且試題多含有主觀題,因而Cronbach’s α系數(shù)是最適合學(xué)科考試的信度分析。因?yàn)镃ronbach’s α系數(shù)不僅適合主觀題,也可以用于多項(xiàng)選擇題等客觀試題。
下面我們以我校外語學(xué)院語音考試題考試題為例介紹用Spss進(jìn)行信度分析的步驟。
1.Cronbach’s Alpha系數(shù)的計(jì)算步驟
步驟1:選擇信度分析程序。在數(shù)據(jù)編輯窗口中單擊Analyze打開下拉菜單,選擇Reliability Analysis??程序,進(jìn)入信度分析主對(duì)話框。
步驟2:選擇要進(jìn)行分析的原始變量。在信度分析主對(duì)話框中選擇第1-5題共五個(gè)變量,單擊右向箭頭將其移入Items方框中。在Model的下拉菜單中選擇Alpha模型,即表示希望獲得Cronbach’s Alpha系數(shù)。在信度分析主對(duì)話框點(diǎn)擊Statistics按鈕,進(jìn)入定義信度分析統(tǒng)計(jì)量對(duì)話框。
步驟3:在定義信度分析統(tǒng)計(jì)量對(duì)話框Descriptives for 中勾選Scale ifitem deleted復(fù)選項(xiàng),表示要求在輸出結(jié)果中顯示刪除各個(gè)項(xiàng)目之后的系數(shù)變化情況。然后點(diǎn)擊Continue按鈕,回到信度分析主對(duì)話框,并點(diǎn)擊OK提交系統(tǒng)運(yùn)行,出現(xiàn)運(yùn)行結(jié)果。
2.信度系數(shù)輸出結(jié)果及說明
按照上述參數(shù)設(shè)置,Spss軟件在輸出信息觀察窗口輸出一個(gè)表格(表1)。該表報(bào)告了“語音聽力考試成績”各題的信度分析結(jié)果。表首為分析方法,意為選擇了Alpha模型。表中的第1欄為變量,是語音聽力考試的五道大題。第二欄為刪除該項(xiàng)目后試題的平均值。第三欄為刪除該項(xiàng)目后試題的方差。第四欄為該項(xiàng)目與試題總分的相關(guān)系數(shù),相關(guān)系數(shù)較低的項(xiàng)目往往是有問題的試題。例如表中第5題與試題的相關(guān)系數(shù)僅為.2854,說明該題應(yīng)該修改或刪除。
最后一欄為刪除其中某個(gè)項(xiàng)目后考試題的Alpha系數(shù)變化情況,該欄在檢驗(yàn)信度差的試題方面很有用。如果刪除某一道試題后的Alpha系數(shù)比試題的信度系數(shù)大,則可考慮將該題刪除。本例中刪除第5題后,信度系數(shù)將由原來的.7491提高到.7819,由此我們可以從提高信度系數(shù)的角度,確認(rèn)該題應(yīng)該修改或刪除。
Cronbach’s Ahlha系數(shù)介0-1之間,系數(shù)越高,說明試題的內(nèi)在一致性越強(qiáng),測試的結(jié)果越可靠。通常自編考試的Cronbach’s Ahlha系數(shù)“要求0.60-0.80之間,而標(biāo)準(zhǔn)化考試則要求在0.90以上”。[6]本例的信度系數(shù)為.7491,因此我們可以得出信度較好的結(jié)論。
二、考試分?jǐn)?shù)的正態(tài)分布檢驗(yàn)
李筱菊認(rèn)為考試“分?jǐn)?shù)拉開距離,它們的分布才可能正態(tài)。分?jǐn)?shù)分布正態(tài),說明它反映了人的能力分布實(shí)況,說明考試有信度。”[7]因此,我們除了使用信度系數(shù)還可使用考試成績正態(tài)分布的數(shù)據(jù)及分布圖來測量和檢驗(yàn)信度。
考試分?jǐn)?shù)是否服從正態(tài)分布,可以用曲線圖來觀察,也可以計(jì)算偏態(tài)值和峰值的方法來確定。
1.正態(tài)分布圖表的制作方法
步驟1:在Spss數(shù)據(jù)編輯視窗,點(diǎn)擊Analyze命令,Descriptive Statistics在下拉菜單中選擇Frequencies?,打開頻數(shù)直方圖編輯對(duì)話框。
步驟2:在頻數(shù)分析主對(duì)話框中左邊變量列表中選擇第1-5題和總分共六個(gè)變量,點(diǎn)擊向右箭頭將其移入Variable::(變量)下白方框中,然后點(diǎn)擊Statistics ?按鈕,進(jìn)入頻數(shù)分析數(shù)據(jù)編輯子對(duì)話框。選擇Display normal curve,表示同時(shí)顯示正態(tài)分布曲線。
步驟3:在頻數(shù)分析數(shù)據(jù)編輯子對(duì)話框中Distribution.中選擇Skewness和Kurtosis,表示要求計(jì)算正態(tài)值與峰值。點(diǎn)擊Continue返回頻數(shù)分析主對(duì)話框,單擊Options?按鈕,進(jìn)入圖形選項(xiàng)對(duì)話框。
步驟4:在頻數(shù)分析圖形選項(xiàng)子對(duì)話框中Chart Type下選擇Histograms(單選項(xiàng),表示要求輸出直方圖,并選擇With normal curve復(fù)選項(xiàng),表示要求輸出的直方圖帶正態(tài)分布曲線。點(diǎn)擊Continue按鈕返回到主對(duì)話框,單擊Ok按鈕提交系統(tǒng)運(yùn)用。
2.正態(tài)分布圖及解釋
按上述參數(shù)設(shè)置,Spss共在輸出信息觀察窗口輸出6幅圖形與7個(gè)表格(其中6個(gè)表格是6個(gè)變量的頻數(shù)分布表)。我們只以其中一幅圖形和描述統(tǒng)計(jì)表格為例介紹報(bào)告結(jié)果的含義及解釋。
考試分?jǐn)?shù)是否服從正態(tài)分布,可以通過帶正態(tài)分布曲線直方圖來觀察。直方圖是以長方形面積表示頻數(shù)分布的一種圖形,它的長度和寬度均有意義,而且由于數(shù)據(jù)值具有連續(xù)性,所以各長方形須相連排列。圖中的頂點(diǎn)是平均成績。直方圖中的曲線稱分布曲線。正態(tài)分布曲線是中間高、兩邊低且左右對(duì)稱的曲線。曲線的最高峰,即頻數(shù)最多處,是曲線的中間位置。這一位置的分?jǐn)?shù)正好是分?jǐn)?shù)的平均值。由于帶正態(tài)分布曲線的次數(shù)直方圖具有以上特點(diǎn),所以可以直觀地確定分?jǐn)?shù)分布是否服從正態(tài)分布。
3.正態(tài)分布表及結(jié)果解釋
表2是該考試五道大題和總分共六個(gè)變量的偏態(tài)值和峰值描述統(tǒng)計(jì)表。表中第一行為變量名;第二行N Valid為參加考試的有效學(xué)生人數(shù);第三行為缺考人數(shù)(Missing);第四行為偏態(tài)值(Skewness);第五行是峰值(Kurtosis)。
偏態(tài)值和峰值為0時(shí)表示完全正態(tài),偏態(tài)值的正、負(fù)表示正、負(fù)偏態(tài)。峰值的正負(fù)表示峰的“高瘦”(分?jǐn)?shù)集中)和“矮平”(分?jǐn)?shù)分散)。
偏態(tài)值如表2第三行所示,本例中單詞聽寫、短文聽寫和聽對(duì)話簡答三題的偏態(tài)值均為負(fù)數(shù),是負(fù)偏態(tài),表示這三題分?jǐn)?shù)分布偏向了右邊,也就是偏向了高分,得分高于平均分的人數(shù)超過50%。而聽句子簡答、短文聽力理解和總分三個(gè)變量的偏態(tài)值均為正數(shù),即正偏態(tài),表示分?jǐn)?shù)分布偏向了左邊,也就是偏向了低分,得分低于平均分的人數(shù)超過了50%。
峰值如表2第四行所示,本例中單詞聽寫、聽對(duì)話簡答和總分的峰值為正數(shù)。表示峰比理想正態(tài)分布的峰高尖,也就是分?jǐn)?shù)過分集中在中分段。而短文聽寫、聽句子簡答和短文聽力理解三個(gè)變量的峰值為負(fù)數(shù)。表示這三個(gè)變量的峰比理想正態(tài)分布峰矮平,也就是分?jǐn)?shù)過分散開。
表2 偏態(tài)值及峰值描述統(tǒng)計(jì)表
“一般說一個(gè)考試偏態(tài)值和峰值能控制在±1之內(nèi),便算其分?jǐn)?shù)基本符合正態(tài)分布”。[8]因此,我們可以得出結(jié)論:語音聽力部分考試的五道大題和總分基本符合正態(tài)分布,這份試題總體信度較好。
綜上所述,本文為不太熟悉數(shù)理統(tǒng)計(jì)的廣大教師介紹了用Spss軟件計(jì)算Cronbach’s Alpha系數(shù)和正態(tài)分布檢驗(yàn)學(xué)業(yè)成績考試信度的方法,從而使我們可以較好地測量出考試成績是否正確反映了學(xué)生的學(xué)習(xí)程度,考試對(duì)教學(xué)的評(píng)價(jià)是否可靠。再用信度檢驗(yàn)數(shù)據(jù)查找出影響信度的試題、修改提高試題質(zhì)量,這對(duì)發(fā)揮考試評(píng)價(jià)教學(xué)的作用和改進(jìn)教學(xué)效果、提高教學(xué)質(zhì)量無疑是很有好處的。
參考文獻(xiàn):
[1]樓裕勝.學(xué)生成績的統(tǒng)計(jì)分析[D].杭州:浙江金融職業(yè)學(xué)院,2007.[2]李良.巧用Excel和SPSS軟件分析考試成績[J].金華職業(yè)技術(shù)學(xué)院學(xué)報(bào).2008年4月.第8卷第2期.[3] 王雪、鄧振偉、陳玲、田七.SPSS軟件在試卷質(zhì)量分析中的應(yīng)用[N].讀與寫雜志.2009年3月.第6卷第3期.[4] 秦志強(qiáng)、賈真真.學(xué)業(yè)成績考試的信度分析[J].教育理論與實(shí)踐.2006年第26卷第7期.第4-6頁.[5]鄒申,楊任明.簡明英語測試教程[M].北京:高等教育出版社,2000.[6]宋兆鴻,劉世表,張才美,張國華,張頌增,彭成獎(jiǎng)等.現(xiàn)代教育測量[M].北京:教育科學(xué)出版社,1986.[7][8]李筱菊.語言測試科學(xué)與藝術(shù)[M].長沙:湖南教育出版社,1997.