第一篇:統(tǒng)計(jì)學(xué)概念總結(jié)
1、主要術(shù)語
1.統(tǒng)計(jì)學(xué):收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。
2.描述統(tǒng)計(jì):研究數(shù)據(jù)收集、處理和描述的統(tǒng)計(jì)學(xué)分支。
3.推斷統(tǒng)計(jì):研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計(jì)學(xué)分支。
4.分類數(shù)據(jù):只能歸于某一類別的非數(shù)字型數(shù)據(jù)。
5.順序數(shù)據(jù):只能歸于某一有序類別的非數(shù)字型數(shù)據(jù)。
6.數(shù)值型數(shù)據(jù):按數(shù)字尺度測(cè)量的觀察值。
7.觀測(cè)數(shù)據(jù):通過調(diào)查或觀測(cè)而收集到的數(shù)據(jù)。
8.實(shí)驗(yàn)數(shù)據(jù):在實(shí)驗(yàn)中控制實(shí)驗(yàn)對(duì)象而收集到的數(shù)據(jù)。
9.截面數(shù)據(jù):在相同或近似相同的時(shí)間點(diǎn)上收集的數(shù)據(jù)。
10.時(shí)間序列數(shù)據(jù):在不同時(shí)間上收集到的數(shù)據(jù)。
11.抽樣調(diào)查:從總體中隨機(jī)抽取一部分單位作為樣本進(jìn)行調(diào)查,并根據(jù)樣本調(diào)查結(jié)果來推
斷總體特征的數(shù)據(jù)收集方法。
12.普查:為特定目的而專門組織的全面調(diào)查。
13.總體:包含所研究的全部個(gè)體(數(shù)據(jù))的集合。
14.樣本:從總體中抽取的一部分元素的集合。
15.樣本容量:也稱樣本量,是構(gòu)成樣本的元素?cái)?shù)目。
16.參數(shù):用來描述總體特征的概括性數(shù)字度量。
17.統(tǒng)計(jì)量:用來描述樣本特征的概括性數(shù)字度量。
18.變量:說明現(xiàn)象某種特征的概念。
19.分類變量:說明事物類別的一個(gè)名稱。
20.順序變量:說明事物有序類別的一個(gè)名稱。
21.數(shù)值型變量:說明事物數(shù)字特征的一個(gè)名稱。
22.離散型變量:只能取可數(shù)值的變量。
23.連續(xù)型變量:可以在一個(gè)或多個(gè)區(qū)間中取任何值的變量。
24.簡(jiǎn)單隨機(jī)抽樣:也稱純隨機(jī)抽樣,它是從含有N個(gè)元素的總體中,抽取n個(gè)元素作為
樣本,使得總體中的每一個(gè)元素都有相同的機(jī)會(huì)(概率)被抽中。
25.簡(jiǎn)單隨機(jī)樣本:從含有N個(gè)元素的總體中,抽取n個(gè)元素作為樣本,使得總體中每一
個(gè)樣本量為n的樣本都有相同的機(jī)會(huì)(概率)被抽中。
26.重復(fù)抽樣:從總體中抽取一個(gè)元素后,把這個(gè)元素放回到總體中再抽取第二個(gè)元素,直
至抽取n個(gè)元素為止。
27.不重復(fù)抽樣:一個(gè)元素被抽中后不再放回總體,而是從所剩元素中抽取第二個(gè)元素,直
到抽取n個(gè)元素為止。
28.分層抽樣:也稱分類抽樣,它是在抽樣之前先將總體的元素劃分為若干層(類),然后
從各個(gè)層中抽取一定數(shù)量的元素組成一個(gè)樣本。
29.系統(tǒng)抽樣:也稱等距抽樣或機(jī)械抽樣,它是先將總體中的各元素按某種順序排列,并按
某種規(guī)則確定一個(gè)隨機(jī)起點(diǎn);然后,每隔一定的間隔抽取一個(gè)元素,直至抽取n個(gè)元素形成一個(gè)樣本。
30.整群抽樣:先將總體劃分成若干群,然后以群作為抽樣單位從中抽取部分群,隨后再對(duì)
抽中的各個(gè)群中所包含的所有元素進(jìn)行觀察。
2、主要術(shù)語
31.頻數(shù):落在某一特定類別(或組)中的數(shù)據(jù)個(gè)數(shù)。
32.頻數(shù)分布:數(shù)據(jù)在各類別(或組)中的分配。
33.比例:一個(gè)樣本(或總體)中各個(gè)部分的數(shù)據(jù)與全部數(shù)據(jù)之比。
34.比率:樣本(或總體)中各不同類別數(shù)值之間的比值。
35.累積頻數(shù):將各有序類別或組的頻數(shù)逐級(jí)累加起來得到的頻數(shù)。
36.數(shù)據(jù)分組:根據(jù)統(tǒng)計(jì)研究的需要,將原始數(shù)據(jù)按照某種標(biāo)準(zhǔn)劃分成不同的組別。
37.組距分組:將全部變量值依次劃分為若干個(gè)區(qū)間,并將這一區(qū)間的變量值作為一組。
38.組距:一個(gè)組的上限與下限的差。
39.組中值:每一組的下限和上限之間的中點(diǎn)值,即組中值=(下限值+上限值)/2。
40.直方圖:用矩形的寬度和高度(即面積)來表示頻數(shù)分布的圖形。
41.莖葉圖:由“莖”和“葉”兩部分組成的、反應(yīng)原始數(shù)據(jù)分布的圖形。
42.箱線圖:由一組數(shù)據(jù)的最大值、最小值、中位數(shù)和兩個(gè)四分位數(shù)5個(gè)特征值繪制而成的、反應(yīng)原始數(shù)據(jù)分布的圖形。
3、主要術(shù)語和公式
(一)主要術(shù)語
1.眾數(shù):一組數(shù)據(jù)中出現(xiàn)頻數(shù)最多的變量值,用Mo表示。
2.中位數(shù):一組數(shù)據(jù)排序后處于中間位置上的變量值,用Me表示。
3.四分位數(shù):一組數(shù)據(jù)排序后處于25%和75%位置上的值。
4.平均數(shù):一組數(shù)據(jù)相加后除以數(shù)據(jù)的個(gè)數(shù)而得到的結(jié)果。
5.幾何平均數(shù):n個(gè)變量值乘積的n次方根,用Gm表示。
6.異眾比率:非眾數(shù)組的頻數(shù)占總頻數(shù)的比率。
7.四分位差:也稱為內(nèi)距或四分間距,上四分位數(shù)與下四分位數(shù)之差。
8.9.10.11.13.14.15.16.極差:也稱全距,一組數(shù)據(jù)的最大值與最小值之差。平均差:也稱平均絕對(duì)離差,各變量值與其平均數(shù)離差絕對(duì)值的平均數(shù)。方差:各變量值與其平均數(shù)離差平方的平均數(shù)。標(biāo)準(zhǔn)差:方差的平方根。離散系數(shù):也稱為變異系數(shù),一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的平均數(shù)之比。偏態(tài):數(shù)據(jù)分布的不對(duì)稱性。偏態(tài)系數(shù):對(duì)數(shù)據(jù)分布不對(duì)稱性的度量值。峰態(tài):數(shù)據(jù)分布的平峰或尖峰程度。12.標(biāo)準(zhǔn)分?jǐn)?shù):變量值與其平均數(shù)的離差除以標(biāo)準(zhǔn)差后的值。
17.峰態(tài)系數(shù):對(duì)數(shù)據(jù)分布峰態(tài)的度量值。
4、主要術(shù)語和公式
(一)主要術(shù)語
43.抽樣分布:在重復(fù)選取樣本量為n的樣本時(shí),由樣本統(tǒng)計(jì)量的所有可能取值形成的相對(duì)
頻數(shù)分布。
44.樣本均值的抽樣分布:在重復(fù)選取樣本量為n的樣本時(shí),由樣本均值的所有可能取值形
成的相對(duì)頻數(shù)分布。
45.樣本比例抽樣分布:在重復(fù)選取樣本量為n的樣本時(shí),由樣本比例的所有可能取值形成的相對(duì)頻數(shù)分布。
46.標(biāo)準(zhǔn)誤差:也稱為標(biāo)準(zhǔn)誤,它是樣本統(tǒng)計(jì)量的抽樣分布的標(biāo)準(zhǔn)差。
47.估計(jì)標(biāo)準(zhǔn)誤差:若計(jì)算標(biāo)準(zhǔn)誤時(shí)所涉及的總體參數(shù)未知,可用樣本統(tǒng)計(jì)量代替計(jì)算的標(biāo)
準(zhǔn)誤。
48.估計(jì)量:用來估計(jì)總體參數(shù)的統(tǒng)計(jì)量的名稱,用符號(hào)??表示。
49.估計(jì)值:用來估計(jì)總體參數(shù)時(shí)計(jì)算出來的估計(jì)量的具體數(shù)值。
50.點(diǎn)估計(jì):用樣本統(tǒng)計(jì)量??的某個(gè)取值直接作為總體參數(shù)?的估計(jì)值。
51.區(qū)間估計(jì):在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)范圍。
52.置信區(qū)間:由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間。
53.置信水平:也稱為置信系數(shù),它是將構(gòu)造置信區(qū)間的步驟重復(fù)多次后,置信區(qū)間中包含
總體參數(shù)真值的次數(shù)所占的比率。
5、主要術(shù)語和公式
(一)主要術(shù)語
18.假設(shè):對(duì)總體參數(shù)的具體數(shù)值所做的陳述。
19.假設(shè)檢驗(yàn):先對(duì)總體參數(shù)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的過程。
20.備擇假設(shè):也稱研究假設(shè),是研究者想收集證據(jù)予以支持的假設(shè),用H1或Ha表示。
21.原假設(shè):也稱零假設(shè),是研究者想收集證據(jù)予以反對(duì)的假設(shè),用H0表示。
22.單側(cè)檢驗(yàn):也稱單尾檢驗(yàn),是指?jìng)鋼窦僭O(shè)具有特定的方向性,并含有符號(hào)“>”或“<”的假設(shè)檢驗(yàn)。
23.雙側(cè)檢驗(yàn):也稱雙尾檢驗(yàn),是指?jìng)鋼窦僭O(shè)沒有特定的方向性,并含有符號(hào)“?”的假設(shè)
檢驗(yàn)。
24.第Ⅰ類錯(cuò)誤:當(dāng)原假設(shè)為正確時(shí)拒絕原假設(shè),犯第Ⅰ類錯(cuò)誤的概率記為?。
25.第Ⅱ類錯(cuò)誤:當(dāng)原假設(shè)為錯(cuò)誤時(shí)沒有拒絕原假設(shè),犯第Ⅱ類錯(cuò)誤的概率通常記為?。
26.顯著性水平:假設(shè)檢驗(yàn)中發(fā)生第Ⅰ類錯(cuò)誤的概率,記為?。
27.檢驗(yàn)統(tǒng)計(jì)量:根據(jù)樣本觀測(cè)結(jié)果計(jì)算得到的,并據(jù)以對(duì)原假設(shè)和備擇假設(shè)做出決策的某
個(gè)樣本統(tǒng)計(jì)量。
28.拒絕域:能夠拒絕原假設(shè)的檢驗(yàn)統(tǒng)計(jì)量的所有可能取值的集合。
29.臨界值:根據(jù)給定的顯著性水平確定的拒絕域的邊界值。
30.P值:也稱觀察到的顯著性水平,如果原假設(shè)H0是正確的,那么所得的樣本結(jié)果出現(xiàn)
實(shí)際觀測(cè)結(jié)果那么極端的概率。
6、主要術(shù)語和公式
(一)主要術(shù)語
31.方差分析(ANOVA):檢驗(yàn)多個(gè)總體均值是否相等的統(tǒng)計(jì)方法。
32.33.34.35.因素:也稱因子,是方差分析中所要檢驗(yàn)的對(duì)象。水平:也稱處理,是因素的不同表現(xiàn)。組內(nèi)誤差:來自水平內(nèi)部的數(shù)據(jù)誤差。組間誤差:來自不同水平之間的數(shù)據(jù)誤差。
36.總平方和:反映全部數(shù)據(jù)誤差大小的平方和,記為SST。
37.組內(nèi)平方和:反映組內(nèi)誤差大小的平方和,記為SSE。
38.組間平方和:反映組間誤差大小的平方和,記為SSA。
39.單因素方差分析:只涉及一個(gè)分類型自變量的方差分析。
40.組內(nèi)方差:組內(nèi)平方和除以相應(yīng)的自由度。
41.組間方差:組間平方和除以相應(yīng)的自由度。
7、主要術(shù)語和公式
(一)主要術(shù)語
42.相關(guān)關(guān)系:變量之間存在的不確定的數(shù)量關(guān)系。
43.相關(guān)系數(shù):也稱Pearson相關(guān)系數(shù),是根據(jù)樣本數(shù)據(jù)計(jì)算的度量?jī)蓚€(gè)變量之間線性關(guān)系
強(qiáng)度的統(tǒng)計(jì)量。
44.因變量:被預(yù)測(cè)或被解釋的變量,用y表示。
45.自變量:用來預(yù)測(cè)或用來解釋因變量的一個(gè)或多個(gè)變量,用x表示。
46.回歸模型:描述因變量y如何依賴于自變量x和誤差項(xiàng)?的方程。
47.回歸方程:描述因變量y的期望值如何依賴于自變量x的方程。
48.估計(jì)的回歸方程:根據(jù)樣本數(shù)據(jù)求出的回歸方程的估計(jì)。
?i之間的離差平方和達(dá)49.最小二乘法:也稱最小平方法,使因變量的觀察值yi與估計(jì)值y
?和??的方法。到最小來求得?10
50.判定系數(shù):回歸平方和占總平方和的比例,記為R2。
51.估計(jì)量的標(biāo)準(zhǔn)誤差:均方殘差(MSE)的平方根,用se來表示。
52.y的平均值的點(diǎn)估計(jì):利用估計(jì)的回歸方程,對(duì)于x的一個(gè)特定值x0,求出y的平均
值的一個(gè)估計(jì)值E(y0)。
53.y的個(gè)別值的估計(jì)值:利用估計(jì)的回歸方程,對(duì)于x的一個(gè)特定值x0,求出y的一個(gè)
?0。個(gè)別值的估計(jì)值y
54.y的平均值的置信區(qū)間估計(jì):對(duì)x的一個(gè)給定值x0,求出y的平均值的區(qū)間估計(jì)。55.y的個(gè)別值的預(yù)測(cè)區(qū)間估計(jì):對(duì)x的一個(gè)給定值x0,求出y的一個(gè)個(gè)別值的區(qū)間估計(jì)。
?,xk和誤差項(xiàng)?的方56.多元線性回歸模型:描述因變量y如何依賴于自變量x1,x2,程。
57.多元線性回歸方程:描述y的期望值如何依賴于x1,x2,?,xk的方程。
58.估計(jì)的多元線性回歸方程:根據(jù)樣本數(shù)據(jù)得到的多元線性回歸方程的估計(jì)。
59.多重判定系數(shù):在多元回歸中,回歸平方和占總平方和的比例。
60.修正的多重判定系數(shù):用模型中自變量的個(gè)數(shù)和樣本量進(jìn)行調(diào)整的多重判定系數(shù),記為
Ra。28、主要術(shù)語和公式
(一)主要術(shù)語
61.時(shí)間序列:同一現(xiàn)象在不同時(shí)間上的相繼觀察值排列而成的序列。
62.平穩(wěn)序列:基本上不存在趨勢(shì)的序列。
63.非平穩(wěn)序列:包含趨勢(shì)性、季節(jié)性或周期性的序列。
64.趨勢(shì):也稱長(zhǎng)期趨勢(shì),是指時(shí)間序列在長(zhǎng)時(shí)期內(nèi)呈現(xiàn)出來的某種持續(xù)向上或持續(xù)下降的變動(dòng)。
65.季節(jié)性:也稱季節(jié)變動(dòng),是指時(shí)間序列在一年內(nèi)重復(fù)出現(xiàn)的周期性波動(dòng)。
66.周期性:也稱循環(huán)波動(dòng),是指時(shí)間序列中呈現(xiàn)出來的圍繞長(zhǎng)期趨勢(shì)的一種波浪形或振蕩
式變動(dòng)。
67.隨機(jī)性:也稱不規(guī)則波動(dòng),是指時(shí)間序列中除去趨勢(shì)、周期性和季節(jié)性之后的偶然性波
動(dòng)。
68.增長(zhǎng)率:也稱增長(zhǎng)速度,是指時(shí)間序列中報(bào)告期觀察值與基期觀察值之比減1后的結(jié)果,用%表示。
69.平均增長(zhǎng)率:也稱平均發(fā)展速度,是指時(shí)間序列中各逐期環(huán)比值(也稱環(huán)比發(fā)展速度)的幾何平均數(shù)減1后的結(jié)果。
70.增長(zhǎng)1%絕對(duì)值:增長(zhǎng)率每增長(zhǎng)一個(gè)百分點(diǎn)而增加的絕對(duì)數(shù)量。
71.簡(jiǎn)單平均法預(yù)測(cè):根據(jù)過去已有的t期觀察值通過簡(jiǎn)單平均來預(yù)測(cè)下一期的數(shù)值。
72.移動(dòng)平均法預(yù)測(cè):通過對(duì)時(shí)間序列逐期遞移求得平均數(shù)作為預(yù)測(cè)值的一種預(yù)測(cè)方法。
73.指數(shù)平滑法預(yù)測(cè):對(duì)過去的觀察值加權(quán)平均進(jìn)行預(yù)測(cè)的一種方法,該方法使得第t+1
期的預(yù)測(cè)值等于t期的實(shí)際觀察值與第t期指數(shù)預(yù)測(cè)值的加權(quán)平均值。
9、主要術(shù)語和公式
(一)主要術(shù)語
74.指數(shù):測(cè)定多個(gè)項(xiàng)目在不同場(chǎng)合下綜合變動(dòng)的相對(duì)數(shù)。
75.加權(quán)綜合指數(shù):通過加權(quán)來測(cè)定一組項(xiàng)目的綜合變動(dòng)狀況的指數(shù)。
76.加權(quán)平均指數(shù):以某一時(shí)期的價(jià)值總量為權(quán)數(shù)對(duì)個(gè)體指數(shù)加權(quán)平均計(jì)算的指數(shù)。77.78.79.80.價(jià)值指數(shù):由兩個(gè)不同時(shí)期的價(jià)值總量對(duì)比形成的指數(shù)。指數(shù)體系:由價(jià)值指數(shù)及其若干個(gè)因素指數(shù)構(gòu)成的數(shù)量關(guān)系式。零售價(jià)格指數(shù):反映城鄉(xiāng)商品零售價(jià)格變動(dòng)趨勢(shì)的一種經(jīng)濟(jì)指數(shù)。居民消費(fèi)價(jià)格指數(shù):反映一定時(shí)期內(nèi)城鄉(xiāng)居民所購買的生活消費(fèi)品價(jià)格和服務(wù)項(xiàng)目?jī)r(jià)格的變動(dòng)趨勢(shì)和程度的一種相對(duì)數(shù)。
81.生產(chǎn)價(jià)格指數(shù):測(cè)量在初級(jí)市場(chǎng)上所售貨物(即在非零售市場(chǎng)上首次購買某種商品時(shí))
價(jià)格變動(dòng)的一種價(jià)格指數(shù)。
82.股票價(jià)格指數(shù):是反映某一股票市場(chǎng)上多種股票價(jià)格變動(dòng)趨勢(shì)的一種相對(duì)數(shù)。
第二篇:統(tǒng)計(jì)學(xué)主要概念
對(duì)于計(jì)算題,一定要把課本上的例題要弄明白。如主要集中指標(biāo)和離散程度的計(jì)算、中心極限定理的應(yīng)用、區(qū)間估計(jì)、假設(shè)檢驗(yàn)、方差分析、相關(guān)系數(shù)的計(jì)算和檢驗(yàn)、一元回歸分析(包括模型的估計(jì)、回歸系數(shù)的檢驗(yàn)、隨機(jī)誤差項(xiàng)方差的估計(jì)、擬合優(yōu)度的計(jì)算、一元回歸模型的點(diǎn)預(yù)測(cè)和區(qū)間預(yù)測(cè))等。
主要概念
1.什么是統(tǒng)計(jì)學(xué)?為什么統(tǒng)計(jì)學(xué)可以通過對(duì)數(shù)據(jù)的分析達(dá)到對(duì)事物性質(zhì)的認(rèn)識(shí)?
2.解釋總體與樣本、參數(shù)和統(tǒng)計(jì)量的含義。
3.解釋總體分布、樣本分布和抽樣分布的含義。
4.簡(jiǎn)述描述統(tǒng)計(jì)學(xué)和推斷統(tǒng)計(jì)學(xué)的概念及其聯(lián)系。
5.簡(jiǎn)述中心極限定理。
6. 解釋置信水平、置信區(qū)間、顯著性水平的含義,它們有什么聯(lián)系。
7.幾何平均數(shù)的適用條件分別是什么?
8.抽樣推斷時(shí)為什么必須遵循隨機(jī)原則抽取樣本?
9.簡(jiǎn)述假設(shè)檢驗(yàn)的一般步驟。
10.相關(guān)系數(shù)(r)絕對(duì)值的大小是如何來反映兩個(gè)變量之間線性關(guān)系顯著性的?
11.簡(jiǎn)述眾數(shù)、中位數(shù)和均值的特點(diǎn)和應(yīng)用場(chǎng)合。
12.為什么要計(jì)算離散系數(shù)?
13.標(biāo)準(zhǔn)差是如何來反映一組數(shù)的離散程度的?
14.方差分析的基本假設(shè)有那些?
15.簡(jiǎn)述相關(guān)分析和回歸分析的區(qū)別與聯(lián)系。
16.一組數(shù)據(jù)的分布特征可以從那幾個(gè)方面進(jìn)行測(cè)定?
17.簡(jiǎn)述樣本容量與置信水平、總體方差、允許誤差的關(guān)系。
18.比較單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)的區(qū)別。
19.甲企業(yè)近四年產(chǎn)品銷售量分別增長(zhǎng)了9%、7%、8%、6%;乙企業(yè)這四年產(chǎn)品的次品率也正好是9%、7%、8%、6%。這兩個(gè)企業(yè)這四年的平均增長(zhǎng)率和平均次品率的計(jì)算是否一樣?為什么?
第三篇:統(tǒng)計(jì)學(xué)主要概念
簡(jiǎn)答題(本專科):15分
1、時(shí)期指標(biāo)和時(shí)點(diǎn)指標(biāo)有哪些不同的特點(diǎn)
(1)時(shí)期指標(biāo)具有連續(xù)統(tǒng)計(jì)的特點(diǎn);時(shí)點(diǎn)指標(biāo)不具有連續(xù)統(tǒng)計(jì)的特點(diǎn)。
(2)時(shí)期指標(biāo)值可以相加;時(shí)點(diǎn)指標(biāo)數(shù)值不具有可加性。
(3)時(shí)期指標(biāo)值大小與所包括時(shí)期長(zhǎng)短有直接關(guān)系;時(shí)點(diǎn)指標(biāo)值的大小與其時(shí)間間隔長(zhǎng)短沒有直接關(guān)系。
2、抽樣調(diào)查、重點(diǎn)調(diào)查和典型調(diào)查有哪些相同點(diǎn)和不同點(diǎn)?
區(qū)別:(1)選取調(diào)查單位的方式不同。抽樣調(diào)查是按照隨機(jī)原則從總體中抽取部分調(diào)查單位進(jìn)行觀察用以推斷總體數(shù)量特征的一種調(diào)查方式;重點(diǎn)調(diào)查是在所要調(diào)查的現(xiàn)象總體的全部單位中選擇部分重點(diǎn)單位進(jìn)行調(diào)查,要求選取的重點(diǎn)單位的某一主要標(biāo)志的標(biāo)志總量在總體標(biāo)志總量中占有很大比重;典型調(diào)查是根據(jù)調(diào)查的目的任務(wù),在對(duì)所研究的現(xiàn)象總體進(jìn)行初步分析的基礎(chǔ)上,有意識(shí)的選取若干具有代表性的單位進(jìn)行調(diào)查和研究,借以認(rèn)識(shí)事物發(fā)展變化的規(guī)律。根據(jù)三者的定義可以看出抽樣調(diào)查序曲調(diào)查單位是按照隨機(jī)原則而重點(diǎn)調(diào)查和典型調(diào)查不是按照隨機(jī)原則,而重點(diǎn)調(diào)查和典型調(diào)查在選取調(diào)查單位上前者著重于數(shù)量特征,所選單位是在所要調(diào)查的數(shù)量特征上占較大比重的單位,而典型調(diào)查主要是定性的,著眼點(diǎn)在代表性上。
(2)調(diào)查目的的不同。重點(diǎn)調(diào)查的目的是通過對(duì)重點(diǎn)單位的調(diào)查,掌握總體的基本情況;抽樣調(diào)查的目的則是通過對(duì)部分單位的調(diào)查結(jié)果來推算總體的數(shù)量特征;作為統(tǒng)計(jì)意義的典型調(diào)查,其目的類似于抽樣調(diào)查。
(3)推算總體指法標(biāo)的準(zhǔn)確性和可靠程度不同。抽樣調(diào)查和典型調(diào)查都要以部分單位調(diào)查的結(jié)果推算總體指法標(biāo),由于二者調(diào)查單位選擇的方法不同,其推算結(jié)果的準(zhǔn)確性、可靠性也不同。抽樣調(diào)查按隨機(jī)原則抽選調(diào)查單位,因而在給定概率和誤差范圍條件下,可保證推斷的準(zhǔn)確性和可靠性;而典型調(diào)查單位的選擇完全由人們有意識(shí)的選擇,因而難以保證推斷結(jié)果的準(zhǔn)確性和可靠性,推斷誤差既無法計(jì)算也不能控制.相同點(diǎn):(1)三者都是非全面調(diào)查,都是選取總體中的一部分單位進(jìn)行觀察和研究;
(2)都是專門組織的一次性調(diào)查。
3.什么是抽樣誤差,影響抽樣誤差大小的因素主要有哪些?
抽樣誤差是指由于隨機(jī)抽樣的偶然因素使樣本各單位的結(jié)構(gòu)不足以代表總體各單位的結(jié)構(gòu),而引起抽樣指標(biāo)和總體參數(shù)之間的絕對(duì)離差
(1)總體各單位標(biāo)志值的差異程度。差異程度愈大則抽樣誤差也愈大,反之則小。
(2)樣本的單位數(shù)。在其他條件相同的情況下,樣本的單位數(shù)愈多,則抽樣誤差愈小。(3)抽樣方法。抽樣方法不同,抽樣誤差也不同。一般地說重復(fù)抽樣的抽樣誤差比不重復(fù)抽樣的抽樣誤差要大些。(4)抽樣調(diào)查的組織形式。不同的抽樣組織形式就有不同的抽樣誤差。而且同一種組織形式的合理程度也影響抽樣誤差。
4.相關(guān)分析和回歸分析的區(qū)別和聯(lián)系有哪些?
聯(lián)系:(1)相關(guān)分析是回歸分析的基礎(chǔ);(2)回歸分析是相關(guān)分析的發(fā)展或深入。
區(qū)別:(1)相關(guān)分析與回歸分析在研究目的和方法上是有明顯區(qū)別的。相關(guān)分析研究變量之間相關(guān)的方向和相關(guān)的程度。但是,相關(guān)分析不能指出變量間相互關(guān)系的具體形式,也無法從一個(gè)變量的變化來推測(cè)另一個(gè)變量的變化情況。回歸分析則是研究變量之間相互關(guān)系的具體形式,它對(duì)具有相關(guān)關(guān)系的變量之間的數(shù)量聯(lián)系進(jìn)行測(cè)定,確定一個(gè)相關(guān)的數(shù)學(xué)方程式,根據(jù)這個(gè)數(shù)學(xué)方程式可以從已知量來推測(cè)未知量,從而為估算和預(yù)測(cè)提供了一個(gè)重要的方法。
(2)相關(guān)分析可以不必確定變量中哪個(gè)是自變量,哪個(gè)是因變量,而回歸分析則必須事先研究確定具有相關(guān)關(guān)系的變量中哪個(gè)為自變量,哪個(gè)為因變量。
(3)相關(guān)分析所涉及的變量可以都是隨機(jī)變量。一般地說,回歸分析中因變量是隨機(jī)的,而把自變量作為研究時(shí)給定的非隨機(jī)變量。(4)對(duì)于互為因果關(guān)系的變量,相關(guān)分析只要計(jì)算一個(gè)相關(guān)系數(shù)即可,而回歸分析需要計(jì)算兩個(gè)不同的回歸方程分別用來根據(jù) x預(yù)測(cè)y,或根據(jù)y預(yù)測(cè)x。
7.什么是變異指標(biāo)?它具有哪些作用?
答案:反應(yīng)統(tǒng)計(jì)數(shù)列中以平均數(shù)為中心總體各單位標(biāo)志值的差異大小或離散程度。
作用:①衡量平均指標(biāo)的代表性
②反應(yīng)經(jīng)濟(jì)現(xiàn)象活動(dòng)過程均衡性、穩(wěn)定性。
③研究總體標(biāo)志值分布偏離的情況。
④是進(jìn)行抽樣推斷等統(tǒng)計(jì)分析的一個(gè)基本指標(biāo)。
7、簡(jiǎn)述指標(biāo)和標(biāo)志的區(qū)別和聯(lián)系。
區(qū)別:(1)標(biāo)志是說明總體單位特征的,指標(biāo)是說明總體特征的;(2)標(biāo)志有能用數(shù)字表示的數(shù)量標(biāo)志和不能用數(shù)字表示的品質(zhì)標(biāo)志,而指標(biāo)都能用數(shù)字表示。
聯(lián)系:(1)指標(biāo)的數(shù)值是由各數(shù)量標(biāo)志值匯總得來的;(2)在一定條件下,指標(biāo)和數(shù)量標(biāo)志可以相互轉(zhuǎn)化。
8、什么是時(shí)期數(shù)列,什么是時(shí)點(diǎn)數(shù)列,兩者的區(qū)別是什么?
時(shí)期數(shù)列是現(xiàn)象在不同時(shí)期內(nèi)的活動(dòng)總量,在總量指標(biāo)時(shí)間數(shù)列中,如果每一指標(biāo)值是反映某現(xiàn)象在一段時(shí)間內(nèi)發(fā)展過程的總量,則這種數(shù)列稱為時(shí)期數(shù)列;時(shí)點(diǎn)數(shù)列是現(xiàn)象在不同瞬間時(shí)點(diǎn)上的總量,在總量指標(biāo)時(shí)間數(shù)列中,如果每一指標(biāo)值是反映某現(xiàn)象在某一時(shí)刻上的總量,則這種數(shù)列稱為時(shí)點(diǎn)數(shù)列。
它們分別有以下三個(gè)特點(diǎn)(1)時(shí)期數(shù)列具有連續(xù)統(tǒng)計(jì)的特點(diǎn);時(shí)點(diǎn)數(shù)列指標(biāo)不具有連續(xù)統(tǒng)計(jì)的特點(diǎn)。((2)時(shí)期數(shù)列中各個(gè)時(shí)期指標(biāo)值可以相加;時(shí)點(diǎn)數(shù)列中各個(gè)指標(biāo)數(shù)值不具有可加性。(3)時(shí)期數(shù)列中各個(gè)指標(biāo)值大小與所包括時(shí)期長(zhǎng)短有直接關(guān)系;時(shí)點(diǎn)數(shù)列中每個(gè)指標(biāo)值的大小與其時(shí)間間隔長(zhǎng)短沒有直接關(guān)系。
10.抽樣推斷方法具有哪些特點(diǎn)?()
(1)抽樣推斷是由部分推斷整體的一種研究方法
(2)抽樣推斷是建立在隨機(jī)取樣的基礎(chǔ)上
(3)抽樣推斷是運(yùn)用概率估計(jì)的方法
(4)抽樣推斷的誤差可以事先計(jì)算并加以控制
11.統(tǒng)計(jì)調(diào)查方案包括哪些內(nèi)容?
(1)確定調(diào)查目標(biāo)(2)確定調(diào)查對(duì)象和調(diào)查單位
(3)確定調(diào)查項(xiàng)目(4)確定調(diào)查表
(5)確定調(diào)查時(shí)間和調(diào)查時(shí)限(6)確定調(diào)查的組織工作
12.什么是時(shí)期數(shù)列?它有哪些特點(diǎn)?
在動(dòng)態(tài)數(shù)列中,每一指標(biāo)反映的是某現(xiàn)象在一段時(shí)間內(nèi)發(fā)展過程的總量,則該動(dòng)態(tài)數(shù)列稱時(shí)期數(shù)列;(3分)
第四篇:心理統(tǒng)計(jì)學(xué)常用概念總結(jié)
1.?描述統(tǒng)計(jì):是對(duì)成組數(shù)據(jù)概括的描述。描述統(tǒng)計(jì)的指標(biāo)有三類:數(shù)據(jù)的集中趨勢(shì),數(shù)據(jù)的離中趨勢(shì),數(shù)據(jù)間的相關(guān)。
2.?推論統(tǒng)計(jì):方法包括從樣本的數(shù)量特性推測(cè)總體數(shù)量特性的一系列問題:推論假設(shè),推論的各種方法和步驟,以及檢驗(yàn)推測(cè)可靠性的各種方法。
3.?組距:每一組上限和下限的差。(組距習(xí)慣上常用2,3,5,10,20)
4.?中點(diǎn):在某一組的下限和上限當(dāng)中的那一點(diǎn)。
5.?集中趨勢(shì):是代表一系列數(shù)據(jù)的典型水平的數(shù)字指標(biāo),代表集中趨勢(shì)的指標(biāo)有平均數(shù),中數(shù)和眾數(shù)。
6.?平均數(shù)(x):是一組數(shù)據(jù)總和的平均值。
7.?中數(shù)(mdn):一系列按大小順序排列的數(shù)據(jù)中的一個(gè)點(diǎn),在這個(gè)系列中有一半數(shù)據(jù)在這個(gè)點(diǎn)以上,有一半數(shù)據(jù)在這個(gè)點(diǎn)以下。
8.?眾數(shù)(mo):在一系列數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個(gè)數(shù)。
9.?全距:一個(gè)分布中最大的數(shù)值的上限減去最小數(shù)值的下限,就得到全距。(全距大,說明這組數(shù)據(jù)分散;全距小,則較集中。使用時(shí)注意:1、無極端值;2、比較兩個(gè)分布的全距時(shí),當(dāng)兩個(gè)分布所包含數(shù)據(jù)的數(shù)目相等或差不多時(shí)才能使用)
10.?離中趨勢(shì):是表示一組數(shù)據(jù)分散程度的指標(biāo),常用的指標(biāo)有:全距,四分差,平均差和標(biāo)準(zhǔn)差。(如果離中趨勢(shì)很小,說明數(shù)據(jù)分布都在平均數(shù)附近變動(dòng),因此平均數(shù)的代表性很大;如果離中趨勢(shì)太大,說明數(shù)據(jù)分布太分散)
11.?四分差(q):是數(shù)據(jù)的離中趨勢(shì)的指標(biāo)之一,四分差說明按大小順序排列的一系列數(shù)據(jù)中間50%個(gè)數(shù)據(jù)的分散程度。(如果一個(gè)分布中間部分的數(shù)據(jù)比較集中,則兩個(gè)四分點(diǎn)q3與q1就離得近些,q的值就小些。)
12.?百分點(diǎn):某次數(shù)分布中處于某百分等級(jí)的數(shù)值。
13.?百分等級(jí):某數(shù)值在某次數(shù)分布中所處的位置。
14.?平均差(ad):一個(gè)分布中每個(gè)變量和平均數(shù)的差的絕對(duì)值的平均值。
15.?標(biāo)準(zhǔn)差:s2開方后的正值就叫標(biāo)準(zhǔn)差,是數(shù)據(jù)的離中趨勢(shì)的指標(biāo)之一。
16.?離中系數(shù)(cv):用相對(duì)量來表示數(shù)據(jù)分散程度的數(shù)字指標(biāo)。
17.?相關(guān)程度:指相關(guān)是否密切,可分為無相關(guān);部分相關(guān);完全相關(guān)。
18.?相關(guān):是描述兩種數(shù)量關(guān)系的一個(gè)指標(biāo),如果一個(gè)變量隨另一個(gè)變量的增加(減小)而增加(減小),則兩個(gè)變量之間存在著相關(guān)。
19.?z分?jǐn)?shù)(標(biāo)準(zhǔn)分?jǐn)?shù)):是以標(biāo)準(zhǔn)差為單位所表示的原始分?jǐn)?shù)(x)與平均數(shù)的偏離,也可以說是一個(gè)以標(biāo)準(zhǔn)差為單位來表示的偏離分?jǐn)?shù)。
20.?總體;某類事物的全部稱為總體。
21.?樣本:從全部抽出的部分叫樣本。
22.?推論統(tǒng)計(jì):從局部推測(cè)全部,從樣本推測(cè)總體的統(tǒng)計(jì)程序。
23.?隨機(jī)抽選樣本:指總體中每個(gè)成分都有同等的機(jī)會(huì)被抽選。
24.?分層抽樣:用分層抽樣的方法,必須對(duì)總體有一定的了解,事先對(duì)于影響所研究問題的諸因素做適當(dāng)安排。
25.?樣本分布:從很多個(gè)樣本中算出的很多個(gè)平均數(shù)的次數(shù)分配叫樣本分布。
26.?正態(tài)分布:是一個(gè)中間高,兩側(cè)逐漸下降,兩端永遠(yuǎn)不與橫軸相交,兩側(cè)完全對(duì)稱的鐘形曲線。
27.?平均數(shù)的標(biāo)準(zhǔn)誤(sx):為了和單個(gè)樣本的標(biāo)準(zhǔn)差有所區(qū)別,把樣本分布的標(biāo)準(zhǔn)差稱做平均數(shù)的標(biāo)準(zhǔn)誤。
28.?自由度(df):能夠獨(dú)立變化的數(shù)據(jù)的數(shù)目。
29.?平均數(shù)差的標(biāo)準(zhǔn)誤(sxd):分別從兩個(gè)總體中抽取出的多個(gè)樣本平均數(shù)的差(xd)的分布,這個(gè)分布的標(biāo)準(zhǔn)差叫做平均數(shù)差的標(biāo)準(zhǔn)誤。
30.?虛無假設(shè)(ho):除概率以外不加任何其它假定,即假設(shè)二總體的平均數(shù)差異為0。
31.?備則假設(shè)(ha):假設(shè)兩個(gè)總體平均數(shù)之間差異中除了抽樣誤差外,還包括有兩個(gè)總體平均數(shù)之間的差異,即備則假設(shè)是個(gè)總體平均數(shù)之間差異不為0。
32.?顯著性水平(p):我們所選擇的推翻虛無假設(shè)的概率叫做檢驗(yàn)的顯著性水平。
33.?第一類錯(cuò)誤:當(dāng)虛無假設(shè)不應(yīng)推翻時(shí)而被推翻了,這意味著把樣本的平均數(shù)差別認(rèn)為是代表了總體平均數(shù)的差異。
34.?第二類錯(cuò)誤:當(dāng)應(yīng)該推翻虛無假設(shè)時(shí)而不推翻,這意味著把樣本的平均數(shù)差別是代表總體平均數(shù)的差別這一事實(shí)給否認(rèn)了。
35.?顯著性檢驗(yàn):通過樣本平均數(shù)的差別來推論總體平均數(shù)是否真正存在差別,并確定存在何種水平。
36.?回歸:當(dāng)兩種變量間存在著一定程度的相關(guān)時(shí),一種變量有向另一種變量的平均數(shù)趨近的現(xiàn)象,這種現(xiàn)象叫回歸。
37.?回歸方程式:從一變量的數(shù)值預(yù)測(cè)另一變量的相應(yīng)數(shù)值的直線方程式,當(dāng)兩個(gè)變量部分相關(guān)時(shí),有兩個(gè)回歸方程式。
38.?回歸系數(shù)(byx):由x變量預(yù)測(cè)y變量的回歸方程式的斜率。
39.?c2檢驗(yàn):是實(shí)際觀察次數(shù)與假設(shè)次數(shù)偏離程度的指標(biāo)。
40.?方差分析:根據(jù)組間和組內(nèi)方差的比值,來比較兩組或多組數(shù)據(jù)的差異是否達(dá)到顯著。
41.?組間變異:在兩組之間所產(chǎn)生的因變量的變異,就是系統(tǒng)變異,也就是由自變量引起的變異。因?yàn)檫@種變異發(fā)生在兩組之間,所以又叫組間變異。
42.?組內(nèi)變異:同一組內(nèi)的因變量的變異,就不是由于自變量的情況不同引起的,而只是由于未加控制的變量引起的。因?yàn)檫@種變異發(fā)生在同一組內(nèi),所以叫做組內(nèi)變異。
43.?組間設(shè)計(jì):每個(gè)被試只參加1個(gè)水平的實(shí)驗(yàn)。
44.?組內(nèi)實(shí)際:每個(gè)被試參加所有水平的實(shí)驗(yàn)。
45.?主效應(yīng):自變量所引起的平均數(shù)差異。
46.?交互作用:一個(gè)自變量對(duì)反應(yīng)變量的影響因另一個(gè)自變量的變化而發(fā)。
第五篇:統(tǒng)計(jì)學(xué)總結(jié)
統(tǒng)計(jì)學(xué)(Statistics):應(yīng)用統(tǒng)計(jì)學(xué)的原理與方法,研究數(shù)據(jù)的搜集、整理與分析的科學(xué),對(duì)不確定性數(shù)據(jù)作出科學(xué)的推斷。
醫(yī)學(xué)統(tǒng)計(jì)學(xué)(Medical Statistics):應(yīng)用統(tǒng)計(jì)學(xué)的原理與方法,研究醫(yī)學(xué)科研中有關(guān)數(shù)據(jù)的搜集、整理和分析的應(yīng)用科學(xué)。
統(tǒng)計(jì)學(xué)方法的特點(diǎn): 1.用數(shù)量反映質(zhì)量
2.統(tǒng)計(jì)邏輯:用群體規(guī)律估算/推測(cè)個(gè)體 3.手段:常通過部分個(gè)體估計(jì)總體
同質(zhì)和變異(考試重點(diǎn))
? 同質(zhì)(homogeneity):據(jù)研究目的所確定的所有研究對(duì)象的相同屬性。例子:身高、體重、年齡、容貌…… ? 變異(variation):同質(zhì)研究單位中變量值間的差異,整個(gè)統(tǒng)計(jì)學(xué)甚至是整個(gè)科學(xué)研究存在的基礎(chǔ)。
總體、樣本和研究單位(考試重點(diǎn))
? 總體(population):是根據(jù)研究目的確定的同質(zhì)研究單位的全體。統(tǒng)計(jì)學(xué)人員習(xí)慣將其叫做同質(zhì)研究單位某種變量值的集合,包括有限總體和無限總體。? 樣本(sample):是總體中抽取的一部分個(gè)體。包括隨機(jī)抽樣和非隨機(jī)樣本。? 樣本含量(sample size):樣本中包含的研究單位數(shù)。? 觀察單位(observed unit):也叫個(gè)體或研究單位,它是研究中的個(gè)體(individual),完全由研究目的確定。它可以是一個(gè)(群)人、一只動(dòng)物和一個(gè)細(xì)胞。
變量、變量值和資料(考試重點(diǎn))
? 變量(variable):按特定目的確定的研究單位的某種特征或?qū)傩浴?/p>
? 變量值(value of variable):變量的觀察或檢測(cè)結(jié)果,也叫變量的觀測(cè)值。? 資料(data):在特定目的指引下而確定的變量及其變量值。? 計(jì)量資料(measurement/quantitative/numerical data):其特征是能夠用數(shù)量衡量,通常具體計(jì)量單位。按照變量值是否連續(xù)又可分為連續(xù)型(continuous/interval)和離散型(discrete)兩類按特定目的確定的研究單位的某種特征或?qū)傩裕ㄕ?qǐng)舉例)。要特別注意比值資料,如細(xì)胞凋亡率。
? 計(jì)數(shù)資料(enumeration/qualitative/categorical/ nominal data):是將觀察單位按某種屬性或類別分組計(jì)數(shù),分組匯總各組觀察單位數(shù)后而得到的資料。其變量值是定性的,表現(xiàn)為互不相容的屬性或類別。按變量值類別的多少又分為二分類和多分類兩種類型(舉例)。
? 等級(jí)資料(ordinal categorical/rank/semi-quantitative data):是將觀察單位按某種屬性的不同程度分成等級(jí)后分組計(jì)數(shù),分組匯總各組觀察單位數(shù)后而得到的資料,其變量值具有半定量性質(zhì)。(舉例,如血清反應(yīng)強(qiáng)度、療效)
參數(shù)和統(tǒng)計(jì)量(考試重點(diǎn))
? 參數(shù)(parameter):根據(jù)總體中所有個(gè)體值計(jì)算出來的特征量/指標(biāo),一般用希臘字母表示。? 統(tǒng)計(jì)量(statistic):根據(jù)樣本個(gè)體值計(jì)算出來的描述的特征量/指標(biāo),一般用拉丁字母表示。
? 總體參數(shù)一般是不知道的,統(tǒng)計(jì)工作的目的是:通過樣本統(tǒng)計(jì)量估計(jì)推測(cè)總體參數(shù)。
誤差、隨機(jī)誤差、系統(tǒng)誤差和非系統(tǒng)誤差(考試重點(diǎn))? 誤差(error):泛指實(shí)際觀測(cè)值與真值之差,也即樣本指標(biāo)/統(tǒng)計(jì)量與總體指標(biāo)/參數(shù)之差。
? 按誤差產(chǎn)生的原因分為:系統(tǒng)誤差、非系統(tǒng)誤差和隨機(jī)誤差。
? 系統(tǒng)誤差(systematic error):由于儀器未校正、測(cè)量者感官的某種障礙、醫(yī)生掌握療效標(biāo)準(zhǔn)偏高或偏低等原因,使觀察值不是分散在真值兩側(cè),而是有方向性、系統(tǒng)性或周期性地偏離真值。
? 非系統(tǒng)誤差(nonsystematic error):由于研究者偶然 失誤而造成的誤差。例如:儀器失靈、抄錯(cuò)數(shù)據(jù)、點(diǎn)錯(cuò)小數(shù)點(diǎn)、寫錯(cuò)單位等,亦稱過失誤差(gross error)? 測(cè)量值 = 真值 + 隨機(jī)誤差 + 非隨機(jī)誤差
? 隨機(jī)誤差:是一類不恒定的、隨機(jī)變化的誤差,由于多種目前尚無法控制的因素引起。如:在同一條件下對(duì)某一實(shí)驗(yàn)進(jìn)行多次重復(fù),雖極力對(duì)其進(jìn)行控制或消除系統(tǒng)誤差后,但實(shí)驗(yàn)結(jié)果卻不盡相同。? 抽樣誤差(sampling error):由于抽樣所造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差別。隨機(jī)抽樣誤差不可避免,具有統(tǒng)計(jì)規(guī)律性,主要由個(gè)體差異(變異)
頻率、概率和小概率事件(考試重點(diǎn))
? 頻率(relative frequency): 一次隨機(jī)試驗(yàn)有幾種可能結(jié)果,在重復(fù)進(jìn)行試驗(yàn)時(shí),各種結(jié)果看來是偶然發(fā)生的,但當(dāng)重復(fù)試驗(yàn)次數(shù)相當(dāng)多時(shí),將顯現(xiàn)某種規(guī)律性。例如,投擲一枚硬幣,結(jié)果不外乎出現(xiàn)“正面”與“反面”兩種
? 概率(probability)概率是度量隨機(jī)事件發(fā)生可能性大小的一個(gè)數(shù)值。設(shè)在相同條件下,獨(dú)立地重復(fù)n次試驗(yàn),隨機(jī)事件A出現(xiàn) f 次,f/n 則稱為隨機(jī)事件A出現(xiàn)的頻率。當(dāng) n 逐漸增大時(shí),頻率 f/n 趨向于一個(gè)常數(shù),則稱該常數(shù)為隨機(jī)事件A的概率,可記為 P(A),簡(jiǎn)記為P。概率的取值范圍: 0≤ P(A)≤1。
? 頻率是就樣本而言的,而概率從總體的意義上說的,頻率是概率的估計(jì)值。試驗(yàn)次數(shù)(樣本含量)越多(越大),估計(jì)就越可靠。
? 小概率事件: 統(tǒng)計(jì)分析中的很多結(jié)論都基于一定置信程度下的概率推斷,小概率是研究人員確定的統(tǒng)計(jì)判斷或決策標(biāo)準(zhǔn),習(xí)慣上將概率小于0.05或0.01定為小概率事件。研究人員認(rèn)為小概率事件在一次試驗(yàn)中不可能發(fā)生,這即是統(tǒng)計(jì)決策必須付出的代價(jià)。
醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟 1.設(shè)計(jì)(design)
? 設(shè)計(jì)階段主要涉及實(shí)驗(yàn)的三要素(對(duì)象對(duì)象、研究因素、實(shí)驗(yàn)效應(yīng))、四原則(對(duì)照、隨機(jī)、重復(fù)和均衡)和設(shè)計(jì)方法。
? 包括專業(yè)設(shè)計(jì)和統(tǒng)計(jì)設(shè)計(jì)。根據(jù)研究對(duì)象的不同可將醫(yī)學(xué)科研設(shè)計(jì)分為:實(shí)驗(yàn)設(shè)計(jì)、調(diào)查設(shè)計(jì) 和 臨床實(shí)驗(yàn)設(shè)計(jì)。
2.收集資料(collection of data)(1)資料來源
? 第一手資料:統(tǒng)計(jì)報(bào)表(傳染病報(bào)表、職業(yè)病報(bào)表、醫(yī)院工作報(bào)表、死亡登記、疫情報(bào)告等);經(jīng)常性工作記錄(衛(wèi)生監(jiān)督記錄、健康檢查記錄、病歷等);專題調(diào)查、實(shí)驗(yàn)或臨床試驗(yàn)。
? 第二手資料:已公布的資料,特別是官方出版物,以及其他各種類型的數(shù)據(jù)。
(2)對(duì)資料要求
? 完整:觀察單位及觀察指標(biāo)應(yīng)盡可能地完整 ? 準(zhǔn)確:即真實(shí)、可靠。真實(shí)是統(tǒng)計(jì)學(xué)的靈魂 ? 及時(shí):即時(shí)限性
3.整理資料(sorting data)
? 目的:通過對(duì)原始數(shù)據(jù)的條理化、系統(tǒng)化和數(shù)量化的處理,使得其能夠滿足統(tǒng)計(jì)分析的需要,特別是要滿足統(tǒng)計(jì)軟件的要求。因此,國外有些教材也把該階段稱作數(shù)據(jù)篩查(data screening)
? 評(píng)估數(shù)據(jù)質(zhì)量,彌補(bǔ)缺失值或補(bǔ)做調(diào)查或?qū)嶒?yàn),確保數(shù)據(jù)準(zhǔn)確、可信。
4.分析資料(analysis of data)(考試重點(diǎn))
? 目的:揭示樣本數(shù)據(jù)中潛藏的內(nèi)在聯(lián)系和規(guī)律,借以估計(jì)總體的特征,從而達(dá)到支持決策的目的。
? 包括統(tǒng)計(jì)描述(統(tǒng)計(jì)圖、表、統(tǒng)計(jì)指標(biāo))和統(tǒng)計(jì)推斷(假設(shè)檢驗(yàn)和置信區(qū)間)。
資料的類型
? 定量資料: 可直接利用原始測(cè)量值進(jìn)行分析,也可將其分為幾類,完全取決于研究目的。
? 無序資料: 二項(xiàng)分類資料(賦值進(jìn)行量化)和多項(xiàng)分類資料(必須采用啞變量)舉行分析。
? 有序數(shù)據(jù):可直接進(jìn)行量化處理。
統(tǒng)計(jì)描述:采用合適的統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)圖和統(tǒng)計(jì)表來表達(dá)數(shù)據(jù)分布的特征和規(guī)律。極差(range)也稱全距,即最大值和最小值之差,記作R。(考試重點(diǎn))
編制頻數(shù)表的步驟 1.求極差 2.確定組距(i)
3.寫組段(分為12個(gè)組段)組下限(L):每個(gè)組段的起點(diǎn) 組上限(U):每個(gè)組段的終點(diǎn)
4.分組段劃記并統(tǒng)計(jì)頻數(shù)
(1)對(duì)稱分布 :若各組段的頻數(shù)以頻數(shù)最多組段為中心左右兩側(cè)大體對(duì)稱,就認(rèn)為該資料是對(duì)稱分布。
(2)偏態(tài)分布 :
? 右偏態(tài)分布也稱正偏態(tài)分布:右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),頻數(shù)向右側(cè)拖尾。(考試重點(diǎn))
? 左偏態(tài)分布也稱負(fù)偏態(tài)分布:左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾。(考試重點(diǎn))頻數(shù)表和頻數(shù)分布圖用途 1.描述數(shù)據(jù)分布類型
2.描述頻數(shù)分布的特征
3.便于發(fā)現(xiàn)一些特大或特小的可疑值; 4.便于進(jìn)一步做統(tǒng)計(jì)分析和處理。
集中趨勢(shì):遴選最合適的代表值。
離散趨勢(shì):評(píng)判代表值對(duì)總體代表的程度。
集中趨勢(shì)的描述(考試重點(diǎn))統(tǒng)計(jì)上使用平均數(shù)(average)這一指標(biāo)體系來描述一組變量值的集中位置或平均水平。(考試重點(diǎn))常用的平均數(shù)有:算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)
? 算術(shù)均數(shù):簡(jiǎn)稱均數(shù)(mean)。可用于反映一組呈對(duì)稱分布的變量值在數(shù)量上的平均水平或者說是集中位置的特征值。(考試重點(diǎn))適用于對(duì)稱分布,特別是正態(tài)分布或近似正態(tài)分布的資料。
? 幾何均數(shù)(geometric mean):可用于反映一組經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布的變量值在數(shù)量上的平均水平。適用于成等比級(jí)數(shù)的資料,特別是對(duì)數(shù)正態(tài)分布資料。? 中位數(shù)(median):是將變量值從小到大排列,位次居于正中間的那個(gè)變量值。當(dāng)數(shù)據(jù)個(gè)數(shù)為奇數(shù)時(shí),取位次居中的變量值;當(dāng)為數(shù)據(jù)個(gè)數(shù)為偶數(shù)時(shí),取位次居中的兩個(gè)變量值的平均值。各種分布類 型的資料,特別是偏態(tài)分布資料和含有不確定數(shù)值的資料。
? 百分位數(shù)(percentile)是一種位置指標(biāo),用
來表示,讀作第X 百分位分?jǐn)?shù)。
離散趨勢(shì)的描述(考試重點(diǎn))
常用統(tǒng)計(jì)指標(biāo):極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異系數(shù)。
極差或全距(Range),用R表示:即一組變量值最大值與最小值之差。
四分位數(shù)間距,用QR表示:QR=p75-p25 下四分位數(shù):QL=P25 上四分位數(shù);QU=P75 方差(variance)也稱均方差(mean square deviation),反映一組數(shù)據(jù)的平均離散水平。
標(biāo)準(zhǔn)差:方差的開方
變異系數(shù)(coefficient of variation)記為,多用于觀察指標(biāo)單位不同時(shí)的變異程度的比較;或均數(shù)相差較大時(shí)變異程度的比較。(考試重點(diǎn))
正態(tài)分布的概念:如果隨機(jī)變量X的分布服從概率密度函數(shù)
?(X??)22?21f(X)?e?2?
???X???則稱服從正態(tài)分布,記作
?
N
(?, ?)μ為X的總體均數(shù),?
2為總體方差。X
百分位數(shù)法:公式:雙側(cè)1-α參考范圍 P100α/2~ P100-100α/2 單側(cè)1-α參考范圍 >P100或
醫(yī)學(xué)參考值(reference value)是指包括絕大多數(shù)正常人的人體形態(tài)、機(jī)能和代謝產(chǎn)物等各種生理及生化指標(biāo)常數(shù),也稱正常值。由于存在個(gè)體差異,生物醫(yī)學(xué)數(shù)據(jù)并非常數(shù)而是在一定范圍內(nèi)波動(dòng),故采用醫(yī)學(xué)參考值范圍(medical reference range)作為判定正常和異常的參考標(biāo)準(zhǔn)。
雙側(cè) :即指標(biāo)過高和過低都不正常,如:血清總膽固醇、血壓、體重等等。
單側(cè): 即僅在指標(biāo)值過低或過高才被認(rèn)為不正常,如:血清轉(zhuǎn)氨酶僅過高異常、肺活量。
計(jì)算醫(yī)學(xué)參考值范圍的常用方法:
? 正態(tài)分布法(當(dāng)資料服從正態(tài)分布)
? 百分位數(shù)法(當(dāng)資料不服從正態(tài)分布)
抽樣誤差:由于存在個(gè)體差異,抽得樣本的均數(shù)不太可能恰好等于總體均數(shù),因此通過樣本推斷總體會(huì)有誤差。這種由個(gè)體變異產(chǎn)生的、抽樣造成的樣本統(tǒng)計(jì)量(statistic)與總體參數(shù)(parameter)的差異,稱為抽樣誤差。(常考內(nèi)容)
標(biāo)準(zhǔn)誤(standard error, SE):表示樣本統(tǒng)計(jì)量抽樣誤差大小的統(tǒng)計(jì)指標(biāo)。均數(shù)標(biāo)準(zhǔn)誤:說明均數(shù)抽樣誤差的大小,總體計(jì)算公式
??X? n
?t 分布: 若某一隨機(jī)變量X服從總體均數(shù)為X??、總體標(biāo)準(zhǔn)差為?2N(?, ?),的正態(tài)分布則可通過u變換(?)將一般正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布N(0,12),即u分布.t 分布特征
1.單峰分布,以0為中心,左右對(duì)稱; 2.自由度3.當(dāng)?越小,則t值越分散,t分布的峰部越矮而尾部翹得越高;
X?逼近?, SX逼近?, t分布逼近u分布,故標(biāo)準(zhǔn)正態(tài)分布是t分布的特例
參數(shù)估計(jì) :用樣本統(tǒng)計(jì)量推斷總體參數(shù)。總體均數(shù)估計(jì):用樣本均數(shù)推推斷總體均數(shù)
點(diǎn)估計(jì):就是用相應(yīng)樣品統(tǒng)計(jì)量直接作為其總體參數(shù)的估計(jì)值。如用ˉX估計(jì)μ,S估計(jì)σ等。其方法雖簡(jiǎn)單,但未考慮抽樣誤差的大小。
區(qū)間估計(jì):是按預(yù)先給定的概率(1-α)所確定的包含位置總體參數(shù)的一個(gè)范圍。該范圍稱為參數(shù)的可信區(qū)間(confidence bound/confidence interval, CI);預(yù)先給定的概率1-α稱為可信度或置信度(confidence level),常取95﹪或99﹪,如果沒有特別說明,一般取雙側(cè)95﹪。
可信區(qū)間的兩個(gè)要素
(1)準(zhǔn)確度:用可信度(1??)表示:即區(qū)間包含總體均數(shù)?的理論概率大小。它愈接近1愈好,如99%的可信區(qū)間比95%的可信區(qū)間要好。
(2)精確度:即區(qū)間的寬度。區(qū)間愈窄愈精確,如95%的可信區(qū)間比99%的可信區(qū)間要好。
假設(shè)檢驗(yàn)的步驟
1.建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)
① ?=?0:即檢驗(yàn)假設(shè),常稱無效假設(shè)或零/原假設(shè),用H0表示。
② ???0:即備擇假設(shè),常稱對(duì)立假設(shè),用H1表示。③ ?:即檢驗(yàn)水準(zhǔn),也稱顯著性水準(zhǔn)。?是預(yù)先規(guī)定的概率值,它確定了小概率事件的標(biāo)準(zhǔn)。在實(shí)際工作中常取?=0.05。2.計(jì)算檢驗(yàn)統(tǒng)計(jì)量
應(yīng)根據(jù)變量和資料類型、設(shè)計(jì)方案、統(tǒng)計(jì)推斷的目的、方法的適用條件等選擇檢驗(yàn)統(tǒng)計(jì)量。3.確定P值
按照所選擇的統(tǒng)計(jì)方法計(jì)算P值。P值的含義是指從H0規(guī)定的總體中隨機(jī)抽樣,抽得等于及大于(或/和等于及小于)現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計(jì)量(如t、u)值的概率。
4.下結(jié)論
? 將上述計(jì)算所得概率P與檢驗(yàn)水準(zhǔn)?進(jìn)行比較,判斷其是否為小概率事件,從而得出結(jié)論。一般來說,結(jié)論應(yīng)包含統(tǒng)計(jì)結(jié)論和專業(yè)結(jié)論兩部分。統(tǒng)計(jì)結(jié)論只說明有無統(tǒng)計(jì)學(xué)意義,而不能說明專業(yè)上的差異大小。必須將二者結(jié)合起來,才能得出符合客觀實(shí)際的結(jié)論。
? 若P≤?,則結(jié)論為按所取的?檢驗(yàn)水準(zhǔn),拒絕H0,接受H1,有統(tǒng)計(jì)學(xué)意義(統(tǒng)計(jì)結(jié)論),可認(rèn)為……不等或不同(專業(yè)結(jié)論)。;
? 若P>?,則結(jié)論為按?檢驗(yàn)水準(zhǔn),不拒絕H0,無統(tǒng)計(jì)學(xué)意義(統(tǒng)計(jì)結(jié)論),還不能認(rèn)為……不等或不同(專業(yè)結(jié)論)。
t檢驗(yàn)和u檢驗(yàn)的應(yīng)用條件
1.t檢驗(yàn)應(yīng)用條件
樣本含量n較小時(shí)(如n<60)(1)正態(tài)分布
(2)方差齊性
2.u 檢驗(yàn)應(yīng)用條件
樣本含量n較大,或n雖小但總體標(biāo)準(zhǔn)差已知(1)方差齊性(homogeneity of variance)總變異:全部測(cè)量值大小不同,這種變異稱為總變異。
離均差平方和:總變異的大小可以用離均差平方和(sum of squares of deviations from mean,SS)表示,即各測(cè)量值Xij與總均數(shù)差值的平方和,記為SS總。
組間變異:各處理組由于接受處理的水平不同,各組的樣本均數(shù)(i=1,2,…,g)也大小不等,這種變異稱為組間變異。其大小可用各組均數(shù)與總均數(shù)的離均差平方和表示,記為SS組間。
均方差,均方(mean square,MS)。
MS組間?MS組內(nèi)?SS組間?組間SS組內(nèi)?組內(nèi)完全隨機(jī)設(shè)計(jì):(completely random design)是采用完全隨機(jī)化的分組方法,將全部試驗(yàn)對(duì)象分配到g個(gè)處理組(水平組),各組分別接受不同的處理,試驗(yàn)結(jié)束后比較各組均數(shù)之間的差別有無統(tǒng)計(jì)學(xué)意義,推論處理因素的效應(yīng)。
隨機(jī)區(qū)組設(shè)計(jì)(randomized block design)又稱為配伍組設(shè)計(jì),是配對(duì)設(shè)計(jì)的擴(kuò)展。具體做法是:先按影響試驗(yàn)結(jié)果的非處理因素(如性別、體重、年齡、職業(yè)、病情、病程等)將受試對(duì)象配成區(qū)組(block),再分別將各區(qū)組內(nèi)的受試對(duì)象隨機(jī)分配到各處理或?qū)φ战M。
率:說明某現(xiàn)象發(fā)生的頻率或強(qiáng)度。常以百分率(%)、千分率(‰)、萬分率(1/萬)、十萬分率(1/10萬)等表示,計(jì)算公式為:某時(shí)期內(nèi)發(fā)生某現(xiàn)象的觀察單位數(shù)率??比例基數(shù) 同期可能發(fā)生某現(xiàn)象的觀察單位總數(shù)
構(gòu)成比:表示事物內(nèi)部某一部分的個(gè)體數(shù)與該事物各部分個(gè)體數(shù)的總和之比,用來說明各構(gòu)成部分在總體中所占的比重或分布。通常以100%為比例基數(shù)。
相對(duì)比簡(jiǎn)稱比(ratio),是兩個(gè)有關(guān)指標(biāo)之比,說明兩指標(biāo)間的比例關(guān)系。兩個(gè)指標(biāo)可以是性質(zhì)相同,如不同時(shí)期發(fā)病數(shù)之比;也可以性質(zhì)不同,通常以倍數(shù)或百分?jǐn)?shù)(%)表示。
應(yīng)用相對(duì)數(shù)的注意事項(xiàng)
1、計(jì)算相對(duì)數(shù)應(yīng)有足夠數(shù)量即分母不宜太小。
2、不能以構(gòu)成比代替率 3.正確計(jì)算合計(jì)率 4.注意資料的可比性
動(dòng)態(tài)數(shù)列(dynamic series):是一系列按時(shí)間順序排列起來的統(tǒng)計(jì)指標(biāo)(可以為絕對(duì)數(shù),相對(duì)數(shù)或平均數(shù)),用以觀察和比較該事物在時(shí)間上的變化和發(fā)展趨勢(shì)。常用的動(dòng)態(tài)數(shù)列分析指標(biāo)有:絕對(duì)增長(zhǎng)量、發(fā)展速度與增長(zhǎng)速度、平均發(fā)展速度與平均增長(zhǎng)速度。
二項(xiàng)分布(binomial distribution)是指在只會(huì)產(chǎn)生兩種可能結(jié)果如“陽性”或“陰性”之一的n次獨(dú)立重復(fù)試驗(yàn)(常常稱為n重Bernoulli試驗(yàn))中,當(dāng)每次試驗(yàn)的“陽性”概率保持不變時(shí),出現(xiàn)“陽性”的次數(shù)X=0,1,2,…,n的一種概率分布。
二項(xiàng)分布的適用條件
1.每次試驗(yàn)只會(huì)發(fā)生兩種對(duì)立的可能結(jié)果之一,即分別發(fā)生兩種結(jié)果的概率之和
恒等于1;
2.每次試驗(yàn)產(chǎn)生某種結(jié)果(如“陽性”)的概率π固定不變;
3.重復(fù)試驗(yàn)是相互獨(dú)立的,即任何一次試驗(yàn)結(jié)果的出現(xiàn)不會(huì)影響其它試驗(yàn)結(jié)果出
現(xiàn)的概率。
Poisson分布(Poisson distribution)作為二項(xiàng)分布的一種極限情況,已發(fā)展成為描述小概率事件發(fā)生規(guī)律性的一種重要分布。Poisson分布是描述單位面積、體積、時(shí)間、人群等內(nèi)稀有事件(或罕見事件)發(fā)生數(shù)的分布。
Poisson分布的適用條件
假定在規(guī)定的觀測(cè)單位內(nèi)某事件(如“陽性”)平均發(fā)生次數(shù)為λ,而其樣本計(jì)數(shù)為X(X=0,1,2,?)。則在滿足下面三個(gè)條件時(shí),有X~P(λ)。
1.普通性
在充分小的觀測(cè)單位上X的取值只能為1個(gè),不能同時(shí)取多個(gè)值。2.平穩(wěn)性
X的取值只與觀測(cè)單位的大小有關(guān),而與觀測(cè)單位的位置無關(guān)。
3.獨(dú)立增量性
在某個(gè)觀測(cè)單位上X的取值與其他各觀測(cè)單位上X的取值無關(guān)。
卡方檢驗(yàn)?zāi)康模和茢鄡蓚€(gè)總體率或構(gòu)成比之間有無差別
多個(gè)總體率或構(gòu)成比之間有無差別
多個(gè)樣本率的多重比較
兩個(gè)分類變量之間有無關(guān)聯(lián)性
頻數(shù)分布擬合優(yōu)度的檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量:X2 應(yīng)用:計(jì)數(shù)資料
X2分布的一個(gè)基本性質(zhì)是可加性
參數(shù)檢驗(yàn)
如果總體分布為已知的數(shù)學(xué)形式,對(duì)其總體參數(shù)作假設(shè)檢驗(yàn)。如: t 檢驗(yàn)和 F 檢驗(yàn)。
非參數(shù)檢驗(yàn):對(duì)總體分布不作嚴(yán)格假定,又稱任意分布檢驗(yàn)(distribution-free test),它直接對(duì)總體分布作假設(shè)檢驗(yàn)。
秩轉(zhuǎn)換的非參數(shù)檢驗(yàn)應(yīng)用范圍: 對(duì)于計(jì)量資料:
1.不滿足正態(tài)和方差齊性條件的小樣本資料;
2.分布不明的小樣本資料;
3.一端或二端是不確定數(shù)值(如<0.5、>5.0等)的資料(必選); 對(duì)于等級(jí)資料: 若選行×列表資料的 x2檢驗(yàn),只能推斷構(gòu)成比差別,而選秩轉(zhuǎn)換的非參數(shù)檢驗(yàn),可推斷等級(jí)強(qiáng)度差別。
wilcoxon秩和檢驗(yàn),用于推斷兩個(gè)獨(dú)立樣本所來自的兩個(gè)總體分布是否有差別。
直線回歸
目的:研究應(yīng)變量Y對(duì)自變量X的數(shù)量依存關(guān)系。
特點(diǎn):統(tǒng)計(jì)關(guān)系。X值和Y的均數(shù)的關(guān)系,不同于一般數(shù)學(xué)上的X 和Y的函數(shù)關(guān)系。
回歸模型的前提條件:線性(linearity)獨(dú)立(independent)正態(tài)(normal)等方差(equal variance)
??a?bX(9?1)直線回歸方程的一般表達(dá)式為
Ya 為回歸直線在 Y 軸上的截距,b為回歸系數(shù),即直線的斜率.殘差(residual)或剩余值,即實(shí)測(cè)值Y與假定回歸線上的估計(jì)值的縱向距離。
直線回歸方程的求法:原則:最小二乘法(least sum of squares),即可保證各實(shí)測(cè)點(diǎn)至直線的縱向距離的平方和最小.22SSlll2回決定系數(shù)(coefficient of determination)R??XYXX?XYSS總lYYlXXlYY
取值在0到1之間且無單位,其數(shù)值大小反映了回歸貢獻(xiàn)的相對(duì)程度,也就是在Y的總變異中回歸關(guān)系所能解釋的百分比。
(Y?Y)SSSS總=SS回+SS殘,總即?,為Y的離均差平方和,表示未考慮X與Y的回歸關(guān)
2系時(shí)Y的總變異。
直線相關(guān)(linear correlation)又稱簡(jiǎn)單相關(guān)(simple correlation),用于雙變量正態(tài)分布(bivariate normal distribution)資料。目的:研究?jī)蓚€(gè)變量X,Y數(shù)量上的依存(或相關(guān))關(guān)系。特點(diǎn):統(tǒng)計(jì)關(guān)系
相關(guān)系數(shù)(correlation coefficient)又稱Pearson積差相關(guān)系數(shù),用來說明具有直線關(guān)系的兩變量間相關(guān)的密切程度與相關(guān)方向。
相關(guān)系數(shù)沒有單位,其值為-1≥ r≥ 1。r值為正表示正相關(guān),r值為負(fù)表示負(fù)相關(guān),r的絕對(duì)值等于1為完全相關(guān),r=0為零相關(guān)。
(X?X)(Y?Y)l樣本相關(guān)系數(shù)的計(jì)算公式為
r??XY lXXlYY(X?X)2(Y?Y)2
秩相關(guān)適用條件:雙變量計(jì)量資料: ①資料不服從雙變量態(tài)分布; ②總體分布型未知,???一端或兩端是不確定數(shù)值(如<10歲,≥65歲)的資料;原始數(shù)據(jù)(一個(gè)或兩個(gè)變量值)用等級(jí)表示的資料。
曲線擬合: 當(dāng)發(fā)現(xiàn)散點(diǎn)圖中應(yīng)變量 Y 和自變量 X 間表現(xiàn)出非線性趨勢(shì)時(shí),可以通過曲線擬合方法來刻畫兩變量間數(shù)量上的依存關(guān)系。
幾種曲線擬合:對(duì)數(shù)曲線、指數(shù)曲線、拋物線、S型曲線
統(tǒng)計(jì)表(statistical table)是表達(dá)統(tǒng)計(jì)分析結(jié)果中數(shù)據(jù)和統(tǒng)計(jì)指標(biāo)的表格形式;
統(tǒng)計(jì)圖(statistical graph)是用點(diǎn)、線、面等各種幾何圖形來形象化表達(dá)統(tǒng)計(jì)數(shù)據(jù)。
制表的基本要求
(1)標(biāo)題:概括表的主要內(nèi)容,包括研究的時(shí)間、地點(diǎn)和研究?jī)?nèi)容,放在表的上方。
(2)標(biāo)目:分別用橫標(biāo)目和縱標(biāo)目說明表格每行和每列數(shù)字的意義,注意標(biāo)明指標(biāo)的單位。(3)線條:至少用三條線,表格的頂線和底線將表格與文章的其它部分分隔開來,縱標(biāo)目下橫線將標(biāo)目的文字區(qū)與表格的數(shù)字區(qū)分隔開來。部分表格可再用橫線將合計(jì)分隔開,或用橫線將兩重縱標(biāo)目分割開。其它豎線和斜線一概省去。
(4)數(shù)字:用阿拉伯?dāng)?shù)字表示。無數(shù)字用“—”表示,缺失數(shù)字用“?”表示,數(shù)值為0者記為“0”,不要留空項(xiàng)。數(shù)字按小數(shù)位對(duì)齊。(5)備注:表中數(shù)字區(qū)不要插入文字,也不列備注項(xiàng)。必須說明者標(biāo)“*”號(hào),在表下方說明。
常用統(tǒng)計(jì)圖
1.直條圖(bar chart)2.圓圖(pie chart)和百分比條圖(percent bar chart)3.線圖(line graph)4.直方圖(histogram)5.統(tǒng)計(jì)地圖(statistical map)6.其他特殊分析圖
箱式圖(box plot)莖葉圖(stem-leaf plot)誤差條圖(error bar chart)
線圖是用線段的升降來表示數(shù)值的變化,適合于描述某統(tǒng)計(jì)量隨另一連續(xù)性數(shù)值變量變化而變化的趨勢(shì),最常用于描述統(tǒng)計(jì)量隨時(shí)間變化而變化的趨勢(shì)。
箱式圖(box plot)使用5個(gè)統(tǒng)計(jì)量反映原始數(shù)據(jù)的分布特征,即數(shù)據(jù)分布中心位置、分布、偏度、變異范圍和異常值。箱式圖的箱子兩端分別是上四分位數(shù)和下四分位數(shù),中間橫線是中位數(shù),兩端連線分別是除異常值外的最小值和最大值。另外標(biāo)記可能的異常值。
多因素試驗(yàn)資料的方差分析設(shè)計(jì)類型:析因設(shè)計(jì) 各因素各水平的全面組合 處理組合數(shù) g = 各因素水平數(shù)之積。
正交試驗(yàn):非全面組合,g個(gè)處理組是各因素 各水平的部分組合,即析因設(shè)計(jì) 的部分實(shí)施。
嵌套試驗(yàn):非各處理因素各水平的全面組合,而是各因素按隸屬關(guān)系系統(tǒng)分組,各因素水平?jīng)]有交叉。
裂區(qū)設(shè)計(jì):兩因素析因設(shè)計(jì)的特殊形式。
單獨(dú)效應(yīng) 指其他因素的水平固定時(shí),同一因素不同水平間的差別。主效應(yīng) 指某一因素各水平間的平均差別/不考慮其他因素下的效應(yīng)。
交互作用 當(dāng)某因素的各個(gè)單獨(dú)效應(yīng)隨另一因素變化而變化時(shí),則稱這兩個(gè)因素間存在交互作用。
析因設(shè)計(jì)變異分解 SS總?SS處理?SS誤差 ?SSA?SSB?SSAB?SS誤差
重復(fù)測(cè)量資料
目的:推斷處理、時(shí)間、處理×?xí)r間作用于試驗(yàn)對(duì)象的試驗(yàn)指標(biāo)的作用。
資料特征:處理因素 g(≥1)個(gè)水平,每個(gè)水平有n個(gè)試驗(yàn)對(duì)象,共計(jì) gn個(gè)試驗(yàn)對(duì)象。時(shí)間因素 同一試驗(yàn)對(duì)象在m(≥2)個(gè)時(shí)點(diǎn)獲得m個(gè)測(cè)量值,共計(jì)gnm個(gè)測(cè)量值。方法:方差分析
單組前后測(cè)量設(shè)計(jì)與配對(duì)設(shè)計(jì)的區(qū)別區(qū)別
區(qū)別點(diǎn) 配對(duì)設(shè)計(jì) 單組前后測(cè)量設(shè)計(jì)
N 兩實(shí)驗(yàn)單位 可隨機(jī)分配
觀測(cè)時(shí)間 同期 兩時(shí)間點(diǎn) N 試驗(yàn)數(shù)據(jù)與差值關(guān)系 獨(dú)立
分析指標(biāo)平均差值平均差值、相關(guān)回歸
推斷 組間差別 前后差別
logistic回歸 分析目的:作出以多個(gè)自變量(危險(xiǎn)因素)估計(jì)應(yīng)變量(結(jié)果因素)的logistic回歸方程。屬于概率型非線性回歸。
用途:研究某種疾病或現(xiàn)象發(fā)生和多個(gè)危險(xiǎn)因素(或保護(hù)因子)的數(shù)量關(guān)系。
logistic回歸種類: 1.成組(非條件)logistic回歸方程。2.配對(duì)(條件)logistic回歸方程。
優(yōu)勢(shì)比OR(odds ratio)流行病學(xué)衡量危險(xiǎn)因素作用大小的比數(shù)比例指標(biāo)。計(jì)算公式為:
P/(1?P 1)ORj?1 P0/(1?P0)
logistic回歸的應(yīng)用及注意事項(xiàng) 1.流行病學(xué)危險(xiǎn)因素分析 2.便于控制混雜因素效應(yīng) 3.預(yù)測(cè)與判別
等級(jí)變量和無序分類變量的數(shù)量化 樣本含量的計(jì)算(經(jīng)驗(yàn)標(biāo)準(zhǔn)和科學(xué)計(jì)算)
模型擬合優(yōu)度(偏差、顯著性檢驗(yàn)、假?zèng)Q定系數(shù)、AIC、BIC和預(yù)測(cè)準(zhǔn)確率)二分類logistic回歸、有序logistic回歸和多分類logistic回歸的選擇