第一篇:統(tǒng)計(jì)學(xué)名詞解釋
中位數(shù):被研究對象各單位的標(biāo)志值依其大小順序排列,位于標(biāo)志值數(shù)列中間位置的標(biāo)志值發(fā)展速度:兩個(gè)不同時(shí)期發(fā)展水平對比而計(jì)算的動(dòng)態(tài)相對數(shù)/標(biāo)志:是說明總體單位特征或?qū)傩缘拿Q//統(tǒng)計(jì)指標(biāo);是指表明總體某種數(shù)量特征的概念及其數(shù)量表現(xiàn)//統(tǒng)計(jì)設(shè)計(jì);在進(jìn)行某項(xiàng)具體工作之前,根據(jù)統(tǒng)計(jì)對象的性質(zhì)和統(tǒng)計(jì)研究的目的要求,對整個(gè)統(tǒng)計(jì)工作預(yù)先制定的實(shí)施方案和程序//專門調(diào)查:是指為了解決某個(gè)專門問題而單獨(dú)組織的調(diào)查//分配數(shù)列:是指在統(tǒng)計(jì)分組的基礎(chǔ)上把分配到各組的總體單位數(shù)按順序排列起來得到的數(shù)列//總量指標(biāo):是用來反映社會(huì)經(jīng)濟(jì)現(xiàn)象在一定條件下的總規(guī)模、總水平或工作總量的統(tǒng)計(jì)指標(biāo)//平均指標(biāo):是指代表同質(zhì)總體各單位某一數(shù)量標(biāo)志值一般水平的統(tǒng)計(jì)指標(biāo)//隨機(jī)變量:指的是影響變量值變動(dòng)的因素很多,作用不同,因而變量值變動(dòng)無確定方向,有偶然性//統(tǒng)計(jì)指標(biāo)體系:在統(tǒng)計(jì)上,由多種相互聯(lián)系、相互依存的統(tǒng)計(jì)指標(biāo)結(jié)合而成的,具有特定功能的有機(jī)整體就稱統(tǒng)計(jì)指標(biāo)體系//統(tǒng)計(jì)整理:是指根據(jù)統(tǒng)計(jì)研究任務(wù)的要求,對統(tǒng)計(jì)調(diào)查所取得的各項(xiàng)資料進(jìn)行科學(xué)的分類、匯總,為統(tǒng)計(jì)分析提供準(zhǔn)確、系統(tǒng)、條理得綜合資料的工作過程//變量:就是可以取不同的值得量,在社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)中,各種數(shù)量標(biāo)志和全部統(tǒng)計(jì)指標(biāo)都是標(biāo)量//統(tǒng)計(jì)調(diào)查:按照統(tǒng)計(jì)設(shè)計(jì)的要求和統(tǒng)計(jì)研究的目的,運(yùn)用科學(xué)的方法,搜集資料的統(tǒng)計(jì)活動(dòng)過程//相對指標(biāo):用對比的方法來反映某些社會(huì)經(jīng)濟(jì)現(xiàn)象總體內(nèi)部的結(jié)構(gòu),比例,發(fā)展?fàn)顩r以及彼此之間的聯(lián)系程度的綜合指標(biāo)
移動(dòng)平均法:是采用逐項(xiàng)遞項(xiàng)遞移的辦法計(jì)算出一系列擴(kuò)大時(shí)距的序時(shí)平均數(shù),并以這一系列序時(shí)平均數(shù)作為對應(yīng)的時(shí)期的趨勢值//發(fā)展速度:是兩個(gè)不同時(shí)期發(fā)展水平對比而計(jì)算的動(dòng)態(tài)相對數(shù)//增長速度:是各期增長量與基期水平之比,用以說明各期現(xiàn)象增長變化的相對程度//時(shí)點(diǎn)指標(biāo):是反應(yīng)事物在某一時(shí)點(diǎn)上的狀況//總體變異性:是指總體所有單位至少有一個(gè)以上的可變品質(zhì)標(biāo)志或數(shù)量標(biāo)志//同質(zhì)性:單位在某些標(biāo)志上有共同性//發(fā)展水平:是指動(dòng)態(tài)數(shù)列中各項(xiàng)具體的指標(biāo)數(shù)值//全面調(diào)查:就是對調(diào)查對象中全部單位進(jìn)行的調(diào)查//數(shù)量標(biāo)志:表明總體單位數(shù)量的方面特征的名稱//無限總體:總體所包括的單位數(shù)可以使無限的,叫無限總體//變量值:變量的數(shù)值表現(xiàn)稱為變量值//問卷調(diào)查:是以問題的形式系統(tǒng)的地記載所要調(diào)查內(nèi)容與質(zhì)詢問表,向調(diào)查對象搜集資料的調(diào)查方法
平均指標(biāo):是指同類社會(huì)經(jīng)濟(jì)現(xiàn)象在一定時(shí)間、地點(diǎn)、條件下所達(dá)到的一般水平//回歸分析:是測定現(xiàn)象之間聯(lián)系的具體形式的統(tǒng)計(jì)分析方法//估計(jì)標(biāo)準(zhǔn)誤差:用來說明回歸方程推算結(jié)果的準(zhǔn)確程度的統(tǒng)計(jì)分析指標(biāo),或者是反映回歸直線代表性大小的統(tǒng)計(jì)分析指標(biāo)//置信度:總體參數(shù)落在置信區(qū)間內(nèi)的概率保證程度////抽樣調(diào)查:是按照隨機(jī)原則從被研究總體中抽選一部分調(diào)查單位作為樣本進(jìn)行調(diào)查的,并計(jì)算出樣本指標(biāo)數(shù)值,而后用以推算總體指標(biāo)數(shù)值的一種方法//頻數(shù)分布:在統(tǒng)計(jì)分組的基礎(chǔ)上,將總體中所有單位按組歸類整理,形成總體中各個(gè)單位在各組間的分布//抽樣推斷:是在抽樣調(diào)查的基礎(chǔ)上,利用樣本的實(shí)際資料計(jì)算樣本指標(biāo),并據(jù)以推算總體分布或總體參數(shù)的一種統(tǒng)計(jì)分析方法/
第二篇:衛(wèi)生統(tǒng)計(jì)學(xué)名詞解釋
1.總體:總體(population)是根據(jù)研究目的確定的同質(zhì)的觀察單位的全體,更確切的說,是同質(zhì)的所有觀察單位某種觀察值(變量值)的集合。總體可分為有限總體和無限總體。總體中的所有單位都能夠標(biāo)識(shí)者為有限總體,反之為無限總體。
樣本:從總體中隨機(jī)抽取部分觀察單位,其測量結(jié)果的集合稱為樣本(sample)。樣本應(yīng)具有代表性。所謂有代表性的樣本,是指用隨機(jī)抽樣方法獲得的樣本。
2.隨機(jī)抽樣:隨機(jī)抽樣(random sampling)是指按照隨機(jī)化的原則(總體中每一個(gè)觀察單位都有同等的機(jī)會(huì)被選入到樣本中),從總體中抽取部分觀察單位的過程。隨機(jī)抽樣是樣本具有代表性的保證。
3.變異:在自然狀態(tài)下,個(gè)體間測量結(jié)果的差異稱為變異(variation)。變異是生物醫(yī)學(xué)研究領(lǐng)域普遍存在的現(xiàn)象。嚴(yán)格的說,在自然狀態(tài)下,任何兩個(gè)患者或研究群體間都存在差異,其表現(xiàn)為各種生理測量值的參差不齊。
4.計(jì)量資料:對每個(gè)觀察單位用定量的方法測定某項(xiàng)指標(biāo)量的大小,所得的資料稱為計(jì)量資料(measurement data)。計(jì)量資料亦稱定量資料、測量資料。.其變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。如某一患者的身高(cm)、體重(kg)、紅細(xì)胞計(jì)數(shù)(1012/L)、脈搏(次/分)、血壓(KPa)等
計(jì)數(shù)資料:將觀察單位按某種屬性或類別分組,所得的觀察單位數(shù)稱為計(jì)數(shù)資料(count data)。計(jì)數(shù)資料亦稱定性資料或分類資料。其觀察值是定性的,表現(xiàn)為互不相容的類別或?qū)傩浴H缯{(diào)查某地某時(shí)的男、女性人口數(shù);治療一批患者,其治療效果為有效、無效的人數(shù);調(diào)查一批少數(shù)民族居民的A、B、AB、O 四種血型的人數(shù)等。
等級(jí)資料:將觀察單位按測量結(jié)果的某種屬性的不同程度分組,所得各組的觀察單位數(shù),稱為等級(jí)資料(ordinal data)。等級(jí)資料又稱有序變量。如患者的治療結(jié)果可分為治愈、好轉(zhuǎn)、有效、無效或死亡,各種結(jié)果既是分類結(jié)果,又有順序和等級(jí)差別,但這種差別卻不能準(zhǔn)確測量;一批腎病患者尿蛋白含量的測定結(jié)果分為 +、++、+++等。
等級(jí)資料與計(jì)數(shù)資料不同:屬性分組有程度差別,各組按大小順序排列。
等級(jí)資料與計(jì)量資料不同:每個(gè)觀察單位未確切定量,故亦稱為半計(jì)量資料。
5.概率:概率(probability)又稱幾率,是度量某一隨機(jī)事件A發(fā)生可能性大小的一個(gè)數(shù)值,記為P(A),P(A)越大,說明A事件發(fā)生的可能性越大。0﹤P(A)﹤1。頻率:在相同的條件下,獨(dú)立重復(fù)做n 次試驗(yàn),事件A 出現(xiàn)了m 次,則比值m/n 稱為隨機(jī)事件A 在n 次試驗(yàn)中出現(xiàn)的頻率(freqency)。當(dāng)試驗(yàn)重復(fù)很多次時(shí)P(A)= m/n。
2.概率是描述隨機(jī)事件發(fā)生可能性大小的數(shù)值,常用P表示。隨機(jī)事件概率的大小在0與1之間,P越接近1,表示某事件發(fā)生的可能性越大;P越接近0,表示某事件發(fā)生的可能性越小。習(xí)慣上將P≤0.05的事件,稱為小概率事件,表示在一次實(shí)驗(yàn)或觀察中該事件發(fā)生的可能性很小,可視為不發(fā)生。6.隨機(jī)誤差:隨機(jī)誤差(random error)又稱偶然誤差,是指排除了系統(tǒng)誤差后尚存的差。它受多種因素的影響,使觀察值不按方向性和系統(tǒng)性而隨機(jī)的變化。誤差變量一般服從正態(tài)分布。隨機(jī)誤差可以通過統(tǒng)計(jì)處理來估計(jì)。
抽樣誤差(sampling error)是指樣本統(tǒng)計(jì)量與總體參數(shù)的差別。在總體確定的情況下,總體參數(shù)是固定的常數(shù),統(tǒng)計(jì)量是在總體參數(shù)附近波動(dòng)的隨機(jī)變量。
7.系統(tǒng)誤差:系統(tǒng)誤差(systematic error)是指由于儀器未校正、測量者感官的某種偏差、醫(yī)生掌握療效標(biāo)準(zhǔn)偏高或偏低等原因,使觀察值不是分散在真值的兩側(cè),而是有方向性、系統(tǒng)性或周期性地偏離真值。系統(tǒng)誤差可以通過實(shí)驗(yàn)設(shè)計(jì)和完善技術(shù)措施來消除或使之減少。
8.隨機(jī)變量:隨機(jī)變量(random variable)是指取指不能事先確定的觀察結(jié)果。隨機(jī)量的具體內(nèi)容雖然是各式各樣的,但共同的特點(diǎn)是不能用一個(gè)常數(shù)來表示,而且,理論上講,每個(gè)變量的取值服從特定的概率分布。
9.參數(shù):參數(shù)(paramater)是指總體的統(tǒng)計(jì)指標(biāo),如總體均數(shù)、總體率等。總體參數(shù)是固定的常數(shù)。多數(shù)情況下,總體參數(shù)是不易知道的,但可通過隨機(jī)抽樣抽取有代表性的樣本,用算得的樣本統(tǒng)計(jì)量估計(jì)未知的總體參數(shù)。10.統(tǒng)計(jì)量:統(tǒng)計(jì)量(statistic)是指樣本的統(tǒng)計(jì)指標(biāo),如樣本均數(shù)、樣本率等。樣本統(tǒng)計(jì)量可用來估計(jì)總體參數(shù)。總體參數(shù)是固定的常數(shù),統(tǒng)計(jì)量是在總體參數(shù)附近波動(dòng)的隨機(jī)變量。
11.頻數(shù)表(frequency table)用來表示一批數(shù)據(jù)各觀察值或在不同取值區(qū)間的出現(xiàn)的頻繁程度(頻數(shù))。對于離散數(shù)據(jù),每一個(gè)觀察值即對應(yīng)一個(gè)頻數(shù),如某醫(yī)院某一日內(nèi)死亡0,1,2?個(gè)病人的天數(shù)。對于散布區(qū)間很大的離散數(shù)據(jù)和連續(xù)型數(shù)據(jù),數(shù)據(jù)散布區(qū)間由若干組段組成,每個(gè)組段對應(yīng)一個(gè)頻數(shù)。
12.算術(shù)均數(shù)(arithmetic mean)描述一組數(shù)據(jù)在數(shù)量上的平均水平。總體均數(shù)用μ表示,樣本均數(shù)用X 表示。
13.幾何均數(shù)(geometric mean)用以描述對數(shù)正態(tài)分布或數(shù)據(jù)呈倍數(shù)變化資料的水平。記為G。
14.中位數(shù)(median)Md將一組觀察值由小到大排列,n 為奇數(shù)時(shí)取位次居中的變量值;為偶數(shù)時(shí),取位次居中的兩個(gè)變量的平均值。反映一批觀察值在位次上的平均水平。
15.極差(range)亦稱全距,即最大值與最小值之差,用于資料的粗略分析,其計(jì)算簡便但穩(wěn)定性較差。
16.百分位數(shù)(percentile)是將n 個(gè)觀察值從小到大依次排列,再把它們的位次依次轉(zhuǎn)化為百分位。百分位數(shù)的另一個(gè)重要用途是確定醫(yī)學(xué)參考值范圍。
17.四分位數(shù)間距(inter-quartile range)是由第3 四分位數(shù)和第1 四分位數(shù)相減計(jì)算而得,常與中位數(shù)一起使用,描述偏態(tài)分布資料的分布特征,較極差穩(wěn)定。
18.方差(variance):方差表示一組數(shù)據(jù)的平均離散情況,由離均差的平方和除以樣本個(gè)數(shù)得到。
19.標(biāo)準(zhǔn)差(standard deviation)是方差的正平方根,使用的量綱與原量綱相同,適用于近似正態(tài)分布的資料,大樣本、小樣本均可,最為常用。
20.變異系數(shù)(coefficient of variation)用于觀察指標(biāo)單位不同或均數(shù)相差較大時(shí)兩組資料變異程度的比較。用CV 表示。計(jì)算:標(biāo)準(zhǔn)差/均數(shù)*100%
21.統(tǒng)計(jì)推斷:通過樣本指標(biāo)來說明總體特征,這種從樣本獲取有關(guān)總體信息的過程稱為統(tǒng)計(jì)推斷(statistical inference)。
22.抽樣誤差:由個(gè)體變異產(chǎn)生的,抽樣造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差異,稱為抽樣誤差(sampling error)。
23.標(biāo)準(zhǔn)誤及X s :通常將樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。許多樣本均數(shù)的標(biāo)準(zhǔn)差X s稱為均數(shù)的標(biāo)準(zhǔn)誤(standard error of mean,SEM),它反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均數(shù)的差異,說明均數(shù)抽樣誤差的大小。
24.可信區(qū)間:按預(yù)先給定的概率確定的包含未知總體參數(shù)的可能范圍。該范圍稱為總體參數(shù)的可信區(qū)間(confidence interval,CI)。它的確切含義是:可信區(qū)間包含總體參數(shù)的可能性是1-α,而不是總體參數(shù)落在該范圍的可能性為1-α。
25.參數(shù)估計(jì):指用樣本指標(biāo)值(統(tǒng)計(jì)量)估計(jì)總體指標(biāo)值(參數(shù))。參數(shù)估計(jì)有兩種方法:點(diǎn)估計(jì)和區(qū)間估計(jì)。
26.假設(shè)檢驗(yàn)中P 的含義:指從H0 規(guī)定的總體隨機(jī)抽得等于及大于(或等于及小于)現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計(jì)量值的概率。
27.I 型和II 型錯(cuò)誤:I 型錯(cuò)誤(type I error),指拒絕了實(shí)際上成立的H0,這類“棄真”的錯(cuò)誤稱為I 型錯(cuò)誤,其概率大小用α表示;II 型錯(cuò)誤(type II error),指接受了實(shí)際上不成立的H0,這類“存?zhèn)巍钡恼`稱為II 型錯(cuò)誤,其概率大小用β表示。
28.檢驗(yàn)效能:1-β稱為檢驗(yàn)效能(power of test),它是指當(dāng)兩總體確有差別,按規(guī)定的檢驗(yàn)水準(zhǔn)a 所能發(fā)現(xiàn)該差異的能力。
29.檢驗(yàn)水準(zhǔn):是預(yù)先規(guī)定的,當(dāng)假設(shè)檢驗(yàn)結(jié)果拒絕H0,接受H1,下“有差別”的結(jié)論時(shí)犯錯(cuò)誤的概率稱為檢驗(yàn)水準(zhǔn)(level of a test),記為α。
30..率(rate)又稱頻率指標(biāo),說明一定時(shí)期內(nèi)某現(xiàn)象發(fā)生的頻率或強(qiáng)度。計(jì)算公式為:發(fā)生某現(xiàn)象的觀察單位數(shù)/可能發(fā)生某現(xiàn)象的觀察單位總數(shù)*100%,表示方式有:百分率(%)、千分率(?)等。
31.構(gòu)成比(proportion)又稱構(gòu)成指標(biāo),說明某一事物內(nèi)部各組成部分所占的比重或分布。計(jì)算公式為:某一組成部分的觀察單位數(shù)/同一事物各組成部分的觀察單位總數(shù)*100%,表示方式有:百分?jǐn)?shù)等。
32.比(ratio)又稱相對比,是A、B 兩個(gè)有關(guān)指標(biāo)之比,說明A 是B 的若干倍或百分之幾。計(jì)算公式為:A/B,表示方式有:倍數(shù)或分?jǐn)?shù)等。
33.非參數(shù)統(tǒng)計(jì):針對某些資料的總體分布難以用某種函數(shù)式來表達(dá),或者資料的總體分布的函數(shù)式是未知的,只知道總體分布是連續(xù)型的或離散型的,用于解決這類問題的一種不依賴總體分布的具體形式的統(tǒng)計(jì)分析方法。由于這類方法不受總體參數(shù)的限制,故稱非參數(shù)統(tǒng)計(jì)法(non-parametric statistics),或稱為不拘分布(distribution-free statistics)的統(tǒng)計(jì)分析方法,又稱為無分布型式假定(assumption free statistics)的統(tǒng)計(jì)分析方法。
34.參數(shù)統(tǒng)計(jì):通常要求樣本來自總體分布型是已知的(如正態(tài)分布),在這種假設(shè)的基礎(chǔ)上,對總體參數(shù)(如總體均數(shù))進(jìn)行估計(jì)和檢驗(yàn),稱為參數(shù)統(tǒng)計(jì)(parametric statistics)
35.秩次:變量值按照從小到大順序所編的秩序號(hào)稱為秩次(rank)。36.秩和:各組秩次的合計(jì)稱為秩和(rank sum),是非參數(shù)檢驗(yàn)的基本統(tǒng)計(jì)量。
37.直線回歸(linear regression)建立一個(gè)描述應(yīng)變量依自變量變化而變化的直線方程,并要求各點(diǎn)與該直線縱向距離的平方和為最小。直線回歸是回歸分析中最基本、最簡單的一種,故又稱簡單回歸(simple regression)。
38.回歸系數(shù)(regression coefficient)即直線的斜率(slope),在直線回歸方程中用b 表示,b 的統(tǒng)計(jì)意義為X每增(減)一個(gè)單位時(shí),Y平均改變b 個(gè)單位。
39.相關(guān)系數(shù)r:用以描述兩個(gè)隨機(jī)變量之間線性相關(guān)關(guān)系的密切程度與相關(guān)方向的統(tǒng)計(jì)指標(biāo)。衛(wèi)生統(tǒng)計(jì)學(xué)中的概念資料的類型、總體和樣本、參數(shù)和統(tǒng)計(jì)量、概率和頻率。
(一)資料的類型
1.定量資料亦稱計(jì)量資料,其變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位,如調(diào)查某年某地7歲女童的生長發(fā)育狀況,以人為觀察單位,女童的身高(cm)、體重(kg)、血紅蛋白(g/L)等均屬定量資料。
2.定性資料亦稱分類資料,其觀察值是定性的,表現(xiàn)為互不相容的類別或?qū)傩裕譃閮煞N情況:
(1)無序分類資料:包括:①二項(xiàng)分類。如調(diào)查吸毒者的HIV感染情況,結(jié)果分為陽性與陰性兩類,表現(xiàn)為互不相容的兩類屬性。②多項(xiàng)分類。如人類的AB0血型,以人為觀察單位,結(jié)果分為A型、B型、AB型與O型,表現(xiàn)為互不相容的多個(gè)類別。
(2)有序分類資料:各類之間有程度的差別,給人以“半定量”的概念,亦稱等級(jí)資料。如測定某人群某血清學(xué)反應(yīng),以人為觀察單位,結(jié)果可分“-”、“±”、“+”、“++”4級(jí);又如觀察某藥治療十二指腸潰瘍的療效,以每個(gè)患者為觀察單位,治療效果分為痊愈、顯效、好轉(zhuǎn)、無效4級(jí)。
(二)總體和樣本
總體就是所有同質(zhì)觀察單位某種觀察值(即變量值)的集合。樣本是總體中隨機(jī)抽取部分觀察單位的觀測值的集合。
(三)參數(shù)和統(tǒng)計(jì)量
總體的數(shù)值特征稱為參數(shù),用希臘字母表示。根據(jù)樣本算得的某些數(shù)值特征稱為統(tǒng)計(jì)量,用英文字母表示。在抽樣研究中,由個(gè)體變異產(chǎn)生,隨機(jī)抽樣引起的樣本統(tǒng)計(jì)量與總體參數(shù)之間的差別稱為抽樣誤差。
(四)概率和頻率
概率是描述隨機(jī)事件發(fā)生可能性大小的數(shù)值,常用P表示。隨機(jī)事件概率的大小在0與1之間,P越接近1,表示某事件發(fā)生的可能性越大;P越接近0,表示某事件發(fā)生的可能性越小。習(xí)慣上將P≤0.05的事件,稱為小概率事件,表示在一次實(shí)驗(yàn)或觀察中該事件發(fā)生的可能性很小,可視為不發(fā)生。
在現(xiàn)實(shí)中,隨機(jī)事件的概率往往是未知的,因此,當(dāng)觀測單位足夠多時(shí),常用樣本中事件的實(shí)際發(fā)生率來估計(jì)總體概率,這種實(shí)際發(fā)生率稱為頻率。設(shè)在相同條件下,獨(dú)立重復(fù)進(jìn)行n次試驗(yàn),事件A出現(xiàn)t次,則事件A出現(xiàn)的頻率為t/n.如治療200例患者,120名患者治愈,治愈率為60%,這就是一個(gè)頻率。當(dāng)觀測單位較少時(shí),用頻率估計(jì)概率是不可靠的。
第三篇:醫(yī)學(xué)統(tǒng)計(jì)學(xué)名詞解釋、簡答、問答
名詞解釋
1.總體:總體(population)是根據(jù)研究目的確定的同質(zhì)的觀察單位的全體,更確切的說,是同質(zhì)的所有觀察單位某種觀察值(變量值)的集合。總體可分為有限總體和無限總體。總體中的所有單位都能夠標(biāo)識(shí)者為有限總體,反之為無限總體。樣本:從總體中隨機(jī)抽取部分觀察單位,其測量結(jié)果的集合稱為樣本(sample)。樣本應(yīng)具有代表性。所謂有代表性的樣本,是指用隨機(jī)抽樣方法獲得的樣本。2.隨機(jī)抽樣:隨機(jī)抽樣(random sampling)是指按照隨機(jī)化的原則(總體中每一個(gè)觀察單位都有同等的機(jī)會(huì)被選入到樣本中),從總體中抽取部分觀察單位的過程。隨機(jī)抽樣是樣本具有代表性的保證。3.變異:在自然狀態(tài)下,個(gè)體間測量結(jié)果的差異稱為變異(variation)。變異是生物醫(yī)學(xué)研究領(lǐng)域普遍存在的現(xiàn)象。嚴(yán)格的說,在自然狀態(tài)下,任何兩個(gè)患者或研究群體間都存在差異,其表現(xiàn)為各種生理測量值的參差不齊。4.計(jì)量資料:對每個(gè)觀察單位用定量的方法測定某項(xiàng)指標(biāo)量的大小,所得的資料稱為計(jì)量資料(measurement data)。計(jì)量資料亦稱定量資料、測量資料。.其變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。如某一患者的身高(cm)、體重(kg)、紅細(xì)胞計(jì)數(shù)(1012/L)、脈搏(次/分)、血壓(KPa)等。計(jì)數(shù)資料:將觀察單位按某種屬性或類別分組,所得的觀察單位數(shù)稱為計(jì)數(shù)資料(count data)。計(jì)數(shù)資料亦稱定性資料或分類資料。其觀察值是定性的,表現(xiàn)為互不相容的類別或?qū)傩浴H缯{(diào)查某地某時(shí)的男、女性人口數(shù);治療一批患者,其治療效果為有效、無效的人數(shù);調(diào)查一批少數(shù)民族居民的A、B、AB、O 四種血型的人數(shù)等。等級(jí)資料:將觀察單位按測量結(jié)果的某種屬性的不同程度分組,所得各組的觀察單位數(shù),稱為等級(jí)資料(ordinal data)。等級(jí)資料又稱有序變量。如患者的治療結(jié)果可分為治愈、好轉(zhuǎn)、有效、無效或死亡,各種結(jié)果既是分類結(jié)果,又有順序和等級(jí)差別,但這種差別卻不能準(zhǔn)確測量;一批腎病患者尿蛋白含量的測定結(jié)果分為 +、++、+++等。等級(jí)資料與計(jì)數(shù)資料不同:屬性分組有程度差別,各組按大小順序排列。等級(jí)資料與計(jì)量資料不同:每個(gè)觀察單位未確切定量,故亦稱為半計(jì)量資料。5.概率:概率(probability)又稱幾率,是度量某一隨機(jī)事件A發(fā)生可能性大小的一個(gè)數(shù)值,記為P(A),P(A)越大,說明A事件發(fā)生的可能性越大。0﹤P(A)﹤1。頻率:在相同的條件下,獨(dú)立重復(fù)做n 次試驗(yàn),事件A 出現(xiàn)了m 次,則比值m/n 稱為隨機(jī)事件A 在n 次試驗(yàn)中出現(xiàn)的頻率(freqency)。當(dāng)試驗(yàn)重復(fù)很多次時(shí)P(A)= m/n。6.隨機(jī)誤差(random error)又稱偶然誤差,是指排除了系統(tǒng)誤差后尚存的差。它受多種因素的影響,使觀察值不按方向性和系統(tǒng)性而隨機(jī)的變化。誤差變量一般服從正態(tài)分布。隨機(jī)誤差可以通過統(tǒng)計(jì)處理來估計(jì)。抽樣誤差(sampling error)是指樣本統(tǒng)計(jì)量與總體參數(shù)的差別。在總體確定的情況下,總體參數(shù)是固定的常數(shù),統(tǒng)計(jì)量是在總體參數(shù)附近波動(dòng)的隨機(jī)變量。7.系統(tǒng)誤差:系統(tǒng)誤差(systematic error)是指由于儀器未校正、測量者感官的某種偏差、醫(yī)生掌握療效標(biāo)準(zhǔn)偏高或偏低等原因,使觀察值不是分散在真值的兩側(cè),而是有方向性、系統(tǒng)性或周期性地偏離真值。系統(tǒng)誤差可以通過實(shí)驗(yàn)設(shè)計(jì)和完善技術(shù)措施來消除或使之減少。8.隨機(jī)變量:隨機(jī)變量(random variable)是指取指不能事先確定的觀察結(jié)果。隨機(jī)量的具體內(nèi)容雖然是各式各樣的,但共同的特點(diǎn)是不能用一個(gè)常數(shù)來表示,而且,理論上講,每個(gè)變量的取值服從特定的概率分布9.參數(shù):參數(shù)(paramater)是指總體的統(tǒng)計(jì)指標(biāo),如總體均數(shù)、總體率等。總體參數(shù)是固定的常數(shù)。多數(shù)情況下,總體參數(shù)是不易知道的,但可通過隨機(jī)抽樣抽取有代表性的樣本,用算得的樣本統(tǒng)計(jì)量估計(jì)未知的總體參數(shù)10.統(tǒng)計(jì)量:統(tǒng)計(jì)量(statistic)是指樣本的統(tǒng)計(jì)指標(biāo),如樣本均數(shù)、樣本率等。樣本統(tǒng)計(jì)量可用來估計(jì)總體參數(shù)。總體參數(shù)是固定的常數(shù),統(tǒng)計(jì)量是在總體參數(shù)附近波動(dòng)的隨機(jī)變量。11.頻數(shù)表(frequency table)用來表示一批數(shù)據(jù)各觀察值或在不同取值區(qū)間的出現(xiàn)的頻繁程度(頻數(shù))。對于離散數(shù)據(jù),每一個(gè)觀察值即對應(yīng)一個(gè)頻數(shù),如某醫(yī)院某一日內(nèi)死亡0,1,2?個(gè)病人的天數(shù)。對于散布區(qū)間很大的離散數(shù)據(jù)和連續(xù)型數(shù)據(jù),數(shù)據(jù)散布區(qū)間由若干組段組成,每個(gè)組段對應(yīng)一個(gè)頻數(shù)。12.算術(shù)均數(shù)(arithmetic mean)描述一組數(shù)據(jù)在數(shù)量上的平均水平。總體均數(shù)用μ表示,樣本均數(shù)用X 表示。13.幾何均數(shù)(geometric mean)用以描述對數(shù)正態(tài)分布或數(shù)據(jù)呈倍數(shù)變化資料的水平。記為G。14.中位數(shù)(median)Md將一組觀察值由小到大排列,n 為奇數(shù)時(shí)取位次居中的變量值;為偶數(shù)時(shí),取位次居中的兩個(gè)變量的平均值。反映一批觀察值在位次上的平均水平。15.極差(range)亦稱全距,即最大值與最小值之差,用于資料的粗略分析,其計(jì)算簡便但穩(wěn)定性較差。16.百分位數(shù)(percentile)是將n 個(gè)觀察值從小到大依次排列,再把它們的位次依次轉(zhuǎn)化為百分位。百分位數(shù)的另一個(gè)重要用途是確定醫(yī)學(xué)參考值范圍。17.四分位數(shù)間距(inter-quartile range)是由第3 四分位數(shù)和第1 四分位數(shù)相減計(jì)算而得,常與中位數(shù)一起使用,描述偏態(tài)分布資料的分布特征,較極差穩(wěn)定。18.方差(variance):方差表示一組數(shù)據(jù)的平均離散情況,由離均差的平方和除以樣本個(gè)數(shù)得到。19.標(biāo)準(zhǔn)差(standard deviation)是方差的正平方根,使用的量綱與原量綱相同,適用于近似正態(tài)分布的資料,大樣本、小樣本均可,最為常用。20.變異系數(shù)(coefficient of variation)用于觀察指標(biāo)單位不同或均數(shù)相差較大時(shí)兩組資料變異程度的比較。用CV 表示。計(jì)算:標(biāo)準(zhǔn)差/均數(shù)*100% 21.統(tǒng)計(jì)推斷:通過樣本指標(biāo)來說明總體特征,這種從樣本獲取有關(guān)總體信息的過程稱為統(tǒng)計(jì)推斷(statistical inference)。22.抽樣誤差:由個(gè)體變異產(chǎn)生的,抽樣造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差異,稱為抽樣誤差(sampling error)。23.標(biāo)準(zhǔn)誤及X s :通常將樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。許多樣本均數(shù)的標(biāo)準(zhǔn)差X s稱為均數(shù)的標(biāo)準(zhǔn)誤(standard error of mean,SEM),它反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均數(shù)的差異,說明均數(shù)抽樣誤差的大小。24.可信區(qū)間:按預(yù)先給定的概率確定的包含未知總體參數(shù)的可能范圍。該范圍稱為總體參數(shù)的可信區(qū)間(confidence interval,CI)。它的確切含義是:可信區(qū)間包含總體參數(shù)的可能性是1-α,而不是總體參數(shù)落在該范圍的可能性為1-α。25.參數(shù)估計(jì):指用樣本指標(biāo)值(統(tǒng)計(jì)量)估計(jì)總體指標(biāo)值(參數(shù))。參數(shù)估計(jì)有兩種方法:點(diǎn)估計(jì)和區(qū)間估計(jì)。26.假設(shè)檢驗(yàn)中P 的含義:指從H0 規(guī)定的總體隨機(jī)抽得等于及大于(或等于及小于)現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計(jì)量值的概率。27.I 型和II 型錯(cuò)誤:I 型錯(cuò)誤(type I error),指拒絕了實(shí)際上成立的H0,這類“棄真”的錯(cuò)誤稱為I 型錯(cuò)誤,其概率大小用α表示;II 型錯(cuò)誤(type II error),指接受了實(shí)際上不成立的H0,這類“存?zhèn)巍钡恼`稱為II 型錯(cuò)誤,其概率大小用β表示。28.檢驗(yàn)效能:1-β稱為檢驗(yàn)效能(power of test),它是指當(dāng)兩總體確有差別,按規(guī)定的檢驗(yàn)水準(zhǔn)a 所能發(fā)現(xiàn)該差異的能力。29.檢驗(yàn)水準(zhǔn):是預(yù)先規(guī)定的,當(dāng)假設(shè)檢驗(yàn)結(jié)果拒絕H0,接受H1,下“有差別”的結(jié)論時(shí)犯錯(cuò)誤的概率稱為檢驗(yàn)水準(zhǔn)(level of a test),記為α。30..率(rate)又稱頻率指標(biāo),說明一定時(shí)期內(nèi)某現(xiàn)象發(fā)生的頻率或強(qiáng)度。計(jì)算公式為:發(fā)生某現(xiàn)象的觀察單位數(shù)/可能發(fā)生某現(xiàn)象的觀察單位總數(shù)*100%,表示方式有:百分率(%)、千分率(?)等。31.構(gòu)成比(proportion)又稱構(gòu)成指標(biāo),說明某一事物內(nèi)部各組成部分所占的比重或分布。計(jì)算公式為:某一組 1
成部分的觀察單位數(shù)/同一事物各組成部分的觀察單位總數(shù)*100%,表示方式有:百分?jǐn)?shù)等。32.比(ratio)又稱相對比,是A、B 兩個(gè)有關(guān)指標(biāo)之比,說明A 是B 的若干倍或百分之幾。計(jì)算公式為:A/B,表示方式有:倍數(shù)或分?jǐn)?shù)等。
33.非參數(shù)統(tǒng)計(jì):針對某些資料的總體分布難以用某種函數(shù)式來表達(dá),或者資料的總體分布的函數(shù)式是未知的,只知道總體分布是連續(xù)型的或離散型的,用于解決這類問題的一種不依賴總體分布的具體形式的統(tǒng)計(jì)分析方法。由于這類方法不受總體參數(shù)的限制,故稱非參數(shù)統(tǒng)計(jì)法(non-parametric statistics),或稱為不拘分布(distribution-free statistics)的統(tǒng)計(jì)分析方法,又稱為無分布型式假定(assumption free statistics)的統(tǒng)計(jì)分析方法。34.參數(shù)統(tǒng)計(jì):通常要求樣本來自總體分布型是已知的(如正態(tài)分布),在這種假設(shè)的基礎(chǔ)上,對總體參數(shù)(如總體均數(shù))進(jìn)行估計(jì)和檢驗(yàn),稱為參數(shù)統(tǒng)計(jì)(parametric statistics)35.秩次:變量值按照從小到大順序所編的秩序號(hào)稱為秩次(rank)。
36.秩和:各組秩次的合計(jì)稱為秩和(rank sum),是非參數(shù)檢驗(yàn)的基本統(tǒng)計(jì)量。37.直線回歸(linear regression)建立一個(gè)描述應(yīng)變量依自變量變化而變化的直線方程,并要求各點(diǎn)與該直線縱向距離的平方和為最小。直線回歸是回歸分析中最基本、最簡單的一種,故又稱簡單回歸(simple regression)。38.回歸系數(shù)(regression coefficient)即直線的斜率(slope),在直線回歸方程中用b 表示,b 的統(tǒng)計(jì)意義為X每增(減)一個(gè)單位時(shí),Y平均改變b 個(gè)單位。
39.相關(guān)系數(shù)r:用以描述兩個(gè)隨機(jī)變量之間線性相關(guān)關(guān)系的密切程度與相關(guān)方向的統(tǒng)計(jì)指標(biāo)。
簡答題
1.醫(yī)學(xué)統(tǒng)計(jì)工作的內(nèi)容:1)實(shí)驗(yàn)設(shè)計(jì)2)收集資料3)整理資料4)分析資料2.資料的類型:1)計(jì)量資料2)計(jì)數(shù)資料3)等級(jí)分組資料。3.抽樣包括四種特征:1)代表性2)隨機(jī)性3)可靠性4)可比性。4.頻數(shù)表的編制方法和應(yīng)注意的問題:1)確定組數(shù)2)確定組距3)確定組限4)用手工編制劃計(jì)表.5.正態(tài)分布的幾個(gè)主要特征:1)正態(tài)分布以均值u為中心,左右對稱。2)正態(tài)分布中曲線下面積集中以均值u為中心的中心部分,越遠(yuǎn)離中心曲線越接近X軸曲線下面積越小,超過一定范圍以外的面積可以忽略。3)正態(tài)分布曲線下的面積分布有一定的規(guī)律。4)正態(tài)分布完全由參數(shù)u和6決定,當(dāng)6一定后u增大,曲線沿橫軸向右移動(dòng),反之u減小曲線沿橫軸向左移動(dòng)。6.總體均數(shù)的估計(jì)方法有兩種:
1)點(diǎn)估計(jì)2)區(qū)間估計(jì)7.T分布的特點(diǎn):分布曲線的形態(tài)變化與自由度V(V=N—1)有關(guān),當(dāng)自由度V逼近OO時(shí),T分布趨向于標(biāo)準(zhǔn)正態(tài)分布。8.配對設(shè)計(jì)主要有三種情況:1)兩種同質(zhì)受試對象分別接受兩種處理,如:把同窩同性別和體重相近的動(dòng)物配成一對,或把同性別和年齡相近的相同病人配成一對。2)同一受試對象或同一樣本的兩個(gè)部分,分別接受兩種不同處理。3)自身對比,即將同一受試對象處理前后的結(jié)果進(jìn)行比較。9.總體方差具有齊性時(shí)的兩獨(dú)立樣本T檢驗(yàn):兩獨(dú)立樣本T檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量在H0:即=0的條件下為:。10.假設(shè)檢驗(yàn)中的兩類錯(cuò)誤:1)型錯(cuò)誤:指拒絕了實(shí)際上成立的H0即”棄真”的錯(cuò)誤,其概率用 表示。2)型錯(cuò)誤:指接受了實(shí)際上不成立的H0即“存?zhèn)巍钡腻e(cuò)誤,其概率用 表示。11.相對數(shù)常用的種類有:率構(gòu)成比 相對比12.相對數(shù)使用應(yīng)注意的問題:1)不要把構(gòu)成比與率相混淆。2)使用相對數(shù)時(shí),分母不宜過小。3)要注意資料的可比性。4)要注意使用率的標(biāo)準(zhǔn)化。5)要考慮存在抽樣誤差。13.T分布圖形特征:1)單峰分布:以0為中心,左右對稱,類似于標(biāo)準(zhǔn)正態(tài)分布的單峰分布。2)T分布圖形不是一條曲線,而是一族曲線其形態(tài)變化與自由度大小有關(guān),自由度越小,則SX越大。T值越分散,曲線的峰部越矮尾部越粗,則T分布曲線越低。3)自由度V越大,T分布越接近于正態(tài)分布。14.方差分析的三種變異:1)總變異
2)組間變異3)組內(nèi)變異自由度V=N-1(例數(shù))V=K-1(組數(shù))V=N-K(例數(shù)-組數(shù))15.標(biāo)準(zhǔn)化的意義:是為了在比較兩個(gè)不同人群的患病率發(fā)病率死亡率等資料時(shí),消除其內(nèi)部構(gòu)成(如:年齡性別工齡病情長短等)的影響。16.常用疾病統(tǒng)計(jì)的指標(biāo):1)發(fā)病率:表示某一時(shí)期內(nèi)某人群中患某病新病例的頻率。2)患病率:表示某一時(shí)點(diǎn)某人群中患某病的頻率。3)病死率:表示某期間內(nèi)某病患者中因某病死亡的頻率。4)治愈率:表示接受治療的病人中治愈的頻率。17.X的適用條件:1)當(dāng)N 40有理論頻數(shù)1 T 5時(shí),須對X值進(jìn)行連續(xù)性校正。2)若遇到總倒數(shù)N 40或有理論頻數(shù)T 1,即使采用校正公式計(jì)算的X值也會(huì)有偏差。因此,直接計(jì)算有利于拒絕H0的概率,以作出檢驗(yàn)判斷的方法。18.非參數(shù)檢驗(yàn)方法適用于:1)總體分布為偏態(tài)或分布形態(tài)未知的計(jì)量資料2)等級(jí)資料3)個(gè)別數(shù)據(jù)偏大或數(shù)據(jù)的某一端無確定數(shù)值4)各組離散程度相差懸殊,即各總體方差不齊。如:有一題需列出:不滿意 滿意 很滿意 非常滿意等,則選用非參數(shù)檢驗(yàn)方法。19.非參數(shù)檢驗(yàn)的優(yōu)點(diǎn)為:適應(yīng)性強(qiáng)缺點(diǎn)為:非參數(shù)檢驗(yàn)方法犯第二類錯(cuò)誤的可能性大于參數(shù)檢驗(yàn)法,對于適合參數(shù)檢驗(yàn)的資料最好還是用參數(shù)檢驗(yàn)20.統(tǒng)計(jì)圖通常由五部分組成:1)標(biāo)題2)圖域3)標(biāo)目4)圖例5)刻度21.統(tǒng)計(jì)圖和統(tǒng)計(jì)表的作用:代替文字,以表或圖的形式進(jìn)行了闡述。22.怎樣確定P值:
(1)當(dāng)N 25時(shí),可查T界值表,T越小P越小。當(dāng)N 25時(shí),無法查T界值表,可按近似正態(tài)分布用u檢驗(yàn)(2)如果T值在查表界值內(nèi) 0.05;如果T值在查表界值外 0.05.23.常用的統(tǒng)計(jì)圖有:直系圖 百分系圖 圓圖 直方圖 構(gòu)成圖。
24.樣本均數(shù)的抽樣分布具有以下特點(diǎn):1)各樣本均數(shù)未必等于總體均數(shù)2)樣本之間存在差異3)樣本均數(shù)的分布很有規(guī)律,圍繞著總體均數(shù)中間多兩邊少左右基本對稱,也服從對稱分布4)樣本均數(shù)變異較原變量的差異大大縮小。25.直方圖與直條圖區(qū)別:1)直方圖:適用于表示連續(xù)變量頻數(shù)分布情況。2)直條圖:適用于無連續(xù)關(guān)系,各自獨(dú)立的統(tǒng)計(jì)指標(biāo)。26.圓圖與百分條圖:1)圓圖:是一種構(gòu)成圖,適用于構(gòu)成比資料,在圓圖中圓的總面積表示事物的全部,而圓內(nèi)的各扇形面積用來表示全體中各部分所占的比。2)百分條圖:也是一種構(gòu)成圖,用矩形條子的面積表示事物全部,而用其中各段表示各構(gòu)成部分。27.方差分析的應(yīng)用條件:各樣本相互獨(dú)立且均來自總體方差具有齊性的正態(tài)分布。問答題
1、標(biāo)準(zhǔn)正態(tài)分布(u分布)與t分布有何異同?
相同點(diǎn):集中位置都為0,都是單峰分布,是對稱分布,標(biāo)準(zhǔn)正態(tài)分布是t分布的特例(自由度是無限大時(shí))
不同點(diǎn):t分布是一簇分布曲線,t 分布的曲線的形狀是隨自由度的變化而變化,標(biāo)準(zhǔn)正態(tài)分布的曲線的形狀不變,是固定不變的,因?yàn)樗男螤顓?shù)為1。
3、簡述直線回歸與直線相關(guān)的區(qū)別。
1資料要求上不同:直線回歸分析適用于應(yīng)變量是服從正態(tài)分布的隨機(jī)變量,自變量是選定變量;直線相關(guān)分析適用于服從雙變量正態(tài)分布的資料。兩種系數(shù)的意義不同:回歸系數(shù)是表明兩個(gè)變量之間數(shù)量上的依存關(guān)系,回歸系數(shù)越大回歸直線越陡峭,表示應(yīng)變
量隨自變量變化越快;相關(guān)系數(shù)是表明兩個(gè)變量之間相關(guān)的方向和緊密程度的,相關(guān)系數(shù)越大,兩個(gè)變量的關(guān)聯(lián)程度越大。
4、抽樣中要求每一個(gè)樣本應(yīng)該具有哪三性?
從總體中抽取樣本,其樣本應(yīng)具有“代表性”、“隨機(jī)性”和“可靠性”。
(1)代表性: 就是要求樣本中的每一個(gè)個(gè)體必須符合總體的規(guī)定。
(2)隨機(jī)性: 就是要保證總體中的每個(gè)個(gè)體均有相同的幾率被抽作樣本。
(3)可靠性: 即實(shí)驗(yàn)的結(jié)果要具有可重復(fù)性,即由科研課題的樣本得出的結(jié)果所推測總體的結(jié)論有較大的可信度。由于個(gè)體之間存在差異, 只有觀察一定數(shù)量的個(gè)體方能體現(xiàn)出其客觀規(guī)律性。每個(gè)樣本的含量越多,可靠性會(huì)越大,但是例數(shù)增加,人力、物力都會(huì)發(fā)生困難,所以應(yīng)以“足夠”為準(zhǔn)。需要作“樣本例數(shù)估計(jì)”。
5、什么是兩個(gè)樣本之間的可比性?
可比性是指處理組(臨床設(shè)計(jì)中稱為治療組)與對照組之間,除處理因素不同外,其他可能影響實(shí)驗(yàn)結(jié)果的因素要求基本齊同,也稱為齊同對比原則。
6、什么叫醫(yī)學(xué)統(tǒng)計(jì)學(xué)?醫(yī)學(xué)統(tǒng)計(jì)學(xué)與統(tǒng)計(jì)學(xué)、衛(wèi)生統(tǒng)計(jì)學(xué)、生物統(tǒng)計(jì)學(xué)有何聯(lián)系與區(qū)別? 醫(yī)學(xué)統(tǒng)計(jì)學(xué):是運(yùn)用統(tǒng)計(jì)學(xué)原理和方法研究生物醫(yī)學(xué)資料的搜索、整理、分析和推斷的一門學(xué)科 統(tǒng)計(jì)學(xué):是研究數(shù)據(jù)的收集、整理、分析與推斷的科學(xué)。衛(wèi)生統(tǒng)計(jì)學(xué):是把統(tǒng)計(jì)理論、方法應(yīng)用于居民健康狀況研究、醫(yī)療衛(wèi)生實(shí)踐、衛(wèi)生事業(yè)管理和醫(yī)學(xué)科研的一門應(yīng)用學(xué)科。生物統(tǒng)計(jì)學(xué):是一門探討如何從不完整的信息中獲取科學(xué)可靠的結(jié)論從而進(jìn)一步進(jìn)行生物學(xué)實(shí)驗(yàn)研究的設(shè)計(jì),取樣,分析,資料整理與推論的科學(xué)。
7、醫(yī)學(xué)統(tǒng)計(jì)的資料主要來源于那些方面?有何要求?
醫(yī)學(xué)統(tǒng)計(jì)資料主要有實(shí)驗(yàn)數(shù)據(jù)和現(xiàn)場調(diào)查資料、醫(yī)療衛(wèi)生工作記錄、報(bào)表和報(bào)告卡等。實(shí)驗(yàn)數(shù)據(jù)是指在試驗(yàn)過程中活的的數(shù)據(jù);現(xiàn)場調(diào)查資料主要來源于大規(guī)模的流行病調(diào)查獲取的資料;醫(yī)療衛(wèi)生工作記錄有門診病歷卡、住院病歷卡、化驗(yàn)報(bào)告等;報(bào)表有衛(wèi)生工作基本情況年報(bào)表、傳染年(月、日)報(bào)表、疫情旬(年、月、日)報(bào)表等;報(bào)表卡有傳染病發(fā)病報(bào)告卡、出生報(bào)告卡、死亡報(bào)告卡等等。這些資料的手機(jī)過程中,必須進(jìn)行質(zhì)量抗旨,包括它的統(tǒng)一性、確切性、可重復(fù)性。這些原始數(shù)據(jù)的精讀和偏性應(yīng)有明確的范圍。
8、醫(yī)學(xué)統(tǒng)計(jì)學(xué)的資料類型有哪些?
(1)計(jì)量資料:對每個(gè)觀察單位用定量的方法測定某項(xiàng)指標(biāo)量的大小,所得的資料稱為計(jì)量資料(measurement data)。計(jì)量資料亦稱定量資料、測量資料。.其變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。如某一患者的身高(cm)、12體重(kg)、紅細(xì)胞計(jì)數(shù)(10/L)、脈搏(次/分)、血壓(KPa)等。
(2)計(jì)數(shù)資料:將觀察單位按某種屬性或類別分組,所得的觀察單位數(shù)稱為計(jì)數(shù)資料(count data)。計(jì)數(shù)資料亦稱定性資料或分類資料。其觀察值是定性的,表現(xiàn)為互不相容的類別或?qū)傩浴H缯{(diào)查某地某時(shí)的男、女性人口數(shù);治療一批患者,其治療效果為有效、無效的人數(shù);調(diào)查一批少數(shù)民族居民的A、B、AB、O 四種血型的人數(shù)等。(3)等級(jí)資料:將觀察單位按測量結(jié)果的某種屬性的不同程度分組,所得各組的觀察單位數(shù),稱為等級(jí)資料(ordinal data)。等級(jí)資料又稱有序變量。如患者的治療結(jié)果可分為治愈、好轉(zhuǎn)、有效、無效或死亡,各種結(jié)果既是分類結(jié)果,又有順序和等級(jí)差別,但這種差別卻不能準(zhǔn)確測量;一批腎病患者尿蛋白含量的測定結(jié)果分為+、++、+++等。等級(jí)資料與計(jì)數(shù)資料不同:屬性分組有程度差別,各組按大小順序排列。等級(jí)資料與計(jì)量資料不同:每個(gè)觀察單位未確切定量,故亦稱為半計(jì)量資料。
9、常見的三類誤差是什么?應(yīng)采取什么措施和方法加以控制?
常見的三類誤差是:(1)系統(tǒng)誤差:在收集資料過程中,由于儀器初始狀態(tài)未調(diào)整到零、標(biāo)準(zhǔn)試劑未經(jīng)校正、醫(yī)生掌握療效標(biāo)準(zhǔn)偏高或偏低等原因,可造成觀察結(jié)果傾向性的偏大或偏小,這叫系統(tǒng)誤差。要盡量查明其原因,必須克服。
(2)隨機(jī)測量誤差:在收集原始資料過程中,即使儀器初始狀態(tài)及標(biāo)準(zhǔn)試劑已經(jīng)校正,但是,由于各種偶然因素的影響也會(huì)造成同一對象多次測定的結(jié)果不完全一致。譬如,實(shí)驗(yàn)操作員操作技術(shù)不穩(wěn)定,不同實(shí)驗(yàn)操作員之間的操作差異,電壓不穩(wěn)及環(huán)境溫度差異等因素造成測量結(jié)果的誤差。對于這種誤差應(yīng)采取相應(yīng)的措施加以控制,至少應(yīng)控制在一定的允許范圍內(nèi)。一般可以用技術(shù)培訓(xùn)、指定固定實(shí)驗(yàn)操作員、加強(qiáng)責(zé)任感教育及購置一定精度的穩(wěn)壓器、恒溫裝置等措施,從而達(dá)到控制的目的。(3)抽樣誤差:即使在消除了系統(tǒng)誤差,并把隨機(jī)測量誤差控制在允許范圍內(nèi),樣本均數(shù)(或其它統(tǒng)計(jì)量)與總體均數(shù)(或其它參數(shù))之間仍可能有差異。這種差異是由抽樣引起的,故這種誤差叫做抽樣誤差,要用統(tǒng)計(jì)方法進(jìn)行正確分析。
10、試述頻數(shù)表的要素及用途。
要素:組段,頻距。用途:① 描述資料的分布特征和分布類型。頻數(shù)分布有兩個(gè)重要特征:集中趨勢和離散趨勢。大部分觀察值向某一數(shù)值集中的趨勢稱為集中趨勢,常用平均數(shù)指標(biāo)來表示,各觀察值之間大小參差不齊。頻數(shù)由中央位置向兩側(cè)逐漸減少,稱離散趨勢,是個(gè)體差異所致,可用一系列的變異指標(biāo)來反映。② 便于進(jìn)一步計(jì)算有關(guān)指標(biāo)或進(jìn)行統(tǒng)計(jì)分析。當(dāng)數(shù)據(jù)較多且需手工計(jì)算時(shí),常先編制頻數(shù)表,再進(jìn)行統(tǒng)計(jì)計(jì)算。③ 發(fā)現(xiàn)特大、特小的可疑值。如果頻數(shù)表的一端或兩端出現(xiàn)連續(xù)幾個(gè)組段的頻數(shù)為零后,又出現(xiàn)少數(shù)幾個(gè)特大值或特小值,使人懷疑其是否準(zhǔn)確,需進(jìn)一步檢查和核對并做相應(yīng)處理。④ 當(dāng)樣本含量比較大時(shí),可用各組段的平率作為概率的估計(jì)值。
11、描述單變量資料的統(tǒng)計(jì)指標(biāo)分哪兩大類,分別是什么指標(biāo)? 分類:①描述數(shù)據(jù)分布集中趨勢的指標(biāo):算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)。②描述數(shù)據(jù)分布離散程度的指標(biāo):極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)。
12、試述平均數(shù)、標(biāo)準(zhǔn)差、變異系數(shù)的含義及用途?
13、標(biāo)準(zhǔn)正態(tài)分布曲線下面積有何分布規(guī)律?
所有的正態(tài)分布曲線,在υ左右的相同倍數(shù)的標(biāo)準(zhǔn)差范圍內(nèi)的面積相同。并且,在υ±σ范圍內(nèi)的面積約為68.3%;在υ±1.96σ范圍內(nèi)的面積約為95%;在υ±2.58σ范圍內(nèi)面積約為99%。
14、同一資料的標(biāo)準(zhǔn)差是否一定小于均數(shù)?
均數(shù)和標(biāo)準(zhǔn)差是兩類不同性質(zhì)的統(tǒng)計(jì)指標(biāo).標(biāo)準(zhǔn)差用于描述數(shù)據(jù)的變異程度,變異程度大,則該值大,變異程度小,則該值小.標(biāo)準(zhǔn)差可大于均數(shù),也可小于均數(shù)。
15、標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤有何區(qū)別和聯(lián)系?
?區(qū)別:1.含義不同:⑴sx)之間的變異度大小,s越大,變量值(x)越分散;反之變量值越集中,均數(shù)的代表性越強(qiáng)。⑵標(biāo)準(zhǔn)誤是描述樣本均數(shù)之間的變異度大小,標(biāo)準(zhǔn)誤越大,樣本均數(shù)與總體均數(shù)間差異越大,抽樣誤差越大;反之,樣本均數(shù)越接近總體均數(shù),抽樣誤差越小。2.與n的關(guān)系不同: n增大時(shí),⑴sσ(恒定)。⑵標(biāo)準(zhǔn)誤減少并趨于0(不存在抽樣誤差)。3.用途不同: ⑴s:表示x的變異度大小,計(jì)算cv,估計(jì)正常值范圍,計(jì)算標(biāo)準(zhǔn)誤等 ⑵ :參數(shù)估計(jì)和假設(shè)檢驗(yàn)。?聯(lián)系: 二者均為變異度指標(biāo),樣本均數(shù)的標(biāo)準(zhǔn)差即為標(biāo)準(zhǔn)誤,標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤成正比。
16、簡述Ⅰ型錯(cuò)誤和Ⅱ型錯(cuò)誤的區(qū)別和聯(lián)系。
·區(qū)別:Ⅰ型錯(cuò)誤(棄真):拒絕實(shí)際成立的H0,型錯(cuò)誤的概率記為α。(1-a)即置信度:重復(fù)抽樣時(shí),樣本區(qū)間包含總體參數(shù)(μ)的百分?jǐn)?shù)。當(dāng)p≤α而拒絕H0時(shí),只能犯Ⅰ型錯(cuò)誤,不可能犯Ⅱ型錯(cuò)誤。
Ⅱ型錯(cuò)誤(存?zhèn)危翰痪芙^實(shí)際不成立的H0,Ⅱ型錯(cuò)誤的概率記為β。(1-β)即把握度(或檢驗(yàn)效能:兩總體確有差別,被檢出有差別的能力。當(dāng)p≥α而拒絕H0時(shí),只能犯Ⅱ型錯(cuò)誤,不可能犯Ⅰ型錯(cuò)誤。
·聯(lián)系:對同一資料,α與β反方向變化,若要同時(shí)減小α與β,唯一的辦法是增加樣本含量。
17、可信區(qū)間與參考值范圍的不同點(diǎn)。
應(yīng)注意:可信區(qū)間與參考值范圍的意義、計(jì)算公式和用途均不同。1.從意義和用途來看95%參考值范圍是指同質(zhì)總體內(nèi)包括95%個(gè)體值的估計(jì)范圍,而總體均數(shù)95%可信區(qū)間是指按95%可信度估計(jì)的總體均數(shù)的所在范圍。可信區(qū)間用于估計(jì)總體參數(shù),總體參數(shù)只有一個(gè)。參考值范圍用于估計(jì)變量值的分布范圍,變量值可能很多甚至無限。2.從計(jì)算公式看:若指標(biāo)服從正態(tài)分布,95%參考值范圍的公式是:±1.96s。總體均數(shù)95%可信區(qū)間的公式是:
。前者用標(biāo)準(zhǔn)差,后者用標(biāo)準(zhǔn)誤。前者用1.96,后者用α為0.05,自由度為v的t界值。
18、在統(tǒng)計(jì)推斷中,如何區(qū)別單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn)?
如果將拒絕性概率平分于理論抽樣分布的兩側(cè),稱為雙側(cè)檢驗(yàn)。例如選定顯著性水平α= 0.05,雙側(cè)檢驗(yàn)就是將α概率所規(guī)定的拒絕區(qū)域平分為兩部分而置于概率分布的兩邊,每邊占有 =0.025。雙側(cè)檢驗(yàn)只強(qiáng)調(diào)差異是否顯著而不強(qiáng)調(diào)方向性。如果將拒絕性概率置于理論抽樣分布的一側(cè)(左側(cè)或右側(cè)),稱為單側(cè)檢驗(yàn)(右側(cè)檢驗(yàn)或左側(cè)檢驗(yàn))。單側(cè)檢驗(yàn)強(qiáng)調(diào)差異的方向性。在具體的假設(shè)檢驗(yàn)中,選擇雙側(cè)檢驗(yàn)或單側(cè)檢驗(yàn)可分為以下三種情況: 第一種:H0:μ=μ0 :μ≠μ0雙側(cè) 第二種:H0:μ≥μ0 :μ<μ0單側(cè)(左側(cè))第三種:H0:μ≤μ0 :μ>μ0單側(cè)(右側(cè))
19、t檢驗(yàn)、z檢驗(yàn)的公式有那些類型,在應(yīng)用上有何異同?
t檢驗(yàn):當(dāng)樣本例數(shù)n較小時(shí),要求樣本取自正態(tài)總體。t檢驗(yàn)的類型:單樣本t檢驗(yàn),獨(dú)立t檢驗(yàn),配對t檢驗(yàn)z檢驗(yàn):樣本例數(shù)較大,或n雖小而總體標(biāo)準(zhǔn)差已知。
20、假設(shè)檢驗(yàn)和總體均數(shù)區(qū)間估計(jì)有何聯(lián)系?
假設(shè)檢驗(yàn):是對總體做出某種假定,然后根據(jù)樣本信息推斷總體是否成立的一類統(tǒng)計(jì)學(xué)方法總稱。假設(shè)檢驗(yàn)有三個(gè)基本步驟:①建立假設(shè)和確定檢驗(yàn)水準(zhǔn);②選擇檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量;③確定P值和做出統(tǒng)計(jì)推斷結(jié)論。總體均數(shù)的估計(jì):
1、點(diǎn)估計(jì):樣本統(tǒng)計(jì)量直接作為總體指標(biāo)的估計(jì)值。它未考慮抽樣誤差的大小。
2、區(qū)間估計(jì):按預(yù)先給定的概率(1-α)確定的包含未知總體參數(shù)的可能范圍。
21、方差分析的基本思想是什么?
方差分析(analysis of variance,ANOVA)的基本思想就是根據(jù)資料的設(shè)計(jì)類型,即變異的不同來源將全部觀察值總的離均差平方和(sum of squares of deviations from mean,SS)和自由度分解為兩個(gè)或多個(gè)部分,除隨機(jī)誤差外,其余每個(gè)部分的變異可由某個(gè)因素的作用(或某幾個(gè)因素的交互作用)加以解釋,如各組均數(shù)的變異SS 組間可由處理因素的作用加以解釋。通過各變異來源的均方與誤差均方比值的大小,借助F 分布作出統(tǒng)計(jì)推斷,判斷各因素對各組均數(shù)有無影響。
22、t檢驗(yàn)和F檢驗(yàn)的使用條件和應(yīng)用范圍有何異同?
t檢驗(yàn)適用于兩個(gè)樣本均數(shù)的比較,F(xiàn)檢驗(yàn)適用于多個(gè)樣本的比較。t檢驗(yàn)的應(yīng)用條件:要求各樣本來自相互獨(dú)立的正態(tài)總體且各總體方差齊。方差分析的應(yīng)用條件(1)各樣本是相互獨(dú)立的隨機(jī)樣本,且來自正態(tài)分布總體。(2)各樣本的總體方差相等,即方差齊性。
23率的標(biāo)準(zhǔn)化的意義及基本思想。
當(dāng)比較的兩組資料內(nèi)部各小組率明顯不同,且各小組觀測例數(shù)的構(gòu)成比也明顯不同時(shí),直接比較兩個(gè)合計(jì)率是不合理的。因?yàn)槠趦?nèi)部構(gòu)成比不同,往往影響合計(jì)率的大小,需要統(tǒng)一的內(nèi)部構(gòu)成進(jìn)行調(diào)整后計(jì)算標(biāo)準(zhǔn)化率,使其具有可比性,這種方法稱為率的標(biāo)準(zhǔn)化。率的標(biāo)準(zhǔn)化的基本思想:要比較兩個(gè)總率時(shí),發(fā)現(xiàn)兩組資料的內(nèi)部構(gòu)成(如年齡、性別構(gòu)成等)存在明顯不同,而且影響到了總率的結(jié)果,這時(shí)就不宜再直接比較總率,而應(yīng)考慮采用標(biāo)準(zhǔn)化法。標(biāo)準(zhǔn)化法的基本思想,就是采用統(tǒng)一的標(biāo)準(zhǔn)(統(tǒng)一的內(nèi)部構(gòu)成)計(jì)算出消除內(nèi)部構(gòu)成不同影響后的標(biāo)準(zhǔn)化率(調(diào)整率),然后再進(jìn)行比較。
24常用相對數(shù)指標(biāo)有哪些?它們在計(jì)算和意義上有何不同?
率(強(qiáng)度相對數(shù),頻率相對數(shù))、構(gòu)成比、相對比應(yīng)用相對數(shù)時(shí)應(yīng)注意的問題:⑴ 計(jì)算相對數(shù)的分母一般不宜過小。⑵ 分析時(shí)不能以構(gòu)成比代替率。⑶ 不能用構(gòu)成比的動(dòng)態(tài)分析代替率的動(dòng)態(tài)分析。⑷ 對觀察單位數(shù)不等的幾個(gè)率,不能直接相加求其總率。⑸ 在比較相對數(shù)時(shí)應(yīng)注意可比性。⑹ 對樣本率(或構(gòu)成比)的比較應(yīng)隨機(jī)抽樣,并做假設(shè)檢驗(yàn)。
25卡方檢驗(yàn)的使用范圍和各個(gè)公式的適用條件是什么?
卡方檢驗(yàn)用于:推斷兩個(gè)及兩個(gè)以上總體率或構(gòu)成比是否有差別,兩個(gè)分類變量間有無相關(guān)關(guān)系,多個(gè)率的趨勢檢驗(yàn),以及兩個(gè)率的等效檢驗(yàn)等。此外,也用于頻數(shù)分布的擬合優(yōu)度檢驗(yàn)。
對不同的設(shè)計(jì)類型的資料,檢驗(yàn)的應(yīng)用條件不同:(1)完全隨機(jī)設(shè)計(jì)兩樣本率的比較1)當(dāng)n>40,且T≥5時(shí),用非連續(xù)性校正值;若所得P≈α,則改用四格表的確切概率法。2)當(dāng)n≥40,且有1≤T<5時(shí),用連續(xù)性校正值。3)n<40,或有T<1時(shí),不能用檢驗(yàn),應(yīng)當(dāng)用四格表的確切概率法。(2)配對設(shè)計(jì)四格表1)當(dāng)b+c≥40,2)當(dāng)b+c<40,需作連續(xù)性校正,(3)行列表資料1)不宜有1/5以上格子的理論頻數(shù)小于5,或有1個(gè)格子的理論頻數(shù)小于1;2)單向有序行列表,在比較各處理組的效應(yīng)有無差別時(shí),應(yīng)該用秩和檢驗(yàn)或Ridit檢驗(yàn);3)多個(gè)樣本率(或構(gòu)成比)比較的檢驗(yàn)時(shí),結(jié)論為拒絕無效假設(shè)時(shí),只能認(rèn)為各總體率(或總體構(gòu)成比)之間總的說來有差別,但不能說明它們彼此之間都有差別,或某兩者間有差別。若想進(jìn)一步了解哪兩者的差別有統(tǒng)計(jì)學(xué)意義,可用分割法。26率的標(biāo)準(zhǔn)誤的意義和用途。
意義:由于抽樣的原因所造成的樣本率與總體率的不一致就是率的抽樣誤差。率的抽樣誤差的大小是用率的標(biāo)準(zhǔn)誤來表示。用途:①表示抽樣誤差的大小,說明樣本率的代表性、可靠性。②對總體率的可信區(qū)間進(jìn)行估計(jì)
27、非參數(shù)統(tǒng)計(jì)方法的概念及適用范圍。
概念:樣本所來自的總體分布難以用某種函數(shù)式來表達(dá),還有一些資料的總體分布的函數(shù)式是未知的,只知道總體分布是連續(xù)型的或離散型的,解決這類問題的一種不依賴總體分布的具體形式的統(tǒng)計(jì)方法。由于這類方法不受總體參數(shù)的限制,故稱非參數(shù)統(tǒng)計(jì)法,或稱為不拘分布的統(tǒng)計(jì)分析方法,又稱為無分布型式假定的統(tǒng)計(jì)分析方法。它檢驗(yàn)的是分布,而不是參數(shù)。非參數(shù)統(tǒng)計(jì)不需對總體分布(總體參數(shù))作出特殊假設(shè)。適用范圍:(1)等級(jí)資料。(2)偏態(tài)分布資料。當(dāng)觀察資料呈偏態(tài)或極度偏態(tài)分布而又未作變量變換,或雖經(jīng)變量變換仍未達(dá)到正態(tài)或近似正態(tài)分布時(shí),宜用非參數(shù)檢驗(yàn)。(3)各組離散程度相差懸殊,即方差明顯不齊,且不能變換達(dá)到齊性。(4)個(gè)別數(shù)據(jù)偏離過大,或資料為單側(cè)或雙側(cè)沒有上限或下限值。(5)分布類型不明。(6)初步分析。有些醫(yī)學(xué)資料由于統(tǒng)計(jì)工作量大,可采用非參數(shù)統(tǒng)計(jì)方法進(jìn)行初步分析,挑選其中有意義者再進(jìn)一步分析(包括參數(shù)統(tǒng)計(jì)內(nèi)容)。(7)對于一些特殊情況,如從幾個(gè)總體所獲得的數(shù)據(jù),往往難以對其原有總體分布作出估計(jì),在這種情況下可用非參數(shù)統(tǒng)計(jì)方法。
28、非參數(shù)檢驗(yàn)的優(yōu)缺點(diǎn)。優(yōu)點(diǎn):①非參數(shù)統(tǒng)計(jì)方法要求的假定條件比較少,因而它的適用范圍比較廣泛。②多數(shù)非參數(shù)統(tǒng)計(jì)方法要求的運(yùn)算比較簡單,可以迅速完成計(jì)算取得結(jié)果,因而比較節(jié)約時(shí)間。③大多數(shù)非參數(shù)統(tǒng)計(jì)方法在直觀上比較容易理解,不需要太多的數(shù)學(xué)基礎(chǔ)知識(shí)和統(tǒng)計(jì)學(xué)知識(shí)。④大多數(shù)非參數(shù)統(tǒng)計(jì)方法可用來分析如象由等級(jí)構(gòu)成的數(shù)據(jù)資料,而對計(jì)量水準(zhǔn)較低的數(shù)據(jù)資料,參數(shù)統(tǒng)計(jì)方法卻不適用。⑤當(dāng)推論多達(dá)3個(gè)以上時(shí),非參數(shù)統(tǒng)計(jì)方法尤具優(yōu)越性。缺點(diǎn):①由于方法簡單,用的計(jì)量水準(zhǔn)較低,因此,如果能與參數(shù)統(tǒng)計(jì)方法同時(shí)使用時(shí),就不如參數(shù)統(tǒng)計(jì)方法敏感。若為追求簡單而使用非參數(shù)統(tǒng)計(jì)方法,其檢驗(yàn)功效就要差些。這就是說,在給定的顯著性水平下進(jìn)行檢驗(yàn)時(shí),非參數(shù)統(tǒng)計(jì)方法與參數(shù)統(tǒng)計(jì)方法相比,第Ⅱ類錯(cuò)誤的概率β要大些。②對于大樣本,如不采用適當(dāng)?shù)慕疲?jì)算可能變得十分復(fù)雜。注意: 凡符合或經(jīng)過變換后符合參數(shù)檢驗(yàn)條件的資料,最好用參數(shù)檢驗(yàn)。當(dāng)資料不具備參數(shù)檢驗(yàn)的條件時(shí),非參數(shù)檢驗(yàn)是一種有效的分析方法。
29、相關(guān)與回歸的聯(lián)系和區(qū)別。區(qū)別:
意義 :相關(guān)反映兩變量的相互關(guān)系,即在兩個(gè)變量中,任何一個(gè)的變化都會(huì)引起另一個(gè)的變化,是一種雙向變化的關(guān)系。回歸是反映兩個(gè)變量的依存關(guān)系,一個(gè)變量的改變會(huì)引起另一個(gè)變量的變化,是一種單向的關(guān)系。應(yīng)用:研究兩個(gè)變量的相互關(guān)系用相關(guān)分析。研究兩個(gè)變量的依存關(guān)系用回歸分析。研究性質(zhì):相關(guān)是對兩個(gè)變量之間的關(guān)系進(jìn)行描述,看兩個(gè)變量是否有關(guān),關(guān)系是否密切,關(guān)系的性質(zhì)是什么,是正相關(guān)還是負(fù)相關(guān)。回歸是對兩個(gè)變量做定量描述,研究兩個(gè)變量的數(shù)量關(guān)系,已知一個(gè)變量值可以預(yù)測出另一個(gè)變量值,可以得到定量結(jié)果。相關(guān)系數(shù)r與回歸系數(shù)b :r與b的絕對值反映的意義不同。r的絕對值越大,散點(diǎn)圖中的點(diǎn)越趨向于一條直線,表明兩變量的關(guān)系越密切,相關(guān)程度越高。b的絕對值越大,回歸直線越陡,說明當(dāng)X變化一個(gè)單位時(shí),Y的平均變化就越大。反之也是一樣。聯(lián)系:
2r與b值可相互換算;r與b正負(fù)號(hào)一致;r與b的假設(shè)檢驗(yàn)等價(jià);回歸可解釋相關(guān)。相關(guān)系數(shù)的平方r(又稱決定系數(shù))是回
歸平方和與總的離均差平方和之比,故回歸平方和是引入相關(guān)變量后總平方和減少的部分。
30、直線相關(guān)、秩相關(guān)的區(qū)別與聯(lián)系。
區(qū)別:(1)資料要求不同:直線相關(guān)要求x、y是來自雙變量正態(tài)總體的隨機(jī)變量;秩相關(guān)適用于不服從雙變量正態(tài)分布或總體分布類型未知以及用等級(jí)表示的原始數(shù)據(jù)。(2)相關(guān)意義不同:直線相關(guān)表示兩變量的直線相關(guān)關(guān)系存在,秩相關(guān)表示兩變量的相關(guān)關(guān)系。聯(lián)系:相關(guān)系數(shù)的取值范圍相同;秩相關(guān)將原始數(shù)據(jù)進(jìn)行秩變換,以秩次計(jì)算直線相關(guān)系數(shù)。
31、統(tǒng)計(jì)表及統(tǒng)計(jì)圖的制表原則和要求。
統(tǒng)計(jì)表:(1)統(tǒng)計(jì)表的制表原則1)應(yīng)重點(diǎn)突出,即一張表一般只包括一個(gè)中心內(nèi)容,內(nèi)容較多時(shí)可以用多個(gè)表格表達(dá)不同指標(biāo)和內(nèi)容。2)統(tǒng)計(jì)表要層次清楚,即標(biāo)目的安排及分組符合邏輯,便于分析比較。主謂分明,通常主語放在表的左邊,作為橫標(biāo)目;謂語放在右邊,作為縱標(biāo)目。由左向右讀,構(gòu)成完整的一句話。但若統(tǒng)計(jì)表的主語項(xiàng)目少而謂語項(xiàng)目多或主語項(xiàng)目多而謂語只有一項(xiàng),亦可將縱標(biāo)目作主語、橫標(biāo)目作謂語,閱讀時(shí)從上至下。3)統(tǒng)計(jì)表應(yīng)簡單明了,一切文字、數(shù)字和線條都應(yīng)盡量從簡。
(2)制表要求:統(tǒng)計(jì)表通常由標(biāo)題、標(biāo)目、線條、數(shù)字4部分組成。表中數(shù)字區(qū)不插入文字,也不列備注項(xiàng)。必須說明者標(biāo)“*”號(hào)等,在表下方說明。1)標(biāo)題:應(yīng)高度概括表的主要內(nèi)容,一般包括研究的時(shí)間、地點(diǎn)和研究內(nèi)容,左側(cè)加表號(hào),置于表的上方。2)標(biāo)目:有橫標(biāo)目和縱標(biāo)目,分別說明表格每行和每列數(shù)字的意義。橫標(biāo)目位于表頭的左側(cè),代表研究的對象;縱標(biāo)目位于表頭右側(cè),表達(dá)研究對象的指標(biāo)。注意標(biāo)明指標(biāo)的單位。3)線條:力求簡潔,多采用三條線,即頂線、底線、縱標(biāo)目下橫線。部分表格可再用短橫線將“合計(jì)”分隔開,或用短橫線將兩重縱標(biāo)目分割開。其它豎線和斜線一概省去。4)數(shù)字:用阿拉伯?dāng)?shù)字表示。同一指標(biāo)小數(shù)點(diǎn)位數(shù)一致,位次對齊。表內(nèi)不留空項(xiàng),無數(shù)字用“—”表示,缺失數(shù)字用“”表示,數(shù)值為0者記為“0”。統(tǒng)計(jì)圖:①根據(jù)資料性質(zhì)和分析目的正確選用適當(dāng)?shù)慕y(tǒng)計(jì)圖。②除圓圖外,一般用直角坐標(biāo)系的第一象限的位置表示圖域(制圖空間),或者用長方形的框架表示。③
繪制圖形應(yīng)注意準(zhǔn)確、美觀,給人以清晰的印象。
32、常見的統(tǒng)計(jì)圖有哪幾種?它們的使用條件各是什么?
常用的統(tǒng)計(jì)圖有直條圖、直方圖、百分比條圖和圓圖、線圖、散點(diǎn)圖、統(tǒng)計(jì)地圖、箱式圖等。·直條圖:適用于比較、分析獨(dú)立的或離散變量的多個(gè)組或多個(gè)類別的統(tǒng)計(jì)指標(biāo)。指標(biāo)既可以是絕對數(shù),也可以是相對數(shù)。·直方圖:主要應(yīng)用于頻數(shù)分布資料,描述連續(xù)變量的頻數(shù)分布。百分比條圖和圓圖:表示事物內(nèi)部各構(gòu)成部分所占的比重,適合描述分類變量的各類別所占的構(gòu)成比。其中,百分比條圖特別適合作多個(gè)構(gòu)成比的比較。·線圖:適合于描述某統(tǒng)計(jì)量隨另一連續(xù)性數(shù)值變量的變化而變化的趨勢,常用于描述統(tǒng)計(jì)量隨時(shí)間變化而變化的趨勢。普通線圖描述的是絕對變化趨勢,半對數(shù)線圖描述的是相對變化趨勢,特別適宜作不同指標(biāo)或相同指標(biāo)不同組別的變化速度的比較。·散點(diǎn)圖:以直角坐標(biāo)上點(diǎn)的密集程度和趨勢來表示兩個(gè)變量間的相關(guān)關(guān)系。·統(tǒng)計(jì)地圖:以不同的顏色和花紋表示統(tǒng)計(jì)量的值在地理分布上的變化,適宜描述研究指標(biāo)的地理分布。·箱式圖:通過使用5個(gè)統(tǒng)計(jì)量(數(shù)據(jù)分布的中心位置、分布、偏度、變異范圍和異常值)來反映原始數(shù)據(jù)的分布特征。特別適合多組數(shù)據(jù)分布的比較。
33普通線圖和半對數(shù)線圖的主要區(qū)別是什么?
從形式上看,二者的不同點(diǎn)在于縱坐標(biāo)的尺度不同,普通線圖的縱坐標(biāo)為算術(shù)尺度,而半對數(shù)線圖的縱坐標(biāo)為對數(shù)尺度。從用途上看,普通線圖描述的是統(tǒng)計(jì)量的絕對變化趨勢,半對數(shù)線圖描述的是相對變化趨勢,特別適宜作不同指標(biāo)或相同指標(biāo)不同組別的變化速度的比較。
34四種基本抽樣方法的概念、優(yōu)缺點(diǎn)和應(yīng)用條件是什么?
(1)單純隨機(jī)抽樣:是在總體中以完全隨機(jī)的方法抽取一部分觀察單位組成樣本,其整個(gè)抽樣過程,都體現(xiàn)了隨機(jī)化的原則。單純隨機(jī)抽樣的優(yōu)點(diǎn):簡單直觀,是最基本的概率抽樣方法,也是其他概率抽樣方法的基礎(chǔ)。單純隨機(jī)抽樣的缺點(diǎn):當(dāng)總體例數(shù)較多時(shí),編號(hào)麻煩,實(shí)際工作中難以實(shí)施;樣本分散,組織困難。單純隨機(jī)抽樣方法多用于總體例數(shù)較少的情況。(2)系統(tǒng)抽樣:是將總體的觀察單位,按一定順序號(hào)平均分成n個(gè)部分,每一部分抽取第k號(hào)觀察單位組成樣本,這里的k是隨機(jī)確定的,其體現(xiàn)了系統(tǒng)抽樣中的隨機(jī)性。系統(tǒng)抽樣的優(yōu)點(diǎn)是:1)易于理解,簡便易行;
2)容易得到一個(gè)按比例分配的樣本;3)一般情況下樣本的觀察單位在總體中分布均勻,其抽樣誤差小于單純隨機(jī)抽樣。系統(tǒng)抽樣的缺點(diǎn)是如果總體中觀察單位按順序有周期趨勢或單調(diào)遞增(減)趨勢時(shí),采用系統(tǒng)抽樣可能產(chǎn)生明顯的系統(tǒng)誤差。系統(tǒng)抽樣方法多用于觀察單位具有現(xiàn)成且與試驗(yàn)無關(guān)的自然編號(hào),同時(shí)觀察單位在總體中分布均勻。(3)整群抽樣:是先將總體按照某種與主要研究指標(biāo)無關(guān)的特征劃分為K個(gè)“群”,每個(gè)群包含若干觀察單位,然后再隨機(jī)抽取k個(gè)“群”,由抽取的各個(gè)群的全部觀察單位組成樣本。其隨機(jī)性主要體現(xiàn)在“群”的抽取過程。整群抽樣的優(yōu)點(diǎn)是便于組織調(diào)查、易于質(zhì)量控制和節(jié)省調(diào)查成本。整群抽樣的缺點(diǎn)是當(dāng)樣本含量一定時(shí),因?yàn)闃颖居^察單位并非廣泛散布于總體中,整群抽樣的抽樣誤差一般大于單純隨機(jī)抽樣。整群抽樣較為常用,尤其當(dāng)“群”間的個(gè)體變異較小時(shí)。
(4)分層抽樣:是先按對主要研究指標(biāo)影響較大的某種特征,將總體分為若干類別(統(tǒng)計(jì)上稱之為“層”),再從每一層內(nèi)隨機(jī)抽取一定數(shù)量的觀察單位,合起來組成樣本。其隨機(jī)性體現(xiàn)在層內(nèi)的抽樣過程。分層抽樣的優(yōu)點(diǎn)是:1)由于分層后增加了層內(nèi)的同質(zhì)性,觀察指標(biāo)變異減小,各層的抽樣誤差減小。2)分層抽樣便于對不同層采用不同的抽樣方法。3)分層抽樣便于對各層獨(dú)立進(jìn)行分析。分層抽樣的缺點(diǎn)是:層間變異較大,抽樣誤差較小;如果分層特征選擇不當(dāng),層內(nèi)變異較大,層間變異較小,抽樣誤差仍然較大,分層抽樣就失去了意義。一般情況下,當(dāng)樣本含量一定,幾種方法抽樣誤差大小的排序?yàn)椋悍謱映闃印芟到y(tǒng)抽樣≤單純隨機(jī)抽樣≤整群抽樣。
35何謂調(diào)查研究和實(shí)驗(yàn)研究?各自的特點(diǎn)是什么?
調(diào)查研究:是指研究者通過客觀地觀察、描述調(diào)查對象來搜集資料,未加任何的干預(yù)措施。實(shí)驗(yàn)研究:是指研究者根據(jù)研究假設(shè)主動(dòng)地對研究對象加以干預(yù)措施,并觀察總結(jié)其結(jié)果,回答研究假設(shè)所提出的問題。
36何謂實(shí)驗(yàn)效應(yīng),對實(shí)驗(yàn)效應(yīng)指標(biāo)的要求是什么?
實(shí)驗(yàn)效應(yīng):指處理作用于實(shí)驗(yàn)對象的反應(yīng),一般是通過某些觀察指標(biāo),定量或定性地反映實(shí)驗(yàn)效應(yīng)。選擇觀察指標(biāo)的基本原則: 指標(biāo)的選擇必須與研究目的密切關(guān)聯(lián)客觀性盡可能選擇客觀指標(biāo),避免一些籠統(tǒng)的、不確切的指標(biāo)。準(zhǔn)確性選用的指標(biāo)應(yīng)盡量精確。靈敏性和特異性 實(shí)驗(yàn)效應(yīng)指標(biāo)應(yīng)當(dāng)同時(shí)兼顧其靈敏性和特異性,盡量使靈敏性和特異性都高。
37實(shí)驗(yàn)研究中為什么要設(shè)立對照,常見的對照有幾種,各自有何特點(diǎn)?
設(shè)立對照組的目的是襯托處理因素的效應(yīng)。對照原則:所設(shè)立的對照組必須與實(shí)驗(yàn)組達(dá)到均衡可比。除干預(yù)措施外,組間其他影響結(jié)果的非處理因素等盡可能相同。對所研究疾病的易感度及發(fā)病機(jī)會(huì)相等。檢測和觀察方法及診斷標(biāo)準(zhǔn)必須一致。自身對照對照與實(shí)驗(yàn)在同一受試者身上進(jìn)行,如用藥前后作為對比。
空白對照對照組不施加任何處理因素。安慰劑對照主要目的是為了平衡對照組病人心理因素的影響。實(shí)驗(yàn)對照(陽性對照)對照組不施加處理因素,但施加某種實(shí)驗(yàn)因素。標(biāo)準(zhǔn)對照不設(shè)立專門的對照組,而是用現(xiàn)有標(biāo)準(zhǔn)值或正常值做對照。歷史對照
38實(shí)驗(yàn)設(shè)計(jì)為什么要遵循重復(fù)原則,影響重復(fù)性的因素有哪些?
重復(fù)原則包含重現(xiàn)性和觀察單位數(shù)量兩方面的含義。可靠的實(shí)驗(yàn)結(jié)果應(yīng)能在相同的條件下重現(xiàn);可靠的實(shí)驗(yàn)結(jié)論也不能憑一次實(shí)驗(yàn)或3~5例結(jié)果獲得,一定要有足夠量的觀察單位數(shù)。
第四篇:【臨床】醫(yī)學(xué)統(tǒng)計(jì)學(xué)名詞解釋+問答題
醫(yī)學(xué)統(tǒng)計(jì)學(xué)
1、應(yīng)用相對數(shù)時(shí)應(yīng)注意的事項(xiàng)
①計(jì)算相對數(shù)時(shí)分母不能太小;
②分析時(shí)不能以構(gòu)成比代替率;
③當(dāng)各分組的觀察單位數(shù)不等時(shí),總率(平均率)的計(jì)算不能直接將各分組的率相加求其平均;④對比時(shí)應(yīng)注意資料的可比性:兩個(gè)率要在相同的條件下進(jìn)行,即要求研究方法相同、研究對象同質(zhì)、觀察時(shí)間相等以及地區(qū)、民族、年齡、性別等客觀條件一致,其他影響因素在各組的內(nèi)部構(gòu)成應(yīng)相近;⑤進(jìn)行假設(shè)檢驗(yàn)時(shí),要遵循隨機(jī)抽樣原則,以進(jìn)行差別的顯著性檢驗(yàn)。
2、正態(tài)分布的特點(diǎn)及其應(yīng)用
性質(zhì):①兩頭低中間高,略呈鐘形;
②只有一個(gè)高峰,在X=μ,總體中位數(shù)亦為μ;
③以均數(shù)為中心,左右對稱;
④μ為位置參數(shù),當(dāng)σ恒定時(shí),μ越大,曲線沿橫軸越向右移動(dòng);
σ為變異度參數(shù),當(dāng)μ恒定時(shí),σ越大,表示數(shù)據(jù)越分散,曲線越矮胖,反之,曲線越瘦高;⑤對于任何服從正態(tài)分布N(μ,σ2)的隨機(jī)變量X作的線性變換,都會(huì)變換成u服從于均數(shù)為0,方差為1的正態(tài)分布,即標(biāo)準(zhǔn)正態(tài)分布。
應(yīng)用:①概括估計(jì)變量值的頻數(shù)分布;
②制定參考值范圍;
③質(zhì)量控制;
④是許多統(tǒng)計(jì)方法的理論基礎(chǔ)。
3、確定參考值范圍的一般原則和步驟、方法
一般原則和步驟:①抽取足夠例數(shù)的正常人樣本作為觀察對象;
②對選定的正常人進(jìn)行準(zhǔn)確而統(tǒng)一的測定,以控制系統(tǒng)誤差;
③判斷是否需要分組測定;
④決定取單側(cè)范圍值還是雙側(cè)范圍值;
⑤選定適當(dāng)?shù)陌俜址秶?/p>
⑥選用適當(dāng)?shù)挠?jì)算方法來確定或估計(jì)界值。
方法:①正態(tài)分布法:②百分位數(shù)法(偏態(tài)分布)
4、總體均數(shù)的可信區(qū)間與參考值范圍的區(qū)別
概念:可信區(qū)間是按預(yù)先給定的概率來確定的未知參數(shù)μ的可能范圍。
參考值范圍是絕大多數(shù)正常人的某指標(biāo)范圍。所謂正常人,是指排除了影響所研究指標(biāo)的疾病和有關(guān)因素的人;所謂絕大多數(shù),是指范圍,習(xí)慣上指正常人的95%。
計(jì)算公式:可信區(qū)間①
②
③
參考值范圍①正態(tài)分布
②偏態(tài)分布
用途:可信區(qū)間用于總體均數(shù)的區(qū)間估計(jì)
參考值范圍用于表示絕大多數(shù)觀察對象某項(xiàng)指標(biāo)的分布范圍
5、標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別與聯(lián)系
區(qū)別:
含義:標(biāo)準(zhǔn)差反映觀察值在個(gè)體中的變異大小,標(biāo)準(zhǔn)差越大,變量值越分散;
標(biāo)準(zhǔn)誤是指樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差,反映來自同一總體的樣本統(tǒng)計(jì)量的離散程度以及樣本統(tǒng)計(jì)量與總體參數(shù)的差異程度,即抽樣誤差的大小。
計(jì)算方法:標(biāo)準(zhǔn)差:總體標(biāo)準(zhǔn)差:樣本標(biāo)準(zhǔn)差:
標(biāo)準(zhǔn)誤:均數(shù)的標(biāo)準(zhǔn)誤:率的標(biāo)準(zhǔn)誤:
用途:標(biāo)準(zhǔn)差①用于對稱分布,特別是正態(tài)分布資料,表示觀察值分布的離散程度
②結(jié)合均數(shù),描述正態(tài)分布的特征、估計(jì)參考值范圍
③結(jié)合樣本統(tǒng)計(jì)量,計(jì)算均數(shù)標(biāo)準(zhǔn)誤
④計(jì)算變異系數(shù)
⑤反映均數(shù)的代表性
標(biāo)準(zhǔn)誤①衡量樣本均數(shù)的可靠性
②估計(jì)總體均數(shù)的可信區(qū)間
③用于均數(shù)的假設(shè)檢驗(yàn)
與樣本例數(shù)的關(guān)系:隨著樣本量的增加,樣本標(biāo)準(zhǔn)差穩(wěn)定于總體標(biāo)準(zhǔn)差;
隨著樣本量的增加,樣本標(biāo)準(zhǔn)誤減少并趨于0。
聯(lián)系:二者均為變異度指標(biāo),樣本均數(shù)的標(biāo)準(zhǔn)差即為標(biāo)準(zhǔn)誤,標(biāo)準(zhǔn)誤大小與標(biāo)準(zhǔn)差呈正比,與樣本例數(shù)的平方根呈反比,故欲降低抽樣誤差,可增加樣本例數(shù)。
6、假設(shè)檢驗(yàn)的步驟
①建立假設(shè)與確定檢驗(yàn)水準(zhǔn)(α)(反證法思想)
H0:μ1=μ2 無效假設(shè)
H1:μ1≠μ2 備擇假設(shè)
檢驗(yàn)水準(zhǔn):α=0.05(雙側(cè)或單側(cè))
②選定方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量:
根據(jù)資料的性質(zhì)(變量類型、設(shè)計(jì)類型、資料組數(shù)、樣本含量等)和分析目的選擇檢驗(yàn)統(tǒng)計(jì)量。所有檢驗(yàn)統(tǒng)計(jì)量均在無效假設(shè)成立的前提下,可以證明其分布。
③確定P值,作出判斷(利用小概率原理)
P值是指在H0成立的前提下,獲得現(xiàn)有檢驗(yàn)統(tǒng)計(jì)量值以及比該統(tǒng)計(jì)量值更極端情況下的概率。P≤α(0.05),拒絕H0,接受H1,認(rèn)為差別有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為......不同或不等;
P >α(0.05),接受H0,拒絕H1,認(rèn)為差別無統(tǒng)計(jì)學(xué)意義,還不能認(rèn)為......不同或不等。
④結(jié)合專業(yè)知識(shí)下結(jié)論。
7、假設(shè)檢驗(yàn)時(shí)應(yīng)注意的問題
①樣本具有代表性且可比;
②正確選用假設(shè)檢驗(yàn)方法;
③差別的統(tǒng)計(jì)學(xué)意義不等于實(shí)際意義;
④判斷結(jié)論時(shí)不能絕對化;
⑤單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)的選擇;
⑥報(bào)告結(jié)果應(yīng)注明樣本含量、統(tǒng)計(jì)量值、P值,單側(cè)檢驗(yàn)也應(yīng)注明;
95%CI既能說明差別的大小,也具有檢驗(yàn)的作用,建議使用。
8、方差分析的基本思想、基本條件
基本思想:
①首先將總變異分解為組間變異和誤差(組內(nèi))變異,然后比較兩者的均方,即計(jì)算F值。
②若F值大于某個(gè)臨界值,表示處理組間的效應(yīng)不同;若F值接近甚至小于某個(gè)臨界值,表示處理組間效應(yīng)相同(差異僅僅由隨機(jī)原因所致)。
③對于不同設(shè)計(jì)的方差分析,其思想都一樣,即均將處理間平均變異與誤差平均變異比較。④不同之處在于變異分解的項(xiàng)目因設(shè)計(jì)不同而異。
基本條件:
①資料無偏性,各樣本是相互獨(dú)立的隨機(jī)樣本(獨(dú)立性);
②各樣本來自正態(tài)分布總體(正態(tài)性);
③各樣本組的總體方差相等(方差齊性)。
9、R×C表χ2檢驗(yàn)的應(yīng)用注意事項(xiàng)
1.采用專用公式計(jì)算χ2值,無須計(jì)算理論頻數(shù),但也必須求出最小理論頻數(shù)。
2.對R×C表,若T<5的個(gè)數(shù)超過所有理論頻數(shù)個(gè)數(shù)的1/5或有T<1的格子出現(xiàn),則易犯第一類錯(cuò)誤。此時(shí)應(yīng):①增大樣本含量
②根據(jù)專業(yè)知識(shí)將相鄰的行或列進(jìn)行合理合并,一般僅對有序分類合并
③精確概率法
④似然比χ2檢驗(yàn)
⑤刪去T過小的行或列,但會(huì)丟失相應(yīng)信息
3.多組樣本率或構(gòu)成比比較時(shí),若效應(yīng)有強(qiáng)弱的等級(jí)時(shí),χ2檢驗(yàn)只能反映其構(gòu)成比有無差異,不能比較效應(yīng)的平均水平。
4.當(dāng)結(jié)果變量為無序分類時(shí),可采用χ2檢驗(yàn);
當(dāng)結(jié)果變量為有序分類時(shí),可考慮趨勢檢驗(yàn)或等級(jí)相關(guān)分析。
10、簡述直線相關(guān)與回歸的區(qū)別與聯(lián)系
區(qū)別:
資料:相關(guān)分析要求X、Y服從雙變量正態(tài)分布
回歸分析要求應(yīng)變量Y服從正態(tài)分布,x無特定要求
應(yīng)用:相關(guān)分析用于說明兩變量間的相關(guān)關(guān)系,描述兩變量X、Y之間呈線性關(guān)系的密切程度和方向回歸分析用于說明兩變量間的依存關(guān)系,可以用一個(gè)變量的數(shù)值推算另一個(gè)變量的數(shù)值 聯(lián)系:
正負(fù)符號(hào):對同一資料中,r與b的符號(hào)相同
假設(shè)檢驗(yàn):對同一資料中,r與b的假設(shè)檢驗(yàn)是等價(jià)的,二者的t值相等,tb=tr
r與b可相互轉(zhuǎn)換回歸可解釋相關(guān):相關(guān)系數(shù)r的平方稱決定系數(shù),表示Y的變異中可由X解釋的部分占總變異的比例
11、應(yīng)用直線相關(guān)與回歸的注意事項(xiàng)
①作相關(guān)與回歸分析要有實(shí)際意義。
②對相關(guān)關(guān)系的作用要正確理解。
③作相關(guān)與回歸分析前必須先作散點(diǎn)圖。
④積差法計(jì)算相關(guān)系數(shù)r適用于正態(tài)資料;
資料明顯偏態(tài)或原始資料只能用等級(jí)劃分或難以判定資料屬何種分布時(shí),才宜按等級(jí)相關(guān)處理。⑤相關(guān)、回歸若無統(tǒng)計(jì)學(xué)意義,不等于無任何關(guān)系。
⑥回歸方程的適用范圍僅適用于自變量X的實(shí)測范圍內(nèi)。
12、相關(guān)系數(shù)的意義、應(yīng)用直線相關(guān)的注意事項(xiàng)
相關(guān)系數(shù)是用以說明在兩個(gè)變量之間存在線性相關(guān)關(guān)系以及相關(guān)關(guān)系的密切程度與方向的統(tǒng)計(jì)指標(biāo)。樣本相關(guān)系數(shù)用r表示,總體相關(guān)系數(shù)用ρ表示。相關(guān)系數(shù)沒有單位,其值為-1≦r≦1。
r值為正表示正相關(guān),r值為負(fù)表示負(fù)相關(guān),r值為0表示X與Y無線性關(guān)系。
r的絕對值越大表示相關(guān)越密切。
①線性相關(guān)表示兩變量之間的關(guān)系是雙向的分析變量之間的關(guān)系;
須首先繪制散點(diǎn)圖,散點(diǎn)圖呈直線趨勢時(shí)再做分析;
②r表示服從雙變量正態(tài)分布的兩變量間的相關(guān)關(guān)系,描述兩變量之間呈線性關(guān)系的密切程度和方向;r=0只能說明X與Y之間無線性關(guān)系,并不表示X與Y之間無任何相關(guān);
③計(jì)算出相關(guān)系數(shù)是樣本相關(guān)系數(shù),是總體相關(guān)系數(shù)的估計(jì)值,因此判斷總體相關(guān)時(shí)需做假設(shè)檢驗(yàn);
④相關(guān)關(guān)系不一定是因果關(guān)系。
**
13、頻數(shù)表的編制步驟
①找出觀察值中的最大值和最小值,并求出極差
②按極差大小決定組段數(shù)、組段和組距
③列出組段
④劃記計(jì)數(shù)
**
14、統(tǒng)計(jì)圖的制圖通則
①據(jù)資料的性質(zhì)和分析目的選擇合適的圖形
②確切的標(biāo)題與編號(hào)(在圖的下方正中央位置)
③縱、橫軸之比為5:7,必要時(shí)注明度量單位
④必要時(shí)輔以圖例
**
15、t 分布有如下性質(zhì):
①單峰分布,曲線在t=0 處最高,并以t=0為中心左右對稱
②與正態(tài)分布相比,曲線最高處較矮,兩尾部翹得高
③隨自由度增大,曲線逐漸接近正態(tài)分布;分布的極限為標(biāo)準(zhǔn)正態(tài)分布。
**
16、非參數(shù)統(tǒng)計(jì)的優(yōu)缺點(diǎn)
優(yōu)點(diǎn):①適用范圍廣,是對有序分類資料最有效的統(tǒng)計(jì)方法
②對不滿足參數(shù)統(tǒng)計(jì)的資料,非參數(shù)統(tǒng)計(jì)的效率高
③搜集資料方便
缺點(diǎn):對適用參數(shù)統(tǒng)計(jì)的資料,應(yīng)用非參數(shù)統(tǒng)計(jì)的效率低,即犯第II類錯(cuò)誤的概率比參數(shù)統(tǒng)計(jì)大
1、醫(yī)學(xué)統(tǒng)計(jì)學(xué):是以醫(yī)學(xué)理論為指導(dǎo),借助統(tǒng)計(jì)學(xué)的原理和方法研究醫(yī)學(xué)現(xiàn)象中的數(shù)據(jù)搜集、整理、分析和推斷的一門綜合性學(xué)科。
2、變量:是指觀察個(gè)體的某個(gè)指標(biāo)或特征,統(tǒng)計(jì)上習(xí)慣用大寫拉丁字母表示。
3、數(shù)值變量/定量變量/計(jì)量資料/定量資料:是以定量的方式來表示觀察單位某項(xiàng)觀察指標(biāo)的大小,所得的資料稱之為~,有度量單位。
4、分類變量/定性變量/計(jì)數(shù)資料/定性資料:是以定性的方式來表示觀察單位某項(xiàng)觀察指標(biāo),所得的資料稱之為~,無固有度量單位。
5、有序分類/等級(jí)資料:是以等級(jí)的方式來表示觀察單位某項(xiàng)觀察指標(biāo),所得的資料稱之為~,為半定量的觀察結(jié)果,有大小順序。
6、同質(zhì):是指事物的性質(zhì)、影響條件或背景相同或相近。
7、變異:是指同質(zhì)的個(gè)體之間的差異。
8、總體:是根據(jù)研究目的所確定的同質(zhì)觀察單位的全體或集合,分為有限總體和無限總體。
9、樣本:是從總體中隨機(jī)抽取的一部分觀察單位所組成的集合。
10、隨機(jī)變量:是指取值不能事先確定的觀察結(jié)果。
11、統(tǒng)計(jì)量:是樣本的統(tǒng)計(jì)指標(biāo),采用拉丁字母表示,是參數(shù)附近波動(dòng)的隨機(jī)變量。
12、參數(shù):是總體的統(tǒng)計(jì)指標(biāo),采用小寫的希臘字母,為固定的常數(shù)。
13、隨機(jī)抽樣:為了保證樣本的可靠性和代表性,需要采用隨機(jī)的抽樣方法,使總體中每個(gè)個(gè)體均有相同的機(jī)會(huì)被抽到。
14、抽樣誤差:是由于個(gè)體差異導(dǎo)致在抽樣研究中產(chǎn)生的樣本統(tǒng)計(jì)量與相應(yīng)的總體參數(shù)之間的差異以及統(tǒng)計(jì)量間的差異。
15、確定性現(xiàn)象:在一定條件下,一定會(huì)發(fā)生或一定不會(huì)發(fā)生的現(xiàn)象。
16、隨機(jī)現(xiàn)象:在同樣條件下可能會(huì)出現(xiàn)兩種或多種結(jié)果,究竟會(huì)發(fā)生哪種結(jié)果,事先不能確定。其表現(xiàn)結(jié)果稱為隨機(jī)事件。
17、頻率:樣本的實(shí)際發(fā)生率稱為~,0≦f≦1。
18、概率:隨機(jī)事件發(fā)生的可能性大小,0≦P≦1。
19、小概率事件:概率小于等于0.05或0.01的事件稱為小概率事件,習(xí)慣上以0.05為標(biāo)準(zhǔn),統(tǒng)計(jì)學(xué)上認(rèn)為小概率事件在一次實(shí)驗(yàn)中是不大可能發(fā)生的。
20、平均數(shù):是反應(yīng)一組觀察值的集中趨勢、中心位置或平均水平的指標(biāo)體系,常用的指標(biāo)有均數(shù)、幾何均數(shù)、中位數(shù)。
21、中位數(shù):是將一組觀察值從小到大按順序排列,位次居中的觀察值就是中位數(shù),適用于任何分布、開口資料、偏態(tài)分布。
22、百分位數(shù):是指一種位置指標(biāo),用Px表示,一個(gè)百分位數(shù)將按大小順序排列的變量值分為100份,旦論上有x%的變量值比它小,有(100-x)%的變量值比它大,對應(yīng)x%位次的數(shù)值。
23、標(biāo)準(zhǔn)差:方差是指樣本觀察值的離均差平方和的均值,方差的正平方根為標(biāo)準(zhǔn)差,表示一組數(shù)據(jù)的平均偏離程度。
24、變異系數(shù):是指標(biāo)準(zhǔn)差與均數(shù)之比,常用百分?jǐn)?shù)表示,沒有單位,主要用于度量衡單位不同或均數(shù)相差懸殊的幾組資料間的比較。
25、相對比:是指A、B兩個(gè)有聯(lián)系的指標(biāo)之比,用于說明A為B的若干倍或百分之幾,是對比的最簡單形式。
26、構(gòu)成比:是指一事物內(nèi)部某一組成部分的觀察單位數(shù)與該事物各組成部分的觀察單位總數(shù)之比,用以說明某一事物內(nèi)部各組成部分所占的比重或分布。
27、率:是指某種現(xiàn)象在一定條件下,實(shí)際發(fā)生的觀察單位數(shù)與可能發(fā)生該現(xiàn)象的總觀察單位數(shù)之比,用以說明某種現(xiàn)象發(fā)生的頻率大小或強(qiáng)度。
28、率的標(biāo)準(zhǔn)化/標(biāo)化率:即采用統(tǒng)一的標(biāo)準(zhǔn)對內(nèi)部構(gòu)成不同的各組頻率進(jìn)行調(diào)整和對比的方法,調(diào)整后的率為標(biāo)準(zhǔn)化率/標(biāo)化率/調(diào)整率。
29、統(tǒng)計(jì)表:是以表格的形式列出統(tǒng)計(jì)分析的事物及其指標(biāo),它可避免長篇文字?jǐn)⑹觯⒕唧w列出數(shù)據(jù)。
30、統(tǒng)計(jì)圖:是用點(diǎn)的位置、線段的升降、直條的長短或面積的大小等形式表達(dá)統(tǒng)計(jì)資料,它可直觀醒目地反映出事物間的數(shù)量關(guān)系。
31、正態(tài)分布:靠近均數(shù)分布的頻數(shù)最多,兩邊頻數(shù)逐漸減少并且近似對稱,這種兩頭低中間高、略呈鐘形、左右近似對稱的連續(xù)性分布稱為~。
32、參考值范圍:是絕大多數(shù)正常人的某指標(biāo)范圍。所謂正常人,是指排除了影響所研究指標(biāo)的疾病和有關(guān)因素的人;所謂絕大多數(shù),是指范圍,習(xí)慣上指正常人的95%。
33、標(biāo)準(zhǔn)誤:是指樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差,反映來自同一總體的樣本統(tǒng)計(jì)量的離散程度以及樣本統(tǒng)計(jì)量與總體參數(shù)的差異程度,即抽樣誤差的大小。
34、均數(shù)標(biāo)準(zhǔn)誤:是指樣本均數(shù)的標(biāo)準(zhǔn)差,反映來自同一總體的樣本均數(shù)的離散程度以及樣本均數(shù)與總體均數(shù)的差異程度,即抽樣誤差的大小。均數(shù)標(biāo)準(zhǔn)誤大小與標(biāo)準(zhǔn)差呈正比,與樣本例數(shù)的平方根呈反比,故欲降低抽樣誤差,可增加樣本例數(shù)。
35、區(qū)間估計(jì):以一定概率估計(jì)總體參數(shù)在哪個(gè)范圍內(nèi)的估計(jì)方法。
36、95%可信區(qū)間:是指從理論而言,在100次隨機(jī)抽樣所得的100個(gè)可信區(qū)間中,平均有95個(gè)可信區(qū)間包括總體均數(shù)。
37、P值:是指在H0成立的前提下,獲得現(xiàn)有檢驗(yàn)統(tǒng)計(jì)量值以及比該統(tǒng)計(jì)量值更極端情況下的概率。
38、第一類錯(cuò)誤ɑ:檢驗(yàn)假設(shè)H0實(shí)際上成立的,但拒絕了H0,誤判為有差別,也就是犯了假陽性錯(cuò)誤,稱為~。其發(fā)生的概率用 ? 表示。在假設(shè)檢驗(yàn)中作為檢驗(yàn)水準(zhǔn)。一般取0.05或0.01。按實(shí)驗(yàn)要求,重點(diǎn)要控制第一類錯(cuò)誤,應(yīng)采用Duncan法。
39、第二類錯(cuò)誤β:假設(shè)檢驗(yàn)H0實(shí)際上不成立,但卻不拒絕H0,誤判為無差別,也就是犯了假陰性錯(cuò)誤,稱~。其發(fā)生的概率用 ? 表示。由于其取值取決于H1,因此在假設(shè)檢驗(yàn)中無法確定。按實(shí)驗(yàn)要求,重點(diǎn)要求控制第二類錯(cuò)誤,應(yīng)采用LSD-t法。
40、檢驗(yàn)效能/把握度:統(tǒng)計(jì)學(xué)上將1-β稱為~,即當(dāng)兩總體確有差別,按規(guī)定的檢驗(yàn)水準(zhǔn)a 所能發(fā)現(xiàn)該差異的能力。
41、相關(guān)分析:研究變量間相互關(guān)系的密切程度、變化趨勢,并用適當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)顯示出來的分析方法。
42、回歸分析:將變量間數(shù)量上的依存關(guān)系用函數(shù)形式表示出來,用一個(gè)或多個(gè)變量來推測另一個(gè)變量的估計(jì)值及波動(dòng)范圍的分析方法。
43、相關(guān)系數(shù):用以說明在兩個(gè)變量之間存在線性相關(guān)關(guān)系以及相關(guān)關(guān)系的密切程度與方向的統(tǒng)計(jì)指標(biāo)。
44、回歸系數(shù):即直線的斜率,在直線回歸方程中用b 表示,b 的統(tǒng)計(jì)意義為X每增(減)一個(gè)單位時(shí),Y平均改變b 個(gè)單位。
45、決定系數(shù):相關(guān)系數(shù)r的平方稱為~,表示Y的變異中可由X解釋的部分占總變異的比例。
46、參數(shù)檢驗(yàn):假設(shè)樣本所來自的總體分布具有某個(gè)已知的函數(shù)形式,而其中有的參數(shù)是未知的,統(tǒng)計(jì)分析的目的就是對這些未知參數(shù)進(jìn)行估計(jì)或檢驗(yàn)。這類方法稱為參數(shù)統(tǒng)計(jì),所用的檢驗(yàn)稱為
47、非參數(shù)檢驗(yàn):不依賴總體分布的具體形式,也不對參數(shù)進(jìn)行估計(jì)或檢驗(yàn)的統(tǒng)計(jì)方法稱為非參數(shù)統(tǒng)計(jì),所用的檢驗(yàn)方法稱為~。其目的是檢驗(yàn)所比較的分布或分布位置是否相同。
第五篇:旅游統(tǒng)計(jì)學(xué)名詞解釋
1,旅游統(tǒng)計(jì)學(xué),是應(yīng)用統(tǒng)計(jì)理論與方法,對旅游經(jīng)濟(jì)現(xiàn)象進(jìn)行集中深入的研究而產(chǎn)生的一門分支統(tǒng)計(jì)學(xué)科。
2,總體,總體單位,總體,統(tǒng)計(jì)所要求的具有某種共同特征事物的全體,總體單位指組成總體的基本單位,即具有某種共同特征事物的基本單位。
3,標(biāo)志,表明總體單位屬性或特征的名稱,按性質(zhì)分,a品質(zhì)標(biāo)志,b數(shù)量標(biāo)志,按變異性分a不變標(biāo)志,b可變標(biāo)志。
4,變異,標(biāo)志在總體各單位之間存在具體表現(xiàn)的差異性,變異中,有屬性變異與數(shù)量變異。
5,變量,把數(shù)量變異的名稱稱為變量,按是否連續(xù),分為連續(xù)變量離散變量。
6,指標(biāo),表明總體數(shù)量特征的社會(huì)經(jīng)濟(jì)概念或范疇,1,特征2,可量性3,綜合性,7,指標(biāo)分類,安表現(xiàn)形式分為,總體指標(biāo),相對指標(biāo),平均指標(biāo),安總體特征,數(shù)量指標(biāo),質(zhì)量指標(biāo).8,總量指標(biāo),在一定時(shí)間地點(diǎn)條件下表明某種旅游經(jīng)濟(jì)活動(dòng)的總規(guī)模或總水平的指標(biāo)。其表現(xiàn)形式為絕對數(shù),按其所反映的時(shí)間狀況不同,分為時(shí)點(diǎn)指標(biāo)與時(shí)期指標(biāo)。
9,相對指標(biāo),將兩個(gè)性質(zhì)相同或相互聯(lián)系的指標(biāo)總值進(jìn)行對比求得的比率或商數(shù)就構(gòu)成相對指標(biāo)。
表現(xiàn)形式,無名數(shù)與有名數(shù)
計(jì)算方法,結(jié)構(gòu)相對數(shù)=總體部分?jǐn)?shù)值/總體全部數(shù)值
10,環(huán)比發(fā)展速度,以報(bào)告期的前一期為基期的發(fā)展過程比較。11,定期發(fā)展速度,以定期為基期的反展過程比較。12,動(dòng)態(tài)數(shù)列將某種旅游經(jīng)濟(jì)現(xiàn)象指標(biāo),在不同時(shí)間讓其按先后順序排列得到的數(shù)列,又稱時(shí)間數(shù)列。
13學(xué)列平均數(shù),動(dòng)態(tài)數(shù)列各時(shí)期或時(shí)點(diǎn)發(fā)展水平的平均數(shù),是根據(jù)動(dòng)態(tài)數(shù)列計(jì)算而得,塌縮平均的是現(xiàn)象在不容時(shí)期發(fā)展水平的差異。
14,統(tǒng)計(jì)指數(shù),綜合反映所研究社會(huì)經(jīng)濟(jì)現(xiàn)象復(fù)雜總體數(shù)量變動(dòng)狀況的相對數(shù)。
15,因素分析內(nèi)容,a,相對數(shù)分析,b絕對數(shù)分析,16,普查,根據(jù)經(jīng)濟(jì)旅游工作特定目的與任務(wù)而專門組織的一次全面調(diào)查。
17,統(tǒng)計(jì)分組概念,根據(jù)被研究對象總體的內(nèi)在特征,與旅游統(tǒng)計(jì)學(xué)研究目的,將統(tǒng)計(jì)總體按一定標(biāo)志劃分為若干相異的組成部分的一種方法。
18,逐級(jí)匯總,按照一定旅游管理機(jī)制,由上而下逐級(jí)匯總,上級(jí)統(tǒng)計(jì)資料的一種形式。
19,手工匯總,劃分法,過錄法,折疊法,卡片法。20,旅游換匯率,我國提供單位本國貨幣的旅游產(chǎn)品換取的外匯數(shù)量。
21,旅游對象物資源,指供旅游者參觀游覽娛樂修養(yǎng)的地區(qū)。條件,a具有旅游價(jià)值b經(jīng)專家堅(jiān)定,世人公認(rèn)。C可進(jìn)入性,d對國際旅游者須經(jīng)政府批準(zhǔn)開放。
22旅游交通,指旅游者利用某種手段途徑從一個(gè)地點(diǎn)到另一個(gè)地點(diǎn)的空間轉(zhuǎn)移過程,類型,水上陸地,空中。
23,交通統(tǒng)計(jì),a車船數(shù)量構(gòu)成,b車船變動(dòng)量,c利用維修狀況。
24,統(tǒng)計(jì)報(bào)表制度,按照國家統(tǒng)一規(guī)定調(diào)查要求,和表格形式等,自下而上提供統(tǒng)計(jì)資料的一種報(bào)表制度。