第一篇:統計學資料
1.統計三個方面得含義和之間的關系。
三個方面含義:統計工作,統計資料和統計學。統計工作是指對數據資料進行收集整理和分析;統計資料是統計工作中所得到得數據資料;統計學是指統計工作、統計實踐的總結。三者關系:三者具有密切的含義。統計工作是人們統計實踐,是主觀反映客觀的認識過程。統計資料是統計工作的結果。統計工作與統計資料是過程和成果的關系,統計學是統計工作經驗的總結和概括,反之,統計學所闡述的理論和方法又是指導統計工作的原則和方法。因此,統計學和統計工作之間存在著理論和實踐的辯證關系。
2.標志和統計指標的區別和聯系。
標志是用來說明總體單位特征的名稱。指標是說明總體的綜合數量特征。
區別:a說明對象不同,標志是說明總體單位特征,而指標是說明總體特征的。b : 表現方式不同。標志可以用數字和文字表現,指標只可以用數字表現。c : 指標數值是經過一定的匯總取得的,而標志中的數量標志不一定經過匯總可直接取得。d :標志一般不具備時間地點等條件,但作為一個完整的統計指標一定要講時間地點范圍。
聯系:a :大多數指標值都是由標志值匯總計量得來的。b : 數量標志和指標在一定條件下可以相互轉化。
3.統計調查方案的內容有哪些?
確定調查目的、調查對象和調查單位、調查項目、調查時間和調查期限、制定調查的組織和實施計劃、選擇調查方法什么是統計分組以及作用?
統計分組,就是根據統計研究的需要將統計總體按照一定的標志區分為若干個組成部分的一種統計方法。
作用:劃分現象的類型,揭示現象內部結構,分析現象之間的依存關系,時期數列和時點數列各有什么特點?
時期數列:a.數列中各個指標的數值可以相加的,即相加具有一定的經濟意義;b.數列中每一個指標數值的大小與所屬時期長短有直接的聯系;c.數列中每個指標的數值通常是通過連續不斷的登記而取得的。
時點數列:a.數列中各個指標的數值時不能相加的,相加不具有實際的經濟意義;b.數列中每個指標數值的大小與其時間間隔沒有直接聯系; c.數列中的每個指標的數值通常是通過一定時期登記一次而取得的。影響抽樣平均誤差的因素。
全及總體標志的變動程度;抽樣單位數的多少;抽樣的組織方式;直線回歸的特點。
a.兩個變量是不對等的,要區分自變量和因變量; b.當X為自變量,Y為因變量時,Y以X為回歸方程。當Y為自變量,X為因變量時,X 以Y 為回歸方程;c.回歸系數必有正負號。若為正,說明兩個變量為正相關。若為負,則說明兩個變量為負相關;d.可依據回歸方程,用自變量的值推算因變量的估計量;e.因變量時隨機的,而自變量不是隨機的,是給定的值。相關分析的主要內容有哪些?
a.確定現象之間是否存在依存關系以及相關的形態如何(做散點圖);b.確定相關關系的密切程度(計算相關系數);c.確定相關關系的數學表達式:Y=F(x)+u;d.確定因變量估計值的誤差程度;e.對相關系數進行顯著性檢驗。
第二篇:企業經營統計學簡答題整理資料
1、簡述企業數據處理的流程(P16)
(1)數據的整理和審核(2)數據的錄入(3)數據的編輯
(4)數據的存儲和處理(5)數據的利用
2、簡述企業實物性投入表的基本構成(P98)
企業實物性投入產出表以實物單位為計量單位,一般有四個部分構成,分別稱為第一、第二、第三、第四象限。
第一象限為左上角的一個n*n的自產產品間的方陣,反映的是企業內部各產品部門之間的產品消耗和供應關系;
第二象限為右上角的兩個n維向量,分別反映的是各生產部門自產產品的最終使用數量和各生產部門自產產品的總量;
第三象限為左下角的一個k*n的矩陣,它反映的是企業各生產部門,在生產過程中消耗外購產品數量,說明企業各生產部門與企業以外的經濟技術聯系;
第四象限為右下角的兩個k維向量,分別反映的是企業外購產品經過中間使用以后剩余部分的使用數量和企業外購產品總量
3、簡述企業產品原是實物量應遵循的原則(P67)
a)在貨物生產企業產出的實物量中,企業產出統計必須符合規定的產品質量標準; b)在貨物生產企業產出的實物數量中,企業產出統計必須是當期生產的產品;
c)在貨物生產企業產出的實物數量中,企業產出統計必須是通過企業人力資本作用,并完后了一定工序的產品;
d)必須嚴格按照產品目錄的規格填報;
e)必須堅持入庫原則;
4、如何從統計上反映企業產品市場占有情況(P165)、市場占有率和市場覆蓋率
市場占有率是指企業、部門或地區生產的某種(某大類)產品在市場上的銷售量(額)占市場同類或同行業產品市場銷售總量(額)的比重。其計算公示為:
市場占有率=某種產品(某大類)的銷售量(額)/該類產品的市場銷售總量(額)或市場占有率=企業的全部商品的銷售額/同行業的商品銷售額
市場覆蓋率是指某企業某種產品的行銷地區數占該產品行銷地區總數的比重。它是從市場占有的廣度方面反映企業某種產品的市場占有情況和企業產品競爭能力、輻射能力的指標。其計算公式為:
市場覆蓋率=企業生產的某種產品銷售地區數/該種產品行銷地區總數
5、影響企業員工需求的基本因素(P235)
(1)產品的需求(2)企業支付給員工的薪酬(3)資本的價格
(4)企業的發展戰屢和經營規劃(5)生產技術和管理水平的變化
6、簡述企業綜合評價的基本步驟(P352)
(1)明確評價對象系統和評價目的(2)根據企業綜合評價的目的,選擇若干個指標,建立綜合指標體系
(3)對不同計量單位的指標數值進行同度量處理
(4)確定指標體系中各指標的權數,以保證評價的科學性
(5)對指標進行匯總,計算綜合統計評價值
第三篇:醫學統計學各種資料比較_選擇方法小結
醫學統計學各種資料比較 選擇方法小結
一、兩組或多組計量資料的比較 1.兩組資料:
1)大樣本資料或服從正態分布的小樣本資料(1)若方差齊性,則作成組t檢驗
(2)若方差不齊,則作t’檢驗或用成組的Wilcoxon秩和檢驗 2)小樣本偏態分布資料,則用成組的Wilcoxon秩和檢驗 2.多組資料:
1)若大樣本資料或服從正態分布,并且方差齊性,則作完全隨機的方差分析。如果方差分析的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:LSD檢驗,Bonferroni檢驗等)進行兩兩比較。
2)如果小樣本的偏態分布資料或方差不齊,則作Kruskal Wallis的統計檢驗。如果Kruskal Wallis的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:用成組的Wilcoxon秩和檢驗,但用Bonferroni方法校正P值等)進行兩兩比較。
二、分類資料的統計分析 1.單樣本資料與總體比較 1)二分類資料:
(1)小樣本時:用二項分布進行確切概率法檢驗;(2)大樣本時:用U檢驗。2)多分類資料:用Pearson c2檢驗(又稱擬合優度檢驗)。2.四格表資料
1)n>40并且所以理論數大于5,則用Pearson c2
2)n>40并且所以理論數大于1并且至少存在一個理論數<5,則用校正c2或用Fisher’s 確切概率法檢驗
3)n£40或存在理論數<1,則用Fisher’s 檢驗 3.2×C表資料的統計分析
1)列變量為效應指標,并且為有序多分類變量,行變量為分組變量,則行評分的CMH c2或成組的Wilcoxon秩和檢驗
2)列變量為效應指標并且為二分類,列變量為有序多分類變量,則用趨勢c2檢驗
3)行變量和列變量均為無序分類變量
(1)n>40并且理論數小于5的格子數<行列表中格子總數的25%,則用Pearson c2
(2)n£40或理論數小于5的格子數>行列表中格子總數的25%,則用Fisher’s 確切概率法檢驗 4.R×C表資料的統計分析
1)列變量為效應指標,并且為有序多分類變量,行變量為分組變量,則CMH c2或Kruskal Wallis的秩和檢驗
2)列變量為效應指標,并且為無序多分類變量,行變量為有序多分類變量,作none zero correlation analysis的CMH c2
3)列變量和行變量均為有序多分類變量,可以作Spearman相關分析 4)列變量和行變量均為無序多分類變量,(1)n>40并且理論數小于5的格子數<行列表中格子總數的25%,則用Pearson c2
(2)n£40或理論數小于5的格子數>行列表中格子總數的25%,則用Fisher’s 確切概率法檢驗
三、Poisson分布資料 1.單樣本資料與總體比較:
1)觀察值較小時:用確切概率法進行檢驗。2)觀察值較大時:用正態近似的U檢驗。2.兩個樣本比較:用正態近似的U檢驗。
配對設計或隨機區組設計
四、兩組或多組計量資料的比較 1.兩組資料:
1)大樣本資料或配對差值服從正態分布的小樣本資料,作配對t檢驗 2)小樣本并且差值呈偏態分布資料,則用Wilcoxon的符號配對秩檢驗
2.多組資料:
1)若大樣本資料或殘差服從正態分布,并且方差齊性,則作隨機區組的方差分析。如果方差分析的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:LSD檢驗,Bonferroni檢驗等)進行兩兩比較。
2)如果小樣本時,差值呈偏態分布資料或方差不齊,則作Fredman的統計檢驗。如果Fredman的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:用Wilcoxon的符號配對秩檢驗,但用Bonferroni方法校正P值等)進行兩兩比較。
五、分類資料的統計分析 1.四格表資料
1)b+c>40,則用McNemar配對c2檢驗或配對邊際c2檢驗 2)b+c£40,則用二項分布確切概率法檢驗 2.C×C表資料:
1)配對比較:用McNemar配對c2檢驗或配對邊際c2檢驗 2)一致性問題(Agreement):用Kap檢驗
變量之間的關聯性分析
六、兩個變量之間的關聯性分析 1.兩個變量均為連續型變量
1)小樣本并且兩個變量服從雙正態分布,則用Pearson相關系數做統計分析
2)大樣本或兩個變量不服從雙正態分布,則用Spearman相關系數進行統計分析
2.兩個變量均為有序分類變量,可以用Spearman相關系數進行統計分析
3.一個變量為有序分類變量,另一個變量為連續型變量,可以用Spearman相關系數進行統計分析
七、回歸分析
1.直線回歸:如果回歸分析中的殘差服從正態分布(大樣本時無需正態性),殘差與自變量無趨勢變化,則直線回歸(單個自變量的線性回歸,稱為簡單回歸),否則應作適當的變換,使其滿足上述條件。2.多重線性回歸:應變量(Y)為連續型變量(即計量資料),自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。如果回歸分析中的殘差服從正態分布(大樣本時無需正態性),殘差與自變量無趨勢變化,可以作多重線性回歸。
1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素 2)實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
3.二分類的Logistic回歸:應變量為二分類變量,自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。1)非配對的情況:用非條件Logistic回歸
(1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素(2)實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
2)配對的情況:用條件Logistic回歸
(1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素(2)實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
4.有序多分類有序的Logistic回歸:應變量為有序多分類變量,自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。
1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素 2)實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
5.無序多分類有序的Logistic回歸:應變量為無序多分類變量,自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。
1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素 2)實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
八、生存分析資:要求資料記錄結局和結局發生的時間(如;死亡和死亡發生的時間)
1.用Kaplan-Meier方法估計生存曲線 2.大樣本時,可以壽命表方法估計
3.單因素可以用Log-rank比較兩條或多條生存曲線 4.多個因素時,可以作多重的Cox回歸
1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素 2)實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
第四篇:醫學統計學各種資料比較選擇方法小結
一、兩組或多組計量資料的比較 1.兩組資料:
1)大樣本資料或服從正態分布的小樣本資料(1)若方差齊性,則作成組t檢驗
(2)若方差不齊,則作t’檢驗或用成組的Wilcoxon秩和檢驗 2)小樣本偏態分布資料,則用成組的Wilcoxon秩和檢驗 2.多組資料:
1)若大樣本資料或服從正態分布,并且方差齊性,則作完全隨機的方差分析。如果方差分析的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:LSD檢驗,Bonferroni檢驗等)進行兩兩比較。
2)如果小樣本的偏態分布資料或方差不齊,則作Kruskal Wallis的統計檢驗。如果Kruskal Wallis的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:用成組的Wilcoxon秩和檢驗,但用Bonferroni方法校正P值等)進行兩兩比較。
二、分類資料的統計分析 1.單樣本資料與總體比較 1)二分類資料:
(1)小樣本時:用二項分布進行確切概率法檢驗;(2)大樣本時:用U檢驗。
2)多分類資料:用Pearson c2檢驗(又稱擬合優度檢驗)。2.四格表資料
1)n>40并且所以理論數大于5,則用Pearson c2 2)n>40并且所以理論數大于1并且至少存在一個理論數<5,則用校正c2或用Fisher’s 確切概率法檢驗
3)n£40或存在理論數<1,則用Fisher’s 檢驗 3.2×C表資料的統計分析
1)列變量為效應指標,并且為有序多分類變量,行變量為分組變量,則行評分的CMH c2或成組的Wilcoxon秩和檢驗
2)列變量為效應指標并且為二分類,列變量為有序多分類變量,則用趨勢c2檢驗 3)行變量和列變量均為無序分類變量
(1)n>40并且理論數小于5的格子數<行列表中格子總數的25%,則用Pearson c2(2)n£40或理論數小于5的格子數>行列表中格子總數的25%,則用Fisher’s 確切概率法檢驗
4.R×C表資料的統計分析
1)列變量為效應指標,并且為有序多分類變量,行變量為分組變量,則CMH c2或Kruskal Wallis的秩和檢驗
2)列變量為效應指標,并且為無序多分類變量,行變量為有序多分類變量,作none zero correlation analysis的CMH c2 3)列變量和行變量均為有序多分類變量,可以作Spearman相關分析 4)列變量和行變量均為無序多分類變量,(1)n>40并且理論數小于5的格子數<行列表中格子總數的25%,則用Pearson c2(2)n£40或理論數小于5的格子數>行列表中格子總數的25%,則用Fisher’s 確切概率法檢驗
三、Poisson分布資料 1.單樣本資料與總體比較:
1)觀察值較小時:用確切概率法進行檢驗。2)觀察值較大時:用正態近似的U檢驗。2.兩個樣本比較:用正態近似的U檢驗。
配對設計或隨機區組設計
四、兩組或多組計量資料的比較 1.兩組資料:
1)大樣本資料或配對差值服從正態分布的小樣本資料,作配對t檢驗 2)小樣本并且差值呈偏態分布資料,則用Wilcoxon的符號配對秩檢驗 2.多組資料:
1)若大樣本資料或殘差服從正態分布,并且方差齊性,則作隨機區組的方差分析。如果方差分析的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:LSD檢驗,Bonferroni檢驗等)進行兩兩比較。
2)如果小樣本時,差值呈偏態分布資料或方差不齊,則作Fredman的統計檢驗。如果Fredman的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:用Wilcoxon的符號配對秩檢驗,但用Bonferroni方法校正P值等)進行兩兩比較。
五、分類資料的統計分析 1.四格表資料
1)b+c>40,則用McNemar配對c2檢驗或配對邊際c2檢驗 2)b+c£40,則用二項分布確切概率法檢驗 2.C×C表資料:
1)配對比較:用McNemar配對c2檢驗或配對邊際c2檢驗 2)一致性問題(Agreement):用Kap檢驗
變量之間的關聯性分析
六、兩個變量之間的關聯性分析 1.兩個變量均為連續型變量
1)小樣本并且兩個變量服從雙正態分布,則用Pearson相關系數做統計分析 2)大樣本或兩個變量不服從雙正態分布,則用Spearman相關系數進行統計分析 2.兩個變量均為有序分類變量,可以用Spearman相關系數進行統計分析
3.一個變量為有序分類變量,另一個變量為連續型變量,可以用Spearman相關系數進行統計分析
七、回歸分析
1.直線回歸:如果回歸分析中的殘差服從正態分布(大樣本時無需正態性),殘差與自變量無趨勢變化,則直線回歸(單個自變量的線性回歸,稱為簡單回歸),否則應作適當的變換,使其滿足上述條件。
2.多重線性回歸:應變量(Y)為連續型變量(即計量資料),自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。如果回歸分析中的殘差服從正態分布(大樣本時無需正態性),殘差與自變量無趨勢變化,可以作多重線性回歸。1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素
2)實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
3.二分類的Logistic回歸:應變量為二分類變量,自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。1)非配對的情況:用非條件Logistic回歸
(1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素
(2)實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用 2)配對的情況:用條件Logistic回歸
(1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素
(2)實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用 4.有序多分類有序的Logistic回歸:應變量為有序多分類變量,自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素
2)實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
5.無序多分類有序的Logistic回歸:應變量為無序多分類變量,自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素
2)實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
第五篇:統計學
標志是用來說明總體單位特征的名稱
指標也稱統計指標,是說明總體的中和數量特征的調查對象就是我們需要進行研究的總體范圍,即調查總體
調查單位就是我們索要研究的總體單位,也即所要登記的標志的承擔者
調查時間是指調查資料所屬的時點或時期
調查期限是指調查工作進行的起讠乞時間(從開始到結束),包括搜集資料和報送資料的整個工作所需的時間
普查是專門組織的一次性的全面調查
抽樣調查是一種飛全面調查,它是在全部調查單位中按照隨機原則抽取一部分單位進行調查,根據調查的結果推斷總體的一種調查方法
重點調查是在調查對象范圍內選擇部分重點調查單位搜集統計資料的非全面調查
典型調查就是在調查對象中有意識地選取若干具有典型意義的或有代表性的單位進行非全面調查
分配數列是在統計分組的基礎上,將總體的所有單位按組歸類整理,并按一定順序排列,形成各個單位在各組間的分布
CPI居民消費價格指數,居民消費指數反映居民家庭一般所購買的消費品和服務價格水平變動情況的標準
隨機誤差是指遵守了隨機原則但可能抽到各種不同樣本而產生的誤差
統計的三重意義:即統計工作、統計資料和統計學。統計工作是指對社會經濟現象數量方面進行搜集、整理和分析工作的總結,它是一種社會調查研究活動。統計資料也即統計信息,是統計部門或單位進行工作所搜集、整理、編制的各種統計數據資料的總稱,它是進行國民經濟宏觀調控的決策依據,是社會公眾了解國情、國力和社會發展狀況的信息主體,統計學是關于統計過程的理論和方法的科學
時期和時點指標的區別:1.時期指標的數值是連續計數的,它的每一個數值是表示現象在一段時期內發生的總量;而時點指標的數值是間斷計數的,它的每一個數值是表示現象發展到一定時點上的所處的水平2.時期指標具有累加性,即各期數值相加可以說明現象在較長時期內發生的總量;而時點指標不具有累加性,即各時點數值相加是沒有意義的 3.時期指標數值的大小受時期長短的制約;而時點指標數值的大小與時點間的間隔長短無直接的關系
指數的概念:廣義的指數是指一切說明社會經濟現象數量變動或差異程度的相對數,如動態相對數、比較相對數、計劃完成相對數等都可稱為指數。狹義指數是一種特殊的相對數,也即專指不能直接相加和對比的復雜社會經濟現象綜合變動程度的相對數