第一篇:數據分析的統計方法選擇小結
數據分析的統計方法選擇小結
完全隨機分組設計的資料
一、兩組或多組計量資料的比較
1.兩組資料:
1)大樣本資料或服從正態分布的小樣本資料
(1)若方差齊性,則作成組t檢驗
(2)若方差不齊,則作t’檢驗或用成組的Wilcoxon秩和檢驗
2)小樣本偏態分布資料,則用成組的Wilcoxon秩和檢驗
2.多組資料:
1)若大樣本資料或服從正態分布,并且方差齊性,則作完全隨機的方差分析。如果方差分析的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:LSD檢驗,Bonferroni檢驗等)進行兩兩比較。
2)如果小樣本的偏態分布資料或方差不齊,則作Kruskal Wallis的統計檢驗。如果Kruskal Wallis的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:用成組的Wilcoxon秩和檢驗,但用Bonferroni方法校正P值等)進行兩兩比較。
二、分類資料的統計分析
1.單樣本資料與總體比較
1)二分類資料:
(1)小樣本時:用二項分布進行確切概率法檢驗;
(2)大樣本時:用U檢驗。
2)多分類資料:用Pearson ?2檢驗(又稱擬合優度檢驗)。
2.四格表資料
1)n>40并且所以理論數大于5,則用Pearson ?2
2)n>40并且所以理論數大于1并且至少存在一個理論數<5,則用校正 ?2或用Fisher’s 確切概率法檢驗
3)n?40或存在理論數<1,則用Fisher’s 檢驗
3.R×C表資料的統計分析
1)列變量為效應指標,并且為有序多分類變量,行變量為分組變量,則用Kruskal Wallis的秩和檢驗
2)列變量和行變量均為無序多分類變量,(1)n>40并且理論數小于5的格子數<行列表中格子總數的25%,則用Pearson ?
(2)n?40或理論數小于5的格子數>行列表中格子總數的25%,則用Fisher’s 確切概率法檢驗 2
配對設計或隨機區組設計
三、兩組或多組計量資料的比較
1.兩組資料:
1)大樣本資料或配對差值服從正態分布的小樣本資料,作配對t檢驗
2)小樣本并且差值呈偏態分布資料,則用Wilcoxon的符號配對秩檢驗
2.多組資料:
1)若大樣本資料或殘差服從正態分布,并且方差齊性,則作隨機區組的方差分析。如果方差分析的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:LSD檢驗,Bonferroni檢驗等)進行兩兩比較。
2)如果小樣本時,差值呈偏態分布資料或方差不齊,則作Fredman的統計檢驗。如果Fredman的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:用Wilcoxon的符號配對秩檢驗,但用Bonferroni方法校正P值等)進行兩兩比較。
四、分類資料的統計分析
四格表資料
1)b+c>40,則用McNemar配對 ?2檢驗
2)b+c?40,則用二項分布確切概率法檢驗,即校正?檢驗 2
第二篇:醫學統計方法小結
統計方法小結
首次分享者:yanyan 已被分享22次 評論(0)復制鏈接 分享 轉載 刪除
一、兩組或多組計量資料的比較 1.兩組資料:
1)大樣本資料或服從正態分布的小樣本資料(1)若方差齊性,則作成組t檢驗
(2)若方差不齊,則作t’檢驗或用成組的Wilcoxon秩和檢驗 2)小樣本偏態分布資料,則用成組的Wilcoxon秩和檢驗 2.多組資料:
1)若大樣本資料或服從正態分布,并且方差齊性,則作完全隨機的方差分析。如果方差分析的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:LSD檢驗,Bonferroni檢驗等)進行兩兩比較。
2)如果小樣本的偏態分布資料或方差不齊,則作Kruskal Wallis的統計檢驗。如果Kruskal Wallis的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:用成組的Wilcoxon秩和檢驗,但用Bonferroni方法校正P值等)進行兩兩比較。
二、分類資料的統計分析 1.單樣本資料與總體比較 1)二分類資料:
(1)小樣本時:用二項分布進行確切概率法檢驗;(2)大樣本時:用U檢驗。
2)多分類資料:用Pearson c2檢驗(又稱擬合優度檢驗)。2.四格表資料
1)n>40并且所以理論數大于5,則用Pearson c2
2)n>40并且所以理論數大于1并且至少存在一個理論數<5,則用校正c2或用Fisher’s 確切概率法檢驗
3)n£40或存在理論數<1,則用Fisher’s 檢驗 3.2×C表資料的統計分析
1)列變量為效應指標,并且為有序多分類變量,行變量為分組變量,則行評分的CMH c2或成組的Wilcoxon秩和檢驗
2)列變量為效應指標并且為二分類,列變量為有序多分類變量,則用趨勢c2檢驗
3)行變量和列變量均為無序分類變量
(1)n>40并且理論數小于5的格子數<行列表中格子總數的25%,則用Pearson c2(2)n£40或理論數小于5的格子數>行列表中格子總數的25%,則用Fisher’s 確切概率法檢驗 4.R×C表資料的統計分析
1)列變量為效應指標,并且為有序多分類變量,行變量為分組變量,則CMH c2或Kruskal Wallis的秩和檢驗 2)列變量為效應指標,并且為無序多分類變量,行變量為有序多分類變量,作none zero correlation analysis的CMH c2
3)列變量和行變量均為有序多分類變量,可以作Spearman相關分析 4)列變量和行變量均為無序多分類變量,(1)n>40并且理論數小于5的格子數<行列表中格子總數的25%,則用Pearson c2(2)n£40或理論數小于5的格子數>行列表中格子總數的25%,則用Fisher’s 確切概率法檢驗
三、Poisson分布資料
1.單樣本資料與總體比較:
1)觀察值較小時:用確切概率法進行檢驗。2)觀察值較大時:用正態近似的U檢驗。2.兩個樣本比較:用正態近似的U檢驗。
配對設計或隨機區組設計
四、兩組或多組計量資料的比較 1.兩組資料:
1)大樣本資料或配對差值服從正態分布的小樣本資料,作配對t檢驗 2)小樣本并且差值呈偏態分布資料,則用Wilcoxon的符號配對秩檢驗 2.多組資料:
1)若大樣本資料或殘差服從正態分布,并且方差齊性,則作隨機區組的方差分析。如果方差分析的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:LSD檢驗,Bonferroni檢驗等)進行兩兩比較。
2)如果小樣本時,差值呈偏態分布資料或方差不齊,則作Fredman的統計檢驗。如果Fredman的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:用Wilcoxon的符號配對秩檢驗,但用Bonferroni方法校正P值等)進行兩兩比較。
五、分類資料的統計分析 1.四格表資料
1)b+c>40,則用McNemar配對c2檢驗或配對邊際c2檢驗 2)b+c£40,則用二項分布確切概率法檢驗 2.C×C表資料:
1)配對比較:用McNemar配對c2檢驗或配對邊際c2檢驗 2)一致性問題(Agreement):用Kap檢驗
變量之間的關聯性分析
六、兩個變量之間的關聯性分析 1.兩個變量均為連續型變量
1)小樣本并且兩個變量服從雙正態分布,則用Pearson相關系數做統計分析 2)大樣本或兩個變量不服從雙正態分布,則用Spearman相關系數進行統計分析 2.兩個變量均為有序分類變量,可以用Spearman相關系數進行統計分析
3.一個變量為有序分類變量,另一個變量為連續型變量,可以用Spearman相關系數進行統計分析
七、回歸分析
1.直線回歸:如果回歸分析中的殘差服從正態分布(大樣本時無需正態性),殘差與自變量無趨勢變化,則直線回歸(單個自變量的線性回歸,稱為簡單回歸),否則應作適當的變換,使其滿足上述條件。2.多重線性回歸:應變量(Y)為連續型變量(即計量資料),自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。如果回歸分析中的殘差服從正態分布(大樣本時無需正態性),殘差與自變量無趨勢變化,可以作多重線性回歸。
1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素
2)實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
3.二分類的Logistic回歸:應變量為二分類變量,自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。1)非配對的情況:用非條件Logistic回歸
(1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素
(2)實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用 2)配對的情況:用條件Logistic回歸
(1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素
(2)實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
4.有序多分類有序的Logistic回歸:應變量為有序多分類變量,自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素
2)實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
5.無序多分類有序的Logistic回歸:應變量為無序多分類變量,自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素
2)實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
八、生存分析資:要求資料記錄結局和結局發生的時間(如;死亡和死亡發生的時間)
1.用Kaplan-Meier方法估計生存曲線 2.大樣本時,可以壽命表方法估計
3.單因素可以用Log-rank比較兩條或多條生存曲線 4.多個因素時,可以作多重的Cox回歸
1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素
2)實驗性研究:在保持主要研究因素變量(干預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
第三篇:數據分析基礎方法
數據分析基礎方法—分拆
對于很多沒有數學基礎和數據敏感度的人而言,面對龐雜的數據常常感到頭痛。為了得到更深入的信息,我們需要用到很多的分析工具,比如googleanalytics、百度統計、站長工具以及自己網站分析系統,在收集客觀的數據后,我們需要對數據進行分析,這里我們介紹最常用和基礎的分析方法:拆分。(以下內容摘自艾瑞學院《蛻變——傳統企業如何向電子商務轉型》)
一、看數據分布
最簡單的拆分方法就是不看平均值,看數據分布。因為凡是“總和”或者“平均”類的統計數據都會丟失掉很多重要的信息。例如李嘉誠來我們公司參觀,這一時間我們公司辦公室里的“平均資產”就會因為李嘉誠一個人被抬高到人均幾億身家。如果有人根據這個“平均資產”數據來判定說我們辦公室的人都是豪華游艇的潛在顧客,這自然是荒謬的。
可實際上,我們每天都在做著類似的判斷,比如當我們聽到說顧客“平均在線時間”是3分34秒,就可能根據這個時間來進行業務決策,例如設置“停留時間超過3分34秒為高價值流量”,或者設置系統,在用戶停留了3分34秒還沒有下單的話就彈出在線客服服務窗口。我們設置這些時間點的根據是“平均停留時間”,在我們的想象里,我們的每個顧客都有著“平均的”表現,停留時間大致都是3分34秒,可實際上真正的顧客訪問時間有長有短,差別巨大:
從上圖我們可以看到絕大部分訪問時間非常短暫,而少數人訪問了大量時間,綜合起來平均停留時間3分多,用
3分34秒來做為一個關鍵判定點是不合適的。
再舉一個例子,比如我們看到上個月平均訂單金額500元/單,這個月也是500元/單,可能會覺得數字沒有變化。可是實際上有可能上個月5萬單都是400~600元,而這個月5萬單則是2萬單300元,2萬單400元,5千單500元,5000單超過2500元——客戶購買習慣已經發生了巨大變化,一方面可能是客戶訂單在變小(可能是因為產品單價下降,采購數量減少,或者客戶選擇了比較便宜的替代品),另一方面出現了一些相對較大的訂單(可能是中小企業采購,或者是網站擴充產品線見效了)。——看數據分布可以讓我們更容易發現這些潛在的變化,及時的做出應對。
二、拆因子
很多時候我們很難直接從數據變化中分析出具體的原因,這時可以考慮拆分因子,將問題一步步細化找尋原因。
例如網站轉化率下降,我們要找原因。因為“轉化率”=“訂單”/“流量”,所以“轉化率”下降的原因很可能是“訂單量下降”,“流量上升”,或者兩者皆是。按照這個思路我們可能發現主要的原因是“流量上升”和“訂單量升幅不明顯”,那么下面我們就可以來拆解“流量”的構成,例如拆成“直接訪問流量”、“廣告訪問流量”和“搜索引擎訪問流量”再看具體是哪部分的流量發生了變化,接下來再找原因。
這時我們可能看到說是搜索引擎訪問流量上升,那就可以再進一步分析是付費關鍵詞部分上升,還是自然搜索流量上升,如果是自然流量,是品牌(或者網站名相關)關鍵詞流量上升,還是其他詞帶來的流量上升——假如最后發現是非品牌類關鍵詞帶來的流量上升,那么繼續尋找原因——市場變化(淡季旺季之類),競爭對手行動,還是自身改變。假如剛好在最近把產品頁面改版過,就可以查一下是不是因為改版讓搜索引擎收錄變多,權重變高。接下來再分析自己到底哪里做對了幫助網站SEO了(比如把頁面導航欄從圖片換成了文字),把經驗記下來為以后改版提供參考;另一方面還要分析哪里沒做好(因為新增流量但是并沒有相應增加太多銷售),研究怎樣讓“產品頁面”更具吸引力——因為對很多搜索引擎流量來說,他們對網站的第一印象是產品頁面,而不是首頁。
三、拆步驟
還有些時候,我們通過拆分步驟來獲取更多信息。
舉兩個例子:第一個例子:兩個營銷活動,帶來一樣多的流量,一樣多的銷售,是不是說明兩個營銷活動效率差不多?
如果我們把每個營銷活動的流量拆細去看每一步,就會發現不一樣的地方。營銷活動B雖然和營銷活動A帶來了等量的流量,可是這部分流量對產品更感興趣,看完著陸頁之后更多的人去看了產品頁面。可惜的是雖然看產品的人很多,最后轉化率不高,訂單數和營銷活動A一樣。
這里面還可以再深入分析(結合之前提到的分析方法,和下一章要說的細分方法),但是光憑直覺,也可以簡單的得出一些猜測來,例如兩個營銷活動的顧客習慣不太一樣,營銷活動B的著陸頁設計更好,營銷活動B的顧客更符合我們的目標客戶描述、更懂產品——但是我們的價格沒有優勢等等這些猜想是我們深入進行分析,得出行動方案的起點。至少,它可以幫助我們
更快的累計經驗,下次設計營銷活動的時候會更有的放矢,而不是僅僅寫一個簡單report說這兩個營銷活動效果一樣就結案了。(注:這是個簡化的例子,實際上還可以分更多層)
第二個例子可能更常見一些,比如網站轉化率下降,我們可以拆成這樣的漏斗:
這樣拆好之后,更能清楚地看到到底是哪一步的轉化率發生了變化。有可能是訪客質量下降,都在著陸頁流失了,也可能是“購物車–>登錄”流失了(如果你把運費放到購物車中計算,很可能就看到這一步流失率飆升),這樣拆細之后更方便我們分析。
曾經有一個例子就是轉化率下降,市場部查流量質量發現沒問題,產品經理查價格競爭力也沒問題——最后發現是技術部為了防止惡意注冊,在登錄頁面加了驗證碼(而且那個驗證碼極度復雜),降低了“登錄頁面–>填寫訂單信息“這一步的轉化率。
四、細分用戶族群
很多時候,我們需要把用戶行為數據拆分開,看不同族群的人有什么不同的表現,通過比較異同來獲取更多的洞察。從實踐出發,客戶族群細分的方法主要有三種:
按照客戶屬性細分:根據客戶“是誰”來劃分族群,例如把客戶分成“新客戶”和“老客戶”。按照客戶行為來細分:根據客戶上網行為來細分,例如把客戶分成“瀏覽服裝專區的客戶”和“瀏覽數碼專區的客戶”。很多時候“根據客戶行為”和“根據客戶屬性”這兩者會混在一起,比如一個客戶的行為是“每個月都來買一次東西而且只買最貴的”,可能我們就會在數據庫里給他標記上“有錢人”,之后“有錢人”就成了這個客戶的屬性之一。
按照最終結果來細分:其實是“按照客戶行為來細分”的一種,但是它適用性非常廣,而且用起來非常方便,所以單獨拿出來講一下。對于這個細分方法,本質上就是根據結果把流量分成“好人”和“壞人”,然后一路比較“好人”和“壞人”從接觸到最后轉化或離開這整個過程中所經歷過的事情有沒有什么顯著的不同,如果有,則進一步深入考慮這些不同點是否就是造成他們一些是“好人”一些是”壞人“的原因,再想辦法優化這些經歷,盡可能增加”好人“這個族群。
第四篇:數據統計與分析演講稿
演講稿
以下是我們的數據統計與分析
1、通過分析原始數據,我們發現湛師運動人數多,對運動設施的需求量大
由圖表一我們可以看到:
高達45人的受訪者一周運動次數在1—2次間,30人在5次以上,還有8人一周基本沒有運動,經過計算湛師學生一周運動量次數至少有兩萬次。另外周一至周五,運動場在日間基本是不開放的,而且體育館或籃球場總是有體育課,學生們也有課,所以大家基本都在周六日或晚上運動,人流量太大。因此我校對于運動設施的需求較大。
2、其次,我們發現湛師學生不進行運動的原因與運動場地的問題有較大的聯系
通過圖表二,我們可以看出受訪者不進行的運動的原因有很多,其中以自身因素不進行運動是不進行運動的原因,但是也有32人認為有場地數量少的因素,將近三分之一的人數,還有13人認為是運動場地遠,還有其他的客觀因素。由此可以看出湛師運動設施的場地數量和分布位置對大部分湛師人的運動次數有一定的影響。
3、我們的調查問卷還涉及到湛師學生對湛師運動設施的了解程度
由圖表可知,超過半數人對運動設施的了解程度一般,但還是有21人認為他們不了解湛師的運動設施,只有23人認為他們在了解程度以上的。由此可以看出大部分湛師人對湛師的運動設施都處于一知半解的狀態甚至是不了解,因此湛師應該加大對湛師運動設施的宣傳力度,加深湛師人對運動設施的了解。
4、關于目前湛師運動設施存在的問題
從表格與圖中可看出,最多人人為學校運動設施存在的最大的問題是運動設施的運動數量較少,其次是有33%的被調查者認為湛師的運動設施年久失修,有損失,接著也有學生認為運動設施還存在人為損失的問題,最后是7%的學生覺得游泳館的收費是有問題的。經過調查我們不難看出學校在運動設施方面還存在著許多的問題,最大的問題就是設施的年久失修和數量過少的問題,所以建議學校可適量地增加運動設施,定期地派人進行維修,光靠學校的力量是不足以維護好學校的設施,我們同學自己也要維護好這些公共的財產。
5、此外關于湛師學生認為數量不足的運動場地
從表和圖中可以看出,大多數的人即27%的人認為學校的羽毛球場的數量不足,還有相當一部分人認為游泳館的場地有限,占到19%,覺得籃球場和乒乓球場數量不多的人數差不多相同,最后剩下少部分人覺得其它運動場地的數量少,比如排球場、田徑場和足球場。大多數同學反映,不是他們不想運動,而是運動場地實在是有限,或者是場地離中心地區較遠,較偏僻,這應該引起學校的重視。
6、表六是湛師學生對湛師運動設施的愛惜情況
通過表與圖可知,在調查身邊的同學對運動設施的愛惜情況的問題上,明顯可看出絕大多數人都覺得身邊的同學對運動設施的愛惜情況是一般般,有17%的人的身邊的同學是愛惜運動設施的,剩下的10%的人的身邊的同學是不愛惜運動設施的。愛惜設施的程度與自身的素質有關,不愛惜設施的同學還是大有人在,但我們維護好公共設施時才能更好的維護自己的利益,我們自己才能更多的享受運動給我們帶來的好處。
7、表七是學校在關于運動設施的問題上與學生溝通的程度
如表7和圖所示,大學生們在關于學校在有關設施問題上有沒有及時有效地與同學溝通的問題上,給出了自己的意見。68%的同學認為學校在運動設施的問題上很少與學生及時有效地溝通,同時也占了較大比重的28%的同學表示沒怎么留意,很少的同學認為學校在關于運動設施的問題上與學生溝通較多,占到被調查者的4%。所以希望學校可以在以后有關設施的問題上多與同學溝通,可以派幾名代表與學校進行對話,可傳達出學生的意見。
8、表八是湛師學子對現有的運動設施改進的看法
由表8與圖可得出,大學生們對我校現有的運動設施積極地提出了自己的看法,看來大學生對自身有切實利益的問題還是比較關心的。我們不難看出,43%的學生認為學校目前應該著手完善室內室外的運動設施,接著認為學校應該加派人手維護運動設施和應該增添更多的休息區的人數是一樣的,最后也有相當一部分也就是17%的學生認為學校應該加大宣傳,增強學生維護公共設施的意識,很少有學生選擇其它的。現在大學生運動的群體不是特別高,這也跟學校對運動設施方面的關注度,這應該引起學校的重視,通過有效的手段提高學生對運動的重視。
通過本次數據分析我們的除了以下調查結論與建議
1、調查結論:(1)由本次調查可知湛師學生對運動設施的需求量較大,而湛師學生不想運動的原因與目前湛師運動設施所存在的問題有很大的關系。(2)湛師運動設施存在的問題主要是運動設施的數量少與設施年久失修,有嚴重損傷,當然運動設施的破損與學生對湛師運動設施的愛惜程度有很大的關系,因為很多同學對湛師運動設施的愛惜程度都是一般般,不愛惜設施的同學也不少。(3)學校在關于運動設施的問題上很少與學生進行溝通,大部分學生對于湛師運動設施的了解程度都是一般般,甚至是不了解,這使得很多關于運動設施的問題得不到及時的解決與完善,也使得學生們對運動設施的需求與建議得不到滿足與答復。
2、建議:存在問題是難免的,但最重要的是怎樣去利用有效的途徑去解決問題。通過調查,我們可以給出小小的建議。現在提倡全民運動,因此學生對運動設施的需求還是比較較大的,所以學校可適量地增加運動設施。為了提高學生的運動次數與質量,以后學校可把運動設施建設在人流較多且地理位置靠近中心的地方,這樣人們運動起來也更加的方便。而且對運動設施進行定期的維修也是非常有必要的,破破爛爛的運動設施鉤不起人們運動的欲望,加大宣傳保護運動設施的重要程度。不過做運動的人們更應該愛護這些公共的設施,如果人人都把這些設施當做是自己家的財產,那么我想人們任何時候都可享受到很好的運動效果。最后想說的是決策問題,進行有關的運動設施的建設,學校可通知學生代表參加有關建設問題的會議,集思廣益,這樣才更有利于學校的管理。
第五篇:數據統計與分析心得
數據統計與分析心得
(第三組)
數據統計與分析是一個比較復雜、比較費時和費力的工作,在工作中,小組成員既要有明確的獨立的分工,也要有集體的團隊的協作精神。每個人在統計數據時都要做到認真嚴謹、實事求是,要有耐心而不是用一顆浮躁的心來對待工作。在數據分析中,要用一顆客觀的、真實的心來做好對統計數據的客觀分析與評價。這樣才能使問卷調查統計出來的數據真實有效,為下一步的工作實施和決策做好準備。
我們這次東華理工大學校園文化調查問卷印發的總數為210份,其中有6份未收回,實際收回問卷共204份,其中無效問卷(被調查人未填寫性別、專業、年級等相關信息)有5份,則實際有效問卷為199份。合格問卷占總數的94.76%,問卷收回率較高。在接下來的數據統計與分析中,則以此199份有效問卷的數據來統計,并計算數據結果。
此次參與問卷調查的年級有11級大
一、10級大
二、09級大三的學生,08級大四學生未參與調查,其中問卷調查又以大一學生為主,有186人,占總人數的93%;而大二學生只有8人,占總人數的4%,大三學生只有5人,占總人數的3%。在此次參與問卷調查的性別比中,女生有136人,占總人數(199人)的68.34%;男生有63人,占總人數的31.66%。問卷調查的女生占有多數。
此外,這次問卷所調查的專業有15個專業,其中文科類專業(廣告、法學、對外漢語、英語)調查人數有133人,所占總人數的百分比為66.83%;經濟類專業(國際貿易、旅游管理、會計、市場營銷、物流管理)調查人
數有50人,占總人數的百分比為25.12%;理科類專業(自動化、科工程、土木工程、資源勘探、信息管理、測繪工程)調查人數有16人,占總人數的百分比為8.05%。調查對象以文科類同學占多數。
在這次數據統計與分析過程中,我們發現了問卷還存在一些問題,但總體還是好的。首先,問卷中存在漏字的情況,主要是出題組印刷前沒有認真做好校對的工作造成的;其次,選項有的出現錯亂及其選項中沒有明確注明題目是多選或者單選的題目,因此在我們數據統計過程中也帶來了一些困惑,但經過向出題組的詢問,我們還是明確了題目的多選與單選問題。但我想,這對于我們的調查所統計出來結果,其實際真實效果多少會有一些水分的。再次,就是我們問卷的發放組沒有考慮我們要調查的比例的分配,比如年級的比例分配、專業類別的比例分配、男女性別的比例分配。這樣就造成我們統計分析出來的數據有一點不合理性、不太全面性。此外,我們數據統計與分析小組中也出現過一些問題,由于我們從來沒有做過數據統計與分析的工作,因此缺乏經驗,在統計數據過程中其實每一道題也有不不合理的作答選項,而我們第一次都把他們統計上了,沒有考慮到每道題都有回答無效的答案。而后來的結果是,又讓我們成員重新統計了一次,這次考慮了把每道題目中無效答案剔除后,再統計出每道題目中有效答案的選擇數量。
數據統計與分析不但要有團隊協作的精神,而且還要會懂電腦,利用Excel操作系統來計算出最終的數據結果。這就在不同的兩個方面考查了我們當代大學生應有的素質。在這次數據統計與分析過程中,我們組成員都表現得積極認真,按時按量地完成了我們每個人所分配的任務。因此在這次數據統計與分析中我們組雖然花費了有一定的時間,但還是比較少的,而且成功地完成了這次統計任務。這也為下一組的成員的論文寫作及其總結工作爭取了更多的時間。在使用Excel操作系統時,由于有些成員不會使用此操作,所以給其他會操作的成員增加了工作量。在此也讓這些不會使用電腦操作系統的同學能夠體會到對于掌握好電腦基礎知識的重要性。希望他們都能夠好好地學習這些知識,為今后的工作和學習帶來更多的便利。
這次問卷調查的數據統計與分析實踐活動,讓每個同學都有收獲。有的收獲了出題時應當注意的問題,有的收獲了問卷調查中所獲得的經驗,有的收獲了同學們之間的友誼,使同學之間的交流與溝通在實踐活動中無形當中就增加了,有的〃〃〃〃〃〃
總之,我們都認為這次問卷調查實踐活動是一次成功的實踐活動,因為在這次調查活動中,我們都看到了每一個同學都在努力的把事情做的更好,都認真地對待自己所分配到的任務,都在積極的討論與交流。
另:附第三組成員數據統計與分析的工作圖片