第一篇:2014數(shù)據(jù)崗位年終總結(jié)
2014年終工作總結(jié)
隨著2015年鐘聲的臨近,2014年的工作即將進(jìn)入尾聲。在這個(gè)特殊的時(shí)點(diǎn),總結(jié)過去的工作,計(jì)劃未來,就顯得尤為重要!在過去的時(shí)間里,本人在公司各級(jí)領(lǐng)導(dǎo)的正確領(lǐng)導(dǎo)下,在同事們的團(tuán)結(jié)合作和關(guān)心幫助下,較好地完成了2014年的各項(xiàng)工作任務(wù),在工作能力和思想政治方面都有了更進(jìn)一步的提高?,F(xiàn)將2014年取得的成績和存在的不足總結(jié)如下:
一、思想政治表現(xiàn)、品德修養(yǎng)及職業(yè)道德方面
2014年以來,本人認(rèn)真遵守勞動(dòng)紀(jì)律,按時(shí)出勤,有效利用工作時(shí)間;堅(jiān)守崗位,需要加班完成工作按時(shí)加班加點(diǎn),保證工作能按時(shí)完成。愛崗敬業(yè),具有強(qiáng)烈的責(zé)任感和事業(yè)心。積極主動(dòng)學(xué)習(xí)專業(yè)知識(shí),工作態(tài)度端正,認(rèn)真負(fù)責(zé)地對(duì)待每一項(xiàng)工作。
二、工作能力和其它方面
我的工作崗位是數(shù)據(jù)與產(chǎn)品支持,準(zhǔn)確和效率一直都是我的工作宗旨。工作內(nèi)容大體分為四塊:
1.在月初關(guān)賬期間,要保證各地提報(bào)的非派費(fèi)用和倉租、外包工、叉車租金分?jǐn)偟臏?zhǔn)確性與及時(shí)性,同時(shí)不僅需要審查數(shù)據(jù)內(nèi)容填寫的規(guī)范性,還需要確認(rèn)各地是否已經(jīng)提報(bào)。匯總完數(shù)據(jù)后要進(jìn)行初步分析,將不符合提報(bào)要求的費(fèi)用提取出來并聯(lián)系提報(bào)人進(jìn)行確認(rèn),并判斷是否應(yīng)該提報(bào)。將數(shù)據(jù)提交給結(jié)算部門后,結(jié)算在核銷的時(shí)候會(huì)有疑問,這些疑問也需要我來進(jìn)行跟進(jìn)與反饋。
2.關(guān)賬結(jié)束后要進(jìn)行合同外議價(jià)的分析,這部分分析分為同一線路同一承運(yùn)商派車次數(shù)大于3次的分析和有合同但走合同外議價(jià)的分析兩部分,前者分析的目的是為了考慮是否要與此線路簽合同,而后者的分析目的是更新完善合同的報(bào)價(jià)。
3.結(jié)束合同外議價(jià)的分析工作,則需要進(jìn)行單個(gè)TO負(fù)毛利的分析,該分析數(shù)據(jù)主要來源于工盤,包括收入明細(xì),成本明細(xì),派車分?jǐn)偤妥廛嚪謹(jǐn)?。分析完成需要將結(jié)果發(fā)給對(duì)應(yīng)的運(yùn)輸經(jīng)理,查明產(chǎn)生虧損的原因,并提出合理的建議。
4.在以上三部分工作內(nèi)容如期進(jìn)行的時(shí)候,全月不定時(shí)穿插項(xiàng)目初步分析,此部分內(nèi)容主要使用者為項(xiàng)目經(jīng)理、客戶經(jīng)理等。
三、存在的不足
總結(jié)2014來的工作,雖然取得了一定的成績,自身也有了很大的進(jìn)步,但是還存在著以下不足:
一是工作方式上還只是按部就班,雖然融入了一些自己的看法和改進(jìn),但還未提高到更高的層面,沒有從管理層的角度去看待問題。
二是由于工作性質(zhì),與區(qū)域的負(fù)責(zé)人和調(diào)度員會(huì)有頻繁的聯(lián)系,但還不能很好的沉著面對(duì),所以溝通交流能力還需要進(jìn)一步的加強(qiáng)。
三是知識(shí)儲(chǔ)備還不夠,還需要更廣泛的學(xué)習(xí)與增長經(jīng)驗(yàn),成為多方面的人才。
四、2015年的工作打算
2015年我將進(jìn)一步發(fā)揚(yáng)優(yōu)點(diǎn),改進(jìn)不足,拓寬思路,求真務(wù)實(shí),全力做好本職工作。打算從以下幾個(gè)方面開展工作:
一是加強(qiáng)工作統(tǒng)籌。根據(jù)公司領(lǐng)導(dǎo)的年度工作要求,對(duì)全年的工作進(jìn)行具體謀劃,明確內(nèi)容、時(shí)限和需要達(dá)到的目標(biāo),把各項(xiàng)工作有機(jī)地結(jié)合起來,理清工作思路,提高辦事效率,增強(qiáng)工作實(shí)效。
二是加強(qiáng)工作作風(fēng)培養(yǎng)。始終保持良好的精神狀態(tài),發(fā)揚(yáng)吃苦耐勞、知難而進(jìn)、精益求精、嚴(yán)謹(jǐn)細(xì)致、積極進(jìn)取的工作作風(fēng)。
三是作為運(yùn)輸總部與區(qū)域?qū)尤藛T之一,一言一行都代表著公司的形象。不僅在工作上必須做到精確、嚴(yán)謹(jǐn),而且在行為品德上要嚴(yán)格要求自己,樹立良好的個(gè)人形象。所以我要加倍努力的工作為了公司的發(fā)展做出自己的貢獻(xiàn)。
第二篇:數(shù)據(jù)分析崗位筆試題目總結(jié)
阿里巴巴
1、異常值是指什么?請(qǐng)列舉1種識(shí)別連續(xù)型變量異常值的方法? 異常值(Outlier)是指樣本中的個(gè)別值,其數(shù)值明顯偏離所屬樣本的其余觀測值。在數(shù)理統(tǒng)計(jì)里一般是指一組觀測值中與平均值的偏差超過兩倍標(biāo)準(zhǔn)差的測定值.常見的異常值檢驗(yàn)方法如下: ? ? ? ? ? ? 基于統(tǒng)計(jì)的方法 基于距離的方法 基于密度的方法 基于聚類的方法 基于偏差的方法 基于深度的方法
t檢驗(yàn):按照t分布的實(shí)際誤差分布范圍來判別異常值,首先剔除一個(gè)可疑值,然后按t分布來檢驗(yàn)剔除的值是否為異常值。
狄克遜檢驗(yàn)法:假設(shè)一組數(shù)據(jù)有序x1 格拉布斯檢驗(yàn)法:與狄克遜檢驗(yàn)法思想一樣,其檢驗(yàn)公式為: 指數(shù)分布檢驗(yàn): SPSS和R語言中通過繪制箱圖可以找到異常值,分布在箱邊框外部; 2、什么是聚類分析?聚類算法有哪幾種?請(qǐng)選擇一種詳細(xì)描述其計(jì)算原理和步驟。 聚類分析(cluster analysis)是一組將研究對(duì)象分為相對(duì)同質(zhì)的群組(clusters)的統(tǒng)計(jì)分析技術(shù)。聚類分析也叫分類分析(classification analysis)或數(shù)值分類(numerical taxonomy)。聚類與分類的不同在于,聚類所要求劃分的類是未知的。 聚類分析計(jì)算方法主要有:層次的方法(hierarchical method)、劃分方法(partitioning method)、基于密度的方法(density-based method)、基于網(wǎng)格的方法(grid-based method)、基于模型的方法(model-based method)等。其中,前兩種算法是利用統(tǒng)計(jì)學(xué)定義的距離進(jìn)行度量。常見的聚類方法有:K-pototypes算法,K-Means算法,CLARANS算法(劃分方法),BIRCH算法(層次方法),CURE算法(層次方法),DBSCAN算法(基于密度的方法),CLIQUE算法(綜合了基于密度和基于網(wǎng)格的算法); k-means 算法的工作過程說明如下:首先從n個(gè)數(shù)據(jù)對(duì)象任意選擇 k 個(gè)對(duì)象作為初始聚類中心;而對(duì)于所剩下其它對(duì)象,則根據(jù)它們與這些聚類中心的相似度(距離),分別將它們分配給與其最相似的(聚類中心所代表的)聚類;然后再計(jì)算每個(gè)所獲新聚類的聚類中心(該聚類中所有對(duì)象的均值);不斷重復(fù)這一過程直到標(biāo)準(zhǔn)測度函數(shù)開始收斂為止。一般都采用均方差作為標(biāo)準(zhǔn)測度函數(shù).k個(gè)聚類具有以下特點(diǎn):各聚類本身盡可能的緊湊,而各聚類之間盡可能的分開。 其流程如下: (1)從 n個(gè)數(shù)據(jù)對(duì)象任意選擇 k 個(gè)對(duì)象作為初始聚類中心; (2)根據(jù)每個(gè)聚類對(duì)象的均值(中心對(duì)象),計(jì)算每個(gè)對(duì)象與這些中心對(duì)象的距離;并根據(jù)最小距離重新對(duì)相應(yīng)對(duì)象進(jìn)行劃分; (3)重新計(jì)算每個(gè)(有變化)聚類的均值(中心對(duì)象); (4)循環(huán)(2)、(3)直到每個(gè)聚類不再發(fā)生變化為止(標(biāo)準(zhǔn)測量函數(shù)收斂)。 優(yōu)點(diǎn):本算法確定的K 個(gè)劃分到達(dá)平方誤差最小。當(dāng)聚類是密集的,且類與類之間區(qū)別明顯時(shí),效果較好。對(duì)于處理大數(shù)據(jù)集,這個(gè)算法是相對(duì)可伸縮和高效的,計(jì)算的復(fù)雜度為 O(NKt),其中N是數(shù)據(jù)對(duì)象的數(shù)目,K是聚類中心,t是迭代的次數(shù)。 缺點(diǎn):1.K 是事先給定的,但非常難以選定;2.初始聚類中心的選擇對(duì)聚類結(jié)果有較大的影響。3.數(shù)據(jù)標(biāo)準(zhǔn)化技術(shù) 是將數(shù)據(jù)按比例縮放,使之落入一個(gè)小的特定區(qū)間。去除數(shù)據(jù)的單位限制,將其轉(zhuǎn)化為無量綱的純數(shù)值,便于不同單位或量級(jí)的指標(biāo)能夠進(jìn)行比較和加權(quán)。常用的方法有: (1)總和標(biāo)準(zhǔn)化。分別求出各要素所對(duì)應(yīng)的數(shù)據(jù)的總和,以各要素的數(shù)據(jù)除以該要素的數(shù)據(jù)的總和,即 4.缺失值處理方法 1)直接丟棄含缺失數(shù)據(jù)的記錄 如:個(gè)案剔除法,這種方法卻有很大的局限性。它是以減少樣本量來換取信息的完備,會(huì)造成資源的大量浪費(fèi),丟棄了大量隱藏在這些對(duì)象中的信息。當(dāng)缺失數(shù)據(jù)所占比例較大,特別是當(dāng)缺數(shù)據(jù)非隨機(jī)分布時(shí),這種方法可能導(dǎo)致數(shù)據(jù)發(fā)生偏離,從而得出錯(cuò)誤的結(jié)論。2)補(bǔ)缺 A.用平均值來代替所有缺失數(shù)據(jù):均值替換法,均值替換法也是一種簡便、快速的缺失數(shù)據(jù)處理方法。使用均值替換法插補(bǔ)缺失數(shù)據(jù),對(duì)該變量的均值估計(jì)不會(huì)產(chǎn)生影響。但這種方法是建立在完全隨機(jī)缺失(MCAR)的假設(shè)之上的,而且會(huì)造成變量的方差和標(biāo)準(zhǔn)差變小。 B.K-最近距離鄰居法:先根據(jù)歐式距離或相關(guān)分析來確定距離具有缺失數(shù)據(jù)樣本最近的K個(gè)樣本,將這K個(gè)值加權(quán)平均來估計(jì)該樣本的缺失數(shù)據(jù)。C.用預(yù)測模型來預(yù)測每一個(gè)缺失數(shù)據(jù):該方法最大限度地利用已知的相關(guān)數(shù)據(jù),是比較流行的缺失數(shù)據(jù)處理技術(shù)。如:回歸替換法,該方法也有諸多弊端,第一,容易忽視隨機(jī)誤差,低估標(biāo)準(zhǔn)差和其他未知性質(zhì)的測量值,而且這一問題會(huì)隨著缺失信息的增多而變得更加嚴(yán)重。第二,研究者必須假設(shè)存在缺失值所在的變量與其他變量存在線性關(guān)系,很多時(shí)候這種關(guān)系是不存在的。5..Apriori算法和信息熵 信息熵是數(shù)學(xué)中一個(gè)抽象的概念,他表示了信息源的不確定度,這里不妨把信息熵理解成某種特定信息的出現(xiàn)概率,當(dāng)一種信息出現(xiàn)概率更高的時(shí)候,表明它被傳播得更廣泛,或者說,被引用的程度更高。我們可以認(rèn)為,從信息傳播的角度來看,信息熵可以表示信息的價(jià)值。 支持度:Support(A->B)=P(A U B)。支持度揭示了A與B同時(shí)出現(xiàn)的概率。如果A與B同時(shí)出現(xiàn)的概率小,說明A與B的關(guān)系不大;如果A與B同時(shí)出現(xiàn)的非常頻繁,則說明A與B總是相關(guān)的。 置信度(Confidence)的公式式:Confidence(A->B)=P(A | B)。置信度揭示了A出現(xiàn)時(shí),B是否也會(huì)出現(xiàn)或有多大概率出現(xiàn)。如果置信度度為100%,則A和B可以捆綁銷售了。如果置信度太低,則說明A的出現(xiàn)與B是否出現(xiàn)關(guān)系不大。 H(x)= E[I(xi)] = E[ log(2,1/p(xi))] =-∑p(xi)log(2,p(xi))(i=1,2,..n),單位是bit.其中,x表示隨機(jī)變量,與之相對(duì)應(yīng)的是所有可能輸出的集合,定義為符號(hào)集,隨機(jī)變量的輸出用x表示。P(x)表示輸出概率函數(shù)。變量的不確定性越大,熵也就越大,把它搞清楚所需要的信息量也就越大.以頻繁項(xiàng)集{I1,I2,I3}為例產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,最小置信度為40% (1)頻繁項(xiàng)集{I1,I2,I3}的非空子集有{I1,I2},{I1,I3},{I2,I3},{I1},{I2},{I3}(2)產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則 {I1,I2}=>I3 confidence=support({I1,I2,I3})/support({I1,I2})=2/4=0.5 {I1,I3}=>I2 confidence=support(I1,I2,I3)/support(I1,I3)=2/4=0.5 {I2,I3}=>I1 confidence=support(I1,I2,I3)/support(I2,I3)=2/4=0.5 I1=>{I2,I3} confidence=support(I1,I2,I3)/support(I1)=2/6=0.33 I2=>{I1,I3} confidence=support(I1,I2,I3)/support(I2)=2/7=0.29 I3=>{I1,I2} confidence=support(I1,I2,I3)/support(I3)=2/6=0.33 則強(qiáng)關(guān)聯(lián)規(guī)則為:{I1,I2}=>I3;{I1,I3};{I2,I3}=>I1 3、根據(jù)要求寫出SQL(沒有學(xué)習(xí)過,之后的學(xué)習(xí)中需要補(bǔ)) 表A結(jié)構(gòu)如下: Member_ID(用戶的ID,字符型) Log_time(用戶訪問頁面時(shí)間,日期型(只有一天的數(shù)據(jù))) URL(訪問的頁面地址,字符型) 要求:提取出每個(gè)用戶訪問的第一個(gè)URL(按時(shí)間最早),形成一個(gè)新表(新表名為B,表結(jié)構(gòu)和表A一致)參考答案: create table B as select Member_ID, min(Log_time), URL from A group by Member_ID; 5、用戶調(diào)研 某公司針對(duì)A、B、C三類客戶,提出了一種統(tǒng)一的改進(jìn)計(jì)劃,用于提升客戶的周消費(fèi)次數(shù),需要你來制定一個(gè)事前試驗(yàn)方案,來支持決策,請(qǐng)你思考下列問題: a)試驗(yàn)需要為決策提供什么樣的信息? c)按照上述目的,請(qǐng)寫出你的數(shù)據(jù)抽樣方法、需要采集的數(shù)據(jù)指標(biāo)項(xiàng),以及你選擇的統(tǒng)計(jì)方法。 a)試驗(yàn)要能證明該改進(jìn)計(jì)劃能顯著提升A、B、C三類客戶的周消費(fèi)次數(shù)。 b)根據(jù)三類客戶的數(shù)量,采用分層比例抽樣; 需要采集的數(shù)據(jù)指標(biāo)項(xiàng)有:客戶類別,改進(jìn)計(jì)劃前周消費(fèi)次數(shù),改進(jìn)計(jì)劃后周消費(fèi)次數(shù); 選用統(tǒng)計(jì)方法為:分別針對(duì)A、B、C三類客戶,進(jìn)行改進(jìn)前和后的周消費(fèi)次數(shù)的,兩獨(dú)立樣本T-檢驗(yàn) 6.常見的抽樣方法有哪些? 常用的有以下六種類型: 簡單抽樣(Simple sampling) 即簡單隨機(jī)抽樣,指保證大小為n的每個(gè)可能的樣本都有相同的被抽中的概率。例如:按照“抽簽法”、“隨機(jī)表”法抽取訪問對(duì)象,從單位人名目錄中抽取對(duì)象。 優(yōu)點(diǎn): 隨機(jī)度高,在特質(zhì)較均一的總體中,具有很高的總體代表度;是最簡單的抽樣技術(shù),有標(biāo)準(zhǔn)而且簡單的統(tǒng)計(jì)公式。 缺點(diǎn): 未使用可能有用的抽樣框輔助信息抽取樣本,可能導(dǎo)致統(tǒng)計(jì)效率低;有可能抽到一個(gè)“差”的樣本,使抽出的樣本分布不好,不能很好地代表總體。 系統(tǒng)抽樣(Systematic random sampling) 將總體中的各單元先按一定順序排列,并編號(hào),然后按照不一定的規(guī)則抽樣。其中最常采用的是等距離抽樣,即根據(jù)總體單位數(shù)和樣本單位計(jì)算出抽樣距離(即相同的間隔),然后按相同的距離或間隔抽選樣本單位。例如:從1000個(gè)電話號(hào)碼中抽取10個(gè)訪問號(hào)碼,間距為100,確定起點(diǎn)(起點(diǎn)<間距)后每100號(hào)碼抽一訪問號(hào)碼。 優(yōu)點(diǎn): 兼具操作的簡便性和統(tǒng)計(jì)推斷功能,是目前最為廣泛運(yùn)用的一種抽樣方法。 如果起點(diǎn)是隨機(jī)確定的,總體中單元排列是隨機(jī)的,等距抽樣的效果近似簡單抽樣;與簡單抽樣相比,在一定條件下,樣本的分布較好。 缺點(diǎn): 抽樣間隔可能遇到總體中某種未知的周期性,導(dǎo)致“差”的樣本;未使用可能有用的抽樣框輔助信息抽取樣本,可能導(dǎo)致統(tǒng)計(jì)效率低。 分層抽樣(Stratified random sampling) 是把調(diào)查總體分為同質(zhì)的、互不交叉的層(或類型),然后在各層(或類型)中獨(dú)立抽取樣本。例如:調(diào)查零售店時(shí),按照其規(guī)模大小或庫存額大小分層,然后在每層中按簡單隨機(jī)方法抽取大型零售店若干、中型若干、小型若干;調(diào)查城市時(shí),按城市總?cè)丝诨蚬I(yè)生產(chǎn)額分出超大型城市、中型城市、小型城市等,再抽出具體的各類型城市若干。 優(yōu)點(diǎn): 適用于層間有較大的異質(zhì)性,而每層內(nèi)的個(gè)體具有同質(zhì)性的總體,能提高總體估計(jì)的精確度,在樣本量相同的情況下,其精度高于簡單抽樣和系統(tǒng)抽樣;能保證“層”的代表性,避免抽到“差”的樣本;同時(shí),不同層可以依據(jù)情況采用不同的抽樣框和抽樣方法。 缺點(diǎn): 要求有高質(zhì)量的、能用于分層的輔助信息;由于需要輔助信息,抽樣框的創(chuàng)建需要更多的費(fèi)用,更為復(fù)雜;抽樣誤差估計(jì)比簡單抽樣和系統(tǒng)抽樣更復(fù)雜。 整群抽樣(Cluster sampling)(層層深入抽樣,不斷縮小抽樣的范圍) 是先將調(diào)查總體分為群,然后從中抽取群,對(duì)被抽中群的全部單元進(jìn)行調(diào)查。例如:入戶調(diào)查,按地塊或居委會(huì)抽樣,以地塊或居委會(huì)等有地域邊界的群體為第一抽樣單位,在選出的地塊或居委會(huì)實(shí)施逐戶抽樣;市場調(diào)查中,最后一級(jí)抽樣時(shí),從居委會(huì)中抽取若干戶,然后調(diào)查抽中戶家中所有18歲以上成年人。 優(yōu)點(diǎn): 適用于群間差異小、群內(nèi)各個(gè)體差異大、可以依據(jù)外觀的或地域的差異來劃分的群體。 缺點(diǎn): 群內(nèi)單位有趨同性,其精度比簡單抽樣為低。 前面談到抽樣方法的一些基本分類和各自特點(diǎn),需要注意的是,在實(shí)際的運(yùn)用中,一個(gè)調(diào)查方案 常常不是只局限于使用某一種抽樣方式,而根據(jù)研究時(shí)段的不同采用多種抽樣方法的組鴿為實(shí)現(xiàn)不同的研究目的,有時(shí)甚至在同一時(shí)段綜合運(yùn)用幾種抽樣方法。 例如,設(shè)計(jì)一個(gè)全國城市的入戶項(xiàng)目,在抽樣上可以分為幾個(gè)不同的步驟,包括: 1)在項(xiàng)目正式開始前,可以采用判斷抽樣法選出某一城市先作試點(diǎn),在問卷設(shè)計(jì)初期可以采用任意抽樣法選出部分人群進(jìn)行問卷試訪。 2)采用分層隨機(jī)抽樣法,確定全國要分別在多少個(gè)超大型市、多少個(gè)中型市、多少個(gè)小型市實(shí)施(先分出城市的幾個(gè)層次,再依據(jù)研究需要在各層用PPS法選取具體城市) 3)采用簡單抽樣法或PPS抽樣法,確定抽出城市中應(yīng)抽的地塊或居委會(huì); 4)采用整群抽樣法,確定抽出地塊或居委會(huì)應(yīng)訪問的家庭戶; 5)在項(xiàng)目后期,可以采用判斷抽樣法選取某城市進(jìn)行深入研究。 8.置信度與置信區(qū)間 P(x1 ROC曲線指受試者工作特征曲線(receiver operating characteristic curve), 是反映敏感性和特異性連續(xù)變量的綜合指標(biāo),是用構(gòu)圖法揭示敏感性和特異性的相互關(guān)系,它通過將連續(xù)變量設(shè)定出多個(gè)不同的臨界值,從而計(jì)算出一系列敏感性和特異性,再以敏感性為縱坐標(biāo)、(1-特異性)為橫坐標(biāo)繪制成曲線,曲線下面積越大,診斷準(zhǔn)確性越高。在ROC曲線上,最靠近坐標(biāo)圖左上方的點(diǎn)為敏感性和特異性均較高的臨界值。 10.數(shù)據(jù)挖掘步驟 ① 理解數(shù)據(jù)和數(shù)據(jù)的來源(understanding)。 ② 獲取相關(guān)知識(shí)與技術(shù)(acquisition)。 ③ 整合與檢查數(shù)據(jù)(integration and checking)。 ④ 去除錯(cuò)誤或不一致的數(shù)據(jù)(data cleaning)。 ⑤ 建立模型和假設(shè)(model and hypothesis development)。 ⑥ 實(shí)際數(shù)據(jù)挖掘工作(data mining)。 ⑦ 測試和驗(yàn)證挖掘結(jié)果(testing and verfication)。 ⑧ 解釋和應(yīng)用(interpretation and use)。11.如何評(píng)估促銷活動(dòng)? 11.Bayes公式(全概率公式) 探索在已知結(jié)果的情況下,是由哪種原因引起的概率;p(Bi|A)?p(BiA)p(Bi)p(A|Bi)? p(A)p(B)p(A|B)?jj 12.邏輯回歸(分類問題) 邏輯回歸適合求解哪些問題:邏輯回歸本質(zhì)上解決的是分類問題,Logistic回歸的主要用途: ? ? 尋找危險(xiǎn)因素:尋找某一疾病的危險(xiǎn)因素等; 預(yù)測:根據(jù)模型,預(yù)測在不同的自變量情況下,發(fā)生某病或某種情況的概率有多大; ? 判別:實(shí)際上跟預(yù)測有些類似,也是根據(jù)模型,判斷某人屬于某病或?qū)儆谀撤N情況的概率有多大,也就是看一下這個(gè)人有多大的可能性是屬于某病。 11.線性回歸 線性回歸(一元和多元)中對(duì)誤差的假設(shè)都是假定服從均值為0方差為定值的正態(tài)分布,擬合系數(shù)的求解方法可以有最小二乘法梯度下降法等。關(guān)于殘差的假設(shè)為:零均值,同方差,正態(tài)性,不相關(guān),樣本隨機(jī)。 回歸分析的自變量為連續(xù)性變量,而方差分析的自變量為離散型分類變量; 廣義線性回歸于線性回歸的最大區(qū)別是隨機(jī)誤差的分布不一定是正態(tài)分布,與非線性模型的最大區(qū)別是非線性回歸無明確的隨機(jī)誤差分布假定。12.過擬合現(xiàn)象以及避免的方法 所謂過擬合問題:過擬合反映的是在學(xué)習(xí)訓(xùn)練中,模型對(duì)訓(xùn)練樣本達(dá)到非常高的逼近精度, 為了能夠?qū)颖就耆_的分類,使得它的構(gòu)造如此精細(xì)復(fù)雜,規(guī)則如此嚴(yán)格,以至于任何與樣本數(shù)據(jù)稍有不同的文檔它全都認(rèn)為不屬于這個(gè)類別,在測試數(shù)據(jù)上往往顯示出很差的效果.產(chǎn)生過擬合是因?yàn)椋?/p> 1.由于對(duì)樣本數(shù)據(jù),可能存在隱單元的表示不唯一,即產(chǎn)生的分類的決策面不唯一.2.權(quán)值學(xué)習(xí)迭代次數(shù)足夠多(Overtraining),擬合了訓(xùn)練數(shù)據(jù)中的噪聲和訓(xùn)練樣例中沒有代表性的特征.過度擬合解決方法: 1.權(quán)值衰減.它在每次迭代過程中以某個(gè)小因子降低每個(gè)權(quán)值 ,此方法的動(dòng)機(jī)是保持權(quán)值較小,避免weight decay,從而使學(xué)習(xí)過程向著復(fù)雜決策面的反方向偏。 2.減少特征的數(shù)量,有人工選擇,或者采用模型選擇算法 3.驗(yàn)證數(shù)據(jù) 一個(gè)最成功的方法是在訓(xùn)練數(shù)據(jù)外再為算法提供一套驗(yàn)證數(shù)據(jù),應(yīng)該使用在驗(yàn)證集合上產(chǎn)生最小誤差的迭代次數(shù),不是總能明顯地確定驗(yàn)證集合何時(shí)達(dá)到最小誤差.4.Cross-validation with some patterns 交叉驗(yàn)證方法在可獲得額外的數(shù)據(jù)提供驗(yàn)證集合時(shí)工作得很好,但是小訓(xùn)練集合的過度擬合問題更為嚴(yán)重.k-fold交叉方法: 把訓(xùn)練樣例分成k份,然后進(jìn)行k次交叉驗(yàn)證過程,每次使用不同的一份作為驗(yàn)證集合,其余k-1份合并作為訓(xùn)練集合.每個(gè)樣例會(huì)在一次實(shí)驗(yàn)中被用作驗(yàn)證樣例,在k-1次實(shí)驗(yàn)中被用作訓(xùn)練樣例;5.正則化方法 正則化是結(jié)構(gòu)風(fēng)險(xiǎn)最小化策略的實(shí)現(xiàn),是在經(jīng)驗(yàn)風(fēng)險(xiǎn)上加一個(gè)正則化項(xiàng)或懲罰項(xiàng)。正則化項(xiàng)一般是模型復(fù)雜度的單調(diào)遞增函數(shù),模型越復(fù)雜,正則化項(xiàng)就越大,正則化方法的作用是:保留所有特征但減小參數(shù)的取值。 13.監(jiān)督學(xué)習(xí)與非監(jiān)督學(xué)習(xí) 有監(jiān)督學(xué)習(xí):對(duì)具有概念標(biāo)記(分類)的訓(xùn)練樣本進(jìn)行學(xué)習(xí),以盡可能對(duì)訓(xùn)練樣本集外的數(shù)據(jù)進(jìn)行標(biāo)記(分類)預(yù)測。這里,所有的標(biāo)記(分類)是已知的。因此,訓(xùn)練樣本的岐義性低。所有的分類回歸算法都是有監(jiān)督算法,常見的算法有:SVM,KNN,決策樹算法,樸素Bayes算法,神經(jīng)網(wǎng)絡(luò),最小平方擬合,最大熵等。 無監(jiān)督學(xué)習(xí):對(duì)沒有概念標(biāo)記(分類)的訓(xùn)練樣本進(jìn)行學(xué)習(xí),以發(fā)現(xiàn)訓(xùn)練樣本集中的結(jié)構(gòu)性知識(shí)。這里,所有的標(biāo)記(分類)是未知的。因此,訓(xùn)練樣本的岐義性高。聚類就是典型的無監(jiān)督學(xué)習(xí),常見的無監(jiān)督學(xué)習(xí)算法:聚類,PCA,關(guān)聯(lián)規(guī)則算法Aprior,F(xiàn)P-Growth等。14.分位數(shù)3?原則 3?原則:在??-3?,?+3??區(qū)間上的概率密度曲線之下的面積占總面積的99.7%,對(duì)于標(biāo)準(zhǔn)正態(tài)分布有p??3?x?3??0.997。15.常見分布的密度函數(shù)均值和方差 16.常見的區(qū)間估計(jì)以及假設(shè)檢驗(yàn)表 對(duì)于均值的檢驗(yàn),方差已知一般采用U檢驗(yàn)(標(biāo)準(zhǔn)正太分布),方差未知采用T檢驗(yàn)(t分布); 關(guān)于方差的檢驗(yàn),一般都采用卡方檢驗(yàn),若是兩個(gè)正太總體采用F檢驗(yàn); 17.假設(shè)檢驗(yàn) P值(P value)是一個(gè)概率,就是當(dāng)原假設(shè)為真時(shí)所得到的樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的幾率。如果P值很小,說明原假設(shè)發(fā)生的概率很小,我們就有理由拒絕原假設(shè),P值越小,我們拒絕原假設(shè)的理由越充分??傊?,P值越小,表明結(jié)果越顯著,一般以P < 0.05 為顯著,P<0.01 為非常顯著。 Sig值是顯著性指標(biāo),一般大于0.05拒絕原假設(shè),否則接受原假設(shè),一般大于0.05表示差異不顯著,小于0.05表示差異顯著,小于0.01表示差異極顯著。 a:第一類錯(cuò)誤是原假設(shè)真時(shí)拒絕了原假設(shè)(棄真);b:第二類錯(cuò)誤是原假設(shè)錯(cuò)誤時(shí)接受了原假設(shè)(取誤);c=1-b:檢驗(yàn)功效是原假設(shè)錯(cuò)誤拒絕原假設(shè); 第一類錯(cuò)誤與第二類錯(cuò)誤互相矛盾的,檢驗(yàn)功效越大越好即犯第二類錯(cuò)誤的概率竟可能的小。18.數(shù)據(jù)分析的基本流程 2012年工作總結(jié) 3.1本著投資節(jié)約的原則,加強(qiáng)對(duì)公司消防設(shè)施、設(shè)備的精心維護(hù)和保養(yǎng),保證了消防設(shè)施、設(shè)備處于良好備用狀態(tài)。申請(qǐng)配置了部分較為經(jīng)濟(jì)實(shí)用的消防設(shè)施、設(shè)備,為股份公司更換各類滅火器129具、滅火器箱25個(gè)、室內(nèi)消火栓4套、室外地上式消火栓2根、消防水帶16盤;為改制企業(yè)更換各類滅火器112具,滅火器箱21個(gè),室內(nèi)消火栓箱5套,室外消火栓6根,水帶44盤,水槍17支;充裝氧氣瓶235個(gè)、空氣瓶107個(gè),校準(zhǔn)氧氣呼吸器730臺(tái)次,檢測空氣呼吸器132臺(tái)、氧氣氣瓶120個(gè),送檢氧壓表340塊。 3.2堅(jiān)持消防救護(hù)安全巡檢和日常工作,發(fā)現(xiàn)隱患,及時(shí)整改。2012年共進(jìn)行消防、氣防安全月度檢查35人次,查出各類隱患48起,全部督促整改完畢;堅(jiān)持每周對(duì)股份公司和改制單位進(jìn)行氧氣呼吸器巡查、每季度檢查防毒面具,查出的問題都及時(shí)處理。開展氣防安全、防火防爆、冬季防火等專項(xiàng)檢查,共查出各類隱患34起,全部督促整改。堅(jiān)持每周檢查搶險(xiǎn)救援器材,并啟動(dòng)、試驗(yàn)、保養(yǎng);每日車輛例檢,發(fā)現(xiàn)問題,及時(shí)解決。 3.3接警及時(shí),出動(dòng)迅速。共接報(bào)火警22起,出動(dòng)火警消防車31臺(tái)/次,消防人員173人/次(其中公司內(nèi)10次,地方12次);完成各類動(dòng)活作業(yè)監(jiān)護(hù)276次,出動(dòng)消防車輛311臺(tái)/次,消防員1258人次;生產(chǎn)現(xiàn)場救護(hù)6次,出動(dòng)救護(hù)車輛6臺(tái)/次,救護(hù)人員19人/次;搶險(xiǎn)救援9次,出動(dòng)車輛22臺(tái)/次,人員103人/次(其中公司內(nèi)2次,地方7次),成功救出5人。參加瀘州市人員密集場所、賓館以及瀘州市、納溪區(qū)防災(zāi)救災(zāi)綜合演練等,共出動(dòng)消防救護(hù)車輛22臺(tái)次,消防指戰(zhàn)員112人次;其他工作任務(wù)50次,出動(dòng)消防救護(hù)車輛58臺(tái)次,人員265人次。社會(huì)救助2次,救出1人。在“7.23”抗洪搶險(xiǎn)中,共出動(dòng)消防車輛14臺(tái)次、人員84人次投入到抗洪搶險(xiǎn)中,成功救出落水群眾1人、疏散30余人、清洗淤泥路面1500余平方米。 3.4強(qiáng)化消防救護(hù)人員的基本功、適用性訓(xùn)練,不斷提高消防救護(hù)人員專業(yè)技能。全年組織消防救護(hù)人員進(jìn)行了為期6個(gè)月的消防救護(hù)理論和技能訓(xùn)練,其中春訓(xùn)安排在4-6月,秋訓(xùn)9-11月,由中心領(lǐng)導(dǎo)親自任教、督促,抽調(diào)業(yè)務(wù)骨干和當(dāng)班班長擔(dān)任教員進(jìn)行消防業(yè)務(wù)22項(xiàng)基本功及業(yè)務(wù)應(yīng)用性訓(xùn)練。春訓(xùn)結(jié)束已進(jìn)行了考核,目前,秋訓(xùn)工作正在開展中,待訓(xùn)練結(jié)束后完成考核任務(wù)。 3.5加強(qiáng)從業(yè)人員和特種作業(yè)人員的消防救護(hù)安全教育、培訓(xùn),不斷提高他們的消防救護(hù)安全知識(shí)和技能。上半年對(duì)各單位進(jìn)行教育培訓(xùn)9次,培訓(xùn)人員約200余人次。積極宣傳消防好人好事,利用安全生產(chǎn)月和119宣傳日等,大力宣傳消防法律法規(guī)、消防常識(shí)、火場逃生自救技能等。向報(bào)社投稿10余篇。 (統(tǒng)計(jì)起止日期:2011年10月20日—2012年10月19日) 基礎(chǔ)數(shù)據(jù) 1、混凝土重量2500KG/m3 2、鋼筋每延米重量0.00617*d*d 3、干砂子重量1500KG/m3,濕砂重量1700KG/m34、石子重量2200KG/m3 5、一立方米紅磚525塊左右(分墻厚) 6、一立方米空心磚175塊左右 7、篩一方干凈砂需1.3方普通砂 一點(diǎn)不同觀點(diǎn): 1、一般多層砌體住宅: 鋼筋25-30KG/m2,其中經(jīng)濟(jì)適用房為16--18KG/m2.2、一般多層砌體住宅,室外抹灰面積占建筑面積0.5--0.7。 3、一般多層砌體住宅,模版面積占建筑面積1.3--2.2,根據(jù)現(xiàn)澆板多少、柱密度變化很大。 4、一個(gè)磚工一天砌240磚墻1000—1800塊,370或500墻2000--3000塊。 5、鋼筋混凝土重量2200KG/m3,素混凝土重量2100KG/m3。 6、工程石子重量1800KG/m3。 0.617是圓10鋼筋每米重量。鋼筋重量與直徑(半徑)的平方成正比。 G=0.617*D*D/100 每米的重量(Kg)=鋼筋的直徑(mm)×鋼筋的直徑(mm)×0.00617 其實(shí)記住建設(shè)工程常用的鋼筋重量也很簡單φ6=0.222 Kg φ6.5=0.26kg φ8=0.395kg φ10=0.617kg φ12=0.888kg Φ14=1.21kg Φ16=1.58kg Φ18=2.0kg Φ24=2.47kgΦ22=2.98kgΦ25=3.85kgΦ28=4.837kg............Φ12(含12)以下和Φ28(含28)的鋼筋一般小數(shù)點(diǎn)后取三位數(shù),Φ14至Φ25鋼筋一般小數(shù)點(diǎn)后取二位數(shù) Φ6=0.222Kg Φ8=0.395Kg Φ10=0.617Kg Φ12=0.888Kg Φ14=1.21Kg Φ16=1.58Kg Φ18=2Kg Φ20=2.47Kg Φ22=3Kg Φ25=3.86Kg 鋼材理論重量計(jì)算簡式 材料名稱 理論重量W(kg/m) 扁鋼、鋼板、鋼帶 W=0.00785×寬×厚 方鋼 W=0.00785×邊長2 圓鋼、線材、鋼絲 W=0.00617×直徑2 鋼管 W=0.02466×壁厚(外徑--壁厚) 等邊角鋼 W=0.00785×邊厚(2邊寬--邊厚) 不等邊角鋼 W=0.00785×邊厚(長邊寬+短邊寬--邊厚)工字鋼 W=0.00785×腰厚[高+f(腿寬-腰厚)] 槽鋼 W=0.00785×腰厚[高+e(腿寬-腰厚)] 備注: 1、角鋼、工字鋼和槽鋼的準(zhǔn)確計(jì)算公式很繁,表列簡式用于計(jì)算近似值。 2、f值:一般型號(hào)及帶a的為3.34,帶b的為2.65,帶c的為2.26。 3、e值:一般型號(hào)及帶a的為3.26,帶b的為2.44,帶c的為2.24。 4、各長度單位均為毫米 一、普通住宅建筑混凝土用量和用鋼量: 1、多層砌體住宅: 鋼筋30KG/m2 砼0.3—0.33m3/m2 2、多層框架 鋼筋38—42KG/m2 砼0.33—0.35m3/m2 3、小高層11—12層 鋼筋50—52KG/m2 砼0.35m3/m2 4、高層17—18層 鋼筋54—60KG/m2 砼0.36m3/m2 5、高層30層H=94米 鋼筋65—75KG/m2 砼0.42—0.47m3/m2 6、高層酒店式公寓28層H=90米 鋼筋65—70KG/m2 砼0.38—0.42m3/m2 7、別墅混凝土用量和用鋼量介于多層砌體住宅和高層11—12層之間 以上數(shù)據(jù)按抗震7度區(qū)規(guī)則結(jié)構(gòu)設(shè)計(jì) 二、普通多層住宅樓施工預(yù)算經(jīng)濟(jì)指標(biāo) 1、室外門窗(不包括單元門、防盜門)面積占建筑面積0.20—0.24 2、模版面積占建筑面積2.2左右 3、室外抹灰面積占建筑面積0.4左右 4、室內(nèi)抹灰面積占建筑面積3.8 三、施工功效 1、一個(gè)抹灰工一天抹灰在35平米 2、一個(gè)磚工一天砌紅磚1000—1800塊 3、一個(gè)磚工一天砌空心磚800—1000塊 4、瓷磚15平米 5、刮大白第一遍300平米/天,第二遍180平米/天,第三遍壓光90平米/天 四、基礎(chǔ)數(shù)據(jù) 1、混凝土重量2500KG/m3 2、鋼筋每延米重量0.00617*d*d 3、干砂子重量1500KG/m3,濕砂重量1700KG/m3 4、石子重量2200KG/m3 5、一立方米紅磚525塊左右(分墻厚) 6、一立方米空心磚175塊左右 7、篩一方干凈砂需1.3方普通砂 數(shù)據(jù)項(xiàng)目整體流程 1.項(xiàng)目立項(xiàng) 2.招投標(biāo)工作 3.了解客戶具體需求,進(jìn)行成本大概估算依據(jù)以下條件: 1)工作范圍確定(成本核算) ? 客戶要求工作總區(qū)域 2)地市、縣城建成區(qū)地圖數(shù)據(jù)要求(成本核算) ? 各種比例尺具體要求 ? 是否需要三維數(shù)據(jù),及具體要求 ? 是否需要街景數(shù)據(jù),及具體要求 ? 各種點(diǎn)、線、面數(shù)據(jù)采集的具體要求 ? 坐標(biāo)系統(tǒng) ? 投影方式 3)影像類型、分辨率具體要求(成本核算) ? 航片---時(shí)間、范圍、分辨率 ? 衛(wèi)片------時(shí)間、范圍、衛(wèi)星、分辨率 ? 根據(jù)客戶需求是否需要航飛 ? 航飛的精度、范圍 4.項(xiàng)目實(shí)施 1)項(xiàng)目啟動(dòng)會(huì) 2)項(xiàng)目需求說明書編寫,交予外業(yè)組、內(nèi)業(yè)組、質(zhì)檢組、影像組,根據(jù)合同確定項(xiàng)目 時(shí)間節(jié)點(diǎn)。 3)影像的查找 ? 根據(jù)客戶需求的區(qū)域在谷歌地球和專業(yè)影像網(wǎng)站查找影像資源 ? 并圈出矢量圖框 4)影像下載 ? 下載滿足客戶需求的谷歌影像 ? 利用公司已有影像 5)影像采購(成本核算) ? 根據(jù)查找結(jié)果,對(duì)部分區(qū)域影像需要采購,并進(jìn)行采購成本核算 ? 提交采購申請(qǐng),交予采購部門 ? 采購回的影像交予影像處理組進(jìn)行專業(yè)處理 6)內(nèi)外業(yè)范圍確定(成本核算) ? 根據(jù)影像劃分精確的外業(yè)采集范圍,交予外業(yè)采集組,并進(jìn)行成本核算 ? 根據(jù)影像劃分精確的內(nèi)業(yè)生產(chǎn)范圍,交予內(nèi)業(yè)生產(chǎn)組,并進(jìn)行成本核算 7)質(zhì)檢工作的安排和質(zhì)檢方式確定(成本核算) 8)如需要外包,需要核算外包成本 ? 內(nèi)業(yè)外包,外包范圍、時(shí)間、成本 ? 外業(yè)外包,外包范圍、時(shí)間、成本 9)定期跟蹤項(xiàng)目進(jìn)度,與客戶溝通,如有新需求,即與項(xiàng)目協(xié)調(diào)溝通。第三篇:消防 年終 數(shù)據(jù) 總結(jié)
第四篇:基礎(chǔ)數(shù)據(jù)總結(jié)
第五篇:數(shù)據(jù)項(xiàng)目總結(jié)[推薦]