久久99精品久久久久久琪琪,久久人人爽人人爽人人片亞洲,熟妇人妻无码中文字幕,亚洲精品无码久久久久久久

臨床數(shù)據(jù)處理和統(tǒng)計分析(精選5篇)

時間:2019-05-14 02:02:14下載本文作者:會員上傳
簡介:寫寫幫文庫小編為你整理了多篇相關(guān)的《臨床數(shù)據(jù)處理和統(tǒng)計分析》,但愿對你工作學(xué)習(xí)有幫助,當(dāng)然你在寫寫幫文庫還可以找到更多《臨床數(shù)據(jù)處理和統(tǒng)計分析》。

第一篇:臨床數(shù)據(jù)處理和統(tǒng)計分析

數(shù)據(jù)處理和統(tǒng)計分析

數(shù)據(jù)處理和統(tǒng)計分析

數(shù)據(jù)處理的目的在于氫來自受試者的當(dāng)選據(jù)迅速、完整、無誤地收入報告,所有涉及數(shù)據(jù)管理的各種步驟均需記錄在案,以備審核人員對試驗實(shí)施過程和收集的數(shù)據(jù)的質(zhì)量進(jìn)行稽查或檢查。申辦者應(yīng)當(dāng)保證有滿意的計算機(jī)數(shù)據(jù)庫的維護(hù)和支持程序。開始試驗前需設(shè)計可被計算閱讀與輸入的臨床報告表及相應(yīng)的計算機(jī)程序。

在臨床試驗的設(shè)計與結(jié)果的表達(dá)與分析過程中,必須采用規(guī)范的統(tǒng)計學(xué)分析。因此,臨床研究從設(shè)計試驗方案到完成總結(jié)報告的各階段都要有生物統(tǒng)計學(xué)專業(yè)人員參加。他們在臨床試驗中的作用包括下列內(nèi)容:

? 參與制訂和審查試驗方案:包括試驗設(shè)計、確定樣本量和把握度、在防止試驗偏性的方法(如盲法和隨機(jī)技術(shù))中進(jìn)行統(tǒng)計學(xué)計算、隨機(jī)化及設(shè)盲、制訂入選和排除標(biāo)準(zhǔn)、確定伴隨或預(yù)兆性因素、制訂統(tǒng)計分析計劃(Statistical analysis plan,SAP)等; ? 參與CRF和數(shù)據(jù)庫的設(shè)計和審查; ? 建立基線標(biāo)準(zhǔn); ? 準(zhǔn)備原型分析; ? 準(zhǔn)備分析程序; ? 參與數(shù)據(jù)監(jiān)查和篩選; ? 對試驗數(shù)據(jù)進(jìn)行統(tǒng)計分析; ? 起草統(tǒng)計分析報告; ? 參與起草總結(jié)報告等。

臨床試驗方案中要寫明統(tǒng)計學(xué)處理方法,此后的任何變動必須在臨床試驗總對報告中記述并說明理由。若需做中期分析,應(yīng)說明理由及規(guī)程。統(tǒng)計分析結(jié)果的表達(dá)著重于對臨床意義的理解。對治療作用的評價應(yīng)將可信限與顯著性檢驗的結(jié)果一并予以考慮。

研究者和申辦者必須保證收集的數(shù)據(jù)的高質(zhì)量,統(tǒng)計人員則必須保證數(shù)據(jù)處理的完整性。統(tǒng)計分析的結(jié)果和發(fā)現(xiàn)要寫入總結(jié)報告。統(tǒng)計分析中若發(fā)現(xiàn)有遺漏的、未用的或我余的資料應(yīng)加以記錄和說明。臨床試驗的統(tǒng)計報告必須與臨床總結(jié)報告相符。通常在試驗結(jié)束時,申辦者與研究者協(xié)商后安排有資格的生物統(tǒng)計學(xué)專業(yè)人員對試驗數(shù)據(jù)進(jìn)行統(tǒng)計學(xué)處理。應(yīng)當(dāng)保證統(tǒng)計人員有足夠的時間在數(shù)據(jù)一收到后就開始進(jìn)行統(tǒng)計學(xué)分析。多方人員在研究過程中的良好合作和及時報告有助于避免研究結(jié)束時數(shù)據(jù)處理上的無謂延誤。數(shù)據(jù)的輸入往往需要較多的時間,建立計算機(jī)數(shù)據(jù)庫可使統(tǒng)計分析和分析報告很快完成。

應(yīng)當(dāng)在數(shù)據(jù)輸入和處理的所有階段進(jìn)行數(shù)據(jù)質(zhì)量保證檢查。采用數(shù)據(jù)雙輸方法可減少輸入錯誤。統(tǒng)計人員也可以在最后分析之前進(jìn)行一次人工抽查(抽查率應(yīng)達(dá)10%~20%)。

第二篇:GPS數(shù)據(jù)處理

《GPS數(shù)據(jù)處理》課程總結(jié)報告

班級:地101 學(xué)號:2103071011291 姓名:常悅

成績:

北京建筑工程學(xué)院.測繪與城市空間信息學(xué)院

二零一三年.五月 《GPS數(shù)據(jù)處理》課程總結(jié)報告

1.GPS數(shù)據(jù)采集的基本作業(yè)流程

2.GPS數(shù)據(jù)處理涉及的計算公式

第 2 頁,共 8 頁

《GPS數(shù)據(jù)處理》課程總結(jié)報告

基線向量解:

3.GPS數(shù)據(jù)處理的質(zhì)量檢驗方法與公式

基線向量的改正數(shù)。

根據(jù)基線向量的改正數(shù)的大小,可以判斷出基線向量中是否含有粗差。具體判定依據(jù),若:,則認(rèn)為基線向量中不含有粗差;反之,則含有粗差。鄰點(diǎn)的中誤差和相對中誤差。

若在進(jìn)行質(zhì)量評定時,發(fā)現(xiàn)有質(zhì)量問題,需要根據(jù)具體情況進(jìn)行處理,如果發(fā)現(xiàn)構(gòu)成GPS網(wǎng)的基線中含有粗差,則需要采用刪除含有粗差的基線、重新對含有粗差的基線進(jìn)行解算或重測含有粗差的基線等方法加以解決;如果發(fā)現(xiàn)個別起算數(shù)據(jù)有質(zhì)量問題,則應(yīng)該放棄有質(zhì)量問題的起算數(shù)據(jù)

公式:

4.GPS數(shù)據(jù)處理的基本流程

基本流程:

1、數(shù)據(jù)預(yù)處理

與外業(yè)記錄對照,修改觀測文件中的一些參數(shù):

(1)檢查外業(yè)觀測數(shù)據(jù)

第 3 頁,共 8 頁 《GPS數(shù)據(jù)處理》課程總結(jié)報告

(2)點(diǎn)名的編輯

(3)天線高檢查或編輯

(4)。。

2、基線解算

(1)設(shè)置基線解算的參數(shù)(使用的衛(wèi)星,衛(wèi)星高度角,對流層電離層模型 等)

(2)基線解算

(3)察看基線報告,不同的軟件成果質(zhì)量判斷不一樣,LGO是看各個檢驗

(4)對于有問題的基線或其殘差過大,可采用開窗刪星等手段處理

(5)繼續(xù)解算,重復(fù)(2)(3)(4)過程,直到得到滿意的結(jié)果

3、無約束平差

(1)設(shè)置平差參數(shù)

(2)平差分析

(3)計算閉合環(huán)

(4)平差

(5)看平差報告

4、約束平差

(1)新建橢球投影坐標(biāo)系

(2)導(dǎo)入控制點(diǎn)

(3)控制點(diǎn)匹配

(4)約束平差

5.GPS商業(yè)處理軟件的使用

5.1 Trimble軟件的使用

1.使用數(shù)據(jù)模塊建立項目 2.輸入樣本文件

3.導(dǎo)入NGS成果表文件 4.導(dǎo)入GPS數(shù)據(jù)文件 5.properties窗口查看實(shí)體 6.處理gps潛在基線 7.評估結(jié)算結(jié)果

8.查閱gps基線處理報告 9.使用時序器處理星歷 10.計算gps環(huán)閉合差 11.計算最小約束網(wǎng)平差

12.查看RTK和常規(guī)測量數(shù)據(jù) 13.輸出數(shù)據(jù)

5.2 Compass軟件的使用 安裝,注意安裝完畢按照說明進(jìn)行破解。并且不能安裝在中文目錄名內(nèi),而且英文字符 不

第 4 頁,共 8 頁 《GPS數(shù)據(jù)處理》課程總結(jié)報告

能超過 8 位。安裝完畢運(yùn)行首先進(jìn)行單位設(shè)置,推薦使用國際單位 SI 標(biāo)準(zhǔn),方法是點(diǎn)擊 Utilities 菜 單,選擇 units 再調(diào)入預(yù)設(shè)的 SI 單位集合即可,注意此時狗腿度的單位是 度/30m,可 以根據(jù)個人習(xí)慣進(jìn)行調(diào)整。第一次使用首先建立一個新公司(company)如二勘、六勘等等,注意在 company 對話 框內(nèi)一定要選擇中國鉆井行業(yè)規(guī)定的標(biāo)準(zhǔn)-曲率半徑法(Radius of Curvature),并且根 據(jù)需要選擇坐標(biāo)的原點(diǎn)(Co-ordinate)是區(qū)塊site的中心還是井口(slot)的中心。如 果不涉及防碰,不需要比較兩井的相當(dāng)位置時,建議選擇井口的中心作為原點(diǎn)。4 建立一個油田(field)如勝利、大慶、塔指等等。建立一個區(qū)塊(site)如哈得、塔河等等??梢暂斎氡緟^(qū)塊的中心坐標(biāo)(如果愿意)。6 建立一口井(well),名字用井號如:輪古 37 等等,并輸入本井的井口坐標(biāo)。建一個軌道(wellpath),一口井可以建立數(shù)個軌道。并可以指定其中的一個為確定的(definitive)軌道。選擇 EDIT編輯-Wellpath(軌道)-targets(靶點(diǎn))菜單(或直接點(diǎn)工具欄的按鈕),進(jìn)入靶點(diǎn)設(shè)計,輸入靶點(diǎn)的名字、垂深、坐標(biāo)、形狀,保存退出。選擇 Planning-new plan 菜單,輸入軌道設(shè)計的名字和起始點(diǎn),進(jìn)行軌道設(shè)計。選擇 Survey-new survey 菜單,輸入測量過程的名字和起始點(diǎn),進(jìn)行實(shí)際測量的參數(shù)計 算。實(shí)際使用過程中,每進(jìn)行一次測量都要重復(fù) 9 的過程建立一個以最后測量點(diǎn)為起點(diǎn)的新 設(shè)計,隨時調(diào)整下一步的定向方式。

6.RINEX格式的作用

RINEX格式已經(jīng)成為了GPS測量應(yīng)用等的標(biāo)準(zhǔn)數(shù)據(jù)格式,幾乎所有測量型GPS接收機(jī)廠商都提供將其格式文件轉(zhuǎn)換為RINEX格式文件的工具,而且?guī)缀跛械臄?shù)據(jù)分析處理軟件都能夠直接讀取RINEX格式的數(shù)據(jù)。這意味著在實(shí)際觀測作業(yè)中可以采用不同廠商、不同型號的接收機(jī)進(jìn)行混合編隊,而數(shù)據(jù)處理則可采用某一特定軟件進(jìn)行。

7.RINEX格式的觀測文件讀取程序說明

基于matlab語言開發(fā)程序。

Rinex格式文件:

由程序命令一個字串一個字串的進(jìn)行,然后根據(jù)文件頭的取舍將有效數(shù)據(jù)重新組合平面數(shù)據(jù)矩陣(二維)或立體數(shù)據(jù)矩陣(三維)。一般情況下,當(dāng)讀取指定的字符串(如“END OF HEADER”)時,即開始讀取有效數(shù)據(jù),在上述觀測文件和導(dǎo)航文件中,有效數(shù)據(jù)為字符串“END OF HEADER”以后的數(shù)據(jù) 相關(guān)函數(shù):

fopen 開啟所要讀取的文件

fscanf 讀取所開啟文件中的資料

textread 讀取所開啟的文本文件中的資料

第 5 頁,共 8 頁 《GPS數(shù)據(jù)處理》課程總結(jié)報告

strcmp 比較兩字串是否相同

8.RINEX格式的導(dǎo)航文件讀取程序說明

同樣基于matlab語言程序。

因觀測文件和上述星歷文件的頭文件包含的信息量不同,觀測頭文件中包含有很多有效 信息,所以必須對頭文件進(jìn)行必要的細(xì)致讀取。認(rèn)為主要是1)“ANTENNA: DELTA H/E/N”2)“'APPROX POSITION XYZ”3)“# / TYPES OF OBSERV”,這三行數(shù)據(jù)對整個數(shù)據(jù)把握和以后的運(yùn)算有幫助。

在讀主要的觀測值時,采用的思路也是將所有的觀測值看做是全矩陣(立體)的矩陣組成,將同歷元的數(shù)據(jù)放在一個二維矩陣中,有n顆衛(wèi)星,m類觀測值如載波相位觀測值、偽

距觀測值、多普勒觀測值等,然后將所有的觀測值進(jìn)行組裝。如下圖(部分),最終形成了7×7×31的一個大型矩陣,因最終進(jìn)行計算的時候為了循環(huán)的需要,同時對應(yīng)于按照時間的順序組織矩陣,所以要對這一中間過程進(jìn)行排序(按照星歷文件衛(wèi)星號的排列順序)。其讀取結(jié)果如表4,其中,midobs(:,:,31)表示第31個采樣間隔里所有的觀測值,第一、二列為L1、L2相位觀測值(cycle),第三列為L1的C/A偽距觀測值(m),第四、五列P1、P2為L1和L2的P碼偽距觀測值(m),最后兩列為L1和L2的多普勒偽距觀測值(Hz)根據(jù)所需要的定位方式(載波定位、偽距定位等),合理的對讀取數(shù)據(jù)的結(jié)果進(jìn)行取舍,方式就是根據(jù)行列號提取或者將所選以外的數(shù)據(jù)進(jìn)行賦值為空(NULL)。

9.GPS單點(diǎn)坐標(biāo)計算公式及流程圖

1.計算衛(wèi)星運(yùn)動的平均角速度n n = n0 + Δn 2.計算觀測瞬間衛(wèi)星的平近點(diǎn)角M M =M0 + n(t-TOE)3.計算偏近點(diǎn)角

E = M+ esinE E°=M°+ ρ°·esinE° 4.計算真近點(diǎn)角f

5.計算升交距角u′ u′= ω+ f 6.計算攝動改正項δu , δr , δ

第 6 頁,共 8 頁 6 《GPS數(shù)據(jù)處理》課程總結(jié)報告

7.對u′、r′、i0 進(jìn)行攝動改正

8.計算衛(wèi)星在軌道面坐標(biāo)系中的位置

9.計算觀測瞬間升交點(diǎn)的經(jīng)度L

10.計算衛(wèi)星在瞬時地球坐標(biāo)系中的位置

11.計算衛(wèi)星在協(xié)議地球坐標(biāo)系中的位置

10.個人課程總結(jié)【1000字】

近年來,GPS測量定位理論和軟件科學(xué)的進(jìn)步促進(jìn)了不同功能GPS數(shù)據(jù)處理軟件的發(fā)展,為了滿足不同領(lǐng)域的應(yīng)用需求,GPS數(shù)據(jù)處理軟件不斷問世。對于一個測量工作者來說選用一種好的數(shù)據(jù)處理方法和軟件對GPS數(shù)據(jù)結(jié)果影響很大。然而眾多的后處理軟件以及不同的處理方法使我們的測量工作者帶來多樣的選擇。盡管不同軟件在數(shù)據(jù)處理方法上各有其特點(diǎn),但它們的總體結(jié)構(gòu)基本上是一致的,即由數(shù)據(jù)準(zhǔn)備、軌道計算、模型改正、數(shù)據(jù)編輯和參數(shù)估計5部分組成。究竟,哪一種GPS數(shù)據(jù)處理軟件性能更好?那一種GPS數(shù)據(jù)處理軟件的處理精度更高呢?本文就將針對國內(nèi)外幾種常用GPS后處理軟件進(jìn)行比較分析,其中包括南方國內(nèi)公司開發(fā)的GPS后處理軟件、Ashtech Solutions2.6平差軟件、中海達(dá)HDS2003、Trimble TGO、leica Geo Office五種軟件。

一般情況下數(shù)據(jù)處理流程應(yīng)該有很多個的過程,才能夠保證數(shù)據(jù)滿足工程需要,根據(jù)資料一般有以下步驟:野外數(shù)據(jù)采集——數(shù)據(jù)傳輸——手簿輸入——數(shù)據(jù)加工——數(shù)據(jù)預(yù)處理——基線解算——重復(fù)基線檢驗——同步環(huán)檢驗——異步環(huán)檢驗(以上為當(dāng)天應(yīng)完成的任務(wù))——重測與補(bǔ)測——WGS-84無約束平差——網(wǎng)精度分析——北京54/80/地方獨(dú)立中三維無約束平差——三維約束平差——二維平差——成果報告——技術(shù)總結(jié)。網(wǎng)平差應(yīng)該是整

第 7 頁,共 8 頁 《GPS數(shù)據(jù)處理》課程總結(jié)報告

個數(shù)據(jù)處理的核心內(nèi)容,直接關(guān)乎數(shù)據(jù)的質(zhì)量。

軟件只是實(shí)現(xiàn)了網(wǎng)平差的解算,更重要的是需要用戶參與,并最終作出正確的判斷。應(yīng)當(dāng)說明的是,這通常是一個反復(fù)的過程,雖然在實(shí)驗報告當(dāng)中看起來只是一個小部分,但那是因為這主要由計算機(jī)進(jìn)行解算,并且只考慮了一次成功的情況,而事實(shí)上可能要許多次才能夠完成。

通過這門課程,我學(xué)習(xí)到了許多關(guān)于計算gps的基礎(chǔ)知識和有關(guān)gps測量的工具使用和gps計算工具的使用方法。同時,我不僅對GPS原理有了更深入的了解,還對GPS外業(yè)數(shù)據(jù)采集和內(nèi)業(yè)處理有了一定的理解。這個課程不僅是對動手能力的一種提升,更是對理論知識的一次綜合性鞏固。雖然測量是一門實(shí)踐性很強(qiáng)的學(xué)科,但是也要求我們掌握扎實(shí)的理論知識,如果沒有扎實(shí)的理論功底,只知道怎么做,但是不知道為什么那么做,當(dāng)我們遇到類似的其他問題時,就不知道怎么解決。所以我覺得理論是實(shí)踐的前提,只有把理論知識學(xué)好,才能更好的促進(jìn)實(shí)踐。所以我們要學(xué)好理論知識,為以后的工作打下堅實(shí)的基礎(chǔ)。當(dāng)然理論知識學(xué)好了,動手能力也要努力培養(yǎng),不能只會紙上談兵,所以我們要多動手,提高自己的動手能量,并在實(shí)踐中促進(jìn)鞏固理論知識。只有理論是實(shí)踐這兩個環(huán)節(jié)都做好,我們才能更好的掌握理論知識,提高自己的動手能力。

第 8 頁,共 8 頁 8

第三篇:數(shù)據(jù)處理教案

數(shù)據(jù)處理教案

引言:

根據(jù)高專中專部安排,由我?guī)?0級綜合班的數(shù)據(jù)處理課和Office辦公自動化課,根據(jù)教學(xué)的要求,特寫此教案,該教案分為5部分,第一部分介紹數(shù)據(jù)處理定義,結(jié)構(gòu),常用軟件;第二部分計算機(jī)基礎(chǔ);第三部分介紹Excel數(shù)據(jù)處理;第四部分介紹常用數(shù)據(jù)庫(access、sql語句),第四部分介紹簡單的關(guān)系數(shù)據(jù)庫、數(shù)據(jù)建模等;第五部分介紹簡單的數(shù)據(jù)處理、報表制作等。

第一部分?jǐn)?shù)據(jù)處理定義,結(jié)構(gòu) 第一節(jié) 數(shù)據(jù)處理定義

教學(xué)目的:通過對數(shù)據(jù)處理的定義使學(xué)生明白,在當(dāng)今的社會,數(shù)據(jù)是如何的重要,數(shù)據(jù)處理在現(xiàn)代社會中起到什么樣的作用。

教學(xué)內(nèi)容:重點(diǎn)是數(shù)據(jù)處理的定義,難點(diǎn)為如何看待數(shù)據(jù)和信息的關(guān)系,模糊數(shù)據(jù)和數(shù)字?jǐn)?shù)據(jù)的區(qū)別 教學(xué)方法:口述與上機(jī)

教學(xué)進(jìn)程:全面4個課時為理論口述講解,后面4個課時上機(jī)介紹數(shù)據(jù)處理常用軟件。

1.1.1數(shù)據(jù)處理定義

數(shù)據(jù)處理是對數(shù)據(jù)的采集、存儲、檢索、加工、變換和傳輸。數(shù)據(jù)是對事實(shí)、概念或指令的一種表達(dá)形式,可由人工或自動化裝置進(jìn)行處理。數(shù)據(jù)的形式可以是數(shù)字、文字、圖形或聲音等。數(shù)據(jù)經(jīng)過解釋并賦予一定的意義之后,便成為信息。數(shù)據(jù)處理的基本目的是從大量的、可能是雜亂無章的、難以理解的數(shù)據(jù)中抽取并推導(dǎo)出對于某些特定的人們來說是有價值、有意義的數(shù)據(jù)。數(shù)據(jù)處理是系統(tǒng)工程和自動控制的基本環(huán)節(jié)。數(shù)據(jù)處理貫穿于社會生產(chǎn)和社會生活的各個領(lǐng)域。數(shù)據(jù)處理技術(shù)的發(fā)展及其應(yīng)用的廣度和深度,極大地影響著人類社會發(fā)展的進(jìn)程

1.1.2數(shù)據(jù)處理軟件

數(shù)據(jù)處理離不開軟件的支持,數(shù)據(jù)處理軟件包括:用以書寫處理程序的各種程序設(shè)計語言及其編譯程序,管理數(shù)據(jù)的文件系統(tǒng)和數(shù)據(jù)庫系統(tǒng),以及各種數(shù)據(jù)處理方法的應(yīng)用軟件包。為了保證數(shù)據(jù)安全可靠,還有一整套數(shù)據(jù)安全保密的技術(shù)。1.1.3 數(shù)據(jù)處理方式

根據(jù)處理設(shè)備的結(jié)構(gòu)方式、工作方式,以及數(shù)據(jù)的時間空間分布方式的不同,數(shù)據(jù)處理有不同的方式。不同的處理方式要求不同的硬件和軟件支持。每種處理方式都有自己的特點(diǎn),應(yīng)當(dāng)根據(jù)應(yīng)用問題的實(shí)際環(huán)境選擇合適的處理方式。數(shù)據(jù)處理主要有四種分類方式①根據(jù)處理設(shè)備的結(jié)構(gòu)方式區(qū)分,有聯(lián)機(jī)處理方式和脫機(jī)處理方式。②根據(jù)數(shù)據(jù)處理時間的分配方式區(qū)分,有批處理方式、分時處理方式和實(shí)時處理方式。③根據(jù)數(shù)據(jù)處理空間的分布方式區(qū)分,有集中式處理方式和分布處理方式。④根據(jù)計算機(jī)中央處理器的工作方式區(qū)分,有單道作業(yè)處理方式、多道作業(yè)處理方式和交互式處理方式。

1.1.4 數(shù)據(jù)處理加工

數(shù)據(jù)處理對數(shù)據(jù)(包括數(shù)值的和非數(shù)值的)進(jìn)行分析和加工的技術(shù)過程。包括對各種原始數(shù)據(jù)的分析、整理、計算、編輯等的加工和處理。比數(shù)據(jù)分析含義廣。隨著計算機(jī)的日益普及,在計算機(jī)應(yīng)用領(lǐng)域中,數(shù)值計算所占比重很小,通過計算機(jī)數(shù)據(jù)處理進(jìn)行信息管理已成為主要的應(yīng)用。如側(cè)繪制圖管理、倉庫管理、財會管理、交通運(yùn)輸管理,技術(shù)情報管理、辦公室自動化等。在地理數(shù)據(jù)方面既有大量自然環(huán)境數(shù)據(jù)(土地、水、氣候、生物等各類資源數(shù)據(jù)),也有大量社會經(jīng)濟(jì)數(shù)據(jù)(人口、交通、工農(nóng)業(yè)等),常要求進(jìn)行綜合性數(shù)據(jù)處理。故需建立地理數(shù)據(jù)庫,系統(tǒng)地整理和存儲地理數(shù)據(jù)減少冗余,發(fā)展數(shù)據(jù)處理軟件,充分利用數(shù)據(jù)庫技術(shù)進(jìn)行數(shù)據(jù)管理和處理。1.1.5 數(shù)據(jù)清洗

有關(guān)商務(wù)網(wǎng)站的數(shù)據(jù)處理:由于網(wǎng)站的訪問量非常大,在進(jìn)行一些專業(yè)的數(shù)據(jù)分析時,往往要有針對性的數(shù)據(jù)清洗,即把無關(guān)的數(shù)據(jù)、不重要的數(shù)據(jù)等處理掉。接著對數(shù)據(jù)進(jìn)行相關(guān)分分類,進(jìn)行分類劃分之后,就可以根據(jù)具體的分析需求選擇模式分析的技術(shù),如路徑分析、興趣關(guān)聯(lián)規(guī)則、聚類等。通過模式分析,找到有用的信息,再通過聯(lián)機(jī)分析(OLAP)的驗證,結(jié)合客戶登記信息,找出有價值的市場信息,或發(fā)現(xiàn)潛在的市場。

第二節(jié)數(shù)據(jù)處理結(jié)構(gòu)

教學(xué)目的:通過對數(shù)據(jù)處理結(jié)構(gòu)的介紹使學(xué)生明白數(shù)據(jù)倉庫、數(shù)據(jù)集市與數(shù)據(jù)挖掘的關(guān)系。

教學(xué)內(nèi)容:重點(diǎn)是數(shù)據(jù)倉庫的圖像理解,難點(diǎn)也是數(shù)據(jù)倉庫整體結(jié)構(gòu)的理解。教學(xué)方法:口述與上機(jī) 教學(xué)進(jìn)程:全面4個課時為理論口述講解,后面4個課時上機(jī)介紹數(shù)據(jù)倉庫案例。

1.2.1商業(yè)智能在中國的發(fā)展機(jī)會(數(shù)據(jù)處理)

商業(yè)智能就像幾年前的ERP(企業(yè)資源管理)一樣,正成為企業(yè)首席技術(shù)官們關(guān)注的焦點(diǎn),呈現(xiàn)如火如荼的發(fā)展態(tài)勢。眾所周知,在ERP等基礎(chǔ)信息系統(tǒng)部署完之后,企業(yè)能夠?qū)ζ錁I(yè)務(wù)數(shù)據(jù)進(jìn)行更為有效的管理,于是如何利用這些數(shù)據(jù)創(chuàng)造價值成為企業(yè)下一步思考的問題。

商業(yè)智能系統(tǒng)已經(jīng)作為一種含金量極高的管理工具,融合在部分大型企業(yè)管理文化的血脈之中了。商業(yè)智能在幫助企業(yè)管理層發(fā)現(xiàn)市場機(jī)會、創(chuàng)造競爭新優(yōu)勢的作用顯而易見,因此成為企業(yè)信息化的新寵也是必然的。

商業(yè)智能軟件市場穩(wěn)步增長

從全球范圍來看,商業(yè)智能領(lǐng)域并購不斷,商業(yè)智能市場已經(jīng)超過ERP和CRM(客戶關(guān)系管理)成為最具增長潛力的領(lǐng)域。從中國市場來看,商業(yè)智能已經(jīng) 被電信、金融、零售、保險、制造等行業(yè)越來越廣泛地應(yīng)用,操作型商業(yè)智能逐步在大企業(yè)普及,商業(yè)智能不局限于高層管理者的決策之用,也日益成為普通員工日 常操作的工具。

不過,盡管這個市場潛力巨大,但仍有不少的現(xiàn)實(shí)情況導(dǎo)致這一市場的發(fā)育沒有大家預(yù)期中的那么好。首先一點(diǎn),國內(nèi)的成熟、專業(yè)的商業(yè)智能實(shí)施顧問較少,不但上游廠商的相關(guān)人才少,下游負(fù)責(zé)實(shí)施的渠道合作伙伴更是缺乏相關(guān)人才,很多時候用戶要啟用商業(yè)智能工具,但是不太明確自己的需求,負(fù)責(zé)實(shí)施的人很多時 候也是一知半解,不能給用戶很好的解決方案;其次,目前多數(shù)商業(yè)智能廠商,尤其是國外廠商都是通過分公司或辦事處來銷售的,而未來國內(nèi)制造業(yè)企業(yè)多數(shù)需要 本地化服務(wù),這種模式必將改變。同時,商業(yè)智能系統(tǒng)的銷售、服務(wù)要求代理商要有很強(qiáng)的能力,如何選擇、培養(yǎng)、發(fā)展這些代理商將是商業(yè)智能大發(fā)展面臨的一個很重要問題。

SaaS將成為重要交付模式

同時,商業(yè)智能系統(tǒng)的核心不是平臺,而是模型。目前,由于國內(nèi)應(yīng)用商業(yè)智能的企業(yè)并不多,應(yīng)用深入的更少,應(yīng)用基礎(chǔ)也比較薄弱,即使拿來國外先進(jìn)的商 業(yè)模型也不一定能運(yùn)轉(zhuǎn)起來,所以盡快建立各種適合國內(nèi)企業(yè)特色的模型是各服務(wù)商未來要加大投入著力解決的。當(dāng)然,對企業(yè)而言,商業(yè)智能的有效應(yīng)用,離不開 數(shù)據(jù)的支持。如果沒有準(zhǔn)確的數(shù)據(jù),那么所要分析產(chǎn)生的報表、決策都與事實(shí)存在差距,將會導(dǎo)致整個決策的錯誤,因此,必須要求前期的數(shù)據(jù)準(zhǔn)確。

最后,隨著云計算的大規(guī)模普及,下一代商業(yè)智能的精細(xì)分析系統(tǒng)很可能會建設(shè)在動態(tài)的基礎(chǔ)架構(gòu)上,而虛擬化、云計算等技術(shù)的發(fā)展也會帶動商業(yè)智能系統(tǒng)的建設(shè)和應(yīng)用,這就是“云智能”。我國企業(yè)需要抓住“云智能”機(jī)遇,加快發(fā)展、迎頭趕上,才能從容應(yīng)對下一階段的全球化競爭。

1.2.2數(shù)據(jù)倉庫技術(shù)的發(fā)展及體系結(jié)構(gòu) 數(shù)據(jù)倉庫技術(shù)的發(fā)展及概念

傳統(tǒng)的數(shù)據(jù)庫技術(shù)是以單一的數(shù)據(jù)資源,即數(shù)據(jù)庫為中心,進(jìn)行事務(wù)處理工作的。然而,不同類型的數(shù)據(jù)有著不同的處理特點(diǎn),以單一的數(shù)據(jù)組織方式進(jìn)行組織的數(shù)據(jù)庫并不能反映這種差異,滿足不了現(xiàn)代商業(yè)企業(yè)數(shù)據(jù)處理多樣化的要求。總結(jié)起來,當(dāng)前的商、世企業(yè)數(shù)據(jù)處理可以大致地劃分為2大類:操作型處理和分析型處理。操作型處理也叫事務(wù)型處理,主要是為企業(yè)的特定應(yīng)用服務(wù)的(這是目前最為常用的),分析型處理則用于商業(yè)企業(yè)管理人員的決策分析,這種需求既要求聯(lián)機(jī)服務(wù),又涉及大量用于決策的數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)已經(jīng)無法滿足,具體體現(xiàn)在:

1)歷史數(shù)據(jù)量大;

2)輔助決策信息涉及許多部門的數(shù)據(jù),而不同系統(tǒng)的數(shù)據(jù)難以集成;

3)由于訪問數(shù)據(jù)的能力不足,它對大量數(shù)據(jù)的訪問能力明顯下降。

數(shù)據(jù)倉庫技術(shù)的出現(xiàn)為解決上述問題提供了新的思路。數(shù)據(jù)倉庫的創(chuàng)始人Inmon指出:“數(shù)據(jù)倉庫是面向主題的、集成的、穩(wěn)定的、隨時間變化的數(shù)據(jù)集合,用以支持經(jīng)營管理中的決策制定過程”。它從大量的事務(wù)型數(shù)據(jù)中抽取數(shù)據(jù),并將其清理、轉(zhuǎn)換為新的存儲格式,即為決策目標(biāo)把數(shù)據(jù)聚合在一種特殊的格式中,作為決策分析的數(shù)據(jù)基礎(chǔ),從而在理論上解決了從不同系統(tǒng)的數(shù)據(jù)庫中提取數(shù)據(jù)的難題。同時,利用聯(lián)機(jī)分析處理(OLAP)技術(shù)可以對數(shù)據(jù)倉庫提供的數(shù)據(jù)進(jìn)行深入加工。

企業(yè)數(shù)據(jù)倉庫的體系結(jié)構(gòu)

一個典型的企業(yè)數(shù)據(jù)倉庫系統(tǒng)通常包含數(shù)據(jù)源、數(shù)據(jù)存儲與管理、OLAP服務(wù)器以及前端工具與應(yīng)用4個部分。

1)數(shù)據(jù)源。

數(shù)據(jù)源是數(shù)據(jù)倉庫系統(tǒng)的基礎(chǔ),是整個系統(tǒng)的數(shù)據(jù)源泉。通常包括企業(yè)內(nèi)部信息和外部信息。內(nèi)部信息包括存放于企業(yè)操作型數(shù)據(jù)庫中(通常存放在RD-BMS中)的各種業(yè)務(wù)數(shù)據(jù),外部信息包括各類法律法規(guī)、市場信息、競爭對手的信息以及各類外部統(tǒng)計數(shù)據(jù)及各類文檔等。

2)數(shù)據(jù)的存儲與管理。

數(shù)據(jù)的存儲與管理是整個數(shù)據(jù)倉庫系統(tǒng)的核心。在現(xiàn)有各業(yè)務(wù)系統(tǒng)的基礎(chǔ)上,對數(shù)據(jù)進(jìn)行抽取、清理,并有效集成,按照主題進(jìn)行重新組織,最終確定數(shù)據(jù)倉庫的物理存儲結(jié)構(gòu),同時組織存儲數(shù)據(jù)倉庫元數(shù)據(jù)(具體包括數(shù)據(jù)倉庫的數(shù)據(jù)字典、記錄系統(tǒng)定義、數(shù)據(jù)轉(zhuǎn)換規(guī)則、數(shù)據(jù)加載頻率以及業(yè)務(wù)規(guī)則等信息)。按照數(shù)據(jù)的覆蓋范圍,數(shù)據(jù)倉庫存儲可以分為企業(yè)級數(shù)據(jù)倉庫和部門級數(shù)據(jù)倉庫(通常稱為“數(shù)據(jù)集市”,Data Mart)。數(shù)據(jù)倉庫的管理包括數(shù)據(jù)的安全、歸檔、備份、維護(hù)、恢復(fù)等工作。這些功能與目前的DBMS基本一致。

3)OLAP服務(wù)器。

對分析需要的數(shù)據(jù)按照多維數(shù)據(jù)模型進(jìn)行再次重組,以支持用戶多角度、多層次的分析,發(fā)現(xiàn)數(shù)據(jù)趨勢。

4)前端工具與應(yīng)用。

前端工具主要包括各種數(shù)據(jù)分析工具、報表工具、查詢工具、數(shù)據(jù)挖掘工具以及各種基于數(shù)據(jù)倉庫或數(shù)據(jù)集市開發(fā)的應(yīng)用。其中數(shù)據(jù)分析工具主要針對OLAP服務(wù)器,報表工具、數(shù)據(jù)挖掘工具既針對數(shù)據(jù)倉庫,同時也針對OLAP服務(wù)器。

1.2.3商業(yè)智能(BI)落地需要的三大工具

商業(yè)智能(后面簡稱BI)的各類角色用戶必須借助和使用工具實(shí)現(xiàn)其需求。BI角色分為業(yè)務(wù)、業(yè)務(wù)融合技術(shù)、技術(shù)這三類,對于其相應(yīng)的應(yīng)用需求(含演繹型和歸納型)和管控開發(fā)需求,需要借演繹型需求支撐工具和歸納型需求支撐工具,及管控開發(fā)型工具來予以實(shí)現(xiàn)。本篇先講述演繹型需求支撐的7種工具,其可分為描述統(tǒng)計工具、經(jīng)營技術(shù)與方法、經(jīng)濟(jì)預(yù)測方法與模型、OLAP分析、知識發(fā)現(xiàn)工具、專家系統(tǒng)以及決策方法與模型。管控開發(fā)支持型工具一般包括系統(tǒng)管理工具、開發(fā)工具;

筆者認(rèn)為BI以認(rèn)識論和組織理論為基本原理,采取相適宜的“工具”,旨在幫助 “相關(guān)角色”對職責(zé)范圍內(nèi)的“有關(guān)內(nèi)容”做出最佳決定的整體解決方案。它由“三維模式”和“三層漏斗”組成,是輔助整個企業(yè)集理念,組織,流程,技術(shù)為一體的整體決策支持方案三維模式由角色維、內(nèi)容維和工具維構(gòu)成,體現(xiàn)了BI的主體、客體和工具等一般性原理。根據(jù)BI的定義,只有清晰劃分相關(guān)角色并據(jù)以確定需求,并借助工具才能實(shí)現(xiàn)BI輔助主體對職責(zé)范圍的有關(guān)事項做出最佳決定的宗旨。

BI的業(yè)務(wù)類角色、技術(shù)類角色以及業(yè)務(wù)融合技術(shù)類角色對應(yīng)存在著業(yè)務(wù)應(yīng)用需求(指業(yè)務(wù)類的演繹型需求和業(yè)務(wù)融合技術(shù)類的歸納型需求)和技術(shù)應(yīng)用需求,即管控開發(fā)型需求。這種需求能否得以有效實(shí)現(xiàn)和提升,必須借助工具。針對三大類角色的兩種需求,BI的工具分為應(yīng)用型支撐型工具和管控開發(fā)支持型工具。鑒于文章的范圍,硬件支撐工具的內(nèi)容請參見相關(guān)書籍。

應(yīng)用支撐工具可以分為描述統(tǒng)計工具、經(jīng)營技術(shù)與方法、經(jīng)濟(jì)預(yù)測方法與模型、OLAP分析、知識發(fā)現(xiàn)工具、專家系統(tǒng)以及決策方法與模型。管控開發(fā)支持型工具一般包括系統(tǒng)管理工具、開發(fā)工具。一般來說,這些工具以軟件包的形式形成產(chǎn)品。鑒于BI對于業(yè)務(wù)應(yīng)用的重要作用及業(yè)務(wù)應(yīng)用成功對BI的重要意義,本文著重分析BI的應(yīng)用型支撐工具,并對有關(guān)產(chǎn)品作簡單介紹。

一、實(shí)現(xiàn)演繹型需求的7種工具

BI的演繹型內(nèi)容可以分為三個層次:報表查詢、綜合分析、決策選擇討。如下圖所示,BI的演繹型需求通過描述性統(tǒng)計工具、報表與展示工具、經(jīng)濟(jì)預(yù)測方法與模型、經(jīng)營技術(shù)與工具、OLAP分析及專家系統(tǒng)工具、決策方法與模型來實(shí)現(xiàn)。

上圖中,描述性統(tǒng)計工具幫助用戶在報表查詢層次實(shí)現(xiàn)對事實(shí)的充分了解;綜合分析以邏輯的方式幫助相關(guān)主體尋求原因或?qū)唵螁栴}直接獲得建議,需要運(yùn)用經(jīng)濟(jì)預(yù)測方法與模型、經(jīng)營技術(shù)與工具及OLAP分析來得以實(shí)現(xiàn)。專家系統(tǒng)和決策方法與模型是實(shí)現(xiàn)定量和部分定性決策的有力工具。通過該類工具,用戶在決策選擇時通過評價各個方案的優(yōu)劣來輔助主體選擇最優(yōu),得出結(jié)論。BI 演繹型應(yīng)用的三層次結(jié)構(gòu)合理、有步驟地解決了前提、邏輯規(guī)則和結(jié)論這一演繹型思維方法的遷移應(yīng)用。

(一)描述性統(tǒng)計工具

統(tǒng)計的基本意義在于利用統(tǒng)計指標(biāo),通過指標(biāo)值的對比關(guān)系和發(fā)展變化來研究社會經(jīng)濟(jì)現(xiàn)象的數(shù)量和數(shù)量關(guān)系,表明其變化發(fā)展的過程、結(jié)果及其規(guī)律。作為統(tǒng)計學(xué)兩大基本內(nèi)容之一的描述性統(tǒng)計是整個統(tǒng)計學(xué)的基礎(chǔ)和統(tǒng)計研究工作的第一步,它包括數(shù)據(jù)的收集、整理、顯示,對數(shù)據(jù)中有用信息的提取和分析,而對變量的集中趨勢和離中趨勢的分析則是其主要內(nèi)容。描述性統(tǒng)計工具指為實(shí)現(xiàn)相關(guān)主體對基本事實(shí)了解的需求而需利用基本指標(biāo)。這些基本統(tǒng)計指標(biāo)包括總量指標(biāo)、相對指標(biāo)、平均指標(biāo)和變異指標(biāo)。

總量指標(biāo):表明具體社會經(jīng)濟(jì)現(xiàn)象總體的規(guī)模、水平或工作總量的數(shù)值,是計算各種派生指標(biāo)的基礎(chǔ)。如某集團(tuán)公司年銷量即是總量指標(biāo)。它可分為總體單位總量、總體標(biāo)志總量和時期總量(如某個事業(yè)部門的總銷量)、時點(diǎn)總量(如月末庫存)??偭恐笜?biāo)可通過直接計算和間接計算求出。

相對指標(biāo):表明兩個互有聯(lián)系的社會、經(jīng)濟(jì)現(xiàn)象之間數(shù)量對比關(guān)系的統(tǒng)計指標(biāo)。如競爭企業(yè)之間庫存周轉(zhuǎn)率的對比,或行業(yè)內(nèi)某企業(yè)銷量與行業(yè)總銷量的對比等等;常用的同比和環(huán)比也是相對指標(biāo)的運(yùn)用。相對指標(biāo)反映了社會經(jīng)濟(jì)現(xiàn)象的實(shí)質(zhì)及其數(shù)量的對比關(guān)系,從現(xiàn)象間數(shù)量對比關(guān)系中清晰地認(rèn)識事物。其次,可使原來無法直接比較的現(xiàn)象,找到共同的基礎(chǔ)進(jìn)行科學(xué)地對比分析。相對指標(biāo)又包括:計劃完成程度指標(biāo)、結(jié)構(gòu)相對指標(biāo)(高中低檔產(chǎn)品利潤在全部利潤中的各自占比)、比例相對指標(biāo)(產(chǎn)品A與產(chǎn)品B的對比)、比較相對指標(biāo)(某企業(yè)銷量增長率與競爭企業(yè)銷量增長率的對比)、強(qiáng)度相對指標(biāo)(如煙草行業(yè)銷售情況中條/人指標(biāo)的對比)、動態(tài)相對指標(biāo)(如歷年的銷售額的比較)。運(yùn)用時,要正確選擇對比的基數(shù)、確定可比的對比指標(biāo)、相對指標(biāo)要與對比基數(shù)結(jié)合使用。

平均指標(biāo):反映同質(zhì)總體內(nèi)各單位某一數(shù)量標(biāo)志的一般水平,可以對比總體的一般水平,如分公司年平均銷量與總公司平均銷量的對比,可以進(jìn)行數(shù)量上的推算和預(yù)測。平均指標(biāo)有算術(shù)平均數(shù)、調(diào)和平均數(shù)(較少用,主要用于已知標(biāo)志總量而不知單位總量的情況)、幾何平均數(shù)(一般用于計算平均發(fā)展速度)、眾數(shù)(一組序列中出現(xiàn)次數(shù)最多的數(shù))、中位數(shù)(按大小順序排列的數(shù)據(jù)中處于中間的數(shù))五種。使用平均數(shù)時要與變異指標(biāo)結(jié)合使用,有時需要用組平均數(shù)補(bǔ)充總體平均數(shù)。

標(biāo)志變異指標(biāo):說明總體各單位某一標(biāo)志數(shù)值差異程度,通過變異指標(biāo)可以揭示被平均指標(biāo)掩蓋了的差異情況,也可作為衡量平均指標(biāo)代表性的尺度。可分為:全距、平均差、標(biāo)準(zhǔn)差、標(biāo)志變異系數(shù)。全距是標(biāo)志值最大值與最小值之差,如2006年某產(chǎn)品在全國各省中最高銷量與最低銷量之差;平均差是各個標(biāo)志值與總體算術(shù)平均數(shù)的離差的絕對值。標(biāo)準(zhǔn)差為各個標(biāo)志值與總體算術(shù)平均數(shù)的離差的平方和的正平方根,其值越大表明差異越大,平均值不能很好代表一般水平;標(biāo)準(zhǔn)差與算術(shù)平均數(shù)的比值稱為標(biāo)志變異系數(shù),用以兩個平均數(shù)指標(biāo)不相等時的對比。

描述性統(tǒng)計工具在當(dāng)前BI的行業(yè)應(yīng)用中非常普遍。值得關(guān)注的是,當(dāng)前一般BI的報表查詢應(yīng)用涉及更多是描述性統(tǒng)計的總量指標(biāo)、平均指標(biāo)和比較指標(biāo),而對于描述離中趨勢的標(biāo)志變異指標(biāo)運(yùn)用得相當(dāng)不夠。事實(shí)上,標(biāo)志變異指標(biāo)可以解決B I的應(yīng)用主體很多實(shí)質(zhì)性問題,比如在眾多品牌中找到銷量不穩(wěn)定的品牌,在眾多客戶中找到交易額波動大的客戶,這些信息為BI的應(yīng)用有關(guān)主體在研發(fā)、生產(chǎn)、采購、銷售、庫存方面起到較為關(guān)鍵的作用。

(二)報表與展示工具

以報表應(yīng)用類別區(qū)分,BI系統(tǒng)能利用報表與展示工具來生成統(tǒng)計報表和查詢報表。查詢報表較為簡單,根據(jù)用戶的需求可以較容易地定制。由于中國式統(tǒng)計報表眾多的表頭項以及表頭中首格的一重甚至多種斜線的特征,甚至在表頭項中又切分子表頭的復(fù)雜情況,致使生成統(tǒng)計報表較為困難。國外的BI產(chǎn)品在生成統(tǒng)計報表方面和國內(nèi)的某些產(chǎn)品相比,如水晶報表,操作過程較繁鎖。對于報表的展示,一是產(chǎn)生表格,二是產(chǎn)生與表格對應(yīng)的圖形,如曲線圖、柱形圖、三維圖等。一般來說,要求報表與圖形連動。即當(dāng)報表數(shù)據(jù)發(fā)生變動時,圖形跟著變動。或者相反,圖形的變動要帶來報表數(shù)據(jù)的變動。這是在鉆取時較容易產(chǎn)生的情況。如SAS的Business Intelligence和BO的圖形互動功能都能實(shí)現(xiàn)此種需求。

報表與展示工具注重實(shí)現(xiàn)報表的靈活性,更強(qiáng)調(diào)圖形展示的美觀、圖形色彩的模板化定,強(qiáng)調(diào)圖形種類的多樣。這是BI工具的基本功能。前兩年大家談到BI時,更容易評判到某個廠家的BI的界面制作的是否美觀等等,這是當(dāng)時人們對BI應(yīng)用認(rèn)識不夠造成的?,F(xiàn)在廠家在宣傳BI時,不僅注重更深層次的綜合分析功能和預(yù)測、決策功能,更擴(kuò)大到數(shù)據(jù)集成與整合,數(shù)據(jù)存儲和元數(shù)據(jù)管理等全套BI平臺上。

(三)經(jīng)濟(jì)預(yù)測方法與模型 經(jīng)濟(jì)預(yù)測方法與模型是統(tǒng)計學(xué)中統(tǒng)計推斷部分的運(yùn)用,復(fù)雜且靈活。它是BI在綜合分析層次上的應(yīng)用。該方法滿足業(yè)務(wù)類用戶展望未來的需求。統(tǒng)計推斷一般包括參數(shù)估計、假設(shè)檢驗以及分類與選擇。經(jīng)濟(jì)預(yù)測方法是參數(shù)估計的應(yīng)用推廣,包含了點(diǎn)估計和參數(shù)估計,如某上時間段銷量的預(yù)測值,或者預(yù)測值所處的區(qū)間。經(jīng)濟(jì)預(yù)測模型是在預(yù)測方法的指導(dǎo)下,根據(jù)行業(yè)的實(shí)際經(jīng)過修正后建立的預(yù)測模型。

定量的預(yù)測方法實(shí)戰(zhàn)中可以建立很多模式,此處以時間序列預(yù)測為主簡要介紹經(jīng)濟(jì)預(yù)測方法與模型的運(yùn)用。

時間序列預(yù)測法是動態(tài)分析法的一種運(yùn)用。動態(tài)分析法是在統(tǒng)計研究中,把經(jīng)濟(jì)現(xiàn)象在不同時間上的數(shù)量進(jìn)行對比,以了解現(xiàn)象變動的方向、速度、趨勢和規(guī)律,并據(jù)此預(yù)測未來的方法。動態(tài)趨勢分析與預(yù)測是動態(tài)分析法的重要用途。時間序列是動態(tài)分析研究的一個主要方面,其前提是編制時間序列,并形成時間序列預(yù)測法。當(dāng)前時間序列有100種左右的預(yù)測方法,但其基本方法一般包括簡單平均、移動平均、指數(shù)平滑、最小二乘等,可以運(yùn)用到直線趨勢預(yù)測和曲線趨勢預(yù)測方面。時間序列影響時間序列的值變化的四種因素:趨勢變動、季節(jié)變動、循環(huán)變動、不規(guī)則變動,循環(huán)變動在短期預(yù)測中通常不考慮。將這四個因素從時間序列值中分解出來的方法稱為分解分析法。如2月份在某地的某品牌白酒銷量為60箱,通過分解技術(shù),可獲知趨勢變動(平均水平與增長勢頭)的影響值為40,中秋的季節(jié)變動影響值為15,但不規(guī)則變動影響值是5,所以即銷量為60。時間序列預(yù)測的基本方法結(jié)合上述四種因素并運(yùn)用到直線預(yù)測和曲線預(yù)測中,就形成了近100種的具體預(yù)測方法,如加權(quán)平均,加權(quán)移動平均、溫特斯法等。溫特斯法是以指數(shù)平滑法為基本模型,結(jié)合季節(jié)因素并運(yùn)用到直線趨勢中而形成的季節(jié)直線趨勢和季節(jié)變動指數(shù)平滑模型。下圖分別是直線趨勢和曲線趨勢預(yù)測的結(jié)果。

1.2.4數(shù)據(jù)倉庫架構(gòu)的建立

每一個數(shù)據(jù)倉庫有一個架構(gòu)。這架構(gòu)要么是即時的或計劃過的;或隱式的或形成文件的。不幸的是,許多數(shù)據(jù)倉庫開發(fā)時并沒有一個明確的架構(gòu),這極大的限制了它的靈活性。在沒有架構(gòu)的情況下,主題區(qū)域就無法契合在一起,它們之間的連接變得無目的,并且使整個數(shù)據(jù)倉庫的管理和變更都難于進(jìn)行。此外,雖然它可能看起來不重要,數(shù)據(jù)倉庫的架構(gòu)已成為選擇工具時的框架。

讓我們把開發(fā)一個數(shù)據(jù)倉庫與建造一個真正的房屋進(jìn)行比較。你如何建造一幢300萬美元的大廈呢?更不用說建造一間10萬美元的房子了。你要有藍(lán)圖、圖紙、技術(shù)規(guī)范、和在多個層次細(xì)節(jié)上顯示這個房子將如何進(jìn)行建造的標(biāo)準(zhǔn)。當(dāng)然,針對房子的各種子系統(tǒng)要有不同版本的藍(lán)圖,如管道工程、電氣、暖通空調(diào)系統(tǒng)(HVAC)、通信、和空間。針對所有的家用的設(shè)備也有相應(yīng)的標(biāo)準(zhǔn),包括插頭、燈具、衛(wèi)生潔具、門的尺寸等。

對于數(shù)據(jù)倉庫,架構(gòu)是對數(shù)據(jù)倉庫的元素和服務(wù)的一種描述,用具體細(xì)節(jié)說明各種組件如何組合在一起,和隨著時間的推移系統(tǒng)將如何地發(fā)展。就像這房子的比喻,數(shù)據(jù)倉庫架構(gòu)是一套文件、計劃、模型、圖紙和規(guī)范,針對每個關(guān)鍵的組件區(qū)域有獨(dú)立的分區(qū),并且足夠詳細(xì)到讓專業(yè)技術(shù)人員可以實(shí)施它們。

這并是一個需求文件。需求文件說明架構(gòu)需要做些什么。數(shù)據(jù)倉庫架構(gòu)也不是一個項目計劃或任務(wù)清單;它說明數(shù)據(jù)倉庫是什么,而不是怎么去做或為什么去做。

一個數(shù)據(jù)倉庫的開發(fā)也并不容易,因為相對于房屋的5000年建筑史,我們發(fā)展數(shù)據(jù)倉庫系統(tǒng)只有20年的時間。因此,我們的標(biāo)準(zhǔn)還不多,工具和技術(shù)正在快速發(fā)展,關(guān)于我們已經(jīng)擁有數(shù)據(jù)倉庫系統(tǒng)的檔案還很少,而且數(shù)據(jù)倉庫的術(shù)語還有很大的出入。

所以,雖然開發(fā)一個架構(gòu)是困難的,但它也是可能的,并且又是至關(guān)重要的。首先,最主要的是,架構(gòu)應(yīng)該受業(yè)務(wù)的驅(qū)動。如果你的要求是每夜進(jìn)行更新,這一要求就該包含在架構(gòu)內(nèi),而你必須弄清實(shí)現(xiàn)你目標(biāo)的技術(shù)需求。下面是一些業(yè)務(wù)需求的例子,和針對每種需求的綜合技術(shù)考量:

●每夜更新――充足的數(shù)據(jù)準(zhǔn)備能力

●全球可用性—平行或分布式服務(wù)器

●顧客層次分析――大型服務(wù)器

●新數(shù)據(jù)源――帶有支持元數(shù)據(jù)的靈活工具

●可靠性――工作的控制功能

關(guān)鍵組件區(qū)域

一個完整的數(shù)據(jù)倉庫架構(gòu)包括數(shù)據(jù)和技術(shù)因素。架構(gòu)可以被分為三個主要區(qū)域。首先,是基于業(yè)務(wù)流程的數(shù)據(jù)架構(gòu)。其次是基礎(chǔ)設(shè)施,包括硬件、網(wǎng)絡(luò)、操作系統(tǒng)和電腦。最后,是技術(shù)區(qū)域,包含用戶所需的決策制定的技術(shù)以及它們的支持結(jié)構(gòu)。對這些區(qū)域?qū)⒃谙挛姆中」?jié)進(jìn)行詳述。

●數(shù)據(jù)架構(gòu)

如上所述,在整體數(shù)據(jù)倉庫架構(gòu)中的數(shù)據(jù)架構(gòu)部分是受業(yè)務(wù)流程所驅(qū)動的。例如,在一個制造環(huán)境里,數(shù)據(jù)模型可能包括訂單、裝運(yùn)和帳單。每一個區(qū)域都依據(jù)一套不同的維度。但是在數(shù)據(jù)模型中對相交維度的定義必須相同。所以相同數(shù)據(jù)項應(yīng)該有同樣的結(jié)構(gòu)和內(nèi)容,并有一個創(chuàng)建和維護(hù)的單一流程。

當(dāng)你完成一個數(shù)據(jù)倉庫架構(gòu)并呈現(xiàn)數(shù)據(jù)給你的用戶,就要做出對工具的選擇,但隨著需求的設(shè)定,選擇就會變窄。例如,產(chǎn)品的功能開始融合,就像多維聯(lián)機(jī)分析處理(M OLAP)和關(guān)系型聯(lián)機(jī)分析處理(ROLAP)。如果停留在你建造的立方體,多維聯(lián)機(jī)分析處理(MOLAP)便可以了。它速度快又允許靈活的查詢――在立方體的范圍內(nèi)。它的缺點(diǎn)是規(guī)模(整體上和一個維度內(nèi))、設(shè)計的局限性(受立方體結(jié)構(gòu)所限)、需要一個專有的數(shù)據(jù)庫。關(guān)系型聯(lián)機(jī)分析處理(ROLAP)是多維聯(lián)機(jī)分析處理(MOLAP)的一種替代方案,它克服了多維聯(lián)機(jī)分析處理(MOLAP)的這些缺點(diǎn)。通常,混合聯(lián)機(jī)處理(HOLAP)更受歡迎,它允許一部分?jǐn)?shù)據(jù)存儲在維聯(lián)機(jī)分析處理(MOLAP)中,另一部分?jǐn)?shù)據(jù)存儲在關(guān)系型聯(lián)機(jī)分析處理(ROLAP)中,折衷了各自的長處。

●基礎(chǔ)設(shè)施架構(gòu)

對硬件及數(shù)據(jù)庫選擇的問題在于其大小、擴(kuò)展性和靈活性。在大約80%的數(shù)據(jù)倉庫項目中,這并不困難,大多數(shù)企業(yè)有足夠的力量來應(yīng)對他們的需要。

在網(wǎng)絡(luò)、檢查數(shù)據(jù)來源、數(shù)據(jù)倉庫準(zhǔn)備區(qū)、以及它們之間的任何設(shè)施方面,要確保有足夠的帶寬用于數(shù)據(jù)的移動?!窦夹g(shù)架構(gòu)

技術(shù)架構(gòu)被元數(shù)據(jù)目錄所驅(qū)動。一切都應(yīng)該受元數(shù)據(jù)所驅(qū)動。服務(wù)應(yīng)該依從表格所需的參數(shù),而不是它們的硬編碼。技術(shù)架構(gòu)的一個重要組件是 ETL(提取、轉(zhuǎn)換和加載)流程,它涵蓋了五個主要區(qū)域:

●提取-數(shù)據(jù)來自多種數(shù)據(jù)源并且種類繁多。在這個區(qū)域如果有數(shù)據(jù)的應(yīng)用時必須考慮對它的壓縮和加密處理。

●轉(zhuǎn)換-數(shù)據(jù)轉(zhuǎn)換包括代理主鍵的管理、整合、去標(biāo)準(zhǔn)化、清洗、轉(zhuǎn)換、合并和審計。

●加載-加載通常是利用加載最優(yōu)化和對整個加載周期的支持對多種目標(biāo)進(jìn)行加載。

●安全-管理員訪問和數(shù)據(jù)加密的策略。

●元件控制--它包括元件的定義、元件安排(時間和事件)、監(jiān)控、登錄、異常處理、錯誤處理和通知。

數(shù)據(jù)準(zhǔn)備區(qū)需要能夠從多種數(shù)據(jù)源提取數(shù)據(jù),如MVS、ORACLE、VM和其它,所以當(dāng)你選擇產(chǎn)品時要具體。它必須將數(shù)據(jù)進(jìn)行壓縮和加密、轉(zhuǎn)化、加載(可能對多個目標(biāo))和安全處理。此外,數(shù)據(jù)準(zhǔn)備區(qū)的活動要能夠自動化進(jìn)行。不同的供應(yīng)商的產(chǎn)品做不同的事情,所以大多數(shù)企業(yè)將需要使用多種產(chǎn)品。

一個監(jiān)控數(shù)據(jù)倉庫使用的系統(tǒng)對查詢的采集、使用的跟蹤是有價值的,而且也有助于性能的調(diào)整。性能優(yōu)化包括通過“管理者”工具進(jìn)行的成本估算,而且應(yīng)包括即時查詢的時間表。有工具能夠提供查詢管理服務(wù)。可使用工具來針對這些和其它相關(guān)任務(wù),如對前臺的基于服務(wù)器的查詢管理和來自于多種數(shù)據(jù)源的數(shù)據(jù)。也有工具可用于報表、連通性和基礎(chǔ)設(shè)施管理。最后,數(shù)據(jù)訪問塊應(yīng)包括報表的服務(wù)(如發(fā)布和訂閱),還應(yīng)包括報表庫,調(diào)度程序和分布管理員。

關(guān)于元數(shù)據(jù)

在數(shù)據(jù)倉庫流程中數(shù)據(jù)的創(chuàng)建和管理要遵循以下的“步驟”:

●數(shù)據(jù)倉庫模型

●數(shù)據(jù)源的定義

●表的定義

●數(shù)據(jù)源到目標(biāo)的映射

●映射和轉(zhuǎn)換信息

●物理信息(表格空間,等)

●提取數(shù)據(jù)

●轉(zhuǎn)移數(shù)據(jù)

●加載統(tǒng)計

●業(yè)務(wù)描述

●查詢請求

●數(shù)據(jù)本身

●查詢統(tǒng)計

為顯示元數(shù)據(jù)的重要性,上述的步驟列表中只有三步包括了“真正”的數(shù)據(jù)-

7、8和12。其他的一切都是元數(shù)據(jù),而且整個數(shù)據(jù)倉庫流程都依賴于它。元數(shù)據(jù)目錄的專業(yè)技術(shù)要素包括: ●業(yè)務(wù)規(guī)則--包括定義、推導(dǎo)、相關(guān)項目、驗證、和層次結(jié)構(gòu)信息(版本、日期等。)

●轉(zhuǎn)移/轉(zhuǎn)換信息--源/目的地的信息,以及DDL(數(shù)據(jù)類型、名稱等等。)

●操作信息--數(shù)據(jù)加載的工作時間表、依存性、通知和信息的可靠性(比如主機(jī)的重定向和加載平衡)。

●特定工具的信息--圖形顯示信息和特殊功能的支持。

●安全規(guī)則--認(rèn)證和授權(quán)。

建立架構(gòu)

在開發(fā)技術(shù)架構(gòu)模型前,要先起草一份架構(gòu)需求的文件。然后將每一項業(yè)務(wù)需求計劃包含到它的架構(gòu)中。根據(jù)架構(gòu)的區(qū)域?qū)@些內(nèi)容進(jìn)行分組(遠(yuǎn)程訪問、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)訪問工具等)。了解它如何于其它區(qū)域相適應(yīng)。采集區(qū)域的定義及其內(nèi)容。最后提煉和形成模型的文件。

我們認(rèn)識到開發(fā)一個數(shù)據(jù)倉庫架構(gòu)是困難的,因此要有一個周密細(xì)致的規(guī)劃。但ZACHMAN框架又超出了大多數(shù)企業(yè)對數(shù)據(jù)倉庫的需要,所以建議使用一個合理的折衷方案,它由四層流程所組成:業(yè)務(wù)需求、技術(shù)架構(gòu)、標(biāo)準(zhǔn)和工具。

業(yè)務(wù)需求本質(zhì)上驅(qū)動著架構(gòu),所以要對業(yè)務(wù)經(jīng)理、分析師、高級用戶進(jìn)行訪談。從你的訪談中尋找主要的業(yè)務(wù)問題,以及企業(yè)戰(zhàn)略、發(fā)展方向、挫折、業(yè)務(wù)流程、時間、可用性、業(yè)績預(yù)期的指標(biāo)。將它們一一妥善歸檔。

從IT的角度來看,跟現(xiàn)有的數(shù)據(jù)倉庫/決策支持系統(tǒng)(DSS)的支持人員、聯(lián)機(jī)分析處理(OLTP)應(yīng)用組成員、數(shù)據(jù)庫管理員們(DBA);以及網(wǎng)絡(luò)、操作系統(tǒng)和桌面支持人員進(jìn)行討論。也要與架構(gòu)師和專業(yè)規(guī)劃人員進(jìn)行探討。你應(yīng)該從這些討論中得知他們從IT的觀點(diǎn)考慮數(shù)據(jù)倉庫的意見。從中了解是否有現(xiàn)存的構(gòu)架文件、IT原則、標(biāo)準(zhǔn)文件、企業(yè)數(shù)據(jù)中心等。

關(guān)于數(shù)據(jù)倉庫并沒有太多現(xiàn)存的標(biāo)準(zhǔn),但對于許多組件來說是有標(biāo)準(zhǔn)的。下面是一些需要牢記的標(biāo)準(zhǔn):

●中間設(shè)備--開放數(shù)據(jù)庫連接(ODBC)、對象鏈接與嵌入(OLE)、對象鏈接與嵌入數(shù)據(jù)庫(OLE DB)、數(shù)據(jù)通信設(shè)備(DCE)、對象請求代理(ORB)和數(shù)據(jù)庫編程(JDBC)

●數(shù)據(jù)庫連接--ODBC, JDBC, OLE DB, 和其它。

●數(shù)據(jù)管理--ANSI SQL 和文件傳輸協(xié)議(FTP)

●網(wǎng)絡(luò)訪問--數(shù)據(jù)通信設(shè)備(DCE)、域名服務(wù)器(DNS)、和 輕量目標(biāo)訪問協(xié)議(LDAP)

無論它們支持的是哪種標(biāo)準(zhǔn),主流的數(shù)據(jù)倉庫工具都受元數(shù)據(jù)所驅(qū)動。然而,它們通常并不互相共享元數(shù)據(jù)而且在開放性上也所有不同。所以,要仔細(xì)研究和購買工具。架構(gòu)師是你選擇適當(dāng)工具的向?qū)А?/p>

一個數(shù)據(jù)倉庫架構(gòu)需要具體到怎樣的程度呢?這個問題要問的是:它有足夠的信息可以讓一個有能力的團(tuán)隊來建立一個滿足業(yè)務(wù)需求的數(shù)據(jù)倉庫嗎?至于它要花多長時間,隨著更多的人加入到它的開發(fā)中來(即:它變成了“復(fù)雜的技術(shù)策略”)和生成的系統(tǒng)需要變得更復(fù)雜(即“復(fù)雜的功能”),架構(gòu)的完成會呈指數(shù)倍的發(fā)展。

像數(shù)據(jù)倉庫中幾乎所有的事情一樣,一個迭代進(jìn)程是最好的。你不能一次做完所有的事情因為它太大了,而且業(yè)務(wù)不能等。同時,數(shù)據(jù)倉庫的市場還沒有完備。所以從流程中影響大、高價值部分開始,然后,利用你的成功去帶動另外的階段。

總結(jié):

綜上所述,建立一個數(shù)據(jù)倉庫架構(gòu)的好處如下:

●提供了一個組織結(jié)構(gòu)的框架--架構(gòu)對什么是單獨(dú)的組件、如何將它們組裝在一起、誰擁有什么部分以及優(yōu)先次序的問題劃出了界線。

●提高了靈活性和維護(hù)性--讓你能快速加入新的數(shù)據(jù)來源,接口標(biāo)準(zhǔn)允許即插即用,模型和元數(shù)據(jù)允許影響分析和單點(diǎn)的變化。

●更快的開發(fā)和再利用--數(shù)據(jù)倉庫開發(fā)者更能夠快速了解數(shù)據(jù)倉庫流程、數(shù)據(jù)庫內(nèi)容和業(yè)務(wù)規(guī)則。

●管理和通信的工具--定義未來方向和項目范圍,確定職務(wù)和職責(zé)、對供應(yīng)商傳達(dá)需求。

●協(xié)調(diào)多項任務(wù)同時進(jìn)行——多種、相對獨(dú)立的工作有機(jī)會成功地集合。

我們建議公司對準(zhǔn)業(yè)務(wù)需求而又要務(wù)實(shí)一些。時刻跟上數(shù)據(jù)倉庫產(chǎn)業(yè)的進(jìn)步是很重要的。最后,請記住架構(gòu)總是存在的:或隱性或具體的,或無計劃或計劃內(nèi)的。經(jīng)驗證明,有一個計劃內(nèi)和具體的架構(gòu)會使數(shù)據(jù)倉庫與 商業(yè)智能項目有更多的成功機(jī)會。

1.2.5如何規(guī)劃數(shù)據(jù)倉庫中的數(shù)據(jù)清洗

可以將數(shù)據(jù)倉庫的數(shù)據(jù)清洗比做政客們募集資金的過程。幾乎不存在任何一方獨(dú)立存在的可能性。數(shù)據(jù)清洗往往是數(shù)據(jù)倉庫項目中時間最密集的,最有爭議的進(jìn)程。

什么是數(shù)據(jù)清洗?

“數(shù)據(jù)清洗確保無法辨認(rèn)的數(shù)據(jù)不會進(jìn)入數(shù)據(jù)倉庫。無法辨認(rèn)的數(shù)據(jù)將影響到數(shù)據(jù)倉庫中通過聯(lián)機(jī)分析處理(OLAP)、數(shù)據(jù)挖掘和關(guān)鍵績效指標(biāo)(KPI)所產(chǎn)生的報表?!?/p>

在哪里會用到數(shù)據(jù)清洗的一個簡單例子是,數(shù)據(jù)是如何儲存在不同的應(yīng)用系統(tǒng)中的。例如:2007年3月11號可以儲存為“03/11/07”或“11/03/07”及其他格式。一個數(shù)據(jù)倉庫項目將數(shù)據(jù)輸入數(shù)據(jù)倉庫之前需要將不同格式的日期轉(zhuǎn)變成一個統(tǒng)一的格式標(biāo)準(zhǔn)。

為什么要進(jìn)行提取,轉(zhuǎn)換和加載(ETL)?

提取、轉(zhuǎn)換和加載(ETL)指的是一種可以幫助確保數(shù)據(jù)在進(jìn)入數(shù)據(jù)倉庫之前被清洗過(即符合標(biāo)準(zhǔn))的工具。供應(yīng)商提供的提取、轉(zhuǎn)換和加載(ETL)工具更加容易被用來管理持續(xù)進(jìn)行的數(shù)據(jù)清洗。供應(yīng)商提供的提取、轉(zhuǎn)換和加載(ETL)工具坐鎮(zhèn)在數(shù)據(jù)倉庫之前,監(jiān)測輸入的數(shù)據(jù)。如果它遇到了程序指定轉(zhuǎn)換的數(shù)據(jù),它就會在數(shù)據(jù)載入數(shù)據(jù)倉庫之前對其進(jìn)行轉(zhuǎn)換。

提取、轉(zhuǎn)換和加載(ETL)工具也可以用來從遠(yuǎn)程數(shù)據(jù)庫或者通過自動設(shè)定的事件或通過人工干預(yù)提取數(shù)據(jù)。有替代工具可以替換ETL工具,這要取決于你項目的復(fù)雜性和預(yù)算。數(shù)據(jù)庫管理員們(DBA)可以編寫腳本來完成提取、轉(zhuǎn)換和加載(ETL)的功能,通常能滿足較小的項目需要。微軟的SQL服務(wù)器都有一個免費(fèi)的被稱為數(shù)據(jù)轉(zhuǎn)換服務(wù)(DTS)的提取、轉(zhuǎn)換和加載(ETL)工具。數(shù)據(jù)轉(zhuǎn)換服務(wù)(DTS)是一款不錯的免費(fèi)工具,但它確實(shí)有其局限性,尤其是在數(shù)據(jù)清洗的持續(xù)管理上。

提取、轉(zhuǎn)換和加載(ETL)的供應(yīng)商有Informatica、IBM(Cognos)及Pentaho等。在對所有產(chǎn)品進(jìn)行選擇時,在接觸供應(yīng)商之前列出你認(rèn)為對一個提取、轉(zhuǎn)換和加載(ETL)供應(yīng)商的需求。從咨詢顧問那里獲得服務(wù)還是值得的,它能在產(chǎn)品的選擇上幫助你進(jìn)行需求分析。

數(shù)據(jù)清洗和提取、轉(zhuǎn)換和加載(ETL)對一個數(shù)據(jù)倉庫項目的成功有多重要?

在數(shù)據(jù)倉庫產(chǎn)生的結(jié)果符合利益相關(guān)者的期望值時,提取、轉(zhuǎn)換和加載(ETL)通常被忽視和置于腦后的。結(jié)果是,提取、轉(zhuǎn)換和加載(ETL)冠以數(shù)據(jù)倉庫項目的“沉默的殺手”的稱號。大多數(shù)數(shù)據(jù)倉庫項目由于數(shù)據(jù)清洗方面的意外情況而體驗到延遲和預(yù)算超支的情況。

如何規(guī)劃數(shù)據(jù)清洗?

及早開始對將要進(jìn)入數(shù)據(jù)倉庫的數(shù)據(jù)進(jìn)行籌劃是很重要的,這一籌劃可能會隨著項目的成熟發(fā)展而改變,但當(dāng)你需要獲得數(shù)據(jù)擁有者在沒有事先通知的情況下不會改動數(shù)據(jù)的格式的承諾時,這些文件的蹤跡就變得極為有價值。

創(chuàng)建一個需要提取、轉(zhuǎn)換和加載的數(shù)據(jù)列表。為極有可能需要轉(zhuǎn)換格式的數(shù)據(jù)設(shè)立一個獨(dú)立的列表。對是否需要購買提取、轉(zhuǎn)換和加載(ETL)工具做出決定,并留出一個全面的預(yù)算。從該領(lǐng)域的專家那里聽取建議并評估產(chǎn)品是否適用于你企業(yè)的整體技術(shù)層次。

第四篇:數(shù)據(jù)處理工作總結(jié)

2011年XXX空間數(shù)據(jù)處理工作總結(jié)

2011年XXX水利普查空間數(shù)據(jù)工作,嚴(yán)格按照《第一次全國水利普查空間數(shù)據(jù)采集與處理實(shí)施方案》要求,以質(zhì)量為中心,精心組織、周密安排,經(jīng)過全區(qū)普查工作人員的辛苦努力在對數(shù)據(jù)錄入、外業(yè)采集及內(nèi)業(yè)標(biāo)繪等各項工作,達(dá)到了上級規(guī)定的具體要求,水利普查清查階段的空間數(shù)據(jù)處理工作,現(xiàn)將XXX水利普查清查階段的空間數(shù)據(jù)處理工作總結(jié)報告如下

一、數(shù)據(jù)處理情況

1、清查數(shù)據(jù)錄入情況

普查辦數(shù)據(jù)處理工作完成如下:一是完成清查數(shù)據(jù)錄入,水利工程128處、經(jīng)濟(jì)社會用水調(diào)查對象39個、河湖治理清查對象22個、行業(yè)能力單位41個、灌區(qū)13個;二是完成鄉(xiāng)鎮(zhèn)典型居民生活用水戶調(diào)查對象100戶、地下水取水井清查對象XXX眼、規(guī)模以上地下水水源地XX處;

2、普查靜態(tài)數(shù)據(jù)采集、錄入情況

通過清查登記、審核對比、查缺補(bǔ)漏、數(shù)據(jù)處理、普查靜態(tài)數(shù)據(jù)獲取等工作流程,獲取普查靜態(tài)數(shù)據(jù)表XXX張,錄入普查靜態(tài)數(shù)據(jù)表XXXX張、靜態(tài)指標(biāo)XXXX個。按照全國水利普查空間數(shù)據(jù)采集與處理相關(guān)技術(shù)規(guī)定要求,空間數(shù)據(jù)采集是采用“內(nèi)業(yè)為主、外業(yè)為輔”的方法,但為了提高空間數(shù)據(jù)的精度,最大限度地減小空間標(biāo)繪的誤差,采集小組對所有需要標(biāo)繪對象的空間數(shù)據(jù)都進(jìn)行了外業(yè)采集,并按要求規(guī)范填寫《水利普查空間數(shù)據(jù)外業(yè)采集成果一覽表》,對采集的坐標(biāo)位置進(jìn)行整理、匯總,采集數(shù)據(jù)完成GPS空間外業(yè)數(shù)據(jù)采集點(diǎn)XXX處,萬畝灌區(qū)主干渠系完成普查靜態(tài)數(shù)據(jù)采集100%、數(shù)據(jù)錄入100%。

二、空間數(shù)據(jù)標(biāo)繪情況

1、內(nèi)業(yè)標(biāo)繪情況 對可以在電子工作底圖上直接辨識的清查對象,參照《第一次全國水利普查空間數(shù)據(jù)采集與處理技術(shù)規(guī)定》,通過選取工作底圖中的相應(yīng)分類要素,完成該對象在電子工作底圖上的位置、形態(tài)特征,若分類要素未表達(dá)該對象或表達(dá)的位置、形態(tài)與遙感影像存在較大差異,則結(jié)合已掌握的實(shí)際信息,以遙感影像為參考,做必要的調(diào)整。完成空間數(shù)據(jù)采集100%、標(biāo)繪100%。

2、對象關(guān)系建立

XXX水利普查數(shù)據(jù)處理組,依據(jù)清查登記成果,結(jié)合基礎(chǔ)資料等相關(guān)信息,利用配發(fā)的電子工作底圖,借助水利普查空間數(shù)據(jù)采集處理軟件,完成對象空間關(guān)系的建立。

三、涉密數(shù)據(jù)管理

XXX水利普查數(shù)據(jù)組為切實(shí)規(guī)范第一次全國水利普查涉密數(shù)據(jù)的使用管理,保障涉密數(shù)據(jù)使用安全防止國家秘密、商業(yè)秘密和個人隱私等泄露,根據(jù)《中華人民共和國保守國家秘密法》、《中華人民共和國保守國家秘密法實(shí)施辦法》、《中華人民共和國統(tǒng)計法》和《水利部保密工作管理規(guī)定》等有關(guān)法規(guī),結(jié)合我區(qū)水利普查工作實(shí)際制定《普查涉密數(shù)據(jù)日常安全管理細(xì)則》、《XXX普查涉密信息保密管理制度》并嚴(yán)格執(zhí)行。對普查相關(guān)人員進(jìn)出保密機(jī)房實(shí)行在冊登記。

四、下一步工作打算

普查辦數(shù)據(jù)組下一步打算,一是要嚴(yán)格按照普查時間節(jié)點(diǎn)要求,做好普查表數(shù)據(jù)審核、平衡處理、內(nèi)業(yè)標(biāo)繪工作。二是對今年工作經(jīng)驗教訓(xùn)進(jìn)行系統(tǒng)總結(jié),重點(diǎn)是完善各專項普查對象的空間關(guān)系建立。三是對空間數(shù)據(jù),做到科學(xué)分析、認(rèn)真標(biāo)繪。今后我們將在市普查辦數(shù)據(jù)專項組的領(lǐng)導(dǎo)下,按照水利普查方案,嚴(yán)把時間節(jié)點(diǎn),順利完成XXX第一次全國水利普查工作空間數(shù)據(jù)處理工作。

第五篇:mtt數(shù)據(jù)處理

實(shí)驗一急性毒性試驗(改進(jìn)寇氏法)

一、目的與要求

1、學(xué)習(xí)急性毒性試驗的方法,掌握LD50的測定方法。

2、觀察馬錢子的毒性反應(yīng)。

二、實(shí)驗原理

急性毒性試驗是指受試動物在一次大劑量給藥后所產(chǎn)生的毒性反應(yīng)和死亡情況。藥物毒性的大小,常用動物的致死量來表示,因為動物生與死的生理指標(biāo)較其他指標(biāo)明顯、客觀、容易掌握。致死量的測定也較準(zhǔn)確。在測定致死量的同時,還應(yīng)仔細(xì)觀察動物是否出現(xiàn)聳毛、倦臥、耳殼蒼白或充血、突眼、步履蹣跚、肌肉癱瘓、呼吸困難、昏迷、驚厥、大小便失禁等不良反應(yīng)。

致死量的測定常以半數(shù)致死量為標(biāo)準(zhǔn)。半數(shù)致死量是指能夠引起試驗動物一半死亡的劑量,媽藥物致死量對數(shù)值,用符號LD50表示。由于LD50的測定較簡便、可靠,而且穩(wěn)定,現(xiàn)已成為標(biāo)志動物急性中毒程度的重要常數(shù)。LD50測定的方法有多種,如Bliss法、改進(jìn)寇氏法、簡化機(jī)率單位法、累積插值法、機(jī)率單位-加權(quán)直線加歸法等等。以上方法雖各有特點(diǎn),但都有共同的要求:

(1)動物:均選用體重17~22克健康小鼠(同次試驗體重相差不得超過4克),或選用體重120~150克(同次試驗體重相差不得超過10克)健康大鼠作實(shí)驗動物。性別相同或雌雄各半。

(2)給藥途徑:要求采用兩種給藥途徑,其中必須有一種與臨床所采用的相同。溶于水的藥物沿須測定靜脈注射的LD50。值得提出的是,臨床上雖然不用腹腔注射,但動物實(shí)驗因腹腔注射給藥方便,吸收迅速,頗為常用。若供試藥物在腹腔內(nèi)不引起強(qiáng)烈刺激或局部變化(如纖維性病變等),那么嚙齒類動物腹腔注射的LD50,參數(shù)很接近于靜脈給藥的LD50。口服制劑無法通過注射給藥途徑時,可只用胃腸給藥。

(3)試驗周期和觀察指標(biāo):給藥后至少觀察7天。觀察期間應(yīng)逐日記錄動物的毒性反應(yīng)情況和死亡動物的分布。

(4)正式試驗前,均須先用少量動物進(jìn)行預(yù)試試驗,大致測出受試藥物引起0%和100%死亡率的致死量范圍,然后安排正式試驗。正式試驗組數(shù)不得少于三個劑量組,一般選用4~5個劑量組,每組動物數(shù)為10~20只。

(5)報告LD50時需注明實(shí)驗動物的種屬及品系、性別、體重范圍、給藥途徑及每個劑量組動物數(shù)等,還需注明受試藥物的配制方法、給藥劑量、各組劑量間的比值(一般以0.65~0.85為宜)、給藥容積、觀察時間及計算方法。還須標(biāo)出LD50的95%可信限。

三、實(shí)驗材料和試劑

動物:小鼠 藥品:馬錢子水煎液

器材:注射器、灌胃針頭、鼠籠

四、操作方法

1、預(yù)試實(shí)驗:預(yù)試實(shí)驗?zāi)康氖菫榱苏页鲆饎游?%(Dn)和100%(Dm)死亡的劑量,以便安排正式實(shí)驗。預(yù)試實(shí)驗一般采用少量動物(6~9只小鼠)進(jìn)行,將動物隨機(jī)分為3組,組間劑量比值一般以1:0.5或1:0.7為宜。灌服或腹腔注射量以0.2ml/10g體重為度。預(yù)試實(shí)驗應(yīng)進(jìn)行到找出Dn和Dm后方可安排正式實(shí)驗。

2、正式實(shí)驗:在預(yù)試實(shí)驗測得Dn和Dm的劑量范圍內(nèi)設(shè)4~6個劑量組,最多10組。最理想的結(jié)果是使LD50的上下各有2~3組。組數(shù)愈少,準(zhǔn)確性愈差。各劑量組的動物要求相等,至少10只動物(分組時應(yīng)注意分層隨機(jī)均勻化的原則)。本實(shí)驗要求最大反應(yīng)率為100%,最小反應(yīng)率為0%,或至少反應(yīng)率接近100%或0%。組間劑量比值(1:K),常用1:0.8或1:0.75。如實(shí)驗中出現(xiàn)相鄰劑量有重復(fù)的100%和0%反應(yīng)率時,應(yīng)將靠邊的組棄去不計,使大劑量組只有一個100%的反應(yīng)率,小劑量組也只有一個0%的反應(yīng)率。

分組完畢和各組劑量算出后,分組灌服或注射不同劑量的受試藥物。為能得到理想的結(jié)果,實(shí)驗最好從中間劑量開始,以便從最初幾個劑量組動物接受藥物后的反應(yīng)來判斷兩端劑量是否合適,便于調(diào)整劑量和組數(shù)。為了提高實(shí)驗的精確度和節(jié)省藥物,受試藥物可按“低比稀釋法”配置。即使每只動物的用藥體積相等(0.2ml/10g),而溶質(zhì)不等。給藥后逐日觀察并記錄中毒反應(yīng)、死亡率和死亡情況。

五、實(shí)驗結(jié)果記錄與計算

馬錢子水煎液對小鼠死亡率的影響

組別

劑量g/kg(d)2 3 4

Logd(X)

死亡數(shù) 死亡率(P)

P2

P-P2

公式1:(logLD50)X50=Xm-i(ΣP-0.5)

則LD50=log-1 X50

公式2:Sx50=i*(p?p2)/(n?1)公式3:LD50的95%可信限=lg-1(X50±1.96S X50)LD50的平均可信限= LD50±(LD50高限-LD50低限)/2 Xm:最大劑量組劑量的對數(shù)值

i:相鄰兩組劑量(d)對數(shù)值之差,或相鄰兩組高劑量與低劑量之比的對數(shù)。P:各組動物的死亡率,用小數(shù)表示。ΣP:為各組動物死亡率的總和。n:每組動物數(shù)。Sx50:logLD50的標(biāo)準(zhǔn)誤。

下載臨床數(shù)據(jù)處理和統(tǒng)計分析(精選5篇)word格式文檔
下載臨床數(shù)據(jù)處理和統(tǒng)計分析(精選5篇).doc
將本文檔下載到自己電腦,方便修改和收藏,請勿使用迅雷等下載。
點(diǎn)此處下載文檔

文檔為doc格式


聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)自行上傳,本網(wǎng)站不擁有所有權(quán),未作人工編輯處理,也不承擔(dān)相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)有涉嫌版權(quán)的內(nèi)容,歡迎發(fā)送郵件至:645879355@qq.com 進(jìn)行舉報,并提供相關(guān)證據(jù),工作人員會在5個工作日內(nèi)聯(lián)系你,一經(jīng)查實(shí),本站將立刻刪除涉嫌侵權(quán)內(nèi)容。

相關(guān)范文推薦

    數(shù)據(jù)處理考綱

    全國殘疾人崗位精英職業(yè)技能競賽規(guī)則計算機(jī)操作員(數(shù)據(jù)處理)全國殘疾人崗位精英職業(yè)技能競賽組委會2012年7月競 賽 標(biāo) 準(zhǔn)一、競賽目的考查參賽選手對于數(shù)據(jù)處理相關(guān)基礎(chǔ)知識的......

    數(shù)據(jù)處理和電子表格軟件教案5篇

    “數(shù)據(jù)處理和電子表格軟件”教學(xué)設(shè)計 【適用年級】 初二年級第二學(xué)期 【適用單元】 電子表格軟件第1節(jié) 【教學(xué)目標(biāo)】 ●知識目標(biāo) (1)熟悉EXCEL窗口。 (2)理解工作簿、工作表、......

    [A]2013年臨床路徑統(tǒng)計分析與改進(jìn)措施5篇

    2013年臨床路徑實(shí)施情況統(tǒng)計分析和改進(jìn)措施 自2013年1月起我院重新開展了臨床路徑實(shí)踐工作,通過1年的實(shí)踐,取得了一些成績和經(jīng)驗,現(xiàn)總結(jié)匯報如下: 一、工作開展情況及成效 1. 建......

    誤差和分析數(shù)據(jù)處理習(xí)題(5篇模版)

    第二章 誤差和分析數(shù)據(jù)處理 1、在定量分析中,精密度和準(zhǔn)確度的關(guān)系是 A、精密度高,準(zhǔn)確度一定高,B、準(zhǔn)確度是保證精密度的前提 C、精密度是保證準(zhǔn)確度的前提 2、從精密度好就可......

    圖書采訪數(shù)據(jù)處理

    圖書采訪數(shù)據(jù)處理 【摘 要】本文結(jié)合本人工作實(shí)踐,以匯文圖書采訪系統(tǒng)為例,介紹了有關(guān)圖書采訪數(shù)據(jù)的處理技巧。【關(guān)鍵詞】圖書;采訪;數(shù)據(jù)處理Book Interview Data Processing......

    調(diào)研數(shù)據(jù)處理方法:

    調(diào)研數(shù)據(jù)處理辦法:調(diào)研數(shù)據(jù)顯示新一季MINISO名創(chuàng)優(yōu)品在華知名度高達(dá)63%當(dāng)前國內(nèi)實(shí)體零售業(yè)市場普遍收縮的大環(huán)境下,MINISO名創(chuàng)優(yōu)品的異軍突起,為廣大零售業(yè)界同行所震撼。為剖......

    數(shù)據(jù)處理培訓(xùn)總結(jié)

    數(shù)據(jù)處理培訓(xùn)報告一、 培訓(xùn)組織 根據(jù)上海市第一次全國水利普查暨上海市第二次水資源 普查技術(shù)路線和數(shù)據(jù)處理工作的要求,為保證在線填報的順利進(jìn)行,確保普查數(shù)據(jù)質(zhì)量, 市水利普......

    數(shù)據(jù)處理學(xué)習(xí)總結(jié)

    數(shù)據(jù)處理與分析學(xué)習(xí)總結(jié) 通過對《數(shù)據(jù)處理與分析》這門課的學(xué)習(xí),對試驗設(shè)計與數(shù)據(jù)處理有了一定的了解。明白了什么情況下進(jìn)行什么樣的數(shù)據(jù)分析無試驗,進(jìn)一步學(xué)會了合理處理數(shù)......

主站蜘蛛池模板: 亚洲伊人久久综合成人| 日韩精品无码一区二区三区av| 精品无码一区二区三区在线| 成人av无码一区二区三区| 精品一区二区成人精品| 精品久久久久久亚洲综合网| 日射精情感性色视频| 久久精品国产久精国产果冻传媒| 最新综合精品亚洲网址| 亚洲色无码专区在线观看| 欧美精品日韩精品一卡| 18精品久久久无码午夜福利| 国产精品亚洲精品日韩己满十八小| 亚洲国产av无码专区亚洲av| 天堂а√中文最新版地址在线| 伊人色综合久久天天人手人婷| 亚洲欧美日本国产专区一区| 久久精品国产亚洲大片| 亚洲欧美日韩另类丝袜一区| 97久久超碰福利国产精品…| 欧美z0zo人禽交欧美人禽交| 亚洲暴爽av天天爽日日碰| 精品欧洲av无码一区二区男男| 老师粉嫩小泬喷水视频90| 亚洲爆乳成av人在线视水卜| 国产成人香蕉久久久久| 精品无码av无码免费专区| 亚洲国产欧美在线人成大黄瓜| 国产精品麻豆aⅴ人妻| 欧美精品一区二区a片免费| 中文 在线 日韩 亚洲 欧美| 无码中文av有码中文av| 久久无码专区国产精品| 亚洲另类自拍丝袜第五页| 思思re热免费精品视频66| 性一交一乱一A片久久99蜜桃| 海角国精产品一区一区三区糖心| 精品久久久久久久久久久aⅴ| 狠狠躁夜夜躁人人躁婷婷视频| 91精品少妇高潮一区二区三区不卡| 国产成人综合亚洲欧美日韩|