久久99精品久久久久久琪琪,久久人人爽人人爽人人片亞洲,熟妇人妻无码中文字幕,亚洲精品无码久久久久久久

BI項目實施方案總結

時間:2019-05-15 13:38:30下載本文作者:會員上傳
簡介:寫寫幫文庫小編為你整理了多篇相關的《BI項目實施方案總結》,但愿對你工作學習有幫助,當然你在寫寫幫文庫還可以找到更多《BI項目實施方案總結》。

第一篇:BI項目實施方案總結

項目實施階段幾個主要問題

1、數據準備

2、缺乏關鍵用戶的參與

3、培訓效果急于求成

4、需求擴大化

5、乙方的承諾

6、項目文檔管理

一、數據準備

項目實施的數據準備階段要求客戶方提供完整的基礎數據以及截至某一時間點的事務性數據,即便將數據整理完畢,其準確性也難以保證,導致不斷出現反復核對修改數據,這樣經常使得原計劃的數據準備工作延期完成,而有的實際的業務數據已經發生,這給后期的業務處理帶來很大的麻煩,導致項目總是模擬運行,無法實現按計劃的順利切換。(若是數據標準統一階段無法按期完成,如何解決?或者按期完成了但是數據準確性不高,導致后期建模,報表等的修改,責任如何劃分?修改的人天如何計算?)

解決方案---乙方應告知我們如何提供完整的、準確的數據字典,應如何去進行分類、編碼、整理

二、缺乏關鍵用戶的參與

項目實施不僅是軟件供應商的事,關鍵用戶必須全程參與項目實施,協調方案討論、需求確認、計劃審定并與實施人員一起推動項目實施,項目經理要定期進行階段工作總結,分析存在的問題,總結項目實施的階段性成果,制定下個階段的實施計劃,爭取企業管理者的重視和信任

三、培訓效果急于求成

培訓不夠正規,培訓環境、人員、課件簡陋,培訓的效果大打折扣,客戶對軟件的功能、流程及設計思想認識不足,堅持過去模式,不能接受新系統帶來的變化,項目經理的方案難以實施。(培訓一定要讓業務人員了解實施的整個過程以及各個階段的內容和目標,要讓業務人員明白實施能給他們帶來的價值)

四、需求擴大化

需要一開始就明確需求,明確實施的范圍和目標

五、銷售人員不切實際的承諾

關于實施范圍、要求能否實現等問題,一定要實施人員做出解答,而不能是銷售人員

六、項目文檔管理

需要有書面化的文檔來明晰各自的職責,信息互通,共同把握實施的節奏(具體包括需求范圍,人員職責等)需要標準的業務流程文檔,有助于雙方明晰業務流程,有效配合業務流程的重組和優化 標準編碼、標準數據文檔及標準參數設置文檔等,可有效地減少重復的工作

從報表開發流程及參與者角色的角度談一下BW項目: 1.用戶需求階段:

報表應用從需求出發,因為BW報表一般是分析型的報表,需要需求提出者對業務有相當的了解,有較高的綜合、歸納能力,若需求不準確,需求多變,報表開發周期難免會延長。

2.需求分析、模型設計階段

此階段可以說是報表開發最重要的階段,與單純R/3報表開發相比,BW報表需要更多的設計、架構。此階段的參與角色除了需求者以外,最重要的是架構師、業務顧問。業務顧問要對用戶需求領域的業務非常清楚,架構師除了精通BW技術外,對需求業務領域也必須有深入的認識,并且架構師、業務顧問必須溝通良好,否則會面臨較大風險。有了基本模型,可能還需要一些程序來實現其中部分功能,因為涉及大量數據,程序設計人員除了實現功能外,尤其需要關注程序的效率。

3.數據抽取階段

模型設計完畢之后,就可以開始抽取、加載數據了。數據抽取、加載人員必須對BW數據流有清晰的理解,根據數據流程設計自動處理鏈,讓系統自動運行,并知道各類錯誤如何解決。

4.報表開發、權限配置階段

此對報表開發、權限配置人員的基本要求同樣是精通BW報表制作及權限配置。

5.報表測試、推廣階段

報表出來后先要經過業務顧問、關鍵用戶仔細測試。由于BW報表一般涉及大量數據,復雜邏輯,在推廣前一定要經過仔細測試,最好將各種業務可能都測試到,確保報表準確。

第二篇:BI系統總結

團委引進CI的原因:

? 明確團委組織文化建設

? 增強團委對外的影響力,建立團委品牌,使我們更

方便、更有效地為同學服務。

? 營造團委內部的團隊凝聚力

? 規范團委的制度與行為

? 傳承團委優秀傳統和工作經驗,規劃發展戰略。BI:行為識別:置于中間層位的BI則直接反映組織理念的個性和特殊性,是組織實踐管理理念與創造組織文化的準則

.BI(Behavior Identity)行為識別系統

工程學院團委的幫事宗旨應始終圍繞團委的口號

“團結、高效、求真、務實”

一個組織的特色并不是體現在它的宣傳上,而是體現在其特有的組織文化上,而其行為則直接體現其特色,BI系統不僅適合于現代企業,其特有的組織先進性也適合在其他組織上,工程學院團委經過長時間的探索,逐漸形成其特色的BI系統,以下主要體現在對內與對外兩個方面。

? 對內:組織制度、干部教育 項目管理 工作環境 行為規范、經驗傳承成員發展、總結規范等

? 對外:活動策劃 公共關系、第一,團委干部公共禮儀素質

(1)講規則是根本:著裝要求,社交談吐;公共環境;電話和名片的使用

(2)懂處事是核心:與人方便,同己方便;與人講話,看人臉色;與人美言,可免百憂;微笑是打開心鎖的鑰匙;情比理更能打動人的心弦

第一,團委干部公共演講素質:用大腦想話;用語言傳話;用身體融話

第二,團委干部公共策劃素質:把想到的記下來;按記下來去實踐;把做過的總結起來

1.組織制度:“無規矩不成方圓”。春秋戰國時期,正是法家的法派商鞅使秦國 1

走向強大,終而一統天下。由此可見,沒有制度,無以成組織。制度化有利于團委日常工作的開展。《共青團華南農業大學工程學院委員會章程》是團委所有干部的最高行動指南,還有《辦公室管理制度》《項目管理制度》《請假制度》《會議制度》《干部績效考核制度》《先進團支部評比條例》等規范團委成員的日常工作。

(一)制度(節選)

《共青團華南農業大學工程學院委員會章程》

1.團委會在校黨委的直接領導下,開展各項有益于學生學習和身心健康的活動,促使學生

德、智、體、美、勞全面發展。做優秀團員入黨的推薦、培養、考察工作。

2.團委宗旨:以“團結、高效、求真、務實”為原則,以服務廣大同學為宗旨,以馬克思

列寧主義、毛澤東思想、鄧小平理論和“三個代表”重要思想為行動指南,以科學發展觀為指導方針。團委意識:創新意識,服務意識,學習意識,奉獻意識。

3.發揮黨聯系青年的橋梁和樞紐作用。關心學院廣大同學的學習和生活,切實為同學服務,及時向上級反映同學的意見和要求。

4.積極參與和配合學院搞好團組織工作和學生會組織工作,致力于學生管理;帶動全院學

生活動,組織全院學生學習黨、團的思想,致力于把全院學生培養為有理想、有道德、有學問的、具備綜合素質的優秀學生,為國家、為社會培養國家之棟梁,有用之才。要發揚團的優良傳統和先鋒作用,富于創造性地開展工作,把工程學院團委建設作為教育青年團員的堅強核心。

2.干部教育:

A:每一位團委干部都應該關注社會形勢發展,接受團務教育和素質培訓,不斷提高辦事的效率和質量。

B:平常應多一點向上一屆的團委成員請教,向老師討教等。

C:在平時的工作中多思考,多學習,充分利用網絡、圖書館、往屆團委資料光碟,積累有經驗的前輩傳承下來的底蘊。

D:多一點與本學院的學生組織交流,相互交流與學習。

E:可以以學院團委的名義,與兄弟學院的團委或其他組織進行經驗交流和相互學習,以達到共同進步的目的。

3.項目管理:就是在有限資源的約束下,運用系統的觀點、方法和理論,對項目涉及的全部工作進行有效地管理。項目化管理是以培養干部的創新精神和實踐能力為目的的,并在團委的宏觀政策指導下,通過對每個活動和每件工作實行專人總負責,專人總管理的方法,使各方面的人力、物力、信息、資金等多方面資源達到最優配置的一種學生工作運行方式。項目化管理為學生干部搭建成長的平臺,給他們留下自我發展的時間和空間

項目管理辦法:

(1)、成立籌委會時,負責人必須盡可能收集多關于項目的資料

(2)、籌委會必須于活動開展前向副書記提交初步策劃意向書

(3)、獲得批準、并結合老師意見后完善活動的具體策劃書,工作開展

(4)、活動進行過程中,籌委會必須定時向副書記匯報情況

(5)、活動后籌委會內部必須2天內向負責人匯報財政狀況

(6)、活動后必須于3天內向副書記上交財務清單,副書記也應在一周內進 行結余

(7)、活動后5天內必須向副書記和秘書部提交電子版詳細項目總結報告

(8)、在完成財務結余和總結審核后,籌委會正式解散

附錄:《辦公室管理制度》

1、辦公室作用:(1)日常辦公場所(2)來訪同學的“窗口”(3)存放團委學生會檔案

辦公室管理人員:秘書部

辦公室地址:工程學院北樓3082、值班時間:周一至周五:上午10:00-11:30,下午4:30-6:00

值班組長:每日秘書小組值班人員

值班人員的要求:準時值班,不缺勤或早退,請假必須提前一天找人替班并告知當日值

班組長。到位后及時填寫值班記錄。儀表穿戴整潔,佩帶工作證,熱

情待人。服從當日值班組長指揮。離開辦公室需關閉所有電器、關好

門窗。

3、檔案管理:檔案要一式兩份,一份為電子版存于辦公室電腦,文件檔案分類存放入各類

文件夾。團委學生會成員經值班組長同意方可就地查閱。若需外借或拷貝電

子版需值班組長同意并登記,外借期限為2天。

4、電腦使用制度:嚴禁用于私人用途。電腦D盤為各類檔案,嚴禁在負責人統一整理之前刪除任何檔案。工作環境:一個組織運行的高效與良好,離不開一個良好的工作環境。快樂的團隊成員是工程團委的財富,和諧的團隊文化是工程團委的靈魂。

團委的工作環境應該體現出人文關懷,成員間互愛互助

A:組織關心成員:在成員生日時送上誠摯的祝福,營造一種大家庭氛圍

B:組員相互幫忙:當組員有困難時,大家盡力幫助,助人度難,以增強團委組員的凝聚力,創建一種和諧的環境;

C:部長熱心對待干事:當干事做錯事情時,部長們應熱心幫忙糾正,體諒干事。D節日組織一些文體活動:如在中秋節組織不會家的成員們一起歡聚等行為規范:

A:團委成員工作期間必須佩帶工作證,大型活動或集體工作期間必須穿上團委工作服。

B:團委成員在出席工作會議時應該具備兩樣道具:筆和筆記本。會議中禁止玩手機、交頭接耳,手機應調置靜音狀態,保持會場肅靜

C:平常接到領導的工作指示或安排時,應嚴格執行,按時完成,完美完成。

D:組員見面時要相互問好。

E:在工作期間組員們要認真嚴肅,切勿大喊大叫,亂走亂跑。

F:在日常工作中,應待人以禮,助人為樂,尊師為重。

G:在行為規范中,符合大學生行為準則是前提,一切行為規范都以其開展。H:大家應該懂得互相尊重,用微笑去真摯交流。

I:參加工作會議時,避免缺席、遲到、早退現象。按會議要求提前10分鐘進場,如有事不能參加會議,應事先按團委規定逐級辦理請假手續;在完成上級組織下達的工作任務時,應充分理解工作內容,常常向組織匯報工作進度,保證工作的銜接;任務實施時,遇到疑問和同事或組織商量。

6溝通規范:

團委成員信息溝通應該為“雙向高效”溝通。

A:“雙向”是指上級布置工作時對下級的耐心指導和經驗傳承和下級向上級匯報工作是的工作總結和心得體會。

B高效”是指工作要定量化,在分工合作的模式下按時甚至提前完成工作。但高效并不代表只追求快而忘了質量,團委的高效應該是在高質量的前提下追求快。

C:團委委員的通知由秘書部負責,團委小組成員的通知由所屬部門負責。

7成員發展:

團委成員的培養采取直接上級負責制,直接上級要注重下級的發展,進行隨時隨地隨事地培養。

A;對于團委部長級以上干部建議選修管理學課程;對于團委全體成員進行系列培訓,由秘書部負責安排,由各個部門直接培訓。

B:團委成員作為學生干部,更應該懂得在日常工作中總結經驗,自我學習,不斷提高為人民服務的悟性。

C:在工作中,團委成員要積極開展批評和自我批評,不斷完善自我,完善團委。D:謙虛地向有經驗的同學或老師請教。

E:懂得利用圖書館或網絡的知識,解決工作中的問題。

8經驗傳承:

團委每完成一個項目,應該通過系統總結,將經驗以文字記錄或光盤的形式傳承下來。不斷經驗積累,避免重復投資,降低項目成本,實現高效管理。

A:在項目完成后一周內,項目負責人以及各相應分管部門把總結和和項目的所有相關資料交到秘書部匯總存檔。

B;平常工作中,上級應該主動向下級介紹工作經驗。

9總結規范:

A:項目負責人的總結內容包括:①項目實際具體策劃書;②逐點羅列成功經驗或突破,并相應作具體說明;③逐點羅列不足之處或教訓,并相應分析原因和作出建議;④活動經費結算清單。

B:籌委會內部成員總結內容包括:①介紹項目分管工作,對相關細節有必要作說明; ②逐點羅列成功經驗或突破,并相應作具體說明;③逐點羅列不足之處或教訓,并相應分析原因和作出建議。④對活動后,自己心里的體會。

1.活動策劃:

1.活動項目化,活動系列化,宣傳有效化,資金多元化,工作透明化

2.策劃書策劃書的主要內容及應注意的細節

(1)背景、主題(2)活動目的及意義(3)主辦,承辦,協辦方(4)活動對象(影響范圍)(5)活動時間地點活動內容(6)活動籌備委員會(7)具體流程(8)效果預測(9)物資清單(10)經費預算(11)突發情況處理方案(12)第二第三備選方案

2.公共關系:

? 正確處理學院團委與年級團總支間的關系,明確組織的責權,肯定團總支的獨

立性。

? 積極配合校團委、院黨委開展工作,加強與各兄弟學院團委的交流合作,優勢

互補,相互促進,共謀華農學生組織的發展。

? 堅持獨立性原則的基礎上,密切團結院學生會,發揮兩大組織合作的巨大作用,攜手開創工程學院學生工作的美好明天

共青團華南農業大學工程學院委員會章程

總則

第一條 華南農業大學工程學院團委是在學院黨委直接領導下的學生群眾組織,她以共

產主義精神教育青年,幫助青年用馬克思列寧主義、毛澤東思想和現代科學文

化知識武裝自己,引導青年在社會主義現代化建設中,鍛煉成為有理想,有道

理,守紀律的共產主義事業的接班人。團委會在校黨委的直接領導下,開展各

項有益于學生學習和身心健康的活動,促使學生德、智、體、美、勞全面發展。

團委會要配合黨委開展適合學生特點的思想教育工作,引導學生樹立正確的人

生觀、世界觀、道德觀。團委會代表青年學生的利益,維護青年學生利益,傾

聽同學們的呼聲,充分發揮橋梁和紐帶作用。對團員進行黨的基礎知識及黨的路線、方針、政策的教育,做優秀團員入黨的推薦、培養、考察工作。

第二條 團委宗旨:

以“團結、高效、求真、務實”為原則,以服務廣大同學為宗旨,以馬克思列

寧主義、毛澤東思想、鄧小平理論和“三個代表”重要思想為行動指南,以科學

發展觀為指導方針。

第三條 團委意識:創新意識,服務意識,學習意識,奉獻意識。

第四條 院團委的基本任務:

熱愛祖國,熱愛人民,堅決擁護中國共產黨的綱領,以馬克思列寧主義,毛澤

東思想和鄧小平理論及江澤民同志“三個代表”的重要思想為行動指南,以科

學發展觀為指導方針,解放思想,實事求是,與時俱進,總攬全局、統籌規劃,團結各年級學院團員青年。堅定不移地貫徹黨在社會主義初級階段的基本路線,造就有理想,有道德,有文化,有紀律的社會主義接班人,努力為黨輸送新鮮

血液。加強學院廣大團員的思想政治工作,幫助團員青年學習科學文化知識,發揮團總支的先鋒作用,不斷提高團員青年的文化素質與政治思想覺悟。

始終把實現好、維護好、發展好廣大團員學生的根本利益作為團委一切工

作的出發點和落腳點,尊重學生主體地位,發揮學生首創精神,保障學生

各項權益。

發揮黨聯系青年的橋梁和樞紐作用。關心學院廣大同學的學習和生活,切實為

同學服務,及時向上級反映同學的意見和要求。

積極參與和配合學院搞好團組織工作和學生會組織工作,致力于學生管理;帶

動全院學生活動,組織全院學生學習黨、團的思想,致力于把全院學生培養為

有理想、有道德、有學問的、具備綜合素質的優秀學生,為國家、為社會培養

國家之棟梁,有用之才。要發揚團的優良傳統和先鋒作用,富于創造性地開展

工作,把工程學院團委建設作為教育青年團員的堅強核心。

詳細內容請查看《共青團華南農業大學工程學院委員會章程》

第三篇:BI學習心得

BI學習心得 BI是什么

通過學習理解,可將BI歸結為一句話:從數據中挖取利潤。

1.1 初識BI 初識BI的概念,是從《BI相關知識介紹.ppt》開始的。通讀之后,我了解三件事: 1)、沃爾瑪將啤酒和尿布擺在一起出售,提高了啤酒的銷量; 2)、BI是Business Intelligence的縮寫,商務智能。官方定義:是一種運用了數據倉庫、在線分析和數據挖掘等技術來處理和分析數據的嶄新技術。3)、BI的分析過程圖,如下:

圖1.1—BI Analyse的過程

同時,幻燈片中還介紹了大量的中英文概念,讓我非常的混亂。為了更好的學習了解BI,首先需要克服的就是名詞解釋,其次是通過實例了解BI的應用。1.2 常見名詞淺釋

? ETL:數據抽取(Extract)、轉換(Transform)、清洗(Cleansing)、裝載(Load)的過程。構建數據倉庫的重要一環,用戶從數據源抽取出所需的數據,經過數據清洗,最終按照預先定義好的數據倉庫模型,將數據加載到數據倉庫中去。? Data Warehouse:數據倉庫,是在企業管理和決策中面向主題的、集成的、與時間相關的、不可修改的數據集合。與其他數據庫應用不同的是,數據倉庫更像一種過程,對分布在企業內部各處的業務數據的整合、加工和分析的過程。而不是一種可以購買的產品。? Data mart:數據集市,或者叫做“小數據倉庫”。如果說數據倉庫是建立在企業級的數據模型之上的話。那么數據集市就是企業級數據倉庫的一個子集,他主要面向部門級業務,并且只是面向某個特定的主題。數據集市可以在一定程度上緩解訪問數據倉庫的瓶頸。? OLAP(On-Line Analytical Processing):聯機在線分析處理,是一類軟件技術,它們使用戶(業務分析師、經理和執行官)能夠以交互形式快速、一致地探查數據,用戶看到的是經過轉換后的原始數據的各種信息視圖,它們可以反映業務的真實維數。? ROLAP:基于Codd的12條準則,各個軟件開發廠家見仁見智,其中一個流派,認為可以沿用關系型數據庫來存儲多維數據,于是,基于稀疏矩陣表示方法的星型結構(star schema)就出現了。后來又演化出雪花結構。為了與多維數據庫相區別,則把基于關系型數據庫的OLAP稱為Relational OLAP,簡稱ROLAP。代表產品有Informix Metacube、Microsoft SQL Server OLAP Services。? MOLAP:Arbor Software嚴格遵照Codd的定義,自行建立了多維數據庫,來存放聯機分析系統數據,開創了多維數據存儲的先河,后來的很多家公司紛紛采用多維數據存儲。被人們稱為Muiltdimension OLAP,簡稱MOLAP,代表產品有Hyperion(原Arbor Software)Essbase、Showcase Strategy等。? Client OLAP:相對于Server OLAP而言。部分分析工具廠家建議把部分數據下載到本地,為用戶提供本地的多維分析。代表產品有Brio Designer,Business Object。? DSS:決策支持系統(Decision Support System),相當于基于數據倉庫的應用。決策支持就是在收集所有有關數據和信息,經過加工整理,來為企業決策管理層提供信息,為決策者的決策提供依據。? Ad hoc query:即席查詢,數據庫應用最普遍的一種查詢,利用數據倉庫技術,可以讓用戶隨時可以面對數據庫,獲取所希望的數據。? EIS:主管信息系統(Executive Information System),指為了滿足無法專注于計算機技術的領導人員的信息查詢需求,而特意制定的以簡單的圖形界面訪問數據倉庫的一種應用。

? BPR:業務流程重整(Business Process Reengineering),指利用數據倉庫技術,發現并糾正企業業務流程中的弊端的一項工作,數據倉庫的重要作用之一。? BI:商業智能(Business Intelligence),指數據倉庫相關技術與應用的通稱。指利用各種智能技術,來提升企業的商業競爭力。? Data Mining:數據挖掘,Data Mining是一種決策支持過程,它主要基于AI、機器學習、統計學等技術,高度自動化地分析企業原有的數據,做出歸納性的推理,從中挖掘出潛在的模式,預測客戶的行為,幫助企業的決策者調整市場策略,減少風險,做出正確的決策 ? CRM:客戶關系管理(Customer Relationship Management),數據倉庫是以數據庫技術為基礎但又與傳統的數據庫應用有著本質區別的新技術,CRM就是基于數據倉庫技術的一種新應用。但是,從商業運作的角度來講,CRM其實應該算是一個古老的“應用”了。比如,酒店對客人信息的管理,如果某個客人是某酒店的老主顧,那么該酒店很自然地會知道這位客人的某些習慣和喜好,如是否喜歡靠路邊,是否吸煙,是否喜歡大床,喜歡什么樣的早餐,等等。當客人再次光臨時,不用客人自己提出來,酒店就會提供客人所喜歡的房間和服務。這就是一種CRM。? Meta Data:元數據,關于數據倉庫的數據,指在數據倉庫建設過程中所產生的有關數據源定義,目標定義,轉換規則等相關的關鍵數據。同時元數據還包含關于數據含義的商業信息,所有這些信息都應當妥善保存,并很好地管理。為數據倉庫的發展和使用提供方便。

1.3 實例應用

BI應用實例:

某家上市公司的銷售副總裁每周五下午要和全國各大區的銷售總監開視頻會議,一般情況下他需要事先了解一下公司上周的銷售情況,這時他進入公司的商業智能系統,查看銷售周報表,報表的橫坐標是時間,縱坐標有:“銷售目標”、“實際收入”、“收入指標達成率”。這張報表顯示了每周銷售變化情況。

副總裁為了進一步弄清楚某一大區及大區下屬的幾大城市的銷售數據,只要使用鉆取功能,用鼠標輕輕在屏幕上點擊幾下,該大區及大區下各城市的銷售數據便一目了然。鉆取即這種從“全國水平”(宏觀)到“地區水平”(微觀)的分析過程。然后,副總裁需要了解在某一區域的銷售數據中,哪些是直銷完成的,哪些是渠道完成的,這種從報表視圖的某一個角度到另外一個角度的視角轉換過程被稱為“切片”。鉆取和切片的操作都非常簡便,只需用鼠標簡單地在電子報表上輕點幾下即可完成。在上面的分析過程中,涉及到了“維”這個概念,即觀察問題的角度。

這位銷售副總裁的分析維度包括:時間、大區、銷售模式,以這三個維為三個軸線來觀察數據,就形成了一個信息立方體,立方體的每一個小單元都包含了企業管理者需要追蹤的消息,包括一個特定地區、特定時間、特定銷售渠道的各項指標的全部信息,通過對立方體的切片或切塊分割,可以從不同的視角觀察各種數據。通過“鉆取”和“切片”,這位副總裁知道了銷售情況的變化是哪個大區、哪些城市、直銷或者代理渠道出現了問題,這種靈活快速的查詢和分析如果通過過去的ERP報表查詢是很難完成的。

通過實例可知,使用BI系統,可以將不同的數據源關聯對應在一起,對企業信息進行管理、分析、自動生成報表,提高分析決策的效率和質量。

1.4 BI的定義

商務智能是指將企業的各種數據及時地轉換為企業管理者感興趣的信息(或者知識),并以各種方式展現出來,幫助企業管理者進行科學決策,加強企業的競爭優勢。這里的數據不僅僅指企業內部的各種數據,而且包括企業外部的數據,例如行業、市場狀況和客戶資源的數據等等。

從技術角度看,商務智能的過程是企業的決策人員以企業中的數據倉庫為基礎,經由聯機分析處理工具、數據挖掘工具加上決策規劃人員的專業知識,從數據中獲得有用的信息和知識,幫助企業獲取利潤。

從應用角度看,商務智能幫助用戶對商業數據進行聯機分析處理和數據挖掘,例如預測發展趨勢、輔助決策、對客戶進行分類、挖掘潛在客戶等等。

從數據角度看,商務智能使得很多事務性的數據經過抽取、轉換之后存入數據倉庫,經過聚集、切片或者分類等操作之后形成有用的信息、規則,來幫助企業的決策者進行正確的決策。

綜上所述,我認為

BI的定義:商務智能是利用各種技術,對數據進行收集、存儲、分析并提供可視化界面顯示,從而更容易、快捷的獲得信息知識,幫助管理者做出更好的業務決策。BI技術簡析

通過閱讀資料,我認為把商業智能看成是一種解決方案的說法比較恰當。它是將數據倉庫、OLAP和數據挖掘等技術組合到一起的綜合運用。BI技術的關鍵是將來自不同的業務系統數據庫中的數據,提取出來,進行清理以保證數據的正確性,然后經過抽取(Extraction)、轉換(Transformation)和裝載(Load),即ETL過程,合并到數據倉庫里,從而得到企業數據的一個全局視圖,在此基礎上利用合適的查詢和分析工具、數據挖掘工具、OLAP工具等對其進行分析和處理(這時信息變為輔助決策的知識),最后將知識呈現給管理者,為管理者的決策過程提供支持。商業智能的這個基本過程如圖所示:

圖2—BI結構圖

一些文章中將BI分為四個主要階段:數據預處理、建立數據倉庫、數據分析、數據展現。同時認為數據倉庫、OLAP和數據挖掘技術是商業智能的三大技術支柱。2.1 數據預處理——ETL ETL是商業智能(BI)的重要組成部分,是英文Extract-Transform-Load的縮寫,即填充、更新數據倉庫的數據抽取、轉換、裝載的過程。這是實現商業智能之前的數據采集步驟。這一步驟完成之后,對庫中數據的數據挖掘、分析處理才可以進行。

對于ETL而言,“是什么”是很容易理解的,也就是將分散的、不易利用的數據進行整理,變成規則清晰的、易于利用的、(可能同時還是)集中的數據。

2.1.1 ETL設計

ETL的設計分三部分:數據抽取、數據的清洗轉換、數據的加載。數據的抽取是從各個不同的數據源抽取到ODS(OperationalDataStore,操作型數據存儲)中——這個過程也可以做一些數據的清洗和轉換),在抽取的過程中需要挑選不同的抽取方法,盡可能的提高ETL的運行效率。ETL三個部分中,花費時間最長的是“T”(Transform,清洗、轉換)的部分,一般情況下這部分工作量是整個ETL的2/3。數據的加載一般在數據清洗完了之后直接寫入DW(DataWarehousing,數據倉庫)中去。

2.1.2 ETL實現

ETL的實現有多種方法,常用的有三種。一種是借助ETL工具(如Oracle的OWB、SQLServer2000的DTS、SQLServer2005的SSIS服務、Informatic等)實現,一種是SQL方式實現,另外一種是ETL工具和SQL相結合。前兩種方法各有各的優缺點,借助工具可以快速的建立起ETL工程,屏蔽了復雜的編碼任務,提高了速度,降低了難度,但是缺少靈活性。SQL的方法優點是靈活,提高ETL運行效率,但是編碼復雜,對技術要求比較高。第三種是綜合了前面二種的優點,會極大地提高ETL的開發速度和效率。

2.1.3 數據的抽取

這一部分需要在調研階段做大量的工作,首先要搞清楚數據是從幾個業務系統中來,各個業務系統的數據庫服務器運行什么DBMS,是否存在手工數據,手工數據量有多大,是否存在非結構化的數據等等,當收集完這些信息之后才可以進行數據抽取的設計。

1、對于與存放DW的數據庫系統相同的數據源處理方法

這一類數據源在設計上比較容易。一般情況下,DBMS(SQLServer、Oracle)都會提供數據庫鏈接功能,在DW數據庫服務器和原業務系統之間建立直接的鏈接關系就可以寫Select語句直接訪問。

2、對于與DW數據庫系統不同的數據源的處理方法

對于這一類數據源,一般情況下也可以通過ODBC的方式建立數據庫鏈接——如SQLServer和Oracle之間。如果不能建立數據庫鏈接,可以有兩種方式完成,一種是通過工具將源數據導出成.txt或者是.xls文件,然后再將這些源系統文件導入到ODS中。另外一種方法是通過程序接口來完成。

3、對于文件類型數據源(.txt,.xls)可以培訓業務人員利用數據庫工具將這些數據導入到指定的數據庫,然后從指定的數據庫中抽取。或者還可以借助工具實現,如SQLServer2005的SSIS服務的平面數據源和平面目標等組件導入ODS中去。

4、增量更新的問題

對于數據量大的系統,必須考慮增量抽取。一般情況下,業務系統會記錄業務發生的時間,我們可以用來做增量的標志,每次抽取之前首先判斷ODS中記錄最大的時間,然后根據這個時間去業務系統取大于這個時間所有的記錄。利用業務系統的時間戳,一般情況下,業務系統沒有或者部分有時間戳。

2.1.4 數據的清洗轉換

一般情況下,數據倉庫分為ODS、DW兩部分。通常的做法是從業務系統到ODS做清洗,將臟數據和不完整數據過濾掉,在從ODS到DW的過程中轉換,進行一些業務規則的計算和聚合。

1、數據清洗

數據清洗的任務是過濾那些不符合要求的數據,將過濾的結果交給業務主管部門,確認是否過濾掉還是由業務單位修正之后再進行抽取。不符合要求的數據主要是有不完整的數據、錯誤的數據、重復的數據三大類。

(1)不完整的數據:這一類數據主要是一些應該有的信息缺失,如供應商的名稱、分公司的名稱、客戶的區域信息缺失、業務系統中主表與明細表不能匹配等。對于這一類數據過濾出來,按缺失的內容分別寫入不同Excel文件向客戶提交,要求在規定的時間內補全。補全后才寫入數據倉庫。

(2)錯誤的數據:這一類錯誤產生的原因是業務系統不夠健全,在接收輸入后沒有進行判斷直接寫入后臺數據庫造成的,比如數值數據輸成全角數字字符、字符串數據后面有一個回車操作、日期格式不正確、日期越界等。這一類數據也要分類,對于類似于全角字符、數據前后有不可見字符的問題,只能通過寫SQL語句的方式找出來,然后要求客戶在業務系統修正之后抽取。日期格式不正確的或者是日期越界的這一類錯誤會導致ETL運行失敗,這一類錯誤需要去業務系統數據庫用SQL的方式挑出來,交給業務主管部門要求限期修正,修正之后再抽取。

(3)重復的數據:對于這一類數據——特別是維表中會出現這種情況——將重復數據記錄的所有字段導出來,讓客戶確認并整理。

數據清洗是一個反復的過程,不可能在幾天內完成,只有不斷的發現問題,解決問題。對于是否過濾,是否修正一般要求客戶確認,對于過濾掉的數據,寫入Excel文件或者將過濾數據寫入數據表,在ETL開發的初期可以每天向業務單位發送過濾數據的郵件,促使他們盡快地修正錯誤,同時也可以做為將來驗證數據的依據。數據清洗需要注意的是不要將有用的數據過濾掉,對于每個過濾規則認真進行驗證,并要用戶確認。

2、數據轉換 數據轉換的任務主要進行不一致的數據轉換、數據粒度的轉換,以及一些商務規則的計算。

(1)不一致數據轉換:這個過程是一個整合的過程,將不同業務系統的相同類型的數據統一,比如同一個供應商在結算系統的編碼是XX0001,而在CRM中編碼是YY0001,這樣在抽取過來之后統一轉換成一個編碼。

(2)數據粒度的轉換:業務系統一般存儲非常明細的數據,而數據倉庫中數據是用來分析的,不需要非常明細的數據。一般情況下,會將業務系統數據按照數據倉庫粒度進行聚合。

(3)商務規則的計算:不同的企業有不同的業務規則、不同的數據指標,這些指標有的時候不是簡單的加加減減就能完成,這個時候需要在ETL中將這些數據指標計算好了之后存儲在數據倉庫中,以供分析使用。

2.1.5 數據的裝載

ETL的裝載部分,可查詢的資料較少。僅查閱到與抽取在一起的部分描述內容。ETL的核心還是在于T這個過程,也就是轉換,而抽取和裝載一般可以作為轉換的輸入和輸出,或者,它們作為一個單獨的部件,其復雜度沒有轉換部件高。和OLTP系統中不同,那里充滿這單條記錄的insert、update和select等操作,ETL過程一般都是批量操作,例如它的裝載多采用批量裝載工具,一般都是DBMS系統自身附帶的工具,例如Oracle SQLLoader和DB2的autoloader等。

2.1.6 ETL日志、警告發送

1、ETL日志

ETL日志分為三類。一類是執行過程日志,這一部分日志是在ETL執行過程中每執行一步的記錄,記錄每次運行每一步驟的起始時間,影響了多少行數據,流水賬形式。一類是錯誤日志,當某個模塊出錯的時候寫錯誤日志,記錄每次出錯的時間、出錯的模塊以及出錯的信息等。第三類日志是總體日志,只記錄ETL開始時間、結束時間是否成功信息。如果使用ETL工具,ETL工具會自動產生一些日志,這一類日志也可以作為ETL日志的一部分。記錄日志的目的是隨時可以知道ETL運行情況,如果出錯了,可以知道哪里出錯。

2、警告發送

如果ETL出錯了,不僅要形成ETL出錯日志,而且要向系統管理員發送警告。發送警告的方式多種,一般常用的就是給系統管理員發送郵件,并附上出錯的信息,方便管理員排查錯誤。

ETL是BI項目的關鍵部分,也是一個長期的過程,只有不斷的發現問題并解決問題,才能使ETL運行效率更高,為BI項目后期開發提供準確的數據。

2.2 BI支撐技術——數據倉庫/數據集市

數據倉庫:商業智能的基礎。

對于一個企業來說,最關鍵也最為重要的是,如何以一種有效的方式逐步整理各個業務處理系統中積累下來的歷史數據,并通過靈活有效的方式為各級業務人員提供統一的信息視圖,從而在整個企業內實現真正的信息共享。數據倉庫技術正好滿足了這一需求。數據倉庫是商業智能系統的基礎,如果沒有數據倉庫,沒有企業數據的融合,數據分析就成為了無源之水。

數據倉庫定義為:“一個面向主題的、集成的、反映歷史變化的、相對穩定的數據集合,用于支持管理決策”。與傳統的事物處理系統有不同的是,數據倉庫是一種過程,它是對分布在組織或企業內部各處的業務數據進行整合、加工和分析的過程。而不是一種可以購買的產品。

2.2.1 數據倉庫常用術語

? 數據倉庫

數據倉庫是一個支持管理決策的數據集合。數據是面向主題的、集成的、不易丟失的并且是時間變量。

數據倉庫是所有操作環境和外部數據源的快照集合。它并不需要非常精確,因為它必須在特定的時間基礎上從操作環境中提取出來。? 數據集市

數據倉庫只限于單個主題的區域,例如顧客、部門、地點等。數據集市在從數據倉庫獲取數據時可以依賴于數據倉庫,或者當它們從操作系統中獲取數據時就不依賴于數據倉庫。? 事實

事實是數據倉庫中的信息單元,也是多維空間中的一個單元,受分析單元的限制。事實存儲于一張表中(當使用關系數據庫時)或者是多維數據庫中的一個單元。每個事實包括關于事實(收入、價值、滿意記錄等)的基本信息,并且與維度相關。在某些情況下,當所有的必要信息都存儲于維度中時,單純的事實出現就是對于數據倉庫足夠的信息。我們稍后討論有關缺無事實的情況。? 維度

維度是綁定由坐標系定義的空間的坐標系的軸線。數據倉庫中的坐標系定義了數據單元,其中包含事實。

坐標系的一個例子就是帶有 x 維度和 y 維度的 Cartesian(笛卡爾)坐標系。在數據倉庫中,時間總是維度之一。? 數據挖掘

在數據倉庫的數據中發現新信息的過程被稱為數據挖掘,這些新信息不會從操作系統中獲得。? 分析空間

分析空間是數據倉庫中一定量的數據,用于進行數據挖掘以發現新信息同時支持管理決策。? 切片

一種用來在數據倉庫中將一個維度中的分析空間限制為數據子集的技術。? 切塊

一種用來在數據倉庫中將多個維度中的分析空間限制為數據子集的技術。? 星型模式 一種使用關系數據庫實現多維分析空間的模式,稱為星型模式。星型模式將在本白皮書中稍后進行進一步討論。? 雪花模式

不管什么原因,當星型模式的維度需要進行規范化時,星型模式就演進為雪花模式。

2.2.2 面向主題(Subject-oriented)

“主題”是一個較為抽象的概念,是指用戶使用數據倉庫進行決策時所關心的重點方面。從信息管理的角度看,主題是在一個較高的管理層次上對數據進行綜合、歸類所形成的分析對象;從數據組織的角度看,主題就是一些數據集合,這些數據集合對分析對象作了比較完整的、一致的描述,這種描述不僅涉及到數據本身,還涉及到數據之間的關系。

“面向主題”則表明了數據倉庫中數據組織的基本原則,是指數據倉庫內的信息是按主題進行組織的,而不像傳統事物處理系統那樣單一地按照業務功能及性能要求進行組織。傳統的操作型系統是圍繞公司的應用進行組織。如對一個電信公司來說,應用問題可能是營業受理、專業計費和客戶服務等,而主題范圍可能是客戶、套餐、繳費和欠費等。

2.2.3 集成(Integrated)

“集成”是指數據倉庫中的信息并不是對各個數據源簡單的選擇、抽取,而是首先進行一系列的加工、整理和轉換等來消除源數據中的不一致;同時按照本行業的邏輯模型設計便于查詢及分析的數據倉庫。然后按照組織或企業的需求,針對不同的主題對數據進行某種程度的綜合、概括和聚集,將源數據加載進數據倉庫。經過這樣的處理,數據就具有了集成性,可以用于決策分析。

2.2.4 反映歷史變化(Time-variant)

“反映歷史變化”是指數據倉庫內的信息并不只是反映企業當前的狀態,而是記錄了從過去某一時點到當前各個階段的信息。通過這些信息,可以對企業的發展歷程和未來趨勢做出定量分析和預測。而信息本身相對穩定,是指一旦某個數據進入數據倉庫以后,一般很少進行修改,更多的是對信息進行查詢操作。

2.2.5 相對穩定(Non-volatile)

“相對穩定”是指數據一旦進入數據倉庫,一般情況下會被長期保留,所涉及的數據操作也主要是查詢、分析,很少會被修改或刪除,通常也只需要定期地加載和刷新。相對穩定性保證了數據倉庫中的數據能夠真實地反映歷史變化。

數據倉庫中所存放的數據在物理上是分離的。由于這種分離,數據倉庫不需要事務處理、恢復和并發控制機制。通常它只需要兩種數據訪問:數據的初始化裝入和數據訪問。

2.2.6 了解實時數據倉庫的定義

實時數據倉庫是兩種事物的組合:實時行為和數據倉庫。實時行為是一種即時發生的行為。行為可以是任何事情,如超市中小商品的銷售行為。一旦行為完成,就有關于它的數據。數據倉庫捕獲有關商業行為的數據,而實時數據倉庫在商業行為發生時就捕獲數據。當商業行為完成時,相關數據就已經進入到數據倉庫并且能立即使用。換句話說,實時數據倉庫是這樣一個系統,只要行為發生、數據變得可用時,就能從中獲得信息。

實時vs.近似實時之間的區別可以下面一個詞概括:反應時間。反應時間是指行為的完成時間和該行為的數據在數據倉庫中可利用時間之間的延遲。實時情況下,反應時間是可以忽略不計的;在近似實時情況下,反應時間是一段時間,比如2小時。為了使系統變得更精確,一些人使用了“實時”這個概念。

2.3 BI分析技術——OLAP 2.3.1 什么是OLAP

當今的數據處理大致可以分成兩大類:聯機事務處理OLTP(on-line transaction processing)、聯機分析處理OLAP(On-Line Analytical Processing)。OLTP是傳統的關系型數據庫的主要應用,主要是基本的、日常的事務處理,例如銀行交易。OLAP是數據倉庫系統的主要應用,支持復雜的分析操作,側重決策支持,并且提供直觀易懂的查詢結果。下表列出了OLTP與OLAP之間的比較。

聯機分析處理(OLAP)是以海量數據為基礎的復雜分析技術。它支持各級管理決策人員從不同的角度、快速靈活地對數據倉庫中的數據進行復雜查詢和多維分析處理,并且能以直觀易懂的形式將查詢和分析結果展現給決策人員。

OLAP是使分析人員、管理人員或執行人員能夠從多角度對信息進行快速、一致、交互地存取,從而獲得對數據的更深入了解的一類軟件技術。OLAP的目標是滿足決策支持或者滿足在多維環境下特定的查詢和報表需求,它的技術核心是“維”這個概念。

區別于傳統的聯機事務處理(OLTP)系統,OLAP有12條準則:

1、OLAP模型必須提供多維概念視圖

2、透明性準則

3、存取能力推測

4、穩定的報表能力

5、客戶/服務器體系結構

6、維的等同性準則

7、動態的稀疏矩陣處理準則

8、多用戶支持能力準則

9、非受限的跨維操作

10、直觀的數據操縱

11、靈活的報表生成

12、不受限的維與聚集層次 雖然隨著技術的發展,部分準則有所突破,但這些準則仍然是OLAP技術的基礎。

2.3.2 OLAP核心技術——維

“維”是人們觀察客觀世界的角度,是一種高層次的類型劃分。“維”一般包含著層次關系,這種層次關系有時會相當復雜。通過把一個實體的多項重要的屬性定義為多個維(dimension),使用戶能對不同維上的數據進行比較。因此OLAP也可以說是多維數據分析工具的集合。

OLAP的基本多維分析操作有鉆取(roll up和drill down)、切片(slice)和切塊(dice)、以及旋轉(pivot)、drill across、drill through等。? 鉆取是改變維的層次,變換分析的粒度。它包括向上鉆取(roll up)和向下鉆取(drill down)。? roll up是在某一維上將低層次的細節數據概括到高層次的匯總數據,或者減少維數; ? 而drill down則相反,它從匯總數據深入到細節數據進行觀察或增加新維。? 切片和切塊是在一部分維上選定值后,關心度量數據在剩余維上的分布。如果剩余的維只有兩個,則是切片;如果有三個,則是切塊。? 旋轉是變換維的方向,即在表格中重新安排維的放置(例如行列互換)。? Drill across:(未找到相關介紹)? Drill through:(未找到相關介紹)

2.3.3 OLAP的分類

OLAP有多種實現方法,根據存儲數據的方式不同可以分為ROLAP、MOLAP、HOLAP。ROLAP 表示基于關系數據庫的OLAP實現(Relational OLAP)。以關系數據庫為核心,以關系型結構進行多維數據的表示和存儲。ROLAP將多維數據庫的多維結構劃分為兩類表:一類是事實表,用來存儲數據和維關鍵字;另一類是維表,即對每個維至少使用一個表來存放維的層次、成員類別等維的描述信息。維表和事實表通過主關鍵字和外關鍵字聯系在一起,形成了“星型模式”。對于層次復雜的維,為避免冗余數據占用過大的存儲空間,可以使用多個表來描述,這種星型模式的擴展稱為“雪花模式”。ROLAP通常使用三層架構,其數據庫層和應用邏輯層是分離的,并且其數據存儲在關系型數據庫中

MOLAP 表示基于多維數據組織的OLAP實現(Multidimensional OLAP)。以多維數據組織方式為核心,也就是說,MOLAP使用多維數組存儲數據。多維數據在存儲中將形成“立方塊(Cube)”的結構,在MOLAP 中對“立方塊”的“旋轉”、“切塊”、“切片”是產生多維數據報表的主要技術。

MOLAPS和ROLAPS相比,具有更短的處理時間,更快的響應速度,并且對于用戶需求更為靈活。而ROLAPS在處理的數據總量和支持的客戶數方面強于MOLAPS。

Hybrid online analytical processing(混合聯機分析處理,HOLAP),HOLAP表示基于混合數據組織的OLAP實現。如低層是關系型的,高層是多維矩陣型的。這種方式具有更好的靈活性。從字面上我們可以大致看出,HOLAP是上面兩種分類的融合,它同時利用了多維數據庫和關系數據庫。HOLAP的優勢在于它可以在性能需求和存儲量需求間找到一個平衡點,從而充分利用系統潛能。

還有其他的一些實現OLAP的方法,如提供一個專用的SQL Server,對某些存儲模式(如星型、雪片型)提供對SQL查詢的特殊支持。

2.3.4 OLAP工具描述

OLAP 工具是針對特定問題的聯機數據訪問與分析。它通過多維的方式對數據進行分析、查詢和報表。維是人們觀察數據的特定角度。例如,一個企業在考慮產品的銷售情況時,通常從時間、地區和產品的不同角度來深入觀察產品的銷售情況。這里的時間、地區和產品就是維。而這些維的不同組合和所考察的度量指標構成的多維數組則是OLAP分析的基礎,可形式化表示為(維1,維2,??,維n,度量指標),如(地區、時間、產品、銷售額)。多維分析是指對以多維形式組織起來的數據采取切片(Slice)、切塊(Dice)、鉆取(Drill-down和Roll-up)、旋轉(Pivot)等各種分析動作,以求剖析數據,使用戶能從多個角度、多側面地觀察數據庫中的數據,從而深入理解包含在數據中的信息。

2.4 BI分析技術——數據挖掘

2.4.1 什么是數據挖掘

數據挖掘又稱知識發現(Knowledge Discovery in Database,簡稱KDD),是從大量數據中抽取有意義的、隱含的、以前未知的并有潛在使用價值的知識的過程。數據挖掘是一個多學科交叉性學科,它涉及統計學、機器學習、數據庫、模式識別、可視化以及高性能計算等多個學科。利用數據挖掘技術可以分析各種類型的數據,例如結構化數據、半結構化數據以及非結構化數據、靜態的歷史數據和動態數據流數據等。

2.4.2 數據挖掘分類

數據挖掘涉及的學科領域和方法很多,有人工智能、數據統計、可視化、并行計算等。數據挖掘有多種分類方法。

? 根據挖掘任務

可分為分類模型發現、聚類、關聯規則發現、序列分析、偏差分析、數據可視化等。(1)分類(Classification)其旨在生成一個分類函數或分類模型,該模型能把數據庫中的數據項映射到給定類別中的某一個。既可以用此模型分析已有的數據,也可以用它來預測未來的數據。

(2)聚集(Clustering)聚集是對記錄分組,把相似的記錄在一個聚集里。聚集和分類的區別是聚集不依賴于預先定義好的類,不需要訓練集。

(3)數據可視化(Description and Visualization)數據可視化嚴格地講不是一個單獨的數據挖掘任務,它被用來支持其他挖掘任務。可視化是采用圖形、圖表等易于理解的方式表達數據挖掘結果。

(4)關聯規則(Affinity grouping or association rules)關聯規則是尋找數據庫中值的相關性,主要是尋找在同一個事件中出現的不同項的相關性,比如在一次購買活動中所買不同商品的相關性。(5)序列分析(Sequence Analysis)序列模式分析同樣也是試圖找出數據之間的聯系。但它的側重點在于分析數據之間前后(因果)關系,因此對數據往往要求引入時間屬性。序列模式分析非常適于尋找事物的發生趨勢或重復性模式。

(6)偏差分析(Deviation Analysis)是用來發現與正常情況不同的異常和變化,并進一步分析這種變化是否是有意的詐騙行為,還是正常的變化。如果是異常行為,則提示預防措施;如果是正常的變化,那么就需要更新數據庫記錄。

? 根據挖掘對象

可分為關系數據庫、面向對象數據庫、空間數據庫、時態數據庫、文本數據源、多媒體數據庫、異質數據庫以及環球網Web。

? 根據挖掘方法

可粗略地分為:機器學習方法、統計方法、神經網絡方法、決策樹、可視化、最近鄰技術等。在機器學習中,可細分為歸納學習方法(決策樹、規則歸納等)、基于范例學習、遺傳算法等;在統計方法中,可細分為:回歸分析(多元回歸、自回歸等)、判別分析(貝葉斯判別、費歇爾判別、非參數判別等)、聚類分析(系統聚類、動態聚類等)、探索性分析(主元分析法、相關分析法等)等。

2.4.3 數據挖掘技術

數據挖掘技術可分為描述型數據挖掘和預測型數據挖掘兩種。描述型數據挖掘包括數據總結、聚類及關聯分析等。預測型數據挖掘包括分類、回歸及時間序列分析等。

1、數據總結

繼承于數據分析中的統計分析。數據總結目的是對數據進行濃縮,給出它的緊湊描述。傳統統計方法如求和值、平均值、方差值等都是有效方法。另外還可以用直方圖、餅狀圖等圖形方式表示這些值。廣義上講,多維分析也可以歸入這一類。

2、聚類分析

是把整個數據庫分成不同的群組。它的目的是使群與群之間差別很明顯,而同一個群之間的數據盡量相似。這種方法通常用于客戶細分。在開始細分之前不知道要把用戶分成幾類,因此通過聚類分析可以找出客戶特性相似的群體,如客戶消費特性相似或年齡特性相似等。在此基礎上可以制定一些針對不同客戶群體的營銷方案。

聚類分析是根據物以類聚的原理,將本身沒有類別的樣本聚集成不同的組,并且對每一個這樣的組進行描述的過程。其主要依據是聚到同一個組中的樣本應該彼此相似,而屬于不同組的樣本應該足夠不相似。

以客戶關系管理為例,利用聚類技術,根據客戶的個人特征以及消費數據,可以將客戶群體進行細分。例如,可以得到這樣的一個消費群體:女性占91%,全部無子女、年齡在31到40歲占70%,高消費級別的占64%,買過針織品的占91%,買過廚房用品的占89%,買過園藝用品的占79%。針對不同的客戶群,可以實施不同的營銷和服務方式,從而提高客戶的滿意度。

對于空間數據,根據地理位置以及障礙物的存在情況可以自動進行區域劃分。例如,根據分布在不同地理位置的ATM機的情況將居民進行區域劃分,根據這一信息,可以有效地進行ATM機的設置規劃,避免浪費,同時也避免失掉每一個商機。

對于文本數據,利用聚類技術可以根據文檔的內容自動劃分類別,從而便于文本的檢索。

3、關聯分析

關聯分析主要用于發現不同事件之間的關聯性,即一個事件發生的同時,另一個事件也經常發生。關聯分析的重點在于快速發現那些有實用價值的關聯發生的事件。其主要依據是事件發生的概率和條件概率應該符合一定的統計意義。

對于結構化的數據,以客戶的購買習慣數據為例,利用關聯分析,可以發現客戶的關聯購買需要。例如,一個開設儲蓄賬戶的客戶很可能同時進行債券交易和股票交易,購買紙尿褲的男顧客經常同時購買啤酒等。利用這種知識可以采取積極的營銷策略,擴展客戶購買的產品范圍,吸引更多的客戶。通過調整商品的布局便于顧客買到經常同時購買的商品,或者通過降低一種商品的價格來促進另一種商品的銷售等。

對于非結構化的數據,以空間數據為例,利用關聯分析,可以發現地理位置的關聯性。例如,85%的靠近高速公路的大城鎮與水相鄰,或者發現通常與高爾夫球場相鄰的對象等。

4、分類分析

目的是構造一個分類函數或分類模型(也常常稱作分類器),該模型能把數據庫中的數據項映射到給定類別中的某一個。要構造分類器,需要有一個訓練樣本數據集作為輸入。訓練集由一組數據庫記錄或元組構成,每個元組是一個由有關字段(又稱屬性或特征)值組成的特征向量,此外,訓練樣本還有一個類別標記。一個具體樣本的形式可表示為:(v1, v2,...,vn;c),其中vi表示字段值,c表示類別。

分類分析通過分析具有類別的樣本的特點,得到決定樣本屬于各種類別的規則或方法。利用這些規則和方法對未知類別的樣本分類時應該具有一定的準確度。其主要方法有基于統計學的貝葉斯方法、神經網絡方法、決策樹方法以及support vector machines等。利用分類技術,可以根據顧客的消費水平和基本特征對顧客進行分類,找出對商家有較大利益貢獻的重要客戶的特征,通過對其進行個性化服務,提高他們的忠誠度。

利用分類技術,可以將大量的半結構化的文本數據,如WEB頁面、電子郵件等進行分類。可以將圖片進行分類,例如,根據已有圖片的特點和類別,可以判定一幅圖片屬于何種類型的規則。對于空間數據,也可以進行分類分析,例如,可以根據房屋的地理位置決定房屋的檔次。

5、回歸

是通過具有已知值的變量來預測其它變量的值。一般情況下,回歸采用的是線性回歸、非線性回歸這樣的標準統計技術。一般同一個模型既可用于回歸也可用于分類。常見的算法有邏輯回歸、決策樹、神經網絡等。

6、時間序列

時間序列是用變量過去的值來預測未來的值。

時間序列分析的是隨時間而變化的事件序列,目的是預測未來發展趨勢,或者尋找相似發展模式或者是發現周期性發展規律。

7、序列分析

序列分析技術主要用于發現一定時間間隔內接連發生的事件。這些事件構成一個序列,發現的序列應該具有普遍意義,其依據除了統計上的概率之外,還要加上時間的約束。

8、預測

預測與分類類似,但預測是根據樣本的已知特征估算某個連續類型的變量的取值的過程,而分類則只是用于判別樣本所屬的離散類別而已。預測常用的技術是回歸分析。

2.5 BI表示/展現技術——信息可視化與Web應用

數據經過分析后得到的即為商業智能。為了使它們直觀、簡練地呈現在用戶面前,需要采用一定的形式表示和發布出來,通常采用的是一些查詢和報表工具。不過,目前越來越多的分析結果是以可視化的形式表示出來。這就需要采用信息可視化技術。所謂信息可視化是指以圖形、圖像、虛擬現實等易為人們所辨識的方式展現原始數據間的復雜關系、潛在信息以及發展趨勢,以便我們能夠更好地利用所掌握的信息資源。

隨著Web應用的普及,商業智能的解決方案能夠提供基于Web的應用服務,這樣就擴展了商業智能的信息發布范圍,享有訪問權限的用戶只要能夠登陸互連網,就可以及時訪問自己所關心的內容。作為基于Web的商業智能解決方案,需要一些基本的組成要素,包括基于Web的商業智能服務器、會話管理服務、文件管理服務、調度、分配和通知服務、裝載平衡服務和應用服務等。以應用服務為例,需要為用戶的查詢、分析和報表請求提供瀏覽器插件。由于商業智能應用涉及到對多個分散在各地的異構數據庫的存取,因此還需要CORBA、IIOP協議和Java、XML語言的支持。

第四篇:BI實驗報告

BI課程

學號:

姓名:王曉郁

專業:計算機科學與技術

日期:

實驗報告

0841902112(08中法)2012年5月20日

實驗、QL Server BI Step by Step SSIS 3 【開發語言及實現平臺或實驗環境】

sql server 2008

【實驗目的】

(1)利用SSIS把SQL Server中的數據導出與導入。(2)熟悉和掌握實驗的各種操作。

(3)能夠在實際的事例中靈活運用學到的有關知識。

【實驗原理】 1.SQL語句查詢 2.SSIS包功能

【實驗要求】

(1)利用SSIS實現了數據的導入和導出,把Product表中的數據導出成Excel,然后對產品編號和名稱兩個字段經過派生的功能進行轉換再導入到數據庫中。(2)按照實驗步驟所示內容認真完成每一個步驟;

【實驗步驟】 1.打開Vs.net 2005,選擇商業智能項目,然后選擇模板中的Integration Service項目,輸入項目名稱:

創建好后,就在默認的Package包中進行設計。

2.向控制流中添加一個數據流組件(Data Flow Task),雙擊進入數據流.從左邊的工具箱中選擇OLEDB數據源(OLE DB Source),可以看到,添加進去后是紅色的.雙擊設置一下連接,如果沒有已經創建的鏈接,則新建一個連接,選定后設置直接訪問Produt表。

OK,確認了之后,發現紅色的錯誤提示已經不存在了。

3.接下來直接再添加一個目標數據源,將數據導出成Excel數據格式,所以選擇Excel Destination,同樣,雙擊對Excel連接管理器進行配置,配置好文件名稱和路徑以后(此處選擇在首行顯示列名,這樣會從第二行開始才開始顯示數據),如果文件不存在,直接選擇下面的新建,創建新的Excel工作表。

4.然后從左邊切換到映射,對數據流中的元數據的列和Excel表中的列進行一一映射,因為剛才是自動創建的Excel工作表,所以默認是根據名稱對應的.這樣我們就完成了對Product產品表的導出,在右邊的解決方案中,右擊執行包,可以看到綠色執行成功.5.通過設置sql語句導出所有顏色為黑色的產品,讓我們把OLEDB數據源的訪問模式改成sql命令,然后輸入查詢語句:

SELECT * FROM Production.Product WHERE(Color = 'Black')

6.接下來,我們再將剛才導出的產品數據導入Product表中.再添加Excel Source和OLE DB Destination,其實就是做和導出相反的過程.把 Excel Source的OLEDB連接指向Excel連接管理器。

OLE DB Destination的連接設置成OLE DB Source中的數據庫連接,同樣,設置成以[表或視圖]的方式訪問Product表,確定后發現有紅色錯誤。需要將rowguid字段,這兩個字段都是數據庫中自動生成的.再次確認后會發現已經沒有錯誤,只剩下了黃色的警告,現在暫時不理會這個警告。

7.把剛才生成的Excel文件刪除,重新配置Excel連接管理器生成新的空Excel文件(或者把生成的Excel中的數據刪除),然后再次運行包,剛才的數據導出仍然正常,數據導入顯示的是沒有導入任何數據,這是因為在數據中剛才的數據導出和導出并沒有先后,所以他們是同步執行的,執行導入時發現里面的數據為空,所以沒有導入成功任何數據.不過,嘗試著把數據導入的操作直接放在Excel Destination后面是失敗的,Excel Destination就是數據流目標,意味著整個流程的結束.(此時Excel Destination中只可定義一個錯誤輸出)。

8.切換到控制流,再添加一個數據流任務,將第一個數據流任何指向這個(鼠標拖拉綠色箭頭):

9.雙擊剛添加的數據導入(已經編輯的數據流組件名稱),把剛才的數據流中的組件剪切過來.清空Excel數據再次運行包,有錯誤 ,看下面的錯誤信息: An OLE DB record is available.Source: “Microsoft SQL Native Client” Hresult: 0x80040E2F Description: “語句已終止。”.An OLE DB record is available.Source: “Microsoft SQL Native Client” Hresult: 0x80040E2F Description: “不能在具有唯一索引 'AK_Product_ProductNumber' 的對象 'Production.Product' 中插入重復鍵的行。”.10.暫時通過添加一次轉換,在剛才的數據流源和數據流目標中間再添加一個派生列組件(Derived Column ,Updates column values using expressions).添加一個新列NewProductNumber,在Excel中的產品編號后面加1,組成新的產品編號,同樣派生出一個新的產品名稱Name,因為在數據庫中同樣也有唯一性約束.11.還要修改OLE DB目標中的映射,將目標列的ProductNumber對應的輸入列ProductNumber改成剛才派生的NewProductNumber.將目標列的Name對應的輸入列Name改成剛才派生的NewName.清空Excel數據,再次運行包,都變成了綠色,執行全部成功

12.通過對比數據庫,確實已經成功的添加進了93行新的數據

【參考文獻】

1、SSIS_StepV2.pdf文檔

【心得體會】

1.熟悉了sql server 2008的環境和熟練了SOL語言的使用。

2.通過實驗得知,控制流中的數據導出和導入兩個組件其實是前后約束條件的,也就是必須數據導出必須成功了才會執行導入(后面會介紹).另外,所謂的數據導出并不會局限于數據庫的導入與導出,數據流源和數據流目標都可以是Excel,Flat File(txt,csv),XML,DataReader等連接.也就是說同樣可以實現txt導入Excel,或者是XML導入數據庫等操作。

第五篇:BI常見面試問題總結

一、現在是否在項目上?

1、剛出項目,目前在看機會;

2、還在項目上,大概XX時間出項目。

二、你最快可以什么時候到位?

1、如果前面回答不在項目上,就可說拿到OFFER后隨時都可以;

2、如果前面回答是在項目上,可回答項目結束后馬上到位;

3、也可以反問下這個項目最遲要求什么時候進?等他回答后,就說時間OK,沒問題。

三、你的簡歷上的項目都是外部的嗎?

1、根據自己的簡歷回答。要注意的是入行的邏輯。這其實是考察你的真實性,最好簡

歷上有一個符合邏輯的入行軌跡。如:KEY USER—內部顧問—外部顧問。

四、你在項目上主要負責哪一塊?

1、BW建模、數據抽取、建一般數據源、建信息對象;

2、BO報表、UNI創建;

3、寫些技術文檔、業務藍圖、測試文檔;

4、參與業務需求調研、討論業務方案、模型設計。

五、列舉一些你做過的報表。

1、財務:資產負債表、增值稅商品明細表。。

2、業務:銷售多維分析表、采購多維分析表、庫存及逾期情況表、庫齡情況分析表。。

3、人資:人員異動分析表、入職統計表、離職統計表、離職原因分析統計表。。

六、你最近的一個項目上有幾個人?

1、5個人:3個BW,1個BO,1個PM;

2、7個人:3個BW,2個BO,1個ABAP,1個PM。

七、你項目上人員是怎樣分工的?

1、3個BW按FICOMMSD每人負責一個模塊,2個BO一個主要做FICO的報表、一個主要做業務的報表,也就是MMSD,PM負責溝通、協調;

2、總共60多張報表,我們三個BW顧問平均每人背20張左右,BO他們每人30張左右,有一些需要開發的ABAP做。

八、你英語怎么樣?

1、沒問題;

2、文檔沒問題,溝通會差一點。

九、你希望入職還是FREE?

1、都可以。優先考慮入職吧。主要看他們優先考慮入職還是FREE。

十、你目前RATE多少?期望是多少?

1、以2-3年為例:8K,期望10K。其他待遇一般為:一天100補助,一月一到兩次FLYBACK.十一、你的BASE地在哪?XX地可不可以?

1、參考:BASE地無要求。

十二、能否舉一個你在項目上遇到的困難?怎么解決的?

1、BO中篩選器 字符型 1>10;

2、另一顧問在開始例程寫了東西,DSO1---DSO2時數據少了;

3、四組系數按季度動態變化。

十三、客戶經常改需求怎么辦?

1、嚴格按照需求變更流程走。我們項目上的流程為。。

十四、你最近的這個項目數據量有多大?

1、回答幾百萬、幾千萬均可

十五、最大的一張報表多大?

1、100多頁、200多頁;

2、2000多頁,是CR報表。

十六、LO抽取步驟。

1、按照培訓講的13步說就行。

十七、增強的步驟。

1、結構增強——增強字段(RSA6更改數據源)

2、功能增強——往字段中填數,CMOD選項目-選增強出口-寫例程。

十八、項目上用到了哪些數據源?

1、標準;0FI_GL_...2LIS_11…

2、自建;ZVBRK、ZVBRP十九、一般數據源創建的步驟?

1、找需要的原始表—SE11根據表建VIEW—RSO2根據VIEW建數據源—到BW端復制數

據源。

二十、什么是標準數據源?

1、標準數據源其實就是一個結構體+提取器,(提取器就是一段寫好的ABAP代碼)。

二十一、請求號怎么收集?

1、選擇需要收集的對象,右鍵----管理----點小車----打包,SE09檢查是否收集全、釋放。

二十二、BW與BO的連接方式?

1、WEBI:QURREY----UNV----WEBI

CR:QURREY----CR

CX:QURREY----UNV----QAAWS----CX

QURREY----WEBIUNV----Liveoffice----CX

二十三、什么是環路?出現環路怎么解決?

1、環路是一組連接,它定義了經過模式中的一組表的閉合連接。當連接形成查找表之

間的多個路徑時,將出現環路。

2、別名或上下文或2者結合一起用。

二十四、檢測和解決環路的一般過程?

1、驗證是否設置了所有基數

2、如果模式需要別名來解決任何環路,請運行“檢測別名”進行標示

3、插入“檢測別名”建議的候選別名

4、如果模式需要上下文來解決僅使用別名無法解決的環路,請運行“檢測上下文”進

行標示

5、實施“檢測上下文”建議的候選上下文

6、通過創建對象并運行查詢來測試已解決的環路

二十五、解決斷層陷阱和扇形陷阱?

1、斷層陷阱是當兩個多對一連接匯聚在一個表上時三個表之間的一種連接路徑

2、別名和上下文。

二十六、WEBICRCX三者的區別?

1、WEBI注重多維分析及查詢、鉆取功能;格式不夠靈活;

2、CR格式靈活、適合制作各種格式的報表;

3、CX注重動態分析和WHAT-IF分析,一般給中、高層領導,數據量不宜太大。

二十七、不同QURREY中的相同名稱的維度在WEBI中怎么處理?

1、合并維度。以達到同一維度對不同QURREY中度量的控制。

二十八、WEBI中有哪幾種報表格式?

1、垂直表、水平表、交叉表。

二十九、做好的報表怎樣從開發機傳到生產機?

1、用Publishing Wizard和Import Wizard,發布向導和導入向導。

2、我們的項目都是客戶IT部門來傳,客戶有規定不允許我們外部顧問來操作這個。不

過這個也很簡單,只要用1中的兩個工具就行了。

十、你們項目上的開發環境是怎么樣的?是否有測試機?

1、我們項目上是開發機----測試機----生產機;在開發機上進行開發,開發好后傳到測試

機進行測試,測試沒問題最后再傳到生產機。

2、我們項目上沒有測試機,在開發機上開發完后直接在開發機上測試,測試后沒問題

后直接傳到生產機。開發機----生產機。

十一、分別介紹一下標準權限和分析權限?

十二、如果客戶要求對A經理只允許讓其看到集團下B部門的報表,怎么設置? 三

十三、兩個數據源一個全量、一個增量,上層怎樣架構?

下載BI項目實施方案總結word格式文檔
下載BI項目實施方案總結.doc
將本文檔下載到自己電腦,方便修改和收藏,請勿使用迅雷等下載。
點此處下載文檔

文檔為doc格式


聲明:本文內容由互聯網用戶自發貢獻自行上傳,本網站不擁有所有權,未作人工編輯處理,也不承擔相關法律責任。如果您發現有涉嫌版權的內容,歡迎發送郵件至:645879355@qq.com 進行舉報,并提供相關證據,工作人員會在5個工作日內聯系你,一經查實,本站將立刻刪除涉嫌侵權內容。

相關范文推薦

    中糧集團BI項目背景及結果展現

    中糧集團BI項目背景及結果展現 商業智能(Business Intelligence,BI)的概念,最早由美國Gartner Group于1996年提出。商務智能的應用領域非常廣泛,典型的有電信、銀行、保險、醫......

    實施BI的方法

    實施BI的方法 2008-4-24大 | 中 | 小 BI的實施是一個系統工程,必須把多種手段配合使用,常用的方法有:(1) 公關秀 公關秀就是利用個別事件、偶發事件為契機,通過一系列精心策劃的公......

    BI服務器采購申請書

    關于采購BI服務器申請書一、BI名詞解釋: 商業智能(簡稱BI),指通過對數據的收集、管理、分析以及轉化,使數據成為可用的信息,從而獲得必要的洞察力和理解力,更好地輔助決策和指導......

    漢語拼音bi怎么發音

    漢語拼音中,每一個都有其獨特的發音,你知道漢語拼音bi怎么發音嗎?不知道也沒有關系,我們一起來學習吧。下面是小編幫大家整理的漢語拼音bi怎么發音,希望大家喜歡。漢語拼音b怎么......

    補種乙肝疫苗項目實施方案、總結

    北林區秦家鎮2009年補種乙肝疫苗項目實施方案 為貫徹《中共中央國務院關于深化醫藥衛生體制改革的意見》和《醫藥衛生體制改革近期重點實施方案(2009-2010年)》要求,按照《黑龍......

    項目實施方案

    苗木花卉基地項目實施方案廬江縣樂橋鎮桂元村苗木花卉基地項目,省財政專項補助資金5萬元,項目建設以苗木花卉種植為重點,示范推廣優質苗木花卉種植和技術培訓。為抓好該項目的......

    項目實施方案

    項目實施方案范文 項目實施方案 項目實施方案文本制作要求 1、文本:按照標準A4紙(210×297)進行縱向左側裝訂(專業裝訂)。2、字體和字型 (1)封面主標題:第一行:“××年度第×批國......

    項目實施方案

    項目實施方案項目實施方案(一)根據自治縣民委“馬民經(**)19號”項目合同書內容和四川省民族兩金管理相關規定,現就**年低產茶園改造項目具體實施制定如下方案:一、項目實施總體要......

主站蜘蛛池模板: 亚洲日韩片无码中文字幕| 无码av一区二区三区无码| 久久99青青精品免费观看| 麻豆视传媒官网免费观看| 久久精品aⅴ无码中文字字幕重口| 2021久久国自产拍精品| 亚洲va欧美va国产va综合| 亚洲欧美在线一区中文字幕| 男女啪啪免费观看无遮挡| 国产高清无密码一区二区三区| 久久偷看各类wc女厕嘘嘘| 免费精品无码av片在线观看| 99久久婷婷国产综合精品青草漫画| 亚洲 欧美 日韩 综合aⅴ视频| 国产在线视欧美亚综合| 99久久免费国产精品| 精品九九人人做人人爱| 成年丰满熟妇午夜免费视频| 无码中文字幕乱码一区| 日韩精品一区二区三区中文不卡| 熟女人妻高清一区二区三区| 日日狠狠久久8888偷偷色| 亚洲日韩精品无码av海量| 欧美黑人又粗又大高潮喷水| 精品国产一二三产品区别在哪| 暖暖免费 高清 日本社区在线观看| 欧美精品videosex性欧美| 激情人妻另类人妻伦| 蜜桃少妇av久久久久久久| 国产乱人伦av在线a麻豆| 娇小萝被两个黑人用半米长| 在线人成免费视频69国产| 中国亚洲女人69内射少妇| 久久久久国产综合av天堂| 欧洲精品码一区二区三区| 无码av中文一区二区三区| 18禁裸体动漫美女无遮挡网站| 久久99亚洲精品久久频| 国产亚洲国际精品福利| 国产精品午夜性视频| 亚洲色无码中文字幕在线|