久久99精品久久久久久琪琪,久久人人爽人人爽人人片亞洲,熟妇人妻无码中文字幕,亚洲精品无码久久久久久久

數(shù)據(jù)挖掘在體育教學中的應用的價值[樣例5]

時間:2019-05-15 07:00:14下載本文作者:會員上傳
簡介:寫寫幫文庫小編為你整理了多篇相關的《數(shù)據(jù)挖掘在體育教學中的應用的價值》,但愿對你工作學習有幫助,當然你在寫寫幫文庫還可以找到更多《數(shù)據(jù)挖掘在體育教學中的應用的價值》。

第一篇:數(shù)據(jù)挖掘在體育教學中的應用的價值

數(shù)據(jù)挖掘在體育教學中的應用的價值

摘 要:進入21世紀以來,體育領域無論是運動訓練、臨場比賽,或是學校體育、體育管理、體育產(chǎn)業(yè)以及全民健身、國民體質(zhì)調(diào)研與優(yōu)化等,無不與大量數(shù)據(jù)緊密聯(lián)系。面對大量的數(shù)據(jù),原來的數(shù)據(jù)庫管理方式和數(shù)據(jù)統(tǒng)計方法已經(jīng)逐漸不能適應國家提出的“健康體育”、體育競技人才梯隊建設和體育產(chǎn)業(yè)發(fā)展的需要。而數(shù)據(jù)挖掘技術正好能滿足這一需求,數(shù)據(jù)挖掘技術將有力地推動體育統(tǒng)計學向前發(fā)展。數(shù)據(jù)挖掘技術可以幫助我們從這些浩瀚的數(shù)據(jù)中深入尋找到各種因素的相互聯(lián)系,發(fā)現(xiàn)體質(zhì)健康數(shù)據(jù)、體育產(chǎn)業(yè)數(shù)據(jù)、運動訓練和競賽數(shù)據(jù)、體育教學數(shù)據(jù)等方面一些有價值的規(guī)律。因此,在實踐過程中,如何應用數(shù)據(jù)挖掘技術對體育數(shù)據(jù)進行信息化管理和深層分析,是當前體育科研人員所要研究的一項重要課題,因此本課題具有重要意義。

關鍵詞:數(shù)據(jù)挖掘 體育教學 教學評價

一、體育教學中的數(shù)據(jù)挖掘技術研究

近年來,國民體質(zhì)監(jiān)測、體育教學訓練、競技、管理數(shù)據(jù)劇增。體育數(shù)據(jù)如同礦藏一樣,只有通過挖掘和提煉才能變成可用的財富。下面就體育教學領域中使用的數(shù)據(jù)挖掘技術做簡要闡述。

1.關聯(lián)規(guī)則

關聯(lián)規(guī)則是體育教學中使用頻率最多,范圍最廣的數(shù)據(jù)挖掘技術之一,也可以被廣泛地應用于國內(nèi)外教育教學的決策分析中。運用關聯(lián)規(guī)則的方法可以判定哪一種教學方法適合某類學生或某門課程,從而方便教師進行教學方法的選擇,使得分層次教學能夠在實踐中得到更進一步的應用和實施。

2.分類

分類算法中應用得最多的是決策樹算法。決策樹是以實例為基礎的歸納學習算法。決策樹主要用于對離散數(shù)據(jù)進行分類,在教學方面則能夠用來對學生課程的選修、畢業(yè)課題的選擇、就業(yè)等方面進行分析指導。

3.聚類分析

所有物體彼此之間都是相類似的,但又和其他分組里的物體是不同的。在基于教育的數(shù)據(jù)挖掘中,聚類分析已經(jīng)被用于根據(jù)學生的行為對學生進行分組。例如聚類分析可以用來區(qū)分在非活躍的學生中表現(xiàn)較活躍的學生。

4.預測

預測是應用于模型的連續(xù)價值函數(shù),也就是預測未知數(shù)據(jù)和缺失的值。在這個模型中,我們可以推導出許多組合數(shù)據(jù)的其他一些方面的數(shù)據(jù)。基于教育的數(shù)據(jù)挖掘預測可以用來檢測學生的行為,預測與了解學生的學習成果。

5.Web數(shù)據(jù)挖掘

利用 Web 日志挖掘技術進行實例分析,找出訪問頻度較高的知識點網(wǎng)頁,確定學生的興趣點及知識點中的難點所在。在此基礎上,幫助教育者調(diào)整教學策略,改善網(wǎng)絡教學效果。

二、數(shù)據(jù)挖掘在體育教學中的應用研究

數(shù)據(jù)挖掘在體育教學領域中具有非常廣泛的應用前景,以下本文詳細從體育教學訓練、教學評價和教學管理三個方面來詳細闡述數(shù)據(jù)挖掘在體育教學中的應用。

1.數(shù)據(jù)挖掘在體育教學訓練中的應用研究

數(shù)據(jù)挖掘在體育教學訓練中的應用主要表現(xiàn)為對體育教材的選擇、體育教學方法的選擇、學生特征挖掘和對學生體質(zhì)狀況的預測等。

1.1體育教材的選擇

隨著科學技術的快速發(fā)展,我國體育教學教材由紙質(zhì)化向電子化轉(zhuǎn)變趨勢明顯。通過數(shù)據(jù)挖掘技術對體育教材的合理歸類、檢索、處理,建立知識體系結構,為體育教材進行體育教材的選擇提供參考。

1.2教學方法的選擇

教師在教學過程中可以采用多種教學方法來完成教學任務,比如講授法、討論法、實驗法、計算機輔助教學法、參觀法、調(diào)查法、實習法等。在通常情況下,可以采取一種或幾種方法進行。

1.3學生特征的挖掘

在體育教學中,可以采用聚類分析來幫助教師分析學生初始知識體系、當前知識體系、和目標知識體系,深刻提交學生的生理、心理和社會特征,以便幫助學習修正個人學習行為、提高學習能力、完善個人人格,促進學生各方面素質(zhì)的全面協(xié)調(diào)發(fā)展。

2.數(shù)據(jù)挖掘在體育教學評價中的應用研究

數(shù)據(jù)挖掘技術在體育教學評價中的應用,主要體現(xiàn)在學習評價、課程考核及教學管理評價三個方面:

2.1學生學習評價

對學生的學習評價是體育教師的主要教學工作之一,科學、合理地評定學生的學習行為,應針對學生的日常學習行為、獎懲記錄等方面的信息,利用數(shù)據(jù)挖掘工具進行分析處理,得到對學生客觀公正的評價,這樣不僅對學生起到信息反饋和激發(fā)學習動機的作用,而且是考查學生個別差異,便于因材施教的途徑。

2.2課程考核評價

在當前我國應試教育制度下,考試不僅是衡量學生學習工作量、學習能力的好壞,也是知道學生學習和培養(yǎng)終身體育觀的內(nèi)在動力。因此,在收集和整理學生理論知識、運動技能和體育素養(yǎng)等各項成績的基礎上,采用數(shù)據(jù)挖掘技術發(fā)現(xiàn)和抽取隱藏在數(shù)據(jù)額背后的知識和規(guī)律,針對考試內(nèi)容的難易程度、考試方法的公平程度和考試標準的合理程度等進行預測和及時調(diào)整,以更好地體現(xiàn)體育教學考試在檢驗教學效果、提高教學質(zhì)量等方面所起到的重要作用。

2.3教學管理評價

利用數(shù)據(jù)挖掘技術中的DEA系統(tǒng)分析方法可以對體育教學的決策單元做出評價,評估體育教學管理工作的有效性、決策單元管理政策的科學性和訓練管理的有效性等,從而指導教學管理單位采取相應的措施來提高體育教學及訓練管理工作水平。

3.數(shù)據(jù)挖掘在體育教學管理中的應用研究

3.1輔助考試

傳統(tǒng)的體育考核方式將期末成績作為評價標準,這對學習者而言往往是片面的、不公平的,利用數(shù)據(jù)挖掘可以對學生平時學習狀況進行綜合分析,從而對其進行全面的具有針對性的評價。

3.2科研選題

科研選題是廣大體育教學和研究者普遍面臨的棘手問題。本研究認為廣大體育教學工作者和研究者可以利用數(shù)據(jù)挖掘技術根據(jù)純數(shù)據(jù)間的關聯(lián)性挖掘出潛在、容易被忽視的規(guī)則作為潛在的課題研究題項。如運用數(shù)據(jù)挖掘技術中的關聯(lián)規(guī)則方法在研究學生體質(zhì)的數(shù)據(jù),挖掘出發(fā)掘出握力與平衡能力的關系、肺活量與握力間的關系后作為科研選題加以研究驗證。

三、結語

總之,數(shù)據(jù)挖掘的興起,為體育統(tǒng)計學與體育信息技術的結合帶來良好的契機,數(shù)據(jù)挖掘技術將成為繼數(shù)學、計算機科學之后,又一推動體育統(tǒng)計學發(fā)展的強大工具。但相比于數(shù)據(jù)挖掘技術在其他領域的應用程度而言,數(shù)據(jù)挖掘在體育教學領域的研究雖取得了一定的成果,但仍還有很多工作要做。

第二篇:數(shù)據(jù)挖掘在房地產(chǎn)營銷中的應用

文章摘要:信息資源的分析、整合在房地產(chǎn)行業(yè)的競爭中起著越來越重要的作用。數(shù)據(jù)挖掘作為一種系統(tǒng)地檢查和理解大量數(shù)據(jù)的工具,能有效地幫助房地產(chǎn)企業(yè)從不斷積累與更新的數(shù)據(jù)中提取有價值的信息。因此,數(shù)據(jù)挖掘被引入到房地產(chǎn)市場研究領域,并日益受到重視。本文從數(shù)據(jù)挖掘在房地產(chǎn)行業(yè)中的市場研究價值入手,分析了數(shù)據(jù)挖掘在房地產(chǎn)市場研究尤其是客戶信息中的應用,并加以舉例說明。關鍵詞:數(shù)據(jù)挖掘 關聯(lián)分析 分類

一、房地產(chǎn)行業(yè)需要數(shù)據(jù)挖掘技術的支持

隨著房地產(chǎn)行業(yè)競爭的加劇,房地產(chǎn)企業(yè)要想在競爭中制勝,必然需要充分的信息支持和準確的市場判斷。房地產(chǎn)行業(yè)擁有大量的數(shù)據(jù)積累,包括行業(yè)信息、經(jīng)濟環(huán)境信息、客戶信息等。這些數(shù)據(jù)是房地產(chǎn)企業(yè)市場運作的重要參考。面對快速增長的海量數(shù)據(jù)收集,企業(yè)需要有力的數(shù)據(jù)分析工具將“豐富的數(shù)據(jù)”轉(zhuǎn)換成“有價值的知識”,否則大量的數(shù)據(jù)將成為“數(shù)據(jù)豐富,但信息貧乏”的“數(shù)據(jù)墳墓”。

數(shù)據(jù)挖掘(Data Mining)是從大量數(shù)據(jù)中發(fā)現(xiàn)潛在關聯(lián)、模式,做出預測性分析的有效工具,它是現(xiàn)有的一些人工智能、統(tǒng)計學等技術在數(shù)據(jù)庫領域中的應用。應用數(shù)據(jù)挖掘有助于發(fā)現(xiàn)業(yè)務發(fā)展的趨勢,揭示已知的事實,預測未知的結果,并幫助企業(yè)分析出解決問題所需要的關鍵因素,使企業(yè)處于更有利的競爭位置。

二、數(shù)據(jù)挖掘在房地產(chǎn)行業(yè)的應用

1.數(shù)據(jù)挖掘的概念

對于企業(yè)的海量信息存儲,數(shù)據(jù)挖掘是一種系統(tǒng)地檢查和理解大量數(shù)據(jù)的工具。數(shù)據(jù)挖掘根據(jù)預定義的商業(yè)目標,對大量的企業(yè)數(shù)據(jù)進行探索和分析,揭示其中隱含的商業(yè)規(guī)律,并進一步生成相應的分析、預測模型。

數(shù)據(jù)挖掘發(fā)現(xiàn)的是以前未知的、可理解的、可執(zhí)行的信息,所以也被稱為“知識發(fā)現(xiàn)”(Knowledge Discovery in Databases)。與統(tǒng)計分析技術相比,數(shù)據(jù)挖掘技術能很好地和數(shù)據(jù)庫技術相結合,而且數(shù)據(jù)挖掘工具用以發(fā)現(xiàn)數(shù)據(jù)中隱含的商業(yè)規(guī)律的方法已不局限于統(tǒng)計技術,還包括神經(jīng)網(wǎng)絡、遺傳算法、自組織圖、神經(jīng)模糊系統(tǒng)等統(tǒng)計學科以外的方法。數(shù)據(jù)挖掘發(fā)現(xiàn)的“知識”一方面可以用于構建預測模型,另一方面可以被用于豐富統(tǒng)計分析師的背景知識,再被統(tǒng)計分析師應用到數(shù)據(jù)分析中。

數(shù)據(jù)挖掘任務一般可以分兩類:描述和預測。描述性挖掘任務刻劃數(shù)據(jù)庫中數(shù)據(jù)的一般特性。預測性挖掘任務在當前數(shù)據(jù)上進行推斷,以進行預測。具體來講,數(shù)據(jù)挖掘主要用于解決以下幾種不同事情:

(1)關聯(lián)分析(Association analysis),是尋找屬性間的相關性。兩種常用的技術是關聯(lián)規(guī)則和序列模式。關聯(lián)規(guī)則是尋找在同一事件中出現(xiàn)的不同項的相關性,比如某個住宅項目的目標客戶對該項目各方面評價之間的相關性序列分析尋找的是事件之間時間上的相關性,如對股票漲跌、房地產(chǎn)周期的分析。

(2)分類(Classification)和預測(Prediction)。分類根據(jù)某種標準將數(shù)據(jù)庫記錄分類到許多預先定義好的類別中。例如,將房地產(chǎn)企業(yè)客戶根據(jù)消費決策模式進行分類;同時可以建立預測模型,給定潛在客戶的收入、職業(yè)、家庭構成等個人屬性,預測他們在購房支出;如將房地產(chǎn)企業(yè)客戶分為潛在客戶、購買者和實際客戶。分類系統(tǒng)可以產(chǎn)生這樣的規(guī)則:“如果客戶可以并且愿意承擔每月2000元的月供,計劃在1年內(nèi)在某地區(qū)買房,那么他/她是一個潛在客戶;如果客戶至少進行過一次業(yè)務訪問,那么他/她是一個購買者。”

(3)聚類(Clustering)是把整個數(shù)據(jù)庫分成不同的群組。它的目的是要群與群之間差別明顯,而同一群之間的數(shù)據(jù)盡量相似。聚類與分類不同:分類之前已經(jīng)知道要把數(shù)據(jù)分成哪幾類,每個類的性質(zhì)是什么;聚類則恰恰相反。

(4)演變分析(evolution analysis)描述行為隨時間變化的對象的規(guī)律或趨勢,并對其建模。例如,結合人口構成變動趨勢、教育水平發(fā)展趨勢、社會經(jīng)濟發(fā)展趨勢進行房地產(chǎn)消費趨向的分析。

(5)描述和可視化(Description and Visualization),對數(shù)據(jù)進行歸約、概化或圖形描述等。例如,通過空間聚集和近似計算對一些具體的地理位置概化聚類,形成對某區(qū)域的形象化描述。

2.數(shù)據(jù)挖掘的市場研究價值

數(shù)據(jù)挖掘技術在商業(yè)上實際應用十分豐富。應用數(shù)據(jù)挖掘技術,可以幫助房地產(chǎn)行業(yè)找出有價值的信息,十分有助于企業(yè)發(fā)現(xiàn)商機、制定開發(fā)計劃與營銷策略。對于房地產(chǎn)市場研究,數(shù)據(jù)挖掘可以應用于宏觀經(jīng)濟形勢研究、市場發(fā)展趨勢研究、樓盤供應研究、競爭對手研究、客戶研究。包括但不局限于以下幾個方面:

(1)宏觀經(jīng)濟形勢研究——1)房地產(chǎn)周期時序分析中的相似搜索:可找出已有房地產(chǎn)周期數(shù)據(jù)庫中與給定查詢序列最接近的數(shù)據(jù)序列。比較識別兩個相似時間段間數(shù)據(jù)系列的主要差異,對房地產(chǎn)市場的宏觀分析很有參考價值。2)宏觀經(jīng)濟形勢研究——房地產(chǎn)周期一般性因素關聯(lián)分析:一般而言,房地產(chǎn)周期是影響不動產(chǎn)收益的一系列因素組成的總體概念。各因素均會對總體房地產(chǎn)周期起決定作用。關聯(lián)分析方法可用于幫助發(fā)現(xiàn)各因素和房地產(chǎn)周期間的交叉與聯(lián)系。

(2)市場發(fā)展趨勢研究——1)銷售量的增長與人均可支配收入的回歸分析;2)個人購買與集團購買房地產(chǎn)比重的擬合與分析;3)對房地產(chǎn)銷售波動率的回歸分析。通過對市場總體狀況、市場占有率、發(fā)展水平等動態(tài)的分析、總結和評價,及時獲得準確數(shù)據(jù),輔助經(jīng)營決策。

(3)樓盤供應研究——地理發(fā)展空間的多維分析:綜合人口住房條件及分布、土地利用現(xiàn)狀及政府規(guī)劃、交通現(xiàn)狀分布信息,通過聚集及層次化描述,發(fā)掘區(qū)域內(nèi)需建立的高檔別墅、高、中、低檔公寓的數(shù)量及各自的地理位置和發(fā)展計劃。

(4)客戶研究——客戶信息的多維關聯(lián)和序列模式分析:關聯(lián)分析可在客戶信息中發(fā)現(xiàn)客戶的消費行為模式,幫助營銷人員找出影響消費者的機會與方式。

目前,專業(yè)市場研究公司對房地產(chǎn)行業(yè)的調(diào)研主要集中在客戶需求分析方面,并積累了一定的經(jīng)驗,因此,本文主要探討房地產(chǎn)客戶信息的數(shù)據(jù)挖掘。

3.數(shù)據(jù)挖掘在房地產(chǎn)客戶研究中有著廣泛的應用

房地產(chǎn)行業(yè)的客戶信息有許多特點,如下圖所示,一方面房地產(chǎn)行業(yè)面對的客戶群廣泛,而且客戶的特征描述的結構復雜,另一方面房地產(chǎn)客戶需求的層次不一,且易受外界因素影響,具有多層次性和多變性。

對于復雜、多樣而且擅變的客戶信息,房地產(chǎn)行業(yè)客戶信息的數(shù)據(jù)挖掘有助于識別客戶購買行為,發(fā)現(xiàn)客戶購買模式和趨勢。從而,幫助房地產(chǎn)企業(yè)改進服務質(zhì)量,取得更好的客戶關系和滿意程度,設計更好的營銷方案,減少商業(yè)成本。根據(jù)已有的數(shù)據(jù)挖掘經(jīng)驗,數(shù)據(jù)挖掘在房地產(chǎn)行業(yè)的應用可以歸納成以下幾個方面:

4.明確商業(yè)目標

三、如何在房地產(chǎn)行業(yè)應用數(shù)據(jù)挖掘技術

應用數(shù)據(jù)挖掘的首要任務就是明確需要達到什么樣的商業(yè)目標,并描述出需要解決的問題。目標的描述應該細化、清楚,以便于選擇合適的挖掘方法,也方便檢測數(shù)據(jù)挖掘效果,判斷建立的模型的有效性。例如,下列目標是大而空的目標:獲得客戶行為的了解;在數(shù)據(jù)中發(fā)現(xiàn)有用的模型;發(fā)現(xiàn)一些有意思得東西。而另外一些目標有較強操作性:發(fā)現(xiàn)哪些客戶不受某種促銷手段的影響;找出項目封頂時哪類客戶成交率增加。

5.數(shù)據(jù)準備

基于數(shù)據(jù)挖掘的商業(yè)目標,提取所需要的數(shù)據(jù)。為了保證數(shù)據(jù)的質(zhì)量,除了對數(shù)據(jù)進行必要地檢查和修正外,還需要考慮不同源之間數(shù)據(jù)的一致性問題。

如果數(shù)據(jù)集包含過多的字段,需采用一定的方法找到對模型輸出影響最大的字段,適當?shù)臏p少輸入的字段。常用的方法包括:“描述型數(shù)據(jù)挖掘”、連結分析等。

很多變量如果組合起來(加、減、比率等)會比這些變量自身影響力更大。一些變量如果擴大它的范圍會成為一個非常好的預測變量,比如用一段時間內(nèi)收入變化情況代替一個單一的收入數(shù)據(jù)。因此,在數(shù)據(jù)準備階段需考慮是否創(chuàng)建一些新的變量。

處理缺失數(shù)據(jù)也是數(shù)據(jù)準備階段的一個重要工作。有些缺值本身就非常有意義。例如:富有的顧客會忽略“收入”,或者不在乎價格的影響。

6.建立模型

建立模型是一個反復的過程。首先需要選擇適合解決當前問題的模型。對模型的選擇過程可能會啟發(fā)對數(shù)據(jù)的理解并加以修改,甚至改變最初對問題的定義。

一旦選擇了模型的類型及應用的方法,所選擇的模型將決定對數(shù)據(jù)的預處理工作。例如,神經(jīng)網(wǎng)絡需要做數(shù)據(jù)轉(zhuǎn)換,有些數(shù)據(jù)挖掘工具可能對輸入數(shù)據(jù)的格式有特定的限制等。

接下來是建立模型的工作。對于通過數(shù)據(jù)挖掘建立的模型需要有一定的數(shù)據(jù)來測試和驗證。對于預測性任務,需通過反復的測試、驗證、訓練,才能不斷提高模型的準確率。

大部分數(shù)據(jù)挖掘模型不是專為解決某個問題而特制的,模型之間也并不相互排斥。不能說一個問題一定要采用某種模型,別的就不行。例如:Cart決策樹算法、神經(jīng)網(wǎng)絡既可以用于建立分類樹,也可建立回歸樹。

7.輸出結果的評價和解釋

模型建立好之后,必須評價其結果,解釋其價值。在實際應用中,模型的準確率會隨著應用數(shù)據(jù)的不同發(fā)生變化。但準確度自身并不一定是選擇模型的正確評價方法。對輸出結果的理解需要進一步了解錯誤的類型和由此帶來的相關費用的多少。如果模型每個不同的預測錯誤所需付出的代價(費用)也不同的話,代價最小的模型(而不一定是錯誤率最小的模型)將是較好的選擇。

直接在現(xiàn)實世界中測試模型很重要。先在小范圍內(nèi)應用,取得測試數(shù)據(jù),覺得滿意后再向大范圍推廣。

8.實施

模型在建立并經(jīng)驗證之后,可以有兩種主要的使用方法。一種是提供給分析人員做參考,由他通過查看和分析這個模型輸出,并做出解釋和方案建議;另一種是把模型應用到不同的數(shù)據(jù)集上。模型可以用來標示一個事例的類別,給一類客戶打分等,還可以用模型在數(shù)據(jù)庫中選擇符合特定要求的記錄,以用其他工具做進一步分析。

在應用模型之后,還要不斷監(jiān)控模型的效果。即使模型的運用很成功,也不能放棄監(jiān)控。因為事物在不斷發(fā)展變化,很可能過一段時間之后,隨著購買方式、消費觀點的變化,模型就不再起作用。因此隨著模型使用時間的增加,要不斷的對模型做重新測試,有時甚至需要更新建立模型。

四、應用舉例:基于客戶分類的關聯(lián)分析

1.商業(yè)目標

為了更詳盡地了解客戶的消費決策,本案例設計的問題是:“給客戶分類,并了解不同類的客戶有什么特點?”針對此類問題挖掘出的結果可以被用于預測性分析,例如預測客戶最傾向于做出哪種購買行為。2.數(shù)據(jù)準備

本案例中采用某一時點上的房地產(chǎn)消費者需求抽樣調(diào)查,取出描述消費者個人屬性和消費特點的字段。

3.建立模型

(1)對數(shù)據(jù)進行分類

本案例中由購房者選擇最多五個自己在購房決策過程中比較看重的因素,并以總評分100分為前提給出每個因素的看重程度的評分。

案例得到的抽樣數(shù)據(jù)顯示,盡管地理位置是影響一個房地產(chǎn)項目定位的重要因素,人們對地理位置的看重程度仍有較大的差異。因此,以客戶對地理位置的關注程度為分類標準,構建了一個簡單的決策樹。決策樹中根據(jù)購房者對地理位置的看重程度,將購房者分為:地理位置決定型、地理位置重要參考型、地理位置參考型、地理位置不重要型、地理位置無關型五種類型。下表是應用決策樹得到的客戶分類結果。從各客戶群評分的均值和標準差可以看出,各客戶群具有較好的組內(nèi)相似性和組間差異性,說明所構建的決策樹的分類結果比較理想,可用于進一步的分析。

(2)關聯(lián)分析運用關聯(lián)分析的目的是尋找數(shù)據(jù)庫中值的相關性。本例采用基于興趣度的關聯(lián)規(guī)則挖掘算法,挖掘每類客戶不同屬性間的相關性。經(jīng)過挖掘,發(fā)現(xiàn)一些值得深入探討的關聯(lián),見下表:

注:a)支持率反映了關聯(lián)是否是普遍存在的規(guī)律。例如:支持率=5%,表示在1000個客戶中有50個客戶符合關聯(lián)規(guī)則描述。

b)可信度反映了關聯(lián)規(guī)則前提成立的條件下結果成例的概率。本例中,可信度=15%可以解釋為,對應的客戶群中有15個人符合關聯(lián)規(guī)則的描述。

c)興趣度反映了關聯(lián)規(guī)則中元素的關系的密切程度。興趣度越大于1說明該規(guī)則中的元素的關系越密切,該規(guī)則的實際利用價值越大。

d)最小支持度閾值、最小可信度和最小興趣度的閾值可以由用戶和領域?qū)<以O定。此例中以支持度>3.5%,可信度>15%,興趣度>2為閾值。

上表中列出的關聯(lián)規(guī)則均有較高的支持率、可信度和興趣度。為了更加準確地挖掘關聯(lián)規(guī)則。對挖掘出的關聯(lián)規(guī)則更換因果關系,形成新的關聯(lián)規(guī)則與之進行對比。如下例:

關聯(lián)規(guī)則A1:地理位置無關型客戶=≥重視物業(yè)管理

支持率=9.7% 可信度=30.3% 興趣度=2.4與

關聯(lián)規(guī)則B1:重視物業(yè)管理 =≥地理位置無關型客戶

支持率=9.7% 可信度=76.9% 興趣度=2.4

對比兩個關聯(lián)規(guī)則將發(fā)現(xiàn),“重視物業(yè)管理的人不關心地理位置”的可能性(76.9%)高于“不關心地理位置的人重視物業(yè)管理”的可能性(30.3%)。說明關聯(lián)規(guī)則B1:重視物業(yè)管理=≥地理位置無關型客戶是一條更有意義的關聯(lián)規(guī)則。

其他被發(fā)掘的關聯(lián)也可以通過類似的比較,進行深一步的挖掘。在此不再全部做出詳細分析。從本例挖掘出的信息可以看到,如果僅依賴于已有行業(yè)經(jīng)驗進行統(tǒng)計分析,往往會因為分析人員的主觀性或者數(shù)據(jù)量太大難以實施而存在信息提取的局限性。而通過數(shù)據(jù)挖掘得到的信息,一方面能彌補直接應用統(tǒng)計分析時的局限性,開拓分析人員的思維,豐富分析人員的行業(yè)背景知識;另一方面可以通過反復的驗證、機器學習建立模型,直接成為分析人員的分析、預測的工具。

需要說明:

a)本案例的目的在于說明數(shù)據(jù)挖掘算法的應用價值,得到的結果僅供參考,并不作為定論,而且數(shù)據(jù)挖掘的結果需要由行業(yè)內(nèi)的商業(yè)分析人員判斷:是否真的具有意義,是否有進一步分析、探討的價值。也就是說數(shù)據(jù)挖掘作為信息提取的工具,其輸出是決策分析的參考,不能代替行業(yè)內(nèi)商業(yè)分析人員的分析工作。

b)案例中的數(shù)據(jù)挖掘作為方法應用的探討,如要生成一個可操作的模型工具還需足夠的數(shù)據(jù)集支持進行測試、驗證、訓練才能不斷提高模型的準確率。

c)本案例中解決問題的方法不是唯一的,可能應用其他的分類手段、分類標準能得到更好的結果。具體方法的應用要取決于實施人員的建模能力、行業(yè)經(jīng)驗。也就是說,數(shù)據(jù)挖掘?qū)θ藛T有較高的要求。數(shù)據(jù)挖掘的人員不僅要有良好的統(tǒng)計概念、建模能力,還要懂得基本的商業(yè)和行業(yè)概念。

五、房地產(chǎn)行業(yè)數(shù)據(jù)挖掘的應用前景

隨著IT/Internet等新技術發(fā)展,市場研究在房地產(chǎn)行業(yè)的應用已經(jīng)不再局限于數(shù)據(jù)采集和簡單的歸納、數(shù)據(jù)分析。更高的決策服務是建立在更大量的“數(shù)據(jù)——信息——知識”的基礎上的,因此數(shù)據(jù)挖掘、商業(yè)智能等概念與技術的引入促進了數(shù)據(jù)挖掘在房地產(chǎn)行業(yè)的應用。與此同時,隨著房地產(chǎn)企業(yè)數(shù)據(jù)挖掘應用的深入,數(shù)據(jù)、數(shù)據(jù)挖掘的任務和數(shù)據(jù)挖掘方法的多樣性將給數(shù)據(jù)挖掘提出了許多挑戰(zhàn)性的課題。例如:

1、應用地理信息系統(tǒng)(GIS)尋求數(shù)據(jù)挖掘過程中的可視化方法,使得知識發(fā)現(xiàn)的過程能夠被用戶理解,也便于在知識發(fā)現(xiàn)過程中的人機交互。

2、web挖掘:由于web上存在大量信息,隨著web的發(fā)展,有關web內(nèi)容挖掘、web日志挖掘等網(wǎng)絡上的數(shù)據(jù)挖掘?qū)⒊蔀閿?shù)據(jù)挖掘中一個最為重要和繁榮的應用領域。房地產(chǎn)公司的企業(yè)形象宣傳、營銷、客戶維護等工作都將離不開網(wǎng)絡,也必然將需要web挖掘數(shù)據(jù)支持。

第三篇:關于數(shù)據(jù)挖掘在出口退稅中的應用

關于數(shù)據(jù)挖掘在出口退稅中的應用引言

出口貨物退(免)稅,簡稱 出口退稅,其基本含義是一個國家或地區(qū)對已報送離境的出口貨物,由稅務機關將其在出口前的生產(chǎn)和流通的各環(huán)節(jié)已經(jīng)繳納的國內(nèi)產(chǎn)品稅、增值稅、營業(yè)稅和特別消費稅等間接稅稅款退還給出口企業(yè)的一項稅收制度。出口退稅 主要是通過退還出口貨物的國內(nèi)已納稅款來平衡國內(nèi)產(chǎn)品的稅收負擔,使本國產(chǎn)品以不含稅成本進入國際市場,與國外產(chǎn)品在同等條件下進行競爭,從而增強競爭能力,擴大出口創(chuàng)匯[1]。

我國從1985年開始,全面地實行了 出口退稅 政策,并從1995年開始全面實行電子化管理,它是全國稅務系統(tǒng)第一個全面推廣應用的稅收管理軟件,是金關工程和金稅工程的一個子系統(tǒng),在強化出口退稅管理,提高出口退稅工作效率,防范和打擊騙稅上發(fā)揮了巨大的作用[2]。但是,目前的出口退稅電子化管理只完成了出口退稅業(yè)務的電子化操作,還未在決策的電子化方面取得較大進展。經(jīng)過十多年的發(fā)展,積累了大量涉稅信息,如何將這些“歷史的、靜態(tài)的”數(shù)據(jù)變成動態(tài)的、具有分析決策性質(zhì)的信息已成為當前急需研究的課題[3],數(shù)據(jù)挖掘技術的出現(xiàn)使這種應用成為現(xiàn)實。出口退稅數(shù)據(jù)挖掘的目的和基本方法

現(xiàn)行的出口退稅電子化管理主要是通過出口企業(yè)把申報退稅的信息通過出口退稅申報系統(tǒng)錄入計算機并生成申報數(shù)據(jù),然后再經(jīng)過出口退稅審核系統(tǒng)把企業(yè)申報的出口退稅憑證的電子信息與稅務機關接收到的其他部門(征稅機關、海關 和外管)傳來的憑證信息進行比對,以達到審核出口退稅憑證的合法性和真實性的目的,進而根據(jù)比對審核通過的數(shù)據(jù)進行退稅。可以看出,目前的出口退稅電子化管理只側(cè)重了出口退稅的 單證 信息的計算機審核,而對于挖掘?qū)徍送ㄟ^的 單證 信息和各部門傳遞來的電子信息的價值方面存在著很大的不足。隨著金稅二期網(wǎng)絡建設的推動,各省現(xiàn)已基本實現(xiàn)了出口退稅數(shù)據(jù)的省級大集中[4],這些數(shù)據(jù)都是各出口退稅部門在日常的業(yè)務審核中積累下來的數(shù)據(jù),十分寶貴,如何充分發(fā)揮其應有的作用,已成為人們研究的熱點。1

數(shù)據(jù)挖掘的目的就是分析出口企業(yè)的出口退稅數(shù)據(jù),挖掘這些數(shù)據(jù)與經(jīng)濟的內(nèi)在聯(lián)系,全面掌握本地區(qū)出口退稅的產(chǎn)品結構、出口的貿(mào)易方式、出口產(chǎn)品的地區(qū)差異等,對于調(diào)整一個地區(qū)的產(chǎn)業(yè)結構、經(jīng)濟發(fā)展方向以及制定經(jīng)濟發(fā)展戰(zhàn)略有著重要的參考價值;對于稅務機關掌握出口企業(yè)的實際生產(chǎn)出口情況,培養(yǎng)稅源,打擊偷稅漏稅和防范出口騙稅等方面有著重要的意義。

對于出口退稅部門在日常的業(yè)務審核中積累下來的數(shù)據(jù)進行挖掘,主要是指在了解和掌握具體納稅人生產(chǎn)經(jīng)營情況和財務數(shù)據(jù)的基礎上,對納稅人的稅收經(jīng)濟關系和稅收繳納狀況進行客觀評價和說明的分析,主要是通過對歷史數(shù)據(jù)進行縱橫比較分析和邏輯關系稽核來進行挖掘,以指導稅收管理工作。

1)橫向比較分析

橫向比較分析是指同一指標在不同個體、單位、地區(qū)之間的比較分析。橫向比較分析最典型的分析例子就是同業(yè)稅負分析。受市場均衡作用的影響,同一產(chǎn)品在生產(chǎn)技術工藝、原材料能源消耗方面有相近之處,適用稅收政策有統(tǒng)一的要求,因此反映生產(chǎn)成本費用方面的指標有相同的規(guī)律特征。總結這種規(guī)律特征,以此檢驗個體數(shù)據(jù)指標的表現(xiàn),找出差異較大的個體予以預警。

2)縱向比較分析

縱向比較分析或歷史數(shù)據(jù)分析是指同一個體的同一指標在不同歷史時期的數(shù)據(jù)比較分析。常用的分析方法有趨勢分析和變動率分析。分析的理論依據(jù)是大多情況下企業(yè)的生產(chǎn)經(jīng)營是處于一種相對平穩(wěn)的狀態(tài),不會出現(xiàn)突然的波動或大起大落現(xiàn)象。因此,如果企業(yè)生產(chǎn)能力沒有作大的調(diào)整,一般情況下企業(yè)各個時期的數(shù)據(jù)指標彼此接近,不會出現(xiàn)大的差異。如果出現(xiàn)較大差異,應引起主管部門的注意,及時進行相關的納稅評估。

3)數(shù)據(jù)邏輯關系稽核

受會計核算原理的約束和稅收制度規(guī)定的制約,反映納稅人生產(chǎn)經(jīng)營情況和財務狀況的眾多數(shù)據(jù)指標之間存在非常嚴謹?shù)摹⑾嗷ヒ来娴倪壿嬯P系。這種邏輯關系決定了企業(yè)的納稅申報數(shù)據(jù)必須滿足企業(yè)財務數(shù)據(jù)相關性的特定要求,檢查這些數(shù)據(jù)邏輯關系是否吻合,可以鑒別企業(yè)申報數(shù)據(jù)的真實性和合理性,從而發(fā)現(xiàn)稅收問題,堵塞征管漏洞。出口退稅數(shù)據(jù)挖掘的功能

數(shù)據(jù)挖掘通過預測未來趨勢及行為,做出前攝的、基于知識的決策。數(shù)據(jù)挖掘的目標是從數(shù)據(jù)庫中發(fā)現(xiàn)隱含的、有意義的知識,主要有以下五類功能:

1)趨勢預測

數(shù)據(jù)挖掘自動在大型數(shù)據(jù)庫中尋找預測性信息,以往需要進行大量手工分析的問題如今可以迅速直接由數(shù)據(jù)本身得出結論。出口退稅數(shù)據(jù)挖掘的預測趨勢是對納稅人特定稅收指標、經(jīng)濟指標或稅收經(jīng)濟關系指標一段時期走勢和趨向的分析和推斷,了解和掌握稅收經(jīng)濟的發(fā)展趨勢,有利于判斷未來出口退稅形勢的好壞,使出口退稅做到心中有數(shù)。

趨勢預測的兩個基本要求是說明特定指標的發(fā)展方向和變化幅度,基礎分析技術是時間序列分析技術,常用說明指標有變動率和平均變化速度等。

2)關聯(lián)分析

數(shù)據(jù)關聯(lián)是數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識。若兩個或多個變量的取值之間存在某種規(guī)律性,就稱為關聯(lián)。關聯(lián)可分為簡單關聯(lián)、時序關聯(lián)、因果關聯(lián)。關聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關聯(lián)網(wǎng)。有時并不知道數(shù)據(jù)庫中數(shù)據(jù)的關聯(lián)函數(shù),即使知道也是不確定的,因此關聯(lián)分析生成的規(guī)則帶有可信度。

在出口退稅評估工作中,可以利用企業(yè)財務報表、納稅申報表和出口退稅匯總表等各項數(shù)據(jù)指標之間的相互邏輯關系進行核算檢查,對于不滿足應有邏輯計算關系的內(nèi)容,即認為破壞了會計核算或稅款計征關系,均應視為異常做進一步的深入分析。由于企業(yè)財務指標和出口退稅申報數(shù)據(jù)有上百條之多,所以與此相關的邏輯計算關系也會在此基礎上更為豐富和復雜,只有通過關聯(lián)分析,才有可能在出口退稅申報環(huán)節(jié)實現(xiàn)實時的出口退稅評估工作。

3)聚類分析

聚類分析是數(shù)理統(tǒng)計的一個分支,是運用事物本身所具有的某種數(shù)據(jù)特征,遵循“物以類聚”規(guī)律進行數(shù)據(jù)處理,為事物的分類管理提供數(shù)據(jù)支持的一種分析方法。借用這種方法開展稅收分析,可將具有某種稅收共同特征的事物聚集在一起,使我們更清楚地認識稅收征管工作的分類特征。

聚類分析的基本原理是根據(jù)數(shù)據(jù)指標差異的絕對距離進行分類,結合矩陣分析技術,可以進行多指標的綜合特征分析,為復雜事物的分類提供了一種可行的分析方法。聚類分析的關鍵是找到一組關系密切的相關指標,如退稅增長、稅源增長、退稅變化彈性和出口影響等,均可以利用這一分析技術進行綜合分析和技術處理。

4)差異分析

數(shù)據(jù)庫中的數(shù)據(jù)常有一些異常記錄,從數(shù)據(jù)庫中檢測這些差異很有意義。差異包括很多潛在的知識,如分類中的反常實例、不滿足規(guī)則的特例、觀測結果與模型預測值的偏差、量值隨時間的變化等。

差異分析的基本方法是測算不同樣本同一指標的差異程度。差異分析的關鍵是建立評價差異的標準,有了標準才能說明差異的影響程度。表示差異程度可以用絕對值,也可以建立參照系用相對值。應用差異分析開展微觀稅收分析的典型分析案例就是同業(yè)稅負分析模型。應用同業(yè)稅負分析模型可以測算出各項相關指標的客觀水平和樣本離散狀況,以此為標準比對個別檢驗樣本的具體數(shù)值,超出差異允許界限的即為預警對象。

5)波動分析

波動分析是描述稅收事物運行變化平穩(wěn)性的分析。稅收事物的運行受經(jīng)濟變化影響、稅收制度規(guī)定的約束和現(xiàn)有征管環(huán)境制約有其自身客觀的規(guī)律。在經(jīng)濟

運行相對平穩(wěn)、稅制不變的條件下,稅收事物運行平穩(wěn)與否,直接反映稅收征管情況的影響作用。因此,開展波動分析,一定程度上可以了解和說明退稅管理的表現(xiàn),反映退稅管理是否能按稅源的發(fā)展變化規(guī)律同步開展,監(jiān)督退稅管理的執(zhí)行情況。出口退稅數(shù)據(jù)挖掘的實現(xiàn)

出口退稅數(shù)據(jù)挖掘應用系統(tǒng)由三部分組成:第一部分是由用戶數(shù)據(jù)源到中央數(shù)據(jù)庫的ETL過程;第二部分是根據(jù)出口退稅業(yè)務模型建立業(yè)務智能分析模型;第三部分是面向稅收管理人員進行數(shù)據(jù)的發(fā)布和多維分析工作。基本結構如圖1所示。

數(shù)據(jù)的ETL(Extract-Transform-Load,數(shù)據(jù)抽取、轉(zhuǎn)換、裝載)過程采用微軟的SSIS(SQL Server Integration Services)來完成數(shù)據(jù)預處理階段對于原始數(shù)據(jù)的轉(zhuǎn)換、清洗加載過程;中央數(shù)據(jù)庫采用微軟的SQL Server 2005,SQL Server 2005除了提供一個安全、可靠和高效的數(shù)據(jù)管理平臺之外,它還是一個企業(yè)級數(shù)據(jù)整合平臺,通過SSIS提供了構建企業(yè)級ETL應用程序所需的功能和性能,是一個集成的商業(yè)智能平臺,通過Analysis Services提供了統(tǒng)一和集成的商業(yè)數(shù)據(jù)視圖,可被用做所有傳統(tǒng)報表、OLAP分析、關鍵績效指標(KPI)記分卡和數(shù)據(jù)挖掘的基礎。

SQL Server 2005分析服務提供了數(shù)據(jù)挖掘服務,支持集成其它個人或者企業(yè)的DM算法,并且將DM算法集成的復雜度不斷降低,它主要是基于OLE DB for DM規(guī)范,使用靈活。開發(fā)人員能夠利用數(shù)據(jù)挖掘功能開發(fā)應用程序,其數(shù)據(jù)挖掘語言非常類似于SQL,數(shù)據(jù)挖掘供應者是一個開放系統(tǒng),因為它是OLE DB的一個部件,數(shù)據(jù)挖掘服務能夠通過DSO(Decision Support Object)、或ADO可包含在任何用戶應用程序中。將DM算法無縫集成到SQL Server的分析服務中,利用集成的DM算法來構建數(shù)據(jù)挖掘解決方案是一種理想的方式。

在SQL Server 2005數(shù)據(jù)挖掘平臺中,創(chuàng)建關系型挖掘模型的語法如下:

Create mining model()using

它類似于建立一個關系表,其中包括輸入、預測屬性,每一個模型與一個數(shù)據(jù)挖掘算法相關聯(lián)。

多維數(shù)據(jù)分析工具和報表工具使用統(tǒng)一空間模型UDM(Unified Dimensional Model),利用UDM中對業(yè)務實體的友好描述、等級導航、多視角、自動平滑 翻譯 為本機語言等功能,可以實現(xiàn)出口退稅數(shù)據(jù)挖掘過程中所得到的結果集的友好展示。結束語

隨著數(shù)據(jù)倉庫技術的發(fā)展,數(shù)據(jù)挖掘會越來越發(fā)揮其獨到的分析優(yōu)勢,特別是將挖掘出的新知識通過用基于OLAP的決策支持系統(tǒng)加以驗證、結合,可以更好地為決策者服務。出口退稅管理的電子化系統(tǒng)已經(jīng)積累了大量的業(yè)務數(shù)據(jù),可以為數(shù)據(jù)挖掘提供大量數(shù)據(jù),數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術在收稅管理具有廣闊的應用前景。

第四篇:數(shù)據(jù)挖掘在企業(yè)競爭情報系統(tǒng)中的應用

數(shù)據(jù)挖掘在企業(yè)競爭情報系統(tǒng)中的應用

摘要:本文主要概述了數(shù)據(jù)挖掘技術的發(fā)展歷史和研究現(xiàn)狀。并將數(shù)據(jù)挖掘技術在企業(yè)競爭情報系統(tǒng)中的應用狀況分別從國內(nèi)和國外兩方面作了介紹。同時對數(shù)據(jù)挖掘技術在企業(yè)競爭中的應用的相關經(jīng)典理論與最新理論作了簡要的介紹。

關鍵詞: 數(shù)據(jù)挖掘;企業(yè)競爭情報;知識發(fā)現(xiàn)

中圖分類號: TP39

21.引言

數(shù)據(jù)挖掘也稱知識發(fā)現(xiàn)。數(shù)據(jù)挖掘是一門不斷發(fā)展的綜合交叉學科,興起于20世紀80年代末,是當前計算機行業(yè)最熱門的研究領域之一。數(shù)據(jù)挖掘理論匯聚了數(shù)據(jù)庫、可視化、并行計算等方面的技術,集統(tǒng)計學、人工智能、模式識別、計算機科學、機器學習等多門學科理論知識為一體。數(shù)據(jù)挖掘技術從本質(zhì)上來說是一種新的商業(yè)信息處理技術。[1]從商業(yè)角度看,數(shù)據(jù)挖掘技術就是按企業(yè)的既定的業(yè)務目標,對大量的企業(yè)數(shù)據(jù)進行深層次分析以揭示隱藏的,未知的規(guī)律并將其模型化,從而支持商業(yè)決策活動。[2]

2.研究歷史

2.1 國外歷史

從數(shù)據(jù)庫中發(fā)現(xiàn)知識(KDD)一詞首次出現(xiàn)在1989年舉行的第十一屆國際聯(lián)合人工智能學術會議上。到目前為止,由美國人工智能協(xié)會主辦的KDD國際研討會已經(jīng)召開了8次,規(guī)模由原來的專題討論會發(fā)展到國際學術大會,研究重點也逐漸從發(fā)現(xiàn)方法轉(zhuǎn)向系統(tǒng)應用,注重多種發(fā)現(xiàn)策略和技術的集成,以及多種學科之間的相互滲透。1999年,亞太地區(qū)在北京召開的第三屆PAKDD會議收到158篇論文,空前熱烈。IEEE的Knowledge and Data Engineering會刊率先在1993年出版了KDD技術專刊。并行計算、計算機網(wǎng)絡和信息工程等其他領域的國際學會、學刊也把數(shù)據(jù)挖掘和知識發(fā)現(xiàn)列為專題和專刊討論,甚至到了膾炙人口的程度。[3]

2.2 國內(nèi)歷史

與國外相比,國內(nèi)對DMKD的研究稍晚,沒有形成整體力量。1993年國家自然科學基金首次支持我們對該領域的研究項目。[4]目前,國內(nèi)的許多科研單位和高等院校競相開展知識發(fā)現(xiàn)的基礎理論及其應用研究,這些單位包括清華大學、中科院計算技術研究所、空軍第三研究所、海軍裝備論證中心等。其中,北京系統(tǒng)工程研究所對模糊方法在知識發(fā)現(xiàn)中的應用進行了較深入的研究,北京大學也在開展對數(shù)據(jù)立方體代數(shù)的研究,華中理工大學、復旦大學、浙江大學、中國科技大學、中科院數(shù)學研究所、吉林大學等單位開展了對關聯(lián)規(guī)則開采算法的優(yōu)化和改造;南京大學、四川聯(lián)合大學和上海交通大學等單位探討、研究了非結構化數(shù)據(jù)的知識發(fā)現(xiàn)以及Web數(shù)據(jù)挖掘。[5]

2.3 重要理論

1997年,Mannila對當時流行的數(shù)據(jù)挖掘理論的理論框架給出了綜述。[6]結合最新的研究成果,有下面一些重要的理論。

模式發(fā)現(xiàn)架構理論,規(guī)則發(fā)現(xiàn)架構理論,基于概率與統(tǒng)計理論,微觀經(jīng)濟學觀點理論,基于數(shù)據(jù)壓縮的理論,基于歸納數(shù)據(jù)庫理論,可視化數(shù)據(jù)挖掘理論。這些經(jīng)典的理論直到今天還是研究的熱門。而且也不能算是完善的理論。畢竟數(shù)據(jù)挖掘的概念的提出不過幾十年。Piatetsky-Shapiro說數(shù)據(jù)挖掘技術在被廣泛應用之前,仍然有許多“鴻溝”要跨越,即所謂Chasm階段。[7]

3. 研究現(xiàn)狀

3.1國外研究與應用現(xiàn)狀

最近,Gartner Group的一次高級技術調(diào)查將數(shù)據(jù)挖掘和人工智能列為“未來三到五年內(nèi)將對工業(yè)產(chǎn)生深遠影響的五大關鍵技術”之首,并且還將并行處理體系和數(shù)據(jù)挖掘列為未來五年內(nèi)投資焦點的十大新興技術前兩位。根據(jù)最近Gartner的HPC研究表明,“隨著數(shù)據(jù)捕獲、傳輸和存儲技術的快速發(fā)展,大型系統(tǒng)用戶將更多地需要采用新技術來挖掘市場以外的價值,采用更為廣闊的并行處理系統(tǒng)來創(chuàng)建新的商業(yè)增長點。”[8]

據(jù)美國《幸福》雜志統(tǒng)計,全球500強企業(yè)的前100名企業(yè)和美國95%的公司均擁有自己的競爭情報系統(tǒng),幫助企業(yè)根據(jù)競爭環(huán)境和競爭對手的各種變化,贏得競爭的主動權。根據(jù)美國未來集團對世界500強企業(yè)的調(diào)查統(tǒng)計,競爭情報對企業(yè)效益所作的貢獻占企業(yè)總效益的比率分別是:微軟為17%、摩托羅拉為11%、IBM為9%、寶潔為8%、通用電氣為7%、惠普為7%、可口可樂為5%、英特爾為5%。[9]

3.2國內(nèi)研究與應用現(xiàn)狀

我國學者對競爭情報的研究始于20世紀80年代末期。當時,上海科技情報所的研究人員在國外進修期間接觸到競爭情報的概念,并將其引入到國內(nèi),拉開了我國競爭情報研究的序幕。

1991—1994年,中國兵器工業(yè)情報研究所牽頭進行了一項課題“情報研究的國內(nèi)外比較研究“,提出了把我國情報研究工作的重點轉(zhuǎn)向競爭情報,推進國家、集團和企業(yè)的科技進步,增強它們的競爭力和提高產(chǎn)品與服務的市場占有率方面來的重要對策。1992年中期,上海科學技術情報研究所成立了“市場調(diào)研部”,開始進行競爭情報實踐的探索。由該所負責的“上海轎車工業(yè)競爭環(huán)境監(jiān)視系統(tǒng)”是國內(nèi)競爭情報領域第一個由政府立項的研究課題,于1992年10月立項、1993年底結束。1994年9月,國家計委、國家科委、國防科工委、北京市政府等部門聯(lián)合召開了“全國競爭情報與企業(yè)發(fā)展研討會”。1 996年,北京市科委將競爭情報軟科學納入“北京市工業(yè)振興計劃“中。作為四個示范工程之一,“北京市競爭情報示范工程”由兵器信息研究所、航天信息研究所具體承擔。示范工程以中介組織與企業(yè)合作的方式開展,在電子,電器、醫(yī)藥、化工、紡織和煙草等行業(yè)中選擇不同盈利狀況的企業(yè),共計8個項目,主要研究競爭情報系統(tǒng)(cis)的數(shù)據(jù)庫設計報系統(tǒng)、網(wǎng)絡設計等,至1999年10 月己完成了6個并通過驗收。1999年年中,北京市科委決定成立“北京市競爭情報咨詢服務中心”,以“北京市競爭情報示范工程”的主要承擔單位航天信息研究所為依托單位,“在北京市企業(yè)開展競爭情報的推廣工作,培養(yǎng)一批競爭情報研究專家,幫助企業(yè)開展競爭情報研究,建立符合企業(yè)實際的競爭情報組織體系,為企業(yè)科學決策提供依據(jù)”。進入2l世紀,我國的海爾、康佳、創(chuàng)維等大型企業(yè)集團分別在美國、印度、墨西哥設立了其海外工廠,競爭情報的應用為他們開拓海外市場起到事半功倍的作用。在國內(nèi)已經(jīng)有一些大中型企業(yè)開始接受外部咨詢公司的服務,并著手建設自己的競爭情報體系。包括醫(yī)藥行業(yè)的:三九醫(yī)藥、哈藥三廠、六廠、上海羅氏、西安楊森、同仁堂等;百貨行業(yè)的:西單商場、武漢中商;金融行業(yè)的:深圳發(fā)展銀行、上海浦發(fā)銀行、中國民生銀行等企業(yè)。2000年12月,由中國兵器工業(yè)第二一零研究所牽頭,北京大學信息管理系、中國科技信息研究所和北京牡丹電子集團參與的一項國家自然科學基金會項目“企業(yè)競爭情報系統(tǒng)的模式和運行機制研究”結題,在總結國內(nèi)外經(jīng)驗的基礎上,構造了由三個網(wǎng)絡、三個系統(tǒng)、一個中心、六大功能構成的企業(yè)競爭情報系統(tǒng),并給出了競爭情報分析方法及其評價指標,詳細介紹了競爭對手跟蹤、關鍵成功因素分析、核心競爭力分析和多點競爭分析方法以及計算機技術在競爭情報分析中的應用。目前,國內(nèi)市場上已出現(xiàn)了專業(yè)的競爭情報系統(tǒng)產(chǎn)品。2002年8月下旬,百度公司正式發(fā)布了業(yè)界首例企業(yè)競爭情報系統(tǒng),據(jù)該公司的宣傳材料稱,名為e.CIS的百度企業(yè)競爭情報系統(tǒng)集情報計劃、采集、管理和服務為一體,能夠幫助企業(yè)對整體競爭環(huán)境和競爭對手進行全面監(jiān)測,同時收集和分析商業(yè)競爭中企業(yè)商業(yè)行為的優(yōu)勢、劣勢及潛在的機遇,可以由此使企業(yè)建立起·個強大的情報中心。競爭情報系統(tǒng)正在以燎原之勢迅速發(fā)展。雖然競爭情報工作在我國已有相當程度的發(fā)展,企業(yè)界對競爭情報的認識正在逐漸深化,但是這項很有意義的工作還并沒有大范圍的推廣普及。據(jù)“企業(yè)競爭情報系統(tǒng)的模式和運行機制研究”課題的一項以競爭情報分會會員為樣本的調(diào)查顯示,在調(diào)查對象中,只有18.75%的企業(yè)擁有競爭情報部門,并且已經(jīng)建立了正規(guī)化的工作流程與情報網(wǎng)絡。在27.78%的企業(yè)中,競爭情報工作只具有圖書館功黥沒有建立正式的競爭情報流程或網(wǎng)絡。而高達53.47%的企業(yè)處于正在建立正式的競爭情報組織與網(wǎng)絡的發(fā)展過程中。但同時,競爭情報流程己制度化,擁有世界范圍網(wǎng)絡,并具有相當反應能力的企業(yè)數(shù)則為零,這說明我國多數(shù)企業(yè)競爭情報工作尚處于發(fā)展中,我國競爭情報事業(yè)的發(fā)展任重道遠引。[10]

3.3目前的研究方向與重要理論

數(shù)據(jù)挖掘技術與特定商業(yè)的平滑問題。商業(yè)邏輯有機地嵌入數(shù)據(jù)挖掘過程等關鍵問題,將是數(shù)據(jù)挖掘技術研究和應用的重要方向。數(shù)據(jù)挖掘技術與特定數(shù)據(jù)存儲類型的適應問題 不同的數(shù)據(jù)存儲方式會影響數(shù)據(jù)挖掘的具體實現(xiàn)機制,目標定位,技術有效性等。大型數(shù)據(jù)的選擇與規(guī)格化問題。數(shù)據(jù)挖掘技術是面向大型數(shù)據(jù)集的,而且源數(shù)據(jù)庫中的數(shù)據(jù)時動態(tài)變化的,數(shù)據(jù)存在噪音,不確定性,信息丟失,信息冗余,數(shù)據(jù)分布稀疏等問題,因此挖掘前的預處理工作是必須的。數(shù)據(jù)挖掘技術又是面向特定商業(yè)目標的,大量的數(shù)據(jù)需要選擇性的利用,因此針對特定挖掘問題進行數(shù)據(jù)選擇,針對特定挖掘方法進行數(shù)據(jù)規(guī)格化是無法回避的問題。數(shù)據(jù)挖掘系統(tǒng)的架構與交互式挖掘技術。數(shù)據(jù)挖掘語言與系統(tǒng)的可視化問題。數(shù)據(jù)挖掘理論與算法研究。[11]

4.結語

當前商業(yè)競爭異常激烈,企業(yè)迅速掌握有效的信息非常重要。數(shù)據(jù)挖掘技術在企業(yè)競爭情報系統(tǒng)中的應用使得企業(yè)從海量信息中徹底解放出來。當前數(shù)據(jù)挖掘技術正在快速發(fā)展階段,它對企業(yè)方方面面的價值日漸凸顯。相關專業(yè)人士應該充分關注當前最新的發(fā)展理論。

參考文獻

[1] 毛國君,段立娟,王實,石云.數(shù)據(jù)挖掘原理與算法(第二版)[M].北京:清華大學出版社,2007.[2] 毛國君.數(shù)據(jù)挖掘的概念﹑系統(tǒng)結構與方法[M].北京:清華大學出版社,2009.[3] 百度空間:數(shù)據(jù)挖掘[EB/OL].[2011-12-25]

[4] 洪家榮.空間數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的理論與方法[M].北京:人民郵電出版社,2001.[5]邵峰晶,于忠清.數(shù)據(jù)挖掘原理與算法[M]北京:中國水利水電出版社,2003.

[6] 陳敏.數(shù)據(jù)挖掘技術在商業(yè)中的應用研究[M].上海:上海科學技術出版社,2005.[7]蘇新寧楊建林等.數(shù)據(jù)倉庫和數(shù)據(jù)挖掘[M]北京:清華大學出版社,2006:60—63.

[8] 百度百科:[EB/OL].[2011-12-25].[10]劉曉燕,單曉紅.數(shù)據(jù)挖掘在競爭情報系統(tǒng)中的應用[J].管理學報,2009,2(2):1 29—1 30

[11] 史忠植.知識發(fā)現(xiàn)[M].北京:清華大學出版社,2010.

第五篇:數(shù)據(jù)挖掘在培訓管理中的應用論文

1、引言

對很多培養(yǎng)機構而言,目前急需解決的問題主要有:如何根據(jù)不同成員需求設置合理的課程、如何通過教學方式提高成員學習積極性、如何提高成員培訓效果、如何通過考核檢驗成員學習成果等,都是培養(yǎng)機構發(fā)展過程中必須面對的問題。隨著我國信息化進程的加快,一些培養(yǎng)機構也開始進行信息化建設,通過信息系統(tǒng)對培訓相關事宜進行管理。但目前在針對培養(yǎng)機構的信息系統(tǒng)中,所實現(xiàn)的功能和模塊是進行簡單的查詢、統(tǒng)計。在了解培訓評估效果時,目前的信息系統(tǒng)中,學員通過系統(tǒng)對不同課程的教師進行打分,系統(tǒng)自對進行匯總、統(tǒng)計,得出教師評價。但這種匯總、統(tǒng)計是最簡單的,對教師評價也缺乏全面性和深度。

2、數(shù)據(jù)挖掘在培訓管理系統(tǒng)中的應用

大數(shù)據(jù)時代下,數(shù)據(jù)信息呈現(xiàn)出海量特點。如何從海量、不完全的信息中尋找到真正有用的信息,是大數(shù)據(jù)時代中重要的問題。由此便利用到數(shù)據(jù)挖掘,顧名思義,數(shù)據(jù)挖掘就是從眾多數(shù)據(jù)信息中尋找到有用、有價值的信息。大數(shù)據(jù)時代下,教育行業(yè)中,信息量也是海量的,要想提高教學質(zhì)量就需要運用數(shù)據(jù)挖掘找尋到有用的教育信息,并運用到實際教學中。信息系統(tǒng)通過一段實際應用后,里面存儲了大量數(shù)據(jù),相應的,學習管理系統(tǒng)也是如此,里面蘊含了大量數(shù)據(jù)信息。如在線課程等功能中藏有大量師生應用過程中的數(shù)據(jù)資料。如圖1為數(shù)據(jù)挖掘在培訓管理中的流程圖。

2.1初步探索

培訓管理系統(tǒng)中一般具有數(shù)據(jù)統(tǒng)計功能,將相關事宜進行統(tǒng)計。如網(wǎng)絡課程開展過程中,數(shù)據(jù)挖掘在培訓管理系統(tǒng)中的應用文/張宏亮在大數(shù)據(jù)時代,如何使用現(xiàn)有的數(shù)據(jù)對學員進行培訓管理,從而提高培訓效率是當前培訓管理中所面臨的問題。本文分析了數(shù)據(jù)挖掘在培訓管理中的應用主要表現(xiàn)在初步探索、數(shù)據(jù)預處理以及數(shù)據(jù)挖掘過程。其中數(shù)據(jù)預處理和數(shù)據(jù)挖掘是培訓系統(tǒng)的核心功能。

2.2數(shù)據(jù)預期處理

數(shù)據(jù)預處理時,原始數(shù)據(jù)庫會發(fā)生轉(zhuǎn)變,以適應數(shù)據(jù)挖掘、數(shù)據(jù)挖掘算法等的要求。在處理結構化的數(shù)據(jù)時,數(shù)據(jù)預處理需要完成兩項任務,即消除數(shù)據(jù)缺陷現(xiàn)象的存在和為數(shù)據(jù)挖掘奠定良好基礎。數(shù)據(jù)處理是對現(xiàn)有的數(shù)據(jù)進行前期處理,方便后期數(shù)據(jù)挖掘。如圖2為培訓管理系統(tǒng)中數(shù)據(jù)預處理模塊。

2.3數(shù)據(jù)挖掘

WangJ開發(fā)了一個將數(shù)據(jù)挖掘技術與基于模擬的培訓相結合的混合框架,以提高培訓評估的有效性。以信仰為基礎的學習概念,用于從知識/技能水平和信心水平的兩個維度來評估學員的學習成果。數(shù)據(jù)挖掘技術用于分析受訓人員的個人資料和基于模擬的培訓產(chǎn)生的數(shù)據(jù),以評估學員的表現(xiàn)和學習行為。提出的方法論以臺灣基于模擬的步兵射擊訓練的實例為例。結果表明,提出的方法可以準確地評估學員的表現(xiàn)和學習行為,并且可以發(fā)現(xiàn)潛在的知識來提高學員的學習成果。BodeaCN使用數(shù)據(jù)挖掘技術進行了培訓學習管理,用于分析參加在線兩年制碩士學位課程項目管理的學生的表現(xiàn)。系統(tǒng)數(shù)據(jù)來源是收集學生意見的調(diào)查數(shù)據(jù),學生記錄的操作數(shù)據(jù)和電子學習的平臺記錄的學生活動數(shù)據(jù)。

3、總結

目前培訓機構在進行教學評估時,所選擇的指標都是參考其他機構的,并沒有真正從自身實際出發(fā)進行評估,因此教學評估時存在諸多問題。其中最明顯的兩個問題是:第一教學評估方式單一化嚴重,只以數(shù)字評估為主;第二評估時容易受各種主觀因素影響。

參考文獻

[1]菅志剛,金旭.數(shù)據(jù)挖掘中數(shù)據(jù)預處理的研究與實現(xiàn)[J].計算機應用研究,2004,21(07):117-118.[2]王全旺,趙兵川.數(shù)據(jù)挖掘技術在Moodle課程管理系統(tǒng)中的應用研究[J].電化教育研究,2011(11):69-73.[3]陳怡薇.數(shù)據(jù)挖掘技術:教育培訓管理新手段[J].石油化工管理干部學院學報,2014(04):49-52.[4]肖明,陳嘉勇,栗文超.數(shù)據(jù)挖掘在學習管理系統(tǒng)中應用的研究進展綜述[J].現(xiàn)代教育技術,2010,20(09):127-133.

下載數(shù)據(jù)挖掘在體育教學中的應用的價值[樣例5]word格式文檔
下載數(shù)據(jù)挖掘在體育教學中的應用的價值[樣例5].doc
將本文檔下載到自己電腦,方便修改和收藏,請勿使用迅雷等下載。
點此處下載文檔

文檔為doc格式


聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻自行上傳,本網(wǎng)站不擁有所有權,未作人工編輯處理,也不承擔相關法律責任。如果您發(fā)現(xiàn)有涉嫌版權的內(nèi)容,歡迎發(fā)送郵件至:645879355@qq.com 進行舉報,并提供相關證據(jù),工作人員會在5個工作日內(nèi)聯(lián)系你,一經(jīng)查實,本站將立刻刪除涉嫌侵權內(nèi)容。

相關范文推薦

    數(shù)據(jù)挖掘在情報信息方面的應用

    數(shù)據(jù)挖掘在情報信息方面的應用 [ 標簽:數(shù)據(jù)挖掘, 情報信息 ] 歐陽烽 2011-07-14 12:57 滿意答案 呵呵,這個我舉個例子來說明:四人幫那時候,新聞標題都是毛主席說什么什么,后面會......

    數(shù)據(jù)挖掘技術在客戶關系管理中如何應用畢業(yè)論文.

    數(shù)據(jù)挖掘技術在客戶關系管理中如何應用 根據(jù)波特的影響企業(yè)的利益相關者理論,企業(yè)有五個利益相關者,分別是客戶、競爭對手、供應商、分銷商和政府等其他利益相關者。其中,最......

    數(shù)據(jù)挖掘在保險精準營銷中的應用-開題報告

    全日制工學(工程)碩士學位論文開題報告 課題來源及研究的目的和意義 1.1 課題來源 自選課題 1.2 選題價值及意義 大型的保險公司已將數(shù)據(jù)挖掘應用到保險業(yè)務中,但由于應用在......

    數(shù)據(jù)挖掘技術在圖書采購中的應用初探.專題

    數(shù)據(jù)挖掘技術在圖書采購中的應用初探 湖南理工學院圖書館 張 暉 [摘 要]數(shù)據(jù)挖掘是一種新的信息技術,在許多行業(yè)有著廣泛的應用。高校圖書館同樣可以成為其應用的一個領域。......

    淺談數(shù)據(jù)挖掘技術及其在高等學校教學中的應用教育論文

    關鍵詞:數(shù)據(jù)挖掘 高校教學 教育信息化摘要:數(shù)據(jù)挖掘技術目前在商業(yè)、金融業(yè)等方面都得到了廣泛的應用,而在教育領域應用較少。本文通過時數(shù)據(jù)挖掘在高校教學中的應用分析,認為......

    《游戲在體育教學中的應用》

    《體育課堂中的游戲運用》 在小學體育課堂中,游戲占有一個十分重要的地位,現(xiàn)在就我在課堂中的游戲安排與選擇談點心得。 一、合理利用游戲比賽 游戲比賽在小學體育教學中是經(jīng)......

    信息技術在體育教學中的應用

    淺析多媒體信息技術在體育教學中的應用 長沙市開福區(qū)清水塘北辰小學 體育教師 湯勇 摘要:伴隨著計算機技術和網(wǎng)絡技術的迅速發(fā)展,現(xiàn)代信息技術對學校傳統(tǒng)體育教學產(chǎn)生了巨大......

    信息技術在體育教學中的應用

    信息技術在體育教學中的應用 我是一名體育教師,感覺信息技術與體育學科是格格不入的,然而當我認識到信息技術后,才發(fā)現(xiàn)信息技術在體育學科教學上有著巨大的幫助。可以說在體育......

主站蜘蛛池模板: 狠狠躁天天躁中文字幕| 欧美丰满熟妇bbb久久久| 麻豆网神马久久人鬼片| 国产精品美脚玉足脚交| 日日碰狠狠添天天爽| 精品无码国产av一区二区三区| 天堂av成年av影视| 丰满大码的熟女在线视频| 天堂а√中文在线官网| 亚洲欧美成人另类激情| 久久精品国产99精品国产2021| 国产亚洲精品久久久一区| 国产乱人伦av在线a| 久久成人a毛片免费观看网站| 欧美日本免费一区二区三区| 国产人妻精品久久久久久| 国产精品aⅴ视频在线播放| 久久久久青草线蕉亚洲| 国产亚洲精品在av| 乱码精品一区二区三区| av无码久久久久不卡网站下载| 亚洲 欧美 清纯 校园 另类| 亚洲一区波多野结衣在线| 国内女人喷潮完整视频| 欧美黑人又粗又大xxxx| 视频久re精品在线观看| 国产精品亚洲专区无码老司国| 国产精品色婷婷亚洲综合看片| 国产精品天干天干有线观看| 亚洲精品无码久久不卡| 在线观看高h无码黄动漫| 久久综合久久自在自线精品自| 亚洲人成网站免费播放| 中文字幕乱码人妻无码久久| 亚洲ⅴ国产v天堂a无码二区| av老司机福利精品导航| 久久久久国产精品人妻aⅴ牛牛| 老熟女毛茸茸浓毛| 色婷婷亚洲婷婷五月| 国产又黄又大又粗视频| 亚洲丰满熟女一区二区哦|