久久99精品久久久久久琪琪,久久人人爽人人爽人人片亞洲,熟妇人妻无码中文字幕,亚洲精品无码久久久久久久

大數據時代基于云計算的數據監護研究論文[5篇]

時間:2019-11-01 22:40:06下載本文作者:會員上傳
簡介:寫寫幫文庫小編為你整理了多篇相關的《大數據時代基于云計算的數據監護研究論文》,但愿對你工作學習有幫助,當然你在寫寫幫文庫還可以找到更多《大數據時代基于云計算的數據監護研究論文》。

第一篇:大數據時代基于云計算的數據監護研究論文

在大數據時代,為了更好地管理和利用科學數據,計算機圖靈獎獲得者Jim Gray于2002年提出了數據監護(Data Curation)的概念。十余年來,數據監護一直是國內外信息資源管理領域的熱點議題,研究主題集中在數據監護的內容、發展策略、合作模式、職業教育、成功實踐等領域。111鑒于云計算能夠為數據監護提供強有力的技術支撐,如云計算快速提供資源的能力有助于輔助完成資源密集型數據監護任務,網絡化云服務有利于實現數據監護的協同工作,基于云計算開展數據監護引起了國外信息資源管理學界和業界的廣泛關注。本文對基于云計算的數據監護問題進行探討,希望對我國的數據監護工作有所借鑒。

一、數據監護工作流程

數據監護是為了確保數據當前的使用目的,并能用于未來再發現及再利用,從數據產生伊始即對其進行管理和完善的活動。121為了有效指導數據監護實踐,提高數據監護效率,一些數據監護機構和研究者對數據監護過程進行了概念化,提出了相應的數據監護生命周期模型。本文基于英國數據監護中心的DCC數據監護生命周期模型13與王芳和慎金花提出的細化的數據監護生命周期模型,梳理出了數據監護工作流程,見圖1。數據監護工作流程由4個階段、11個業務環節組成,涵蓋了數據監護的所有必要階段和核心工作。

數據收集階段:數據采集。數據采集是數據監護活動的起點,指根據采集政策,從數據創建者、檔案館、知識庫或數據中心等接收數據。元數據創建。為采集到的數據創建管理、描述、結構和技術元數據,以便進行數據管理和數據維護,以及實現數據共享。

數據處理階段:數據評價和選擇。評估數據并為長期監護和保存選擇數據。數據評價和選擇直接關系到科學數據庫的質量,并且帶有一定的主觀性。數據剔除。根據成文的政策、指引或法律要求,處理未成為長期監護和保存對象的數據,將這些數據轉移到其他檔案館、知識庫、數據中心或其他保管機構。根據法律要求,有些數據會被安全銷毀。數據導入。將經過選擇的數據傳送至檔案館、知識庫、數據中心或其他數據監護機構。為保證數據的可用性,在導入數據之前,應進行去重、交叉注釋、格式認證等。數據遷移。根據存儲環境的需求,或者為了確保數據對硬件和軟件退化的抗擾性,改換數據的格式、存儲系統、存儲類型。

數據保存階段:數據長期保存。長期保存須確保數據的可信性、可靠性、可用性和完整性。長期保存包括數據清洗、數據驗證、分配保存元數據、分配表征信息,保證數據具備可接受的數據結構和文件格式。數據存儲。遵守相關標準,選擇科學的組織方式和安全的存儲介質組織并存儲數據。數據存儲既可以保證數據的安全性,又便于數據被隨時使用和加工處理。

數據利用階段:數據獲取。采用適當的標準發布數據,并執行嚴格的訪問控制和驗證程序,保證用戶安全、準確的訪問和獲取數據。數據復用。制訂數據復用規則,在不違反知識產權的前提下,提供數據復制、鏈接、引用等服務。數據轉換。根據原始數據創建新數據。例如,通過轉換格式、建立子集等途徑,創建新數據。

二、云計算為數據監護提供支撐

云計算作為分布式計算、網絡存儲、負載均衡、熱備份冗余等計算機和網絡技術融合的產物,具有超大規模、虛擬化、通用性、高可擴展性等諸多特點。云計算的特點與數據監護的需求非常契合,可以為數據監護提供強有力的技術支撐。

彈性服務:云計算服務的規模可快速伸縮,以自動適應業務負載的動態變化。用戶使用的云計算資源與業務的實際需求相一致,避免了因為資源供需不匹配而導致的服務質量下降或資源浪費。161數據監護的數據剔除和數據遷移等任務不需要持續不斷的執行,屬偶發性活動。云計算的彈性服務能夠很好地滿足偶發性數據監護活動的資源調用需求。

按需服務:云計算以服務的形式為用戶提供基礎設施、存儲空間、應用程序等,并能夠根據用戶的需求,自動分配各種資源。17用戶也可以根據需要在云中部署所需的應用程序。云計算的按需服務為數據監護中需要依賴主觀意識完成的任務,如元數據創建、數據評價和選擇提供了極大的便利。

泛在接入:用戶通過互聯網可以隨時隨地利用云計算服務。數據用戶越來越多的使用筆記本電腦、智能手機、平板電腦,將數據監護業務流程轉移至云,能夠極大地方便用戶上傳、訪問和下載數據。數據監護的數據采集、數據獲取和數據復用等業務環節,可以從云計算的這一特點中受益。

服務外包:用戶進行數據處理所需的計算資源價格昂貴,將提供計算資源的業務委托給云服務商,既能夠節省開支,又能夠使用戶專注于自己的核心工作。云服務商為了利益最大化,保持最優競爭力,都會迅速應對技術變革,以更低的價格提供更快的處理器和更大的存儲空間。云計算服務外包的特點使數據監護機構將部分信息技術支持業務委托給云服務商,以獲得更低廉的價格和更優質的服務成為可能。

三、基于云計算的數據監護模型

云計算提供從硬件設施到應用軟件的多層次服務。根據服務的對象和功能差異可以將云計算劃分為三種服務模式:基礎設施即服務(IaaS)、平臺即服務(PaaS)、軟件即服務(SaaS);根據租用云計算的用戶對數據和環境的控制權,可以將云計算劃分為公有云、私有云和混合云等部署模型。本文根據數據監護不同業務階段的工作內容和技術需求,并結合云計算的服務模式和部署模型,構建了基于云計算的數據監護模型,見圖2。下面分別從數據監護的云計算服務模式和部署模型兩個方面分析基于云計算的數據監護模型。

(一)數據監護的云計算服務模式

IaaS層。IaaS提供基礎設施部署服務。IaaS通過虛擬化技術整合服務器、存儲設備、網絡資源、高性能計算集群等物理資源,構建全局統一的動態虛擬化資源池。基于云計算的數據監護模型的IaaS層為上層云計算服務提供海量硬件資源,實現硬件資源的按需酉己置。

PaaS層。PaaS是云計算應用程序運行環境,提供應用程序部署與管理服務。PaaS不僅能夠實現海量數據的存儲,而且能夠提供面向海量數據的分析處理功能。在基于云計算的數據監護模型的PaaS層,數據監護機構使用云供應商的軟件工具和開發語言,開發數據收集和數據處理所需的各種應用程序,實現應用程序的多元化和定制化服務,并將科學數據保存于海量數據存儲系統。

SaaS層。SaaS提供以服務為形式的應用程序。SaaS允許用戶使用部署于供應商云基礎設施上的應用程序,用戶也可以根據需求向供應商定制應用程序。在基于云計算的數據監護模型的SaaS層,數據監護機構通過應用程序向用戶提供數據利用服務,實現數據共享和科研協作。

(二)數據監護的云計算部署模型

數據監護的各個階段分別面向數據監護方和數據使用方,對應不同的數據存取、處理等操作權限,因此需要采用相適應的云計算部署模型。數據監護過程中的數據利用階段位于SaaS層,為用戶提供方便高效的數據獲取等服務,而公有云面向一般公眾提供敏捷彈性服務的特點與數據利用階段的功能需求相契合。用戶能夠通過網絡瀏覽器像使用個人電腦中的軟件那樣使用公有云的應用程序,實現應用程序的泛在訪問。因此,基于云計算的數據監護模型的SaaS層應采用公有云部署模型。數據收集和數據處理工作要求云計算提供量身定制的服務功能和非常穩定的服務質量,而數據保存工作要求云計算能夠切實保障數據安全。私有云部署在用戶數據中心的防火墻內,能夠提供對數據、安全性和服務質量的最有效控制,而且不會沖擊用戶已有的業務流程。因此,基于云計算的數據監護模型的PaaS層適宜采用私有云部署模型。上述公有云和私有云的基礎設施共同構成了基于云計算的數據監護模型的IaaS層,并且公有云和私有云具有統一的接口標準,保證服務的無縫遷移,即IaaS層采用混合云部署模型。

四、基于云計算的數據監護案例

SRF項目:英國南安普頓大學的SRF項目,針對科學研究工作集成了許多已有的協作型數據管理工具,并將這些工具部署到一個共享的虛擬云平臺上,以SaaS的方式提供服務。SRF工具最大的特點是能夠在網絡日志中自動或者手工創建和共享實驗數據。例如,SRF的一款代理軟件能夠植入實驗儀器和計算機,自動抽取儀器在實驗過程中記錄的數據,并轉換為XML格式,然后以博客的形式發布以實現協作復用。通過博客發布平臺實現實驗過程、實驗數據、實驗分析的互聯,組織實驗數據記錄,構建實驗、實驗數據、實驗設備之間的關聯關系。在數據監護生命周期中,SRF工具主要用于接收和抽取數據,以保證實驗數據在上傳至云的過程中會被格式化成標準格式。

Data Flow項目:牛津大學的Data Flow項目,旨在創建免費的云托管Data Stage和Data Bank,以便于管理、保存、發布研究數據。其中,Data Stage以在用戶電腦上運行映射驅動器的方式,提供研究組水平的、安全的“本地”文件管理環境。另外,Data Stage還提供數據的網絡獲取和在線存儲服務,用戶通過訪問控制程序的認證之后,即可以訪問私人、共享、協作、公眾和公共數據目錄。Data Bank是一種虛擬化的、基于云部署的機構研究數據倉儲。機構可以選擇將Data Bank部署在Eduserv教育云或者機構自己的基礎設施中。Data Bank還具備包括數據抽取、儲存、長期保存、訪問在內的一系列數據監護功能。

Kindura項目:倫敦國王學院的Kindura項目,是一個基于混合云部署模型的科學數據管理試點項目,提供基于存儲的數據管理服務和基于計算的數據處理服務。Kindura項目通過DuraSpace推出的托管云服務一DuraCloud,將本地服務與各種云服務相銜接。用戶利用DuraCloud提供的統一界面,即可享受一站式數據存取服務。Kindura項目通過部署于服務器上的規則引擎,以及面向規則的集成數據管理系統(iRODS)的規則庫,決定具體數據存儲在本地還是存儲于云端:二進制對象存儲在云端,元數據和Fedora對象存儲在本地。l9Kindura項目證明,混合云能夠有效節省數據監護成本,并且能夠更加高效地利用本地存儲庫,提升數據處理能力。

東南大學AMS-02項目:東南大學為大型國際合作項目AMS-02的數據監護工作構建的云計算平臺,提供IaaS、PaaS、SaaS服務。該云計算平臺架構如圖3所示。在IaaS層,云計算基礎設施由3500顆CPU內核和500TB高速存儲設備構成,提供虛擬機和物理機的按需分配,并且自動配置操作系統、科學計算函數庫等運行環境。在PaaS層,數據分析處理平臺提供大規模計算能力和海量數據存儲能力;應用開發環境為AMS-02數據分析處理應用提供編程接口。在SaaS層,以服務的形式部署云計算應用程序,用戶通過訪問AMS-02應用,可以獲取原始科學數據以及數據處理分析結果。云計算通過超級計算模式,整合大量的存儲、計算、帶寬等資源,為數據監護提供了經濟高效的解決方案。國內的數據監護尚處于起步階段,對基于云計算的數據監護進行深入的理論探討和實踐探索,有助于推動我國的數據監護實現跨越式發展。

第二篇:大數據與云計算論文

大數據與云計算

摘 要:大數據(Big Data)這個概念近年來在越來越多的場合、被越來越多的人提及,并且經常和云計算聯系在一起,云計算與大數據之間到底是什么關系成為熱點話題。本

專題報告包含以下四個方面內容:1.大數據的價值;2.大數據帶來的挑戰;3.大數據研究成果;4.云計算是大數據挖掘的主流方式。通過本報告闡述我們對大數據的理解,以及對大數據的價值的認識,探討大數據處理與挖掘技術,大數據主要著眼于“數據”,提供數據采集、挖掘、分析的技術和方法;云計算技術主要關注“計算”,提供IT 解決方案。大數據、云計算技術可以促進持續審計方式的發展、總體審計模式的應用、審計成果的綜合應用、相關關系證據的應用、高效數據審計的發展和大數據審計師的發展。強化大數據、云計算技術審計應用的措施包括制定長遠發展戰略、加快審計法規建設、建立行業平臺、加強研發和提高利用能力。關鍵詞:大數據 云計算 數據挖掘 對審計影響 政策建議 引言

目前,大數據伴隨著云計算技術的發展,正在對全球經濟社會生活產生巨大的影響。大數據、云計算技術給現代審計提供了新的技術和方法,要求審計組織和審計人員把握大數據、云計算技術的內容與特征,促進現代審計技術和方法的進一步發展。

一、大數據、云計算的涵義與特征

隨著云計算技術的出現,大數據吸引了全世界越來越多的關注。哈佛大學社會學教授加里·金(2012)說: “這是一場革命,龐大的數據資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程。”(一)大數據的涵義與特征

“數據”(data)這個詞在拉丁文里是“已知”的意思,也可以理解為“事實”。2009 年,“大數據”概念才逐漸開始在社會上傳播。而“大數據”概念真正變得火爆,卻是因為美國奧巴馬政府在2012 年高調宣布了其“大數據研究和開發計劃”。這標志著“大數據”時代真正開始進入社會經濟生活中來了。“大數據”(big data),或稱巨量資料,指的是所涉及的數據量規模大到無法利用現行主流軟件工具,在一定的時間內實現收集、分析、處理或轉化成為幫助決策者決策的可用信息。互聯網數據中心(IDC)認為“大數據”是為了更經濟、更有效地從高頻率、大容量、不同結構和類型的數據中獲取價值而設計的新一代架構和技術,用它來描述和定義信息爆炸時代產生的海量數據,并命名與之相關的技術發展與創新。大數據具有4 個特點: 第一,數據體量巨大(Volume),從TB 級別躍升到PB 級別。第二,處理速度快(Velocity),這與傳統的數據挖掘技術有著本質的不同。第三,數據種類多(Variety),有圖片、地理位置信息、視頻、網絡日志等多種形式。第四,價值密度低,商業價值高(Value)。存在單一數據的價值并不大,但將相關數據聚集在一起,就會有很高的商業價值(金良,2012)。大數據時代,不僅改變了傳統的數據采集、處理和應用技術與方法,還促使人們思維方式的改變。大數據的精髓在于促使人們在采集、處理和使用數據時思維的轉變,這些轉變將改變人們理解和研究社會經濟現象的技術和方法。

(1)是在大數據時代,不依賴抽樣分析,而可以采集和處理事物整體的全部數據。19 世紀以來,當面臨大的樣本量時,人們都主要依靠抽樣來分析總體。但是,抽樣技術是在數據缺乏和取得數據受限制的條件下不得不采用的一種方法,這其實是一種人為的限制。過去,因為記錄、儲存和分析數據的工具不夠科學,只能收集少量數據進行分析。如今,科學技術條件已經有了很大的提高,雖然人類可以處理的數據依然是有限的,但是可以處理的數據量已經大量增加,而且未來會越來越多。隨著大數據分析取代抽樣分析,社會科學不再單純依賴于抽樣調查和分析實證數據,現在可以收集過去無法收集到的數據,更重要的是,現在可以不再依賴抽樣分析。

(2)是在大數據時代,不再熱衷于追求數據的精確度,而是追求利用數據的效率。當測量事物的能力受限制時,關注的是獲取最精確的結果。但是,在大數據時代,追求精確度已經既無必要又不可行,甚至變得不受歡迎。大數據紛繁多樣,優劣摻雜,精準度已不再是分析事物總體的主要手段。擁有了大數據,不再需要對一個事物的現象深究,只要掌握事物的大致發展趨勢即可,更重要的是追求數據的及時性和使用效率。與依賴于小數據和精確性的時代相比較,大數據更注重數據的完整性和混雜性,幫助人們進一步認識事物的全貌和真相。

(3)是在大數據時代,人們難以尋求事物直接的因果關系,而是深入認識和利用事物的相關關系。長期以來,尋找因果關系是人類發展過程中形成的傳統習慣。尋求因果關系即使很困難且用途不大,但人們無法擺脫認識的傳統思維。在大數據時代,人們不必將主要精力放在事物之間因果關系的分析上,而是將主要精力放在尋找事物之間的相關關系上。事物之間的相關關系可能不會準確地告知事物發生的內在原因,但是它會提醒人們事情之間的相互聯系。人們可以通過找到一個事物的良好相關關系,幫助其捕捉到事物的現在和預測未來。(二)云計算的涵義與特征

“云計算”概念產生于谷歌和IBM 等大型互聯網公司處理海量數據的實踐。2006 年8 月9 日,Google首席執行官埃里克·施密特(Eric Schmidt)在搜索引擎大會首次提出“云計算”的概念。2007 年10 月,Google 與IBM 開始在美國大學校園推廣云計算技術的計劃,這項計劃希望能降低分布式計算技術在學術研究方面的成本,并為這些大學提供相關的軟硬件設備及技術支持(Michael Mille,2009)。目前全世界關于“云計算”的定義有很多。“云計算”是基于互聯網的相關服務的增加、使用和交付模式,是通過互聯網來提供動態易擴展且經常是虛擬化的資源。美國國家標準技術研究院(NIST)2009年關于云計算的定義是: “云計算是一種按使用量付費的模式,這種模式提供可用的、便捷的、按需的網絡訪問,進入可配置的計算資源共享池(資源包括網絡、服務器、存儲、應用軟件、服務等),這些資源能夠被快速提供,只需投入很少的管理工作,或與服務供應商進行很少的交互。”根據這一定義,云計算的特征主要表現為: 首先,云計算是一種計算模式,具有時間和網絡存儲的功能。其次,云計算是一條接入路徑,通過廣泛接入網絡以獲取計算能力,通過標準機制進行訪問。第三,云計算是一個資源池,云計算服務提供商的計算資源,通過多租戶模式為不同用戶提供服務,并根據用戶的需求動態提供不同的物理的或虛擬的資源。第四,云計算是一系列伸縮技術,在信息化和互聯網環境下的計算規模可以快速擴大或縮小,計算能力可以快速、彈性獲得。第五,云計算是一項可計量的服務,云計算資源的使用情況可以通過云計算系統檢測、控制、計量,以自動控制和優化資源使用。(三)大數據與云計算的關系

從整體上看,大數據與云計算是相輔相成的。大數據主要專注實際業務,著眼于“數據”,提供數據采集、挖掘、分析的技術和方法,強調的是數據存儲能力。云計算主要關注“計算”,關注IT 架構,提供IT 解決方案,強調的是計算能力,即數據處理能力。如果沒有大數據的數據存儲,那么云計算的計算能力再強大,也難以找到用武之地;如果沒有云計算的數據處理能力,則大數據的數據存儲再豐富,也終究難以用于實踐中去。

從技術上看,大數據依賴于云計算。海量數據存儲技術、海量數據管理技術、MapReduce 編程模型都是云計算的關鍵技術,也都是大數據的技術基礎。而數據之所以會變“大”,最重要的便是云計算提供的技術平臺。數據被放到“云”上之后,打破了過去那種各自分割的數據存儲,更容易被收集和獲得,大數據才能呈現在人們眼前。而巨量的數據也只能依靠云計算強大的數據處理能力,才能夠“淘盡黃沙始得金”。

從側重點看,大數據與云計算的側重點不同。大數據的側重點是各種數據,廣泛、深入挖掘巨量數據,發現數據中的價值,迫使企業從“業務驅動”轉變為“數據驅動”。而云計算主要通過互聯網廣泛獲取、擴展和管理計算及存儲資源和能力,其側重點是IT 資源、處理能力和各種應用,以幫助企業節省IT部署成本。云計算使企業的IT 部門受益,而大數據使企業的業務管理部門受益。

從結果看,大數據與云計算帶來不同的變化。大數據對社會經濟帶來的變化是巨大的,涉及到各個領域。大數據已經與資本、人力一起作為生產的主要因素影響著社會經濟的發展。數據創造價值,而挖掘數據價值、利用數據的“推動力”就是云計算。云計算將信息存儲、分享和挖掘能力極大提高,更經濟、高效地將巨量、高速、多變的終端數據存儲下來,并隨時進行計算與分析。通過云計算對大數據進行分析、總結與預測,會使得決策更可靠,釋放出更多大數據的內在價值。

二、大數據、云計算技術對審計的影響分析

審計技術和方法的發展是隨著科學和管理技術的發展而發展的。現代審計技術和方法體系是在原始的查賬基礎上從低級向高級、從不完備到比較完備發展起來的。在業務和會計處理手工操作階段,審計實施的是賬表導向的審計技術和方法;當內部控制理論和方法全面應用于業務和會計處理時,審計實施的是系統導向的審計技術和方法;當風險管理理論和方法全面應用于業務和財務管理時,審計實施的是風險導向審計技術和方法;與風險導向審計技術和方法并行的是,計算機技術廣泛應用于業務和會計處理時,審計實施的是IT 審計技術和方法。目前,面對大數據、云計算技術的產生和發展,審計人員需要應時而變來適應由此而帶來的變化,分析大數據、云計算技術對審計方式、審計抽樣技術、審計報告模式、審計證據搜集等技術和方法的影響。(一)大數據、云計算技術促進持續審計方式的發展

傳統審計中,審計人員只是在被審計單位業務完成后才進行審計,而且審計過程中并不是審計所有的數據和信息,只是抽取其中有的一部分進行審計。這種事后和有限的審計對被審計單位復雜的生產經營和管理系統來說很難及時做出正確的評價,而且對于評價日益頻繁和復雜的經營管理活動的真實性和合法性則顯得過于遲緩。隨著信息技術迅速發展,越來越多的審計組織對被審計單位開始實施持續審計方式,以解決審計結果與經濟活動的時差問題。但是,審計人員實施持續審計時,往往受目前業務條件和信息化手段的限制,取得的非結構化數據無法數據化,或者無法取得相關的明細數據,致使對問題的判斷也難以進一步具體和深入。而大數據、云計算技術可以促進持續審計方式的發展,使信息技術與大數據、云計算技術較好交叉融合,尤其對業務數據和風險控制“實時性”要求較高的特定行業,如銀行、證券、保險等行業,在這些行業中實施持續審計迫在眉睫。如審計組織對商業銀行的審計,實行與商業銀行建立業務和數據系統的接口,在開發的持續審計系統中固化了非結構化數據結構化和數據分析模塊,該模塊可以在海量貸款客戶中挖掘、分析出行業性和區域性貸款風險趨勢,實現在線的風險預警,并將發現的風險數據、超預警值指標及問題登記為疑點,并建立實時審計工作底稿,按照重要程度進行歸類、核實或下發給現場審計人員進行現場核實,以較好處理非結構化數據的利用和數據的實時分析利用問題。(二)大數據、云計算技術促進總體審計模式的應用

現時的審計模式是在評價被審計單位風險基礎上實施抽樣審計。在不可能收集和分析被審計單位全部經濟業務數據的情況下,現時的審計模式主要依賴于審計抽樣,從局部入手推斷整體,即從抽取的樣本著手進行審計,再據此推斷審計對象的整體情況。這種抽樣審計模式,由于抽取樣本的有限性,而忽視了大量和具體的業務活動,使審計人員無法完全發現和揭示被審計單位的重大舞弊行為,隱藏著重大的審計風險。而大數據、云計算技術對審計人員而言,不僅僅是一種可供采用的技術手段,這些技術和方法將給審計人員提供實施總體審計模式的可行性。利用大數據、云計算技術,對數據的跨行業、跨企業搜集和分析,可以不用隨機抽樣方法,而采用搜集和分析被審計單位所有數據的總體審計模式。利用大數據、云計算技術的總體審計模式是要分析與審計對象相關的所有數據,使得審計人員可以建立總體審計的思維模式,可以使現代審計獲得革命性的變化。審計人員實施總體審計模式,可以規避審計抽樣風險。如果能夠收集總體的所有數據,就能看到更細微、深入的信息,對數據進行多角度的深層次分析,從而發現隱藏在細節數據中的對審計問題更具價值的信息。同時,審計人員實施總體審計模式,能發現從審計抽樣模式所不能發現的問題。大數據、云計算技術給審計人員提供了一種能夠從總體把握審計對象的技術手段,從而幫助審計人員能從總體的視角發現以前難以發現的問題。

(三)大數據、云計算技術促進審計成果的綜合應用

目前,審計人員的審計成果主要是提供給被審計單位的審計報告,其格式固定,內容單一,包含的信息量較少。隨著大數據、云計算技術在審計中廣泛應用,審計人員的審計成果除了審計報告外,還有在審計過程中采集、挖掘、分析和處理的大量的資料和數據,可以提供給被審計單位用于改進經營管理,促進審計成果的綜合應用,提高審計成果的綜合應用效果。首先,審計人員通過對審計中獲取的大量數據和相關情況資料的匯總、歸納,從中找出財務、業務和經營管理等方面的內在規律、共性問題和發展趨勢,通過匯總歸納宏觀性和綜合性較強的審計信息,為被審計單位投資者和其他利益相關者提供數據證明、關聯分析和決策建議,從而促進被審計單位管理水平的提高。其次,審計人員通過應用大數據、云計算技術,可以將同一問題歸入不同的類別進行分析和處理,從不同的角度、不同的層面整合提煉以滿足不同層次的需求。再次,審計人員將審計成果進行智能化留存,通過大數據、云計算技術,將問題規則化并固化到系統中,以便于計算或判斷問題發展趨勢,向被審計單位進行預警。最后。審計人員將審計成果、被審計單位與審計問題進行關聯,并進行信息化處理,在進行下次審計時,減少實地審計的時間和工作量,提高審計工作的效率。(四)大數據、云計算技術促進相關關系證據的應用

審計人員在審計過程中,應根據充分、適當的審計證據發表審計意見,出具審計報告。但是,在大數據、云計算環境下,審計人員既面臨巨量數據篩選的考驗,又面臨搜集適當審計證據的挑戰。審計人員在搜集審計證據時,傳統的思維路徑都是基于因果關系來搜集審計證據,而大數據分析將會更多地運用相關關系分析來搜集和發現審計證據。但從審計證據發現的角度來看,由于大數據技術提供了前所未有的跨領域、可供量化的維度,使得審計問題大量的相關信息能夠得以記錄和計算分析。大數據、云計算技術沒有改變事物間的因果關系,但在大數據、云計算技術中對相關關系的開發和利用,使得數據分析對因果邏輯關系的依賴降低了,甚至更多地傾向于應用基于相關關系的數據分析,以相關關系分析為基礎的驗證是大數據、云計算技術的一項重要特征。在大數據、云計算技術環境下,審計人員能搜集到的審計證據大多是電子證據(秦榮生,2013)。電子證據本身就非常復雜,云計算技術使獲取有因果關系的證據更加困難。審計人員應從長期依賴因果關系來搜集和發現審計證據,轉變成為利用相關關系來搜集和發現審計證據。(五)大數據、云計算技術促進高效數據審計的發展

直到今天,審計人員的數字審計技術依然建立在精準的基礎上。這種思維方式適用于掌握“小數據量”的情況,因為需要分析的數據很少,所以審計人員必須盡可能精準地量化被審計單位的業務。隨著大數據、云計算技術成為日常生活中的一部分,審計人員應開始從一個比以前更大、更全面的角度來理解被審計單位,將“樣本= 總體”植入審計人員的思維中。相比依賴于小數據和精確性的時代,大數據更強調數據的完整性和混雜性,幫助審計人員進一步接近事情的真相,“局部”和“精確”將不再是審計人員追求的目標,審計人員追求的是事物的“全貌”和“高效”。圍繞大數據,一批新興的數據挖掘、數據存儲、數據處理與分析技術將不斷涌現。在實施審計時,審計人員應利用大數據、云計算技術,使用分布式拓樸結構、云數據庫、聯網審計、數據挖掘等新型的技術手段和工具,以提高審計的效率。

(六)大數據、云計算技術促進大數據審計師的發展

大數據、云計算時代,數據的真實、可靠是大數據發揮作用的前提。這客觀上要求專業人員來對大數據的真實性、可靠性進行鑒證,審計人員可以扮演這種角色,或者稱為數據審計師。能對大數據真實性、可靠性進行鑒證的數據審計師應該是計算機科學、數學、統計學和審計學領域的專家,他們應有大數據分析和預測的評估能力。數據審計師應恪守公正的立場和嚴守保密的原則,面對海量的數據和紛繁復雜的相關關系,選取分析和預測工具,以及解讀數據及數據計算結果是否真實、可靠。一旦出現爭議,數據審計師有權審查與分析結果相關的運算法則、統計方法以及數據采集、挖掘和處理過程。數據審計師的出現是為滿足以市場為導向來解決數據真實性、可靠性問題的需求,這與20 世紀初期為了處理財務信息虛假而出現的審計人員一樣,都是為了滿足新需求而出現的。

三、大數據挖掘

數據的價值只有通過數據挖掘才能從低價值密度的數據中發現其潛在價值,而大數據挖掘技術的實現離不開云計算技術。在業界,全球著名的Google、EMC、惠普、IBM、微軟等互聯網公司都已經意識到大數據挖掘的重要意義。上述IT 巨頭們紛紛通過收購大數據分析公司,進行技術整合,希望從大數據中挖掘更多的商業價值。數據挖掘通常需要遍歷訓練數據獲得相關的統計信息,用于求解或優化模型參數,在大規模數據上進行頻繁的數據訪問需要耗費大量運算時間。數據挖掘領域長期受益于并行算法和架構的使用,使得性能逐漸提升。過去15 年來,效果尤其顯著。試圖將這些進步結合起來,并且提煉。GPU平臺從并行上得到的性能提升十分顯著。這些GPU平臺由于采用并行架構,使用并行編程方法,使得計算能力呈幾何級數增長。即便是圖形處理、游戲編程是公認的復雜,它們也從并行化受益頗多。研究顯示數據挖掘、圖遍歷、有限狀態機是并行化未來的熱門方向。MapReduce 框架已經被證明是提升GPU 運行數據挖掘算法性能的重要工具。D.Luo 等提出一種非平凡的策略用來并行一系列數據挖掘與數據挖掘問題,包括一類分類SVM 和兩類分類SVM,非負最小二乘問題,及L1 正則化回歸(lasso)問題。由此得到的乘法算法,可以被直截了當地在如MapReduce 和CUDA 的并行計算環境中實現。K.Shim 在MapReduce 框架下,討論如何設計高MapReduce 算法,對當前一些基于MapReduce 的數據挖掘和數據挖掘算法進行歸納總結,以便進行大數據的分析。Junbo Zhang 等提出一種新的大數據挖掘技術,即利用MapRedue 實現并行的基于粗糙集的知識獲取算法,還提出了下一步的研究方向,即集中于用基于并行技術的粗糙集算法處理非結構化數據。F.Gao 提出了一種新的近似算法使基于核的數據挖掘算法可以有效的處理大規模數據集。當前的基于核的數據挖掘算法由于需要計算核矩陣面臨著可伸縮性問題,計算核矩陣需要O(N2)的時間和空間復雜度來計算和存儲。該算法計算核矩陣時大幅度降低計算和內存開銷,而且并沒有明顯影響結果的精確度。此外,通過折中結果的一些精度可以控制近似水平。它獨立于隨后使用的數據挖掘算法并且可以被它們使用。為了闡明近似算法的效果,在其上開發了一個變種的譜聚類算法,此外設計了一個所提出算法的基于MapReduce 的實現。在合成和真實數據集上的實驗結果顯示,所提出的算法可以獲得顯著的時間和空間節省。Christian Kaiser 等還利用MapReduce 框架分布式實現了訓練一系列核函數學習機,該方法適用于基于核的分類和回歸。Christian Kaiser 還介紹了一種擴展版的區域到點建模方法,來適應來自空間區域的大量數據。Yael Ben-Haim 研究了三種MapReduce 實現架構下并行決策樹分類算法的設計, 并在Phoenix 共享內存架構上對SPRINT 算法進行了具體的并行實現。F.Yan 考慮了潛在狄利克雷分配(LDA)的兩種推理方法——塌縮吉布斯采樣(collapsed Gibbssampling,CGS)和塌縮變分貝葉斯推理(collapsedvariational Bayesian,CVB)在GPU 上的并行化問題。為解決GPU 上的有限內存限制問題,F.Yan 提出一種能有效降低內存開銷的新穎數據劃分方案。這種劃分方案也能平衡多重處理器的計算開銷,并能容易地避免內存訪問沖突。他們使用數據流來處理超大的數據集。大量實驗表明F.Yan 的并行推理方法得到的LDA 模型一貫地具有與串行推理方法相同的預測能力;但在一個有30 個多核處理器的GPU 上,CGS 方法得到了26倍的加速,CVB 方法得到了196 倍的加速。他們提出的劃分方案和數據流方式使他們的方法在有更多多重處理器時可伸縮,而且可被作為通用技術來并行其它數據挖掘模型。Bao-Liang Lu 提出了一種并行的支持向量機,稱為最小最大模塊化網絡(M3),它是基“分而治之”的思想解決大規模問題的有效的學習算法。針對異構云中進行大數據分析服務的并行化問題G.Jung 提出了最大覆蓋裝箱算法來決定系統中多少節點、哪些節點應該應用于大數據分析的并行執行。這種方法可以使大數據進行分配使得各個計算節點可以同步的結束計算,并且使數據塊的傳輸可以和上一個塊的計算進行重疊來節省時間。實驗表明,這種方法比其他的方法可以提高大約60% 的性能。在分布式系統方面,Cheng 等人 提出一個面向大規模可伸縮數據分析的可伸縮的分布式系統——GLADE。GLADE 通過用戶自定義聚合(UDA)接口并且在輸入數據上有效地運行來進行數據分析。文章從兩個方面來論證了系統的有效性。第一,文章展示了如何使用一系列分析功能來完成數據處理。第二,文章將GLADE 與兩種不同類型的系統進行比較:一個用UDA 進行改良的關系型數據庫(PostgreSQL)和MapReduce(Hadoop)。然后從運行結果、伸縮性以及運行時間上對不同類型的系統進行了比較。

四、總結 大數據的超大容量自然需要容量大,速度快,安全的存儲,滿足這種要求的存儲離不開云計算。高速產生的大數據只有通過云計算的方式才能在可等待的時間內對其進行處理。同時,云計算是提高對大數據的分析與理解能力的一個可行方案。大數據的價值也只有通

過數據挖掘才能從低價值密度的數據中發現其潛在價值,而大數據挖掘技術的實現離不開云計算技術。總之,云計算是大數據處理的核心支撐技術,是大數據挖掘的主流方式。沒有互聯網,就沒有虛擬化技術為核心的云計算技術,沒有云計算就沒有大數據處理的支撐技術。

參考文獻

秦榮生.大數據、云計算技術對審計的影響研究 何清.大數據與云計算

張為民.云計算: 深刻改變未來

文峰.云計算與云審計———關于未來審計的概念與框架的一些思考

Big data and cloud computing Big Data(Big Data)in recent years, more and more occasions, the concept is mentioned more and more people, And often, and cloud computing together, what is the relationship between cloud computing and big data become a hot topic.this Special report contains the following four aspects: 1.The value of big data;2.Big data challenge;3.Big data research;4.Cloud computing is the mainstream way of data mining.Through this report on our understanding of big data, as well as the understanding of the value of big data, large data processing and mining technology, large data mainly focus on “data”, provide the technology and methods of data collection, mining and analysis;Cloud computing technology focusing on “computing”, providing IT solutions.Big data and cloud computing technology can promote the development of continuous audit mode, the overall audit mode of application, the audit results of comprehensive application, the application of related evidence, the development of efficient data audit and the development of large data auditor.Strengthen big data and cloud computing technology measures of audit applications include set up long-term development strategy, accelerate the construction of the audit regulations, establish a platform, to strengthen research and development and improve the utilization ability.Keywords: big data cloud computing data mining impact on the audit policy Suggestions

第三篇:云計算和大數據下在線教育研究

云計算和大數據環境下的在線教育研究

1.引言

當前云計算和大數據技術的出現,面對在線教育交互中產生的大量復雜數據,可以實現識別、分析、挖掘并組織隱含在學習者交互過程中的結構化、非結構化數據信息,開發交互過程數據的價值,發現其隱性訴求并預測學習支持服務趨勢,并以其為導向改進和拓寬在線教育服務,達到在線教育服務與學習者需求的雙向平衡。本文就是立足于對在線教育的交互瓶頸和需求分析,構建基于大數據和云計算支持的在線教育交互平臺模型。重點研究交互平臺功能實現,使在線的學習者和教師可以實現完美的在線交互活動,并且對交互的數據進行深入挖掘分析,解決目前在線教育所面臨的弊端。

2.在線教育交互平臺現狀分析

在線教育交互分為個別化交互和社會性交互,前者是學習者和學習資料之問的交互,后者是學習者和教師或者學習者之問的交互,社會性交互是提高在線教育交互水平的關鍵因素。隨著在線教育的交互信息資源增加,在線學習者和在線教師的需求不斷發展和提高,在線教育出現了許多問題。

針對服務應用。目前在線教育的交互平臺缺乏統一身份認證體系,需要進行身份重復驗證,給用戶造成不便同時給系統增加安全隱患;缺乏統一的應用展現,用戶信息分散在各個應用中,且服務功能重復,堆砌浪費;使用方法、界面和質量不統一,給平臺使用和維護管理造成不便。在線學習時間的碎片化趨勢對學習者的終端設備要求很高,造成學習質量下降;缺乏跨終端的資源共享系統,影響學習效率和滿意度,改變終端學習,增加數據丟失、病毒入侵等安全問題。

針對信息資源的存儲和分析挖掘。隨著在線學習者和在線教師的服務需求日益個性化和專業化,對于服務質量也越來越看重,在線教育交互平臺必須根據在線學習者和在線教師的需求作出相應的策略改變,以適應服務需求的不斷改變和提高。由于在線教育是基于互聯網的學習方式,學生和學習資源、教師與學生、學生與學生之間的交流是通過網絡全方位進行,所以需要通過對學習交流的分析挖掘出在線學習者和教師的需求。在線教育的信息資源總量日益增大,主要的數據資源包括結構化和非結構化信息,以及在線教育平臺內部以異構化數據為主的相關信息,且每天以大量的非結構化數據和異構性數據資源為主。但是目前對于這些異構性數據和非結構化數據的記錄、存儲和統計技術,完全不能滿足在線教育交互平臺的數據需求。因此對平臺產生的結構化、非結構化、異構性大量數據進行分析和深度挖掘潛在價值成為必然,為在線學習者和教師反饋快速、及時、高效、安全的信息分析結果。3.在線教育交互平臺應用云計算和大數據

3.1 云計算和大數據與在線教育交互平臺

云計算是通過互聯網絡龐大的計算處理能力,將待處理程序自動分拆成無數個較小的子程序,再交由多部服務器所組成的龐大系統經搜尋、計算和分析,最后將處理結果回傳給用戶。大數據技術是數據分析的前沿技術,需要從各種各樣類型的數據中,快速獲得有價值信息的能力,是需要新處理模式才能實現更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。云計算強調的是動態計算能力,大數據注重的是靜態的計算對象。云計算彌補了目前大數據的存儲和運行的最大問題,就是提供了運算平臺,而大數據則運用分布式處理手段應用于這個平臺之上,兩者是相輔相成的關系。

云計算與大數據結合應用,前者強調計算能力,后者看重存儲能力。大數據需要處理大量復雜數據的能力,包括數據獲取、整理、轉換、統計,即強大的計算能力,而云計算需要大量數據作為運算的基礎,所以兩者的結合是必然趨勢。實際應用中,云計算的出現和興起促進了大數據的廣泛應用,而大數據和云計算的結合應用更是出現在許多領域,現已擴展到公共問題領域。但是目前還沒有進入在線教育行業。

借助云計算的優勢,在線教育交互平臺上的用戶無需考慮在線學習時終端設備的運算、存儲和負載能力的問題,可以更好的實現教育資源共享和教育網絡協同工作,大幅度提高教育資源的利用率和運行效率。云存儲屏蔽了數據丟失、病毒入侵等問題,保障了數據安全和用戶信息私密,是在線教育交互平臺最安全可靠的數據存儲中心。用戶使用終端設備訪問教育資源進行在線學習和交流,都會產生并積累大量結構化和非結構化數據,不僅體量大而且增長速度很快。其中非結構化數據已占數據總量的八成以上,但目前的數據分析處理算法和軟件不能達到對非結構化數據的處理要求。大數據技術的應用卻可以高速實時處理在線教育平臺產生的復雜海量數據,為在線教育平臺實時洞察學習者的變化、把握學習者的需求、提高教育質量提供支持。對在線教育平臺上大量的不相關信息,進行深度復雜分析,為未來教育需求趨勢提供預測分析,這是應用大數據的在線教育與傳統在線教育本質的不同。

3.2 基于云計算和大數據的在線教育交互平臺應用模型分析

根據上述分析,隨著在線教育日益同質化,在線教育機構需要在保障教育資源豐富和高質量的同時,更好的分析在線學習者和教師的偏好,為平臺的每個用戶提供有針對性的個性化服務。下面將利用云計算和大數據的優勢構建符合學習者和教師需求的高質量在線教育交互平臺模型,如圖1所示。

應用云計算和大數據技術的在線教育交互平臺主要分為用戶應用服務層、數據資源處理層、基礎設施硬件層三部分,依次分析三部分功能實現。

3.2.1用戶服務應用層

在線教育交互平臺的用戶主要為兩類,即在線教師和在線學習者。針對不同的用戶,訪問的授權和界面不同,盡可能為用戶提供個性化的精準服務,主要表現為屬于用戶自己的展現網頁。服務應用內容主要分為四類,包括在線教學內容、教學管理、交流互動和學習管理,如圖2所示。

服務應用層是資源對外交互的窗口,是用戶使用資源的橋梁,與用戶體驗的便捷性有很大關系。因此應用服務層是根據用戶需求,對信息資源請求重構和提供,實現信息資源的服務分類,用戶享受個性化的服務資源。

平臺對每個用戶展現的內容是不相同的。針對教師,平臺實時反饋在線學習者的情況和分析結果,尤其是對學習者的學習風格和偏好的分析,實時跟蹤學生在課前、課中和課后的情況,完成課程反饋,對學生在平臺上的行為、學習記錄智能跟蹤記錄分析。針對學習者,構成學習、答疑、測評、互動四位一體的學習模式,運用豐富的學習資源,根據后臺的數據挖掘。提供學習進度安排和個性化的學習方案。實現以學生為中心的在線教育方式。實現自主個性化學習、個性化即時筆記、針對性課程復習和測評,多方式在線交互的方式。

在線教育交互平臺的用戶看到的是良好的服務交互界面,無需知道后臺數據資源整合過程,完全由平臺的數據資源處理層完成,所以擁有更好的用戶體驗。平臺是所有教學資源的集散地,整合資源方便統一管理和使用,同一份資源,只需保存一份,通過資源關聯,可以在任意系統中快速調用。同時避免數據庫急劇增長,極大地減輕網絡負荷,減少用戶和平臺的工作時間,維持資源唯一性,資源發生更改時所有使用該資源的應用均自動更新。

3.2.2數據資源處理層

中問層是數據資源處理層,主要為三部分。第一部分是對數據進行標準化處理,第二部分是進行數據挖掘分析整合。第三部分是數據庫。中問層的核心是第二部分,也是在線教育交互平臺的核心。如圖3所示。

面對迅速增加的復雜數據,在線教育交互平臺利用云計算和大數據進行現代數據管理,支持所有數據類型,如文件、圖片、視頻、博客、點擊流和地理空問數據等,并以“云存儲”持久存儲于數據中心,保持數據實時更新,實現數據共享、分析、發現、整合和優化數據,提升數據價值。

利用負載平衡優勢,有效透明地擴展網絡設備和服務器的帶寬、增加在線教育交互平臺的吞葉量、加強平臺網絡數據處理能力、提高服務的靈活性和可用性。面對用戶大量的并發訪問或數據流量,可以分擔到多臺設備上處理,減少教師和學習者的等待響應的時間;同時做并行處理,處理結果匯總返回到在線交互平臺,平臺系統處理能力得到大幅度提高。

離線數據是用戶訪問的各種數據庫中的信息資源,是從服務器端、客戶端、代理服務器端中采集的用戶訪問信息和行為信息。利用大數據技術進行數據處理,清除不需要的數據,用聚類、分類等算法對處理之后的數據進行模式分析,成立樣本數據資源為數據流挖掘分析作準備。在線數據是由于數據流的動態性和流量大的特點,在實現數據流挖掘時,對流入的數據流,利用云計算做到占用內存少,處理速度快,實現關聯規則、分類和聚類的挖掘。

整合數據是將離線數據作為樣本庫的參考,對在線數據進行分析,及時有效的反饋結果,并且隨著時間的推移和用戶對信息資源的需求改變,及時更新資源分析結果。通過數據挖掘過程,對數據過濾、分析和整合,建立多資源分類結果,按照用戶的不同需求進行決策,形成索引為用戶訪問和使用服務提供便利。整合數據主要是為整合用戶做準備,將用戶的信息資源進行相似度分析,對于類似的用戶歸類,進行同類信息資源的分配。根據在線學習者的基本信息、學習風格、學習滿意度和學習感知四維度的服務需求,可實現用戶的定制服務、個性化服務、精準服務,便于用戶方便提取自己需要的資源。最后將用戶需要的資源根據授權不同。做統一標準化處理。上傳至服務應用層,展現于用戶的界面。

4.基于云計算和大數據的在線教育交互平臺應用優勢

云計算和大數據結合對在線教育的發展具有巨大的促進作用,不僅是針對提供的服務,更是對教育發展的促進,增強在線教育的核心競爭力,保持在線教育的健康發展。4.1實現針對不同用戶的個性化精準服務

在從以資源為核心的在線教育平臺建設到以用戶為核心的個性化在線教育平臺建設過程中,最主要的變化的就是針對不同用戶提供不同的個性化服務。而云計算和大數據的應用就在于加強對在線教育的平臺用戶研究與交互數據的分析利用。并基于分析結果。改善服務內容,提升個性化服務的質量,完成平臺對用戶的跟蹤服務、精準服務、知識關聯服務和宣傳推廣服務。面對平臺快速增長的數據,從中提取有價值的信息,實時分析反饋,建立不同類別的用戶模型,達到針對不同用戶提供針對性服務、增強用戶體驗、提高服務質量的目標。即使分析的數據源相同,但是由于提供對象不同,分析結果會不同,提供的服務也不同,做到精準服務。即使是同類用戶,針對不同的個體,分析數據源不同,結果不同,提供的服務也不盡相同,做到個性化服務。

4.2提供教育發展動向以及熱點的變化

通過大數據和云計算技術,改變了被動更新教學資源的情況,變成根據在線學習者的需求主動更新資源,提升了在線教育平臺的作用。不僅為在線學習者提供了需要的學習資源,也為在線教師提供更有質量的教學資源和研究依據。在線教育交互平臺通過對用戶數據的收集、整理、分析、深度挖掘和匯總,在宏觀上分析相關教育領域的發展動向和熱點變化,更快地洞察最新的學習者興趣走向,以及相關領域的內容進展,更新在線平臺的學習資源,并且保證學習內容的實時性和前沿性。同時通過匯總結果有效評估在線學習者對各種教學資源的使用情況,并且根據熱點分析和目前已有教學資源交叉對比,可以有效評估教學資源的質量,利于在線教育交互平臺持久發展。4.3提供無限量的數據存儲能力和更可靠的數據安全性

隨著在線教育交互的發展,信息數據量迅猛增長,產生出大量的半結構化、非結構化信息數據,對存儲的要求愈加嚴格。云計算的出現使得海量數據的存儲與運算得到了解決,分布式存儲的方式可以持續收集大量數據,不會造成存儲空問的不足。在線教育交互平臺應用“云存儲”方式,保證存儲數據的可靠性,并能夠實時更新,有效解決海量數據資源的查詢、管理等問題。云計算使用數據多副本容錯、設備同構可互換等手段來保障平臺的數據存儲安全。數據存儲到“云”中,不會受到計算機病毒或硬盤損壞造成的數據丟失。同時解放了用戶對終端設備能力的要求。4.4提高在線教育交互平臺管理能力

應用云計算和大數據的在線教育交互平臺,能夠面向具體應用的數據需求,做到快速、及時和有效地響應。根據需求的變化和增長,平臺具有很好的性能擴展空問和擴容時穩定和可靠的支持,高效處理多種類型數據。在線教育機構以此平臺為基礎利用云計算技術和大數據的優勢,充分挖掘自身數據價值,實現數據資產從成本中心到利潤中心的轉變。通過整合數據資產,對數據資產進行標準化,形成靈活可擴展、易于更新、可管控的、可隔離、綠色環保的高效分析型數據管理交互平臺,實現支持標準開發、用戶自服務、多元化開發多種應用支持模式,形成松禍合、可異構的基礎數據和應用數據兩級數據管理層次。同時,在線教育機構可以駕馭自身數據資產,全面提升平臺的數據信息管理能力,盡力獲取對在線學習者和在線教師的洞察,以數據驅動在線教育的發展。

5.結論

對于在線教育交互這個重要研究領域而言,云計算和大數據技術的出現不僅影響著在線教育交互的形態,也為交互信息分析提供了新的思路和手段。一方面,新的技術使交互行為不斷向著實時化和碎片化的方向發展,使交互過程日益復雜;另一方面,新的技術又使獲得大量交互數據、特別是行為數據成為了可能,從而有更多了解在線學習過程和進行教學決策的依據。在線教育交互作為信息服務,盡管在線教育交互平臺有資源的優勢,但在技術等方面的劣勢也限制了其本身的發展。本文構建基于大數據和云計算支持的在線教育交互平臺模型,分析平臺的功能實現,使在線的學習者和教師可以實現完美的在線交互活動,總結出利用云計算和大數據的在線教育交互平臺的特點優勢。因此,在線教育交互平臺的快速發展需要利用云計算和大數據創新提升在線教育交互的核心競爭力。

第四篇:大數據時代管理會計研究論文

一、大數據時代

1.大數據。大數據原來是計算機領域處理信息的一種方法。為了得到更精確的結果,大數據采納了很多看起來毫無關聯的信息,比如天氣、溫度等,構成了龐大繁雜的數據庫。這些信息平均價值較低,利用新的處理模式刪繁就簡,實現高效準確的目的,于是大數據便發展成為一種新的信息處理模式,它包括海量的、高增長率的和多樣化的信息資產,且具有更強的決策力、洞察發現力和流程優化能力。大數據時代最大的轉變就是關注相關關系而不是因果關系,即只需要結果,而不需要理清其中的聯系,這顛覆了人們的思維習慣,對收集信息、管理信息和預測信息等方面提出了新的挑戰。

2.云計算。云計算是大數據的主要運算方法之一,也是支撐大數據的平臺,它可以挖掘出紛繁復雜、價值低廉的數據群下的真實價值。云計算由不同研究機構共同開發,普遍被認為是一個由虛擬資源構成的資源池,通過互聯網向外按需提供資源,其主要特點是多用戶共享、大數據處理與大數據儲存。云計算是在原有的并行計算和分布式計算等多種技術的基礎上進化而來,成熟度高,可靠性強,具備廉價和高效的優點。

二、大數據時代的管理會計

管理會計的任務是將財務會計所記錄的總賬和報表等資料進行加工處理,使高層管理人員能夠對日常活動進行規劃、控制和決策。管理會計是對未來的規劃,側重于對未來的預測,相對于財務會計來說更依賴對數據、尤其是大數據的處理分析。管理會計大致可分為對經營預測、決策和長期投資決策的預期效果綜合分析的“決策會計”和為了提高預期決策效率而進行的預算管理、責任會計、成本控制和績效評價的“執行會計”。大數據時代大大擴展了管理會計的各項職能。

1.經營預測。傳統的經營預測存在偏差的最大原因是信息不對稱,很多信息沒有被利用或量化。大數據時代,可利用計算機、互聯網和云計算將巨量數據的信息載體處理成為簡單準確的所需信息呈現在面前,只要挖掘數據,即可得出預測結果。互聯網時代,人們習慣于在網上搜尋自己需求的信息,這就在網上留下了文本、音頻、視頻等瀏覽記錄。這些記錄之間缺乏邏輯與結構的聯系,所以被稱為“非結構性數據”。管理會計可通過云計算處理這些“非結構性數據”,并利用計算結果進行經營預測。

2.全面預算管理。預算管理既將企業制定的經營目標以貨幣形式表現出來,也將企業整體目標拆分開來落實到每個部門和員工。大數據時代,預算人員面對復雜的巨量數據和動態實時的預算要求,需要將預算管理系統與大數據結合。

2.1大數據時代下的預算是動態、實時的。在編寫預算時,所有預算項目會經審批后儲存進云端,在執行預算時,云會計下的系統可以利用云端上新增的數據同步計算出實際與預算的差異,并可調整預算。

2.2有力的數據分析軟件使預算系統更加及時。應用多維數據分析技術,大數據下的預算系統可以很好的支持巨量數據的及時分析。

2.3預算的編寫更加智能。大數據下的預算系統,可以先由IT部門制作標準模型和參數表,將它們與預算模塊中的具體數據建立動態聯系,再由預算管理人員通過自定義計算功能實現預算模塊各個數據之間的聯系,并且預算人員可以自己編寫、維護和更新業務規則,使預算要求更加明確有效的反映到預算模塊中。

3.績效評價。績效評價系統的關鍵績效指標是衡量員工工作的量化指標,其設定應遵循具體、可度量、可實現、現實性和時限性五個原則,實際設計時容易出現偏差。應用大數據系統可以解決其中一些問題。

3.1可度量原則可能導致的關鍵指標遺漏。可度量原則是指績效指標應是數量化或行為化的,過分追求量化指標往往導致關鍵績效指標遺漏。應用大數據系統,設計者可以在云端獲得形式多樣的間接反映績效的數據,量化充分即可避免關鍵指標的遺漏。

3.2現實性原則可能導致的指標偏離。現實性原則是指績效指標的考察是現實可行的,而在操作時,設計者可能常為節省考核費用而忽略考察成本較高的指標,導致考核結果偏離戰略目標。大數據系統下,大量數據的收集唾手可得,很多指標的測定變得不再復雜昂貴,既可以通過委托專門的研究中心計算所需指標,也可以租用經濟高效的虛擬服務器自己計算指標,成本低,更加符合現實性原則。

3.3時限原則可能導致的考核過于注重短期利益。時限原則是指指標的完成應在特定期限內,不能遙遙無期,這導致員工過于注重短期利益,對企業長期經營不利。大數據是站在巨量數據之上進行分析的,數據基數很大,考量因素很多,有更大的把握對復雜和長遠的投資進行預測,在一定程度上避免短視行為。

三、挑戰

大數據和云計算尚未引起普遍重視。麥肯錫公司2013年調查顯示,只有49%的高管關注大數據的發展,很多中小企業忽視對大數據的關注。這無疑會影響大數據的推廣應用,落后企業也會因此增加機會成本與時間成本。大數據的信息真實性越來越被重視。大數據的引進,對外部信息和內部信息真實性均提出了更高的標準,這對目前還未做到公開透明的企業來說是個挑戰。大數據系統的處理技術尚不令人滿意。例如,處理非結構化數據時,在轉化成結構化數據的途中可能會產生意思曲解和信息遺漏;目前處理巨量數據較為成熟的Hadoop體系的應用門檻較高,不利于大數據系統的推廣;網絡容量有限,儲存成本較高。信息和網絡安全問題的挑戰日益嚴重。一方面是企業取得的信息是否合法,是否尊重了客戶的隱私權。另一方面是企業能否保護好客戶的資料,不被竊取。網絡水平的快速發展與網絡高手的層出不窮,信息和網絡安全愈發重要。熟練掌握大數據處理技術的人才不足。企業需要能夠熟練應用大數據工具的管理會計人才,只有通過他們專業解讀和提煉大數據系統處理得到的最終信息,管理層才能得到有利于經營管理的信息,才能做出合理可行的決策。目前,這類人才嚴重缺少。

四、建議

1.大力宣傳和推廣大數據系統,普及大數據和云計算知識,推動大數據時代的健康發展。

2.國家應著重提升全民的計算機素質,鼓勵參與國家大型分布式計算項目,發展大數據計算技術。分布式計算項目是將一個超大型計算項目分解成可在單個電腦上計算的小塊兒,每一個擁有電腦的人只需下載正規軟件,即可參與其中。

3.高度重視云安全,不僅要建立殺毒系統保護信息免受侵害,還要在信息共享時注意混合云中數據的所有權問題,推廣使用分裂密鑰加密等技術對機密數據進行保護。

4.加大培養管理會計人才的力度,鼓勵使用大數據工具。逐步培養可以綜合掌握數學、統計學、計算機等多方面知識的復合型人才,提高管理會計的數據分析與挖掘能力,適應大數據時代的變化。

第五篇:新技術—云計算與大數據

云計算與大數據

大數據時代已經悄然到來,如何應對大數據時代所帶來的挑戰與機遇,是我們當代大學生特別是我們計算機專業學生的一個必須面對的嚴峻課題。在這次課上通過陶老師的講解以及在課后查閱相關資料,我了解到什么是大數據,什么是云計算,它們都有什么用處,有什么關系。

近幾年,云計算和大數據的概念受到了學術界、商界、甚至政府的熱傳,一時間云計算無處不在。秉承著“按需服務”理念的云計算正高速發展,“數據即資源”的“大數據”時代已經來臨。大數據利用對數據處理的實時性、有效性提出來更高要求,需要根據大數據特點對傳統的常規數據處理技術進行變革,形成適用于大數據收集、存儲、管理、處理、分析、共享和可視化的技術。大數據的規模效應給數據存儲和管理以及數據分析帶來了極大的挑戰。

一、云計算概念

在課后,經過翻閱各種資料,了解到狹義的云計算是指IT基礎設施的交付和使用模式。指通過網絡以按需、易擴展的方式獲得所需的資源;廣義的云計算是指服務的交付和使用模式,指通過網絡以按需、易擴展的方式獲得所需的服務,這種服務可以是IT和軟件、互聯網相關的,也可以是任意其他的服務,它具有超大規模、虛擬化、可靠安全等獨特功能。通俗的理解是,云計算的“云”就是存在于互聯網上的服務器集群上的資源,它包括硬件資源和軟件資源,本地計算機只需要通過互聯網發送一個需求信息,遠端就會有成千上萬的計算機為你提供需要的資源并將結果返回到本地計算機。這樣,本地計算機幾乎不需要做什么,所有的處理都在云計算提供商所提供的計算機群體來完成。

Kevin Hartig:云是一個龐大的資源地,你按需購買;云是虛擬化的;云可以像自來水、電、煤氣那樣計費。

Jan Pritzker:云計算是用戶友好的網絡計算。

云計算,它是基于數據中心,強調性價比、效率、可行性的服務運營模式,這是提高高端計算利用率,同時提升低端計算事物處理能力,我們不關注本身計算機的能力,更多提供給后臺,由于后臺強大的處理能力完成。

二、云計算部署模式

根據云計算服務對象范圍的不同,云計算有四種部署模式:私有云、社區云、公有云和混合云。私有云是由一個用戶組織(例如政府、軍隊、企業)建立運維的云計算平臺,專供組織內部人員使用,不提供對外服務。社區云也稱機構云,云基礎設施由多個組織共同提供,平臺由多個組織共同管理。社區云被一些組織共享,為一個有共同關注點的社區或大機構提供服務。公有云的基礎設施由一個提供云計算服務的大型運營商組織建立和運維,該運營組織一般是擁有大量計算資源的IT巨頭,這些IT公司將云計算服務以“按需購買”的方式銷售給一般用戶或中小企業群體。用戶只需將請求提交給云計算系統,付費租用所需的資源和服務。混合云的云基礎設施是由兩種或兩種以上的云組成,每種云仍然保持獨立,但用標準的或專用的技術將它們組合起來,具有數據和應用程序的可移植性。

三、云計算服務模式

計算就要有就算環境,一般計算環境都有硬件的一層,資源組合調度的一層即操作層,以及計算任務的應用業務的軟件層。云計算提供的三種服務模式對應了計算環境的三個層面。這三種服務模式分別是基礎設施即服務IaaS、軟件即服務SaaS、平臺即服務PaaS。

IaaS即把廠商的由多臺服務器組成的“云端”基礎設施,作為計量服務提供給客戶。它的優點是用戶只需低成本硬件,按需租用相應計算能力和存儲能力,大大降低了用戶在硬件上的開銷。目前以Google云應用最具代表性,例如GoogleDocs、GoogleApps、Googlesites。SaaS服務提供商將應用軟件統一部署在自己的服務器上,用戶根據需求通過互聯網向廠商訂購應用軟件服務,服務提供商根據客戶所定軟件的數量、時間的長短等因素收費,并且通過瀏覽器像客戶提供軟件的模式。對于小型企業來說,SaaS是采用先進技術的最好途徑。PaaS把開發環境作為一種服務來提供。PaaS能夠給企業或個人提供研發的中間件平臺,提供應用程序開發、數據庫、應用服務器、試驗、托管及應用服務。

四、大數據

大數據(big data),或稱巨量資料,就是對全球各種大規模數據資料進行深度挖掘,并進行高速度及多樣式計算后,整理出來的高價值的分析結果;重點應用在國防領域建設,未來發展方向在人工智能領域,可以讓計算機自主地從經驗中進行學習和反饋。個人總結,大數據的特點主要有如下4點:

一是大量。存儲大,計算量大。

二是數據類型多樣。現在的數據類型不僅是文本形式,更多的是圖片、視頻、音頻、地理位置信息等多類型的數據,個性化數據占絕對多數。三是處理速度快。增長速度快,處理速度要求快。四是價值密度低。浪里淘沙卻彌足珍貴,數據沒有辦法在可忍受的時間下使用常規軟件方法完成存儲、管理和處理任務。

大數據已經不簡簡單單是數據大的事實了,而最重要的現實是對大數據進行分析,只有通過分析才能獲得很多智能的,深入的,有價值的信息。大數據分析普遍存在的方法理論有:可視化分析、數據挖掘算法、預測性分析、語義引擎、數據質量和數據管理。

五、云計算與大數據關系

云計算和大數據是這個時代的兩個王者,是一個硬幣的兩面,云計算是大數據的IT基礎,而大數據是云計算的一個殺手級應用。張亞勤說,云計算是大數據的驅動力,而另一方面,由于數據越來越多,越來越復雜,越來越實時,這就更加需要云計算去處理,所以二者之間是相輔相成的。

本質上,云計算和大數據的關系是靜與動的關系;云計算強調的是計算,這是動的概念;數據則是計算的對象,是靜的概念。在實際的應用中,前者強調的是計算能力,或者看重的是存儲能力;但是這樣說,并不意味著兩個概念如此涇渭分明。大數據需要處理大數據的能力如數據獲取、清潔、轉換、統計等,其實就是需要強大的計算能力,另一方面,云計算的動也好是相對而言,比如基礎設施即服務中存儲設備提供的主要是數據能力,所以可謂是動中有靜。

如果數據是財富,那么大數據就是寶藏,而云計算就是挖掘和利用寶藏的利器。沒有強大的計算能力,數據寶藏終究是鏡中花,沒有大數據的積淀,云計算也只能是殺雞用的宰牛刀。

六、心得體會

通過這次課程的學習,了解到在如此快速到來的大數據革命時代,我們還有很多知識需要學習,許多思維需要轉變,許多技術需要研究。職業規劃中,也需要充分考慮到大數據對于自身職業的未來發展所帶來的機遇和挑戰。

下載大數據時代基于云計算的數據監護研究論文[5篇]word格式文檔
下載大數據時代基于云計算的數據監護研究論文[5篇].doc
將本文檔下載到自己電腦,方便修改和收藏,請勿使用迅雷等下載。
點此處下載文檔

文檔為doc格式


聲明:本文內容由互聯網用戶自發貢獻自行上傳,本網站不擁有所有權,未作人工編輯處理,也不承擔相關法律責任。如果您發現有涉嫌版權的內容,歡迎發送郵件至:645879355@qq.com 進行舉報,并提供相關證據,工作人員會在5個工作日內聯系你,一經查實,本站將立刻刪除涉嫌侵權內容。

相關范文推薦

    大數據時代

    大數據時代近年來,隨著互聯網、移動互聯網、智能手機及傳感器等的普及,信息流量有了爆發性的增長,兩會以后,互聯網里最熱的詞匯,就是李克強總理在政府工作在報告里面提到的“互......

    大數據時代

    “大”數據時代 眾所周知,數據本身就蘊藏著價值,但是將有用的數據與沒有價值的數據進行區分看起來可能是一個棘手的問題。 顯然,您所掌握的人員情況、工資表和客戶記錄對于企業......

    大數據時代

    《大數據時代》讀書筆記 作者:邁爾舍恩伯格 出版發行:浙江人民出版社 版次:2013年1月第一版 讀者:物流一班、時菲陽 一、作者觀點 谷歌有一個名為“谷歌流感趨勢”的工具,它通過......

    大數據時代環境管理會計發展研究論文

    環境管理會計作為提供環境管理決策支持的信息系統,其信息的取得離不開對信息載體———數據的收集、加工和處理。隨著新興信息技術與應用模式的不斷涌現,全球數據量呈現出前......

    大數據與云計算的安全

    云計算和大數據結合的安全問題 摘要:云計算的浪潮還沒有過去,大數據時代已經到來。在對大數據的含義、特征、影響和意義進行系統總結的基礎上,分析了大數據與云計算的關系,論......

    云計算與大數據學習報告

    “大數據與云計算”學習報告 題目:談談對“大數據與云計算”技術的理解,及這兩項技術對商業活動、社會進步帶來哪些影響. 首先我想簡單談談何為云計算,何為大數據。云計算,是基......

    大數據時代讀后感

    《大數據時代》這本書主要描述的是大數據時代人們生活、工作與思維各方面所遇到的重大變革,并用三個部分講述了大數據時代的思維變革、商業變革和管理變革。 第一部分提出了......

    大數據時代心得體會

    《大數據時代》心得體會 信息時代的到來,我們感受到的是技術變化日新月異,隨之而來的是生活方式的轉變,我們這樣評論著的信息時代已經變為曾經。如今,大數據時代成為炙手可熱的......

主站蜘蛛池模板: 窝窝午夜看片国产精品| 免费网禁国产you女网站下载| 久草网站| 中文字幕精品亚洲无线码二区| 国产做爰又粗又大又爽动漫| 无码免费一区二区三区免费播放| 爆乳高潮喷水无码正在播放| 亚洲精品尤物av在线观看任我爽| 婷婷色婷婷开心五月四房播播久久| www夜片内射视频日韩精品成人| 久久香蕉国产线看观看怡红院妓院| 久久精品国产亚洲av忘忧草18| 伊人久久大香线蕉avapp下载| 国产aⅴ视频免费观看| 免费a级毛片18以上观看精品| 免费特级毛片| 久久东京伊人一本到鬼色| 国产精品www夜色视频| 性高朝久久久久久久| 日韩中文字幕在线一区二区三区| 亚洲国产精品久久久久婷婷老年| 亚洲国产精品一区二区成人片不卡| 精品久久久久久久国产潘金莲| 亚洲精品乱码久久久久久不卡| 国产欧美日韩视频怡春院| 精品福利视频一区二区三区| 米奇7777狠狠狠狠视频影院| 在线a人片免费观看| 国色天香成人网| 成年女人免费视频播放体验区| av无码人妻无码男人的天堂| 思思99re6国产在线播放| 国内精品自在自线视频| 农村乱人伦一区二区| 日韩精人妻无码一区二区三区| 永久黄网站免费视频性色| 精品国产一区二区三区不卡| av无码午夜福利一区二区三区| 熟女一区| 亚洲国产初高中生女av| 国内精品自在拍精选|