第一篇:論大數據時代的利與弊
論大數據時代的利與弊
摘 要:信息是推動世界發展、科技進步的不竭動力。而作為信息時代的產物――大數據,逐漸成為大家討論的話題。下面將對大數據時代進行簡單概述,介紹大數據前沿的公司以及大數據時代的利與弊。
關鍵詞:大數據;數據分析;認知計算系統
中圖分類號:TP181 大數據時代的概述
最早提出“大數據”時代到來的是全球知名咨詢公司麥肯錫,他稱:“數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來。” “大數據”在物理學、生物學等領域以及軍事、金融、通訊等行業存在已有時日,卻因為近年來互聯網和信息行業的發展而引起人們關注。大數據作為云計算、物聯網之后IT行業又一大顛覆性的技術革命。云計算主要為數據資產提供了保管、訪問的場所和渠道,而數據才是真正有價值的資產。企業內部的經營交易信息、物聯網世界中的商品物流信息,互聯網世界中的人與人交互信息、位置信息等,其數量將遠遠超越現有企業IT架構和基礎設施的承載能力,實時性要求也將大大超越現有的計算能力。
當大數據還在眾說紛紜時,維克托?邁爾-舍恩伯格就以對大數據進行了深入而系統的研究,并與麥肯思?庫克耶編輯在《經濟學人》發表了大數據專題論文,他曾說,世界的本質就是數據,大數據將開啟一次重大的時代變革。
大數據的引領者
Google,Microsoft,亞馬遜,IBM,蘋果,Facebook,twitter,VISA都是大數據時代的領軍企業,他們都洞察到了大數據的發展,在其中他們“受益匪淺”。
IBM執行總裁羅睿蘭認為,“數據將成為一切行業當中決定勝負的根本因素,最終數據將成為人類至關重要的自然資源。”未經處理的數據就像源礦,毫無價值,只有經過分析與處理的數據才有價值。大數據及分析最大的魅力就在于能夠為國家、企業、醫療機構等帶來分析洞察力,依托數據更加科學的來進行決策,進一步推動生產力發展。對于大數據分析,IBM采用的是一種“人工智能”+“大數據”的方式來提供大數據分析和服務,即“Watson Foundations”。
曾在《危險邊緣》中一舉成名的沃森能夠戰勝人類的“秘技”主要有以下幾個:能夠識別自然語言;從知識庫中搜索證據來支持假設的答案;具有學習能力。IBM認為,隨著信息的增加,以學習的、交互的方式,隨著數據的進一步增長逐步提高認知的分析行為,就是“認知計算”。在IBM內部,“沃森”所代表的就是“認知計算”,IBM已經將認知計算作為未來大數據分析的戰略方向。“沃森”基于IBM Power硬件平臺,實際上“沃森”的認知計算能力并不僅限于Power,而是能移植到其他IBM系統上。IBM的Watson Foundations是一個開放式平臺,傳統的大數據解決方案用戶也能獲得認知計算帶來的好處。
現在,IBM已經創建了三大類認知計算系統:新一代的對話系統;新一代的探索系統;新一代的決策系統,這是認知計算的最高應用境界,能幫助客戶提供最佳的決策,如根據客戶過往購物情況和實時購物情況,預測接下來客戶要買什么。
“沃森”正變得越來越受歡迎,因為它所代表的“認知計算”讓大數據及分析變得更加簡單。
在國內,百度已經致力于開發自己的大數據處理和存儲系統;騰訊也提出目前已經到了數據化運營的黃金時期,如何整合這些數據成為未來的關鍵任務。每一個商業巨頭都在緊緊把握這次機會。大數據時代的利與弊
一分鐘內,微博推特上新發的數據量超過10萬;社交網絡“臉譜”的瀏覽量超過600萬……你把它們當作抒情議論的工具,華爾街的斂財高手們卻正在挖掘這些互聯網的“數據財富”,先人一步用其預判市場走勢,而且取得了不俗的收益。他們究竟是怎么利用這些數據的?這些數據具體有六大價值:
(1)華爾街根據民眾情緒拋售股票;(2)對沖基金依據購物網站的顧客評論,分析企業產品銷售狀況;(3)銀行根據求職網站的崗位數量,推斷就業率;(4)投資機構搜集并分析上市企業聲明,從中尋找破產的蛛絲馬跡;(5)美國疾病控制和預防中心依據網民搜索,分析全球范圍內流感等病疫的傳播狀況;(6)美國總統奧巴馬的競選團隊依據選民的微博,實時分析選民對總統競選人的喜好。
幾乎每一個成功的人,成功的企業都充分利用了大數據的絕妙優勢。
蘋果公司的傳奇總裁史蒂夫?喬布斯在與癌癥斗爭的過程中采用了不同的方式,成為世界上第一個對自身所有DNA和腫瘤DNA進行排序的人。他得到的不是只有一系列標記的樣本,而是包括整個基因密碼的數據文檔。對于一個普通患者,醫生只能期望他的DNA排列同實驗中使用的樣本足夠相似。但是,史蒂夫?喬布斯的醫生們能夠基于喬布斯的特定基因組成,按所需效果用藥。如果癌癥病變導致藥物失效,醫生可以及時更換另一種藥,也就是喬布斯所說的,“從一片睡蓮葉跳到另一片上。”喬布斯開玩笑說:“我要么是第一個通過這種方式戰勝癌癥的人,要么就是最后一個因為這種方式死于癌癥的人。”雖然他的愿望沒有實現,但是他獲得的所有數據還是將他的生命延長了好幾年,也才有了iphone的一次次創新,帶給我們的一次次驚喜。[1]
采用所有數據而不是樣本數據,增加了我們解決問題的方法和能力,降低了我們的直接和間接經濟損失,甚至挽救或者延長了人的生命,這就是大數據的魅力所在。
沃爾瑪是世界上最大的零售商,在網絡帶來的巨大數據之前,沃爾瑪在美國企業中擁有的數據資源是最多的。在20世紀90年代,通過把每一個產品記錄為數據,沃爾瑪可以讓供應商監控銷售速率、數量以及存貨的情況,利用此沃爾瑪成為了世界上最大的“寄售店”。而且在2004年,沃爾瑪對歷史交易記錄這個龐大的數據庫進行了觀察,這個數據庫記錄的不僅僅包括每一個顧客的購物清單以及消費額,還包括購物籃中的物品,具體時間,甚至購買當日的天氣。他們注意到,每當季節性颶風來臨之前,不僅手電筒的銷售量增加了,而且POPTarts蛋撻的銷量也增加了。因此當季節性颶風來臨時,沃爾瑪會把庫存的蛋撻放在靠近颶風用品的位置,從而增加銷售量。[2]
當數據點以數量級方式增長時,我們會觀察到許多似是而非的相關關系,大數據的相關關系分析法更準確、更快,也更不易受到偏見的影響。[3]
任何事物都有兩面性,大數據難道帶給我們的只有好處而無弊端嗎?不,當然不是。大數據的最大弊端就是隱私。
Google、Yahoo!、微軟搜索、Ask.com以及萬維網進行邊路的其他許多搜索引擎,通過碎網頁的諸葛搜索,使得所有人僅在搜索框中鍵入一兩個關鍵字就能訪問這些網頁。然而在不經意間,搜索引擎記住了許多,比網上發布的信息多得多。Google能識別出我們每個人在什么時候搜索了什么的,以及我們可能覺得足夠準確并點擊進去的搜索結果是什么。毫不夸張的說,Google對我們的了解比我們自己能夠記住的還要多。[4]
他們得到了我們如此之多的隱私(并非我們自愿給予的),我們完全處于赤裸的狀態(雖然Google等都對他們存儲的信息進行定期的刪除)。我們的隱私不再隱私。
大數據為我們帶來便利的同時,也為我們埋下了巨大隱患。但是我們不會因為它的不足就摒棄它,相反地我們要好好利用它,并對它產生的弊端進行研究,拿出合理的解決方案。
參考文獻:
[1]維克托?邁爾-舍恩伯格,肯尼思?庫克耶.盛楊燕,周濤譯.大數據時代[M].浙江人民出版社,2012(12):33-34.[2]維克托?邁爾-舍恩伯格,肯尼思?庫克耶.盛楊燕,周濤譯.大數據時代[M].浙江人民出版社,2012(12):50.[3]維克托?邁爾-舍恩伯格,肯尼思?庫克耶.盛楊燕,周濤譯.大數據時代[M].浙江人民出版社,2012(12):51.[4]維克托?邁爾-舍恩伯格.刪除[M].袁杰譯.浙江人民出版社,2013(01):12-13.作者單位:沈陽農業大學,沈陽 110866
第二篇:大數據的利與弊
大數據的利與弊
隨著科學技術的發展,越來越多的現代產品涌入我們的生活,它們無不例外地方便著我們的生活,為我們提供資訊,或者是將我們的資訊提供給他人。在這種信息不斷交互的過程中,大數據的理念開始產生,大數據主要是指無法在一定時間內用常規軟件工具對其內容進行抓取、管理和處理的數據集合。大數據技術,是指從各種各樣類型的數據中,快速獲得有價值信息的能力。適用于大數據的技術,包括大規模并行處理數據庫,數據挖掘電網,分布式文件系統,分布式數據庫,云計算平臺,互聯網,和可擴展的存儲系統。雖然在普通人看來大數據遙不可及,與自己沒有什么關系,但是大數據與每個個體正如國家與每個公民一樣,我們每個人都是大數據的提供者與受益者。
大數據有四個基本特征:數據體量巨大、數據類型多樣、處理速度快、價值密度低。基于大數據以上的特征,人們由此衍生出了許多與大數據有關的產業,并且得到了蓬勃的發展。
大數據最主要的發展當然集中在互聯網上面。對大數據的處理分析正成為新一代信息技術融合應用的節點。移動互聯網、物聯網、社交網絡、數字家庭、電子商務等是新一代信息技術的應用形態,這些應用不斷產生大數據。通過對不同來源數據的管理、處理、分析與優化,將結果反饋到上述應用中,將創造出巨大的經濟和社會價值。大數據也是信息產業持續高速增長的新引擎。面對大數據市場的新技術、新產品、新業態會不斷涌現。在硬件與集成設備領域,大數據將對芯片、存儲產業產生重要影響,還將催生一體化數據存儲處理服務器、內存計算等市場。在軟件與服務領域,大數據將引發數據快速處理分析、數據挖掘技術和軟件產品的發展。大數據利用將成為提高核心競爭力的關鍵因素。各行各業的決策正在從“業務驅動”轉變為“數據驅動”。對大數據的分析可以使零售商實時掌握市場動態并迅速做出應對;可以為商家制定更加精準有效的營銷策略提供決策支持;可以幫助企業為消費者提供更加及時和個性化的服務;在醫療領域,可提高診斷準確性和藥物有效性;在公共事業領域,大數據也開始發揮促進經濟發展、維護社會穩定等方面的重要作用。大數據時代科學研究的方法手段將發生重大改變。例如,抽樣調查是社會科學的基本研究方法。在大數據時代,可通過實時監測,跟蹤研究對象在互聯網上產生的海量行為數據,進行挖掘分析,揭示出規律性的東西,提出研究結論和對策。
目前大數據在醫療衛生領域有廣為所知的應用,公共衛生部門可以通過覆蓋全國的患者電子病歷數據庫進行全面疫情監測。5千萬條美國人最頻繁檢索的詞條被用來對冬季流感進行更及時準確的預測。學術界整合出2003年H5N1禽流感感染風險地圖,研究發行此次H7N9人類病例區域。社交網絡為許多慢性病患者提供了臨床癥狀交流和診治經驗分享平臺,醫生借此可獲得院外臨床效果統計數據。基于對人體基因的大數據分析,可以實現對癥下藥的個性化治療。
在疾病診治方面,可通過健康云平臺對每個居民進行智能采集健康數據,居民可以隨時查閱,了解自身健康程度。同時,提供專業的在線專家咨詢系統,由專家對居民健康程度做出診斷,提醒可能發生的健康問題,避免高危病人轉為慢性病患者,避免慢性病患者病情惡化,減輕個人和醫保負擔,實現疾病科學管理。對于醫療衛生機構,通過對遠程監控系統產生數據的分析,醫院可以減少病人住院時間,減少急診量,實現提高家庭護理比例和門診醫生預約量的目標。武漢協和醫院目前也已經與市區八家社區衛生服務中心建立遠程遙控聯系,并將在未來提供“從醫院到家”的服務。在醫療衛生機構,通過實時處理管理系統產生的數據,連同歷史數據,利用大數據技術分析就診資源的使用情況,實現機構科學管理,提高醫療衛生服務水平和效率,引導醫療衛生資源科學規劃和配置。大數據還能提升醫療價值,形成個性化醫療,比如基于基因科學的醫療模式。
在醫藥研發方面,大數據的戰略意義在于對各方面醫療衛生數據進行專業化處理,對患者甚至大眾的行為和情緒的細節化測量成為可能,挖掘其癥狀特點、行為習慣和喜好等,找到更符合其特點或癥狀的藥品和服務,并針對性的調整和優化。在醫藥研究開發部門或公司的新藥研發階段,能夠通過大數據技術分析來自互聯網上的公眾疾病藥品需求趨勢,確定更為有效率的投入產品比,合理配置有限研發資源。除研發成本外,醫藥公司能夠優化物流信息平臺及管理,更快地獲取回報,一般新藥從研發到推向市場的時間大約為13年,使用數據分析預測則能幫助醫藥研發部門或企業提早將新藥推向市場。
在公共衛生管理方面,大數據可以連續整合和分析公共衛生數據,提高疾病預報和預警能力,防止疫情爆發。公共衛生部門則可以通過覆蓋區域的衛生綜合管理信息平臺和居民信息數據庫,快速監測傳染病,進行全面疫情監測,并通過集成疾病監測和響應程序,進行快速響應,這些都將減少醫療索賠支出、降低傳染病感染率。通過提供準確和及時的公眾健康咨詢,將會大幅提高公眾健康風險意識,同時也將降低傳染病感染風險。
在居民健康管理方面,居民電子健康檔案是大數據在居民健康管理方面的重要數據基礎,大數據技術可以促進個體化健康事務管理服務,改變現代營養學和信息化管理技術的模式,更全面深入地從社會、心理、環境、營養、運動的角度來對每個人進行全面的健康保障服務,幫助、指導人們成功有效地維護自身健康。另外,大數據可以對患者健康信息集成整合,在線遠程為診斷和治療提供更好的數據證據,通過挖掘數據對居民健康進行智能化監測,通過移動設備定位數據對居民健康影響因素進行分析等等,進一步提升居民健康管理水平。
在健康危險因素分析方面,互聯網、物聯網、醫療衛生信息系統及相關信息系統等普遍使用,可以系統全面地收集健康危險因素數據,包括環境因素,生物因素,經濟社會因素,個人行為和心理因素,醫療衛生服務因素,以及人類生物遺傳因素等,利用大數據技術對健康危險因素進行比對關聯分析,針對不同區域、人群進行評估和遴選健康相關危險因素及制作健康監測評估圖譜和知識庫也成為可能,提出居民健康干預的有限領域和有針對性的干預計劃,促進居民健康水平的提高。
當然作為一個新興的概念,大數據也有著一些有待改進的缺陷。例如大數據的安全性。如果某個數據庫發生了泄露或者是黑客入侵等情況,那么就有可能使得成百上千的公民的個人數據泄露,從而造成公民財產,個人隱私上面的危害。并且,大數據作為一個有著高額利潤的項目,有不少企業會只看重利潤就盲目地啟動大數據的有關項目,但卻沒有相關的知識和人才,所以導致大數據這個新興的項目充滿了不確定性。
因此,大數據對于我們來說,既是機遇又是挑戰。我們一方面要把握好大數據帶來的機遇,努力把握住它,永遠走在時代浪潮的頂端;另一方面,我們要時刻保持清醒警戒的意識,保護好個人的隱私,不要讓不法分子鉆了大數據的漏洞。
第三篇:大數據時代
大數據時代
近年來,隨著互聯網、移動互聯網、智能手機及傳感器等的普及,信息流量有了爆發性的增長,兩會以后,互聯網里最熱的詞匯,就是李克強總理在政府工作在報告里面提到的“互聯網+”,大數據將會更廣泛的被運用到各個領域,越來越多的業內人士開始談論“大數據”,如何利用大數據,成為政府和眾多企業關心的熱點?
互聯網+《大數據》緊緊圍繞這些問題展開,幫您如何利用大數據為企業從戰略上面進行指導挖掘和預測,從戰術上進行營銷服務和安全措施,精彩我們共同期待。
第一篇大數據很熱,大數據不神秘(趨勢)有人說,如果你不知道大數據,你就OUT了 --大數據到底有多熱 什么樣的數據算是大數據 --大數據的特點和概念辨析 亂我心者,大數據之事多煩憂 --大數據并不象你想象的那樣神秘 身邊的大數據
--大數據就在你我身邊
案例分析:淘寶是如何利用大數據淘寶的 小結:不管你愿不愿意,大數據已經在那里 電話:010---59002742 010--59004371 第二篇:認識大數據 1.什么是大數據 2.大數據應用的意義
3.大數據在企業經營中應用的意義 4.對大數據的認識誤區 案例分析
第三篇:大數據時代變革 1:大數據時代的思維變革 2:大數據時代的商業變革 3:大數據時代的管理變革
第四篇:大數據在營銷中的運用 大數據精準營銷 1.什么是精確營銷 2.精確營銷的方法 實操教學+案例分析
第五篇:在技術中應用 數據挖掘
大數據的核心價值——挖掘 1.什么是數據挖掘? 2.數據挖掘的流程 3.數據挖掘解決的問題 結合現場實操教學+案例分析
第六篇:預測
大數據的核心價值——預測 1:如何預測? 案例分析
第七篇:大數據與云計算 1:什么是云計算
2:大數據與云計算的關系
第八篇:大數據的安全問題
大數據給信息安全帶來新的挑戰和機遇 大數據存儲安全策略 大數據應用安全策略 大數據管理安全策略
第四篇:大數據時代
“大”數據時代 眾所周知,數據本身就蘊藏著價值,但是將有用的數據與沒有價值的數據進行區分看起來可能是一個棘手的問題。
顯然,您所掌握的人員情況、工資表和客戶記錄對于企業的運轉至關重要,但是其他數據也擁有轉化為價值的力量。一段記錄人們如何在您的商店瀏覽購物的視頻、人們在購買您的服務前后的所作所為、如何通過社交網絡聯系您的客戶、是什么吸引合作伙伴加盟、客戶如何付款以及供應商喜歡的收款方式……所有這些場景都提供了很多指向,將它們抽絲剝繭,透過特殊的棱鏡觀察,將其與其他數據集對照,或者以與眾不同的方式分析解剖,就能讓您的行事方式發生天翻地覆的轉變。
大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法通過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊。
“大數據”這個術語最早期的引用可追溯到apache org的開源項目Nutch。當時,大數據用來描述為更新網絡搜索索引需要同時進行批量處理或分析的大量數據集。隨著谷歌MapReduce和Google File System(GFS)的發布,大數據不再僅用來描述大量的數據,還涵蓋了處理數據的速度。
早在1980年,著名未來學家阿爾文·托夫勒便在《第三次浪潮》一書中,將大數據熱情地贊頌為“第三次浪 潮的華彩樂章”。不過,大約從2009年開始,“163大數據”才成為互聯網信息技術行業的流行詞匯。美國互聯網數據中心指出,互聯網上的數據每年將增長50%,每兩年便將翻一番,而目前世界上90%以上的數據是最近幾年才產生的。此外,數據又并非單純指人們在互聯網上發布的信息,全世界的工業設備、汽車、電表上有著無數的數碼傳感器,隨時測量和傳遞著有關位置、運動、震動、溫度、濕度乃至空氣中化學物質的變化,也產生了海量的數據信息。
大數據技術的戰略意義不在于掌握龐大的數據信息,而在于對這些含有意義的數據進行專業化處理。換言之,如果把大數據比作一種產業,那么這種產業實現盈利的關鍵,在于提高對數據的“加工能力”,通過“加工”實現數據的“增值”。
大數據就是互聯網發展到現今階段的一種表象或特征而已,沒有必要神話它或對它保持敬畏之心,在以云計算為代表的技術創新大幕的襯托下,這些原本很難收集和使用的數據開始容易被利用起來了,通過各行各業的不斷創新,大數據會逐步為人類創造更多的價值。
第五篇:大數據時代
《大數據時代》讀書筆記
作者:邁爾舍恩伯格
出版發行:浙江人民出版社
版次:2013年1月第一版
讀者:物流一班、時菲陽
一、作者觀點
谷歌有一個名為“谷歌流感趨勢”的工具,它通過跟蹤搜索詞相關數據來判斷全美地區的流感情況。這就是一個典型的“大數據”的應用例子,舍恩伯格的這本《大數據時代》受到了廣泛的贊譽,他本人也因此書被視為大數據領域中的領軍人物。
作者提出了三點結論:第一,要盡可能分析事物相關的“全部”數據,而不是之前的隨機抽樣,即“樣本=總體”。第二,要樂于接受數據的繁雜,而不應過分追求其精確性。第三,重視大數據呈現的“相關關系”,而不要執于探索事物間的因果關系。
二、摘抄:
在甲型H1N1流感爆發的幾周前,互聯網巨頭谷歌公司的工程師們在《自然》雜志上發表了一篇引人注目的論文。它令公共衛生官員們和計算機科學家們感到震驚。文中解釋了谷歌為什么能夠預測冬季流感的傳播:不僅是全美范圍的傳播,而且可以具體到特定的地區和州。谷歌通過觀察人們在網上的搜索記錄來完成這個預測,而這種方法以前一直是被忽略的。谷歌保存了多年來所有的搜索記錄,而且每天都會收到來自全球超過30億條的搜索指令,如此龐大的數據資源足以支撐和幫助它完成這項工作。
發現能夠通過人們在網上檢索的詞條辨別出其是否感染了流感后,谷歌公司把五千萬條美國人最頻繁檢索的詞條和美國疾控中心在03年至08年間季節性流感傳播時期的數據進行了比較。其他公司也曾試圖確定這些相關的詞條,但是他們缺乏像谷歌公司一樣龐大的數據資源、處理能力和統計技術。
雖然谷歌公司的員工猜測,特定的檢索詞條是為了在網絡上得到關于流感的信息,如“哪些是治療咳嗽和發熱的藥物”,但是找出這些詞條并不是重點,他們也不知道哪些詞條更重要,更關鍵的是,他們建立的系統并不依賴于這樣的語義理解。他們設立的這個系統唯一關注的就是特定檢索詞條的頻繁使用與流感在時間和空間上的傳播之間的聯系。谷歌公司為了測試這些檢索詞條,總共處理了4.5億個不同的數字模型。在將得出的預測與07年、08年美國疾控中心記錄的實際流感病例進行對比后,谷歌公司發現,他們的軟件發現了45條檢索詞條的組合,一旦將它們用于一個數學模型,他們的預測與官方數據的相關性高達97%。和疾控中心一樣,他們也能判斷出流感是從哪里傳播出來的,而且他們的判斷非常及時,不會像疾控中心一樣要在流感爆發一兩周之后才可以做到。
所以,09年甲型H1N1流感爆發的時候,與習慣性滯后的官方數據相比,谷歌成為了一個更有效、更及時的指示標。公共衛生機構的官員獲得了非常有價值的數據信息。驚人的是,谷歌公司的方法甚
至不需要分發口腔試紙和聯系醫生——它是建立在大數據的基礎之上的。這是當今社會所獨有的一種新型能力:以一種前所未有的方式,通過對海量數據進行分析,獲得有巨大價值的產品和服務,或深刻的洞見。基于這樣的技術理念和數據儲備,下一次流感來襲的時候,世界將會擁有一種更好的預測工具,以預防流感的傳播。
三、感想:
看完本書有如下感想:
首先,作者站在理論的制高點上,條理清楚地闡述了大數據對人類的工作、生活、思維帶來的革新,大數據時代的三種典型的商業模式,以及大數據時代對于個人隱私保護、公共安全提出的挑戰。其次,文中的事例貼近現實生活,貼近時代,令讀者既印象深刻,又感同身受。此外,作者沒有使用大量的專業術語,沒有假裝一副專業的面孔。縱觀全書,遣詞造句,均通俗易懂。
其次,作者認為大數據時代具有三個顯著特點。
一、人們研究與分析某個現象時,將使用全部數據而非抽樣數據;
二、在大數據時代,不能一味地追求數據的精確性,而要適應數據的多樣性、豐富性、甚至要接受錯誤的數據。
三、了解數據之間的相關性,勝于對因果關系的探索。“是什么”比“為什么”重要。
最后,作者指出,隨著技術的發展,數據的存儲與處理成本顯著降低,人們現在有能力從支離破碎的、看似毫不相干的數據礦渣中抽煉出真知爍見。在大數據時代,三類公司將成為時代的寵兒。一是擁有大數據的公司與組織。如政府、銀行、電信公司、全球性互聯網公
司(阿里巴巴、淘寶網)。二是擁有數據分析與處理技術的專業公司,如亞馬遜、谷歌。三是擁有創新思維的公司,他們可能既不掌握大數據,也沒有專業技術,但卻擅長使用大數據,從大數據中找到自己的理想天地。