久久99精品久久久久久琪琪,久久人人爽人人爽人人片亞洲,熟妇人妻无码中文字幕,亚洲精品无码久久久久久久

大數據時代讀書心得體會

時間:2019-05-15 14:01:17下載本文作者:會員上傳
簡介:寫寫幫文庫小編為你整理了多篇相關的《大數據時代讀書心得體會》,但愿對你工作學習有幫助,當然你在寫寫幫文庫還可以找到更多《大數據時代讀書心得體會》。

第一篇:大數據時代讀書心得體會

《大數據時代》是英國維克托·邁爾-舍恩伯格教授的著作,這本書也被尊為國外大數據研究的先河之作。下面是帶來的大數據時代讀書心得,歡迎查看。

大數據時代讀書心得體會范文

1《大數據時代》是英國維克托·邁爾-舍恩伯格教授的著作,這本書也被尊為國外大數據研究的先河之作。這本書最大的優點就在于作者利用上百個例子來對大數據的方方面面做了詳細解說,讓外行也很容易理解。結構上,作者通過大數據時代的思維變革、商業變革和管理變革三個角度依次闡述,條理清晰。

所謂“大數據”,按作者的說法,就是“所有數據”。隨著計算機運算速度和存儲能力的發展,收集數據變得越來越簡單,儲存數據的成本越來越低。在過去,由于技術限制,人們做統計時只能收集有限的數據做樣本,其中要考慮隨機樣本的選擇,努力減小因樣本問題出現的誤差;統計結果往往不能重復使用,造成數據利用率低。而現在則可以做到“樣本=總體”。數據的增多帶來不可避免的精確性問題?!靶祿睍r代,一個樣本的錯誤就可以造成對總體估計的失敗,幸運的是,“大數據”時代對精確性不再那么要求苛刻——也無法要求太嚴格——數據的數量足以彌補這一缺陷。在對思維變革這一部分的闡述中,最重要也是全書的核心觀點就是大數據時代,我們應該從追求“因果關系”的舊思維方式向追求“相關關系”轉變。在我看來,這實際上是通過大數據來透視一種事物的發展趨勢,而很多精確學科領域依然需要探尋“因果關系”解決更有針對性的問題,所以,這局限了這一轉變只能在特定的領域發生。作者自己也說,“大數據的相關性將人們指向了比探討因果關系更有前景的領域?!?/p>

大數據時代的數據獲取方式是多種多樣,數據形式也是千變萬化,任何文字、行為、萬物都可以被數據化后用來分析。對這些數據的利用,不僅要考慮到其初次使用價值,更要放眼它未來可能的用途以提高數據的利用率。當然數據并不是無限使用,時效、環境的變化肯定會對數據提出新的要求,所以數據的折舊也是應當考慮的。這又引出了對數據這一無形資產的估值可能性。對于這樣的公司來說,數據就是他們的核心,如何在資產負債表上給他們一個公正的體現正是我們需要考慮的。

大數據時代的價值鏈由三部分構成,我把它們簡化為“生產—分析—使用”三個環節,這對應書中的三種類型公司: 第一種是基于數據本身的公司,第二種是基于技能,第三種則是基于思維。在大數據早期,技能和思維最有價值,但作者認為,最終,大部分的價值還是必須從數據本身來挖掘。這是假定了一個成熟的市場,人人都了解了大數據的用途。

對于普通人來說,大數據時代最關心的還是隱私問題。不知不覺中,個人的一舉一動都暴露在政府甚至私人企業之下,還面臨潛在的泄露風險。對此,作者提出了使用者承擔責任的解決辦法,而不是過去那種流于形式的使用授權。大數據甚至能預測一個人的犯罪動機,這給監管者帶來的難題是,預測一個人要犯罪,懲罰還是不懲罰?在這點上,社會達成“個人僅需對行為而非動機負責”的共識非常重要。

大數據時代的風險控制靠的是“算法師”,類似會計師一樣的職業,對大數據的準確度或有效性進行鑒定。這能在一定程度上防止數據濫用的發生和數據獨裁。當今的法律亦需對大數據監管進行修訂補充。

當代大數據發展主要由科技公司推動,相信在不久的將來更多的傳統領域會意識到大數據的重要性。但我們也應該保持清醒,大數據并不是萬能藥,對某些領域或環節,使用大數據是一種簡單且實用的選擇;但對某些領域,盲目使用大數據只會適得其反。

大數據時代讀書心得體會范文

24月13日下午,在湖南大學東樓205參加了關于《大數據時代》的讀書交流活動。通過相互交流學習,使我更深層次的理解了大數據時代的利與弊,機遇和挑戰。在寫心得體會前,我想再重新審視一下關于大數據的歷史沿革和現實意義。

首先,最早提出“大數據”時代到來的是全球知名咨詢公司麥肯錫,麥肯錫稱:“數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對于海量數 據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來?!薄按髷祿痹谖锢韺W、生物學、環境生態學等領域以及軍事、金融、通訊等行業存在已有時日,卻因為近年來互聯網和信息行業的發展而引起人們關注。大數據作為云計算、物聯網之后又IT行業又一大顛覆性的技術革命。云計算主要為數據資產提供了保管、訪問的場所和渠道,而數據才是真正有價值的資產。企業內部的經營交易信息、物聯網世界中的商品物流信息,互聯網世界中的人與人交互信息、位置信息等,其數量將遠遠超越現有企業IT架構和基礎設施的承載能力,實時性要求也將大大超越現有的計算能力。如何盤活這些數據資產,使其為國家治理、企業決策乃至個人生活服務,是大數據的核心議題,也是云計算內在的靈魂和必然的升級方向。

其次,進入2012年,大數據(big data)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產生的海量數據,并命名與之相關的技術發展與創新。它已經上過《紐約時報》《華爾街日報》的專欄封面,進入美國白宮的新聞,現身在國內一些互聯網主題的講座沙龍中,甚至被嗅覺靈敏的國金證券、國泰君安、銀河證券等寫進了投資推薦報告。數據正在迅速膨脹并變大,它決定著企業的未來發展,雖然很多企業可能并沒有意識到數據爆炸性增長帶來問題的隱患,但是隨著時間的推移,人們將越來越多的意識到數據對企業的重要性。正如《紐約時報》2012年2月的一篇專欄中所稱,“大數據”時代已經降臨,在商業、經濟及其他領域中,決策將日益基于數據和分析而作出,而并非基于經驗和直覺。哈佛大學社會學教授加里·金說:“這是一場革命,龐大的數據資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程。”

最后,隨著云時代的來臨,大數據(Big data)也吸引了越來越多的關注。著云臺的分析師團隊認為,大數據(Big data)通常用來形容一個公司創造的大量非結構化和半結構化數據,這些數據在下載到關系型數據庫用于分析時會花費過多時間和金錢。大數據分析常和云計算聯系到一起,因為實時的大型數據集分析需要像MapReduce一樣的框架來向數

十、數百或甚至數千的電腦分配工作?!按髷祿痹诨ヂ摼W行業指的是這樣一種現象:互聯網公司在日常運營中生成、累積的用戶網絡行為數據。這些數據的規模是如此龐大,以至于不能用G或T來衡量。大數據到底有多大?一組名為“互聯網上一天”的數據告訴我們,一天之中,互聯網產生的全部內容可以刻滿1.68億張DVD;發出的郵件有2940億封之多(相當于美國兩年的紙質信件數量);發出的社區帖子達200萬個(相當于《時代》雜志770年的文字量);賣出的手機為37.8萬臺,高于全球每天出生的嬰兒數量37.1萬……,截止到2012年,數據量已經從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。國際數據公司(IDC)的研究結果表明,2008年全球產生的數據量為0.49ZB,2009年的數據量為0.8ZB,2010年增長為1.2ZB,2011年的數量更是高達1.82ZB,相當于全球每人產生200GB以上的數據。而到2012年為止,人類生產的所有印刷材料的數據量是200PB,全人類歷史上說過的所有話的數據量大約是5EB。IBM的研究稱,整個人類文明所獲得的全部數據中,有90%是過去兩年內產生的。而到了2020年,全世界所產生的數據規模將達到今天的44倍。

首先,談談大數據帶給生活的轉變。大數據已經是信息產業發展的必然趨勢,可以說,大數據現在已經開始慢慢滲透入我們的生活,如:現在流行的打車軟件、三維立體化社區的建立、某些從事生產銷售的行業利用大數據來優化規模和實現利益最大化。而我們很多人對大數據還很陌生,只是被動的適應著大數據給生活帶來的改變。大數據時代是以云計算為基礎的,所以,要實現大數據,相關的很多的硬件設備都要更新換代,信息處理系統、信息傳輸系統、信息反饋系統、信息決策系統都將面臨新的挑戰,相關產業都要重新調整產業結構,在那時,可以夸張的說,信息就是黃金,信息就是石油。大數據時代的到來會解放更多的勞動生產力,勢必將會更加加劇生產力過剩的現狀,社會兩極分化現象會更加明顯,掌握不了信息資源,很難再翻身,要防止信息壟斷帶來的可怕局面。大數據時代的到來會使人們的生活節奏急速加快,信息的時效性決定了它的流通速率,人們的生活節奏要跟上信息流通的速率,就不得不加快自己的節奏,人們會越來越忙,到那時,就像現在的日本,可能想找個人聽你說說話,真的是一件很難的事。

第二,關于數據管理的看法。大數據時代,數據管理是一件很重要的工作,如何才能避免自己的數據被非法竊取、丟失和被盜?我的看法是,人防、技防、物防一體化。人防,即我們要從思想上牢固樹立信息安全防范的意識,不主動泄露信息,要管理好自己身邊的信息設備;技防,就是要運用軟件來管理和處理數據,經常檢查更新數據庫,定時查殺電腦病毒,確保電腦狀況安全;物防,就是重要的數據一定要備份保留,而且應當做到備份與原始文件是物理隔離,無關的信息應當及時刪除,減輕硬盤的壓力。

三、怎么保護自己的隱私。隱私,顧名思義,就是不愿意讓別人看到的東西,所以,在大數據時代,更要管理好自己的隱私,以免對自己和家人造成麻煩和損失。越是隱私的信息,越要遠離網絡,不要再公開的社交網絡儲存和展示個人圖片、資料等信息,免得被非法人士采用和竊取。建議還是用紙質的日記代替電腦日記,避免信息傳播范圍太大,管理好自己的日記本。研發一種新的硬件連接器,總是以隨機碼來保護自己真實IP地址,提高網絡安全的可靠性,加強對聯網信息的管理和保護。

不論我們情不情愿,大數據時代都會到來,現實社會是我們高喊著走向大數據時代,其實大數據時代已經向我們走來,所以與其被動接受,不如主動學習,從中找到自己的出路,成為大數據時代的建設者和受益者。

第二篇:大數據時代讀書心得體會

大數據時代讀書心得體會

大數據時代讀書心得體會1

未來的十年,將是大數據引領下的智慧科技時代。不管你是否意識到它的存在,大數據都將越來越快地改變我們這個時代,包括我們的生活方式。

維克托·邁爾-舍恩伯格是最早洞見大數據時代發展趨勢的數據科學家之一。他通過一個大家熟知的事例,來幫助我們理解“大數據”的潛在影響力,那就是四個世紀之前望遠鏡和顯微鏡的發明。望遠鏡能夠讓我們感受宇宙,顯微鏡能夠讓我們觀測微生物,它們都是收集海量數據的新工具,因為這種工具的發明,人們同步更新了分析數據的技術和方法,促進了人們對世界更好的理解。如果說望遠鏡和顯微鏡是測量領域中的一場革命,那么今天的數據測量就相當于是現代版的望遠鏡、顯微鏡。隨著社交網絡的逐漸成熟,移動帶寬迅速提升,云計算、物聯網應用更加豐富,以及更多的傳感設備、移動終端接入到網絡,由此產生的數據及數據的增長速度比歷史上的任何時期都要多、都要快。一個大數據的時代,不經意間順理成章地翩然而至。

一、什么是大數據?

大數據是當前最熱門的話題之一。但什么是大數據,人們尚未給出確切的定義。首先,“大數據”是相對過去小的、局部性的數據而言的;其次,利用大數據進行分析和工作時,所依據的關于此事盡可能完整的數據,從而“一覽眾山小”,而不是采用局部的小數據,從局部推斷整體。

維克托也并未直接給出大數據的定義。不過,他用三大轉變描述了大數據的特性:

轉變之一:在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴于隨機采樣。例如一項針對相撲比賽中非法操縱比賽結果的研究對64000場比賽進行了分析,這算不上一個很大的數字,但由于這是過去十年所有的比賽,所以它是大數據。

轉變之二:由于有了更多的數據,我們可以接受更多的混雜、更多數據上的不精確。如果我們對于一個事物只有50個數據點,那么每一個數據點都必須非常精確,因為每個數據點都是有用的;但是如果我們有5000萬個,去掉10個,甚至去掉1000個都沒有太大的問題。

轉變之三:不再探求難以捉摸的因果關系,轉而關注事物的相關關系。分析大數據主要為了預測未來“是什么”,而不是“為什么”。因為很多時候我們以為我們找到了事情背后的原因,實際上卻沒有找到。更多時候知道了“是什么”就足夠了。例如知道流感將會擴散到哪里就足夠了,我不需要知道為什么;知道什么時候在網上購買機票能夠獲得最優惠的價格就足夠了,我不需要知道為什么此時價格最低。

二、大數據帶來的變化

大數據從根本上改變我們認識世界和改變世界的方式。很多傳統的習慣將被顛覆,很多舊的制度將面臨挑戰。舉例來說:

第一,科學探究的思路和方式受到挑戰

探究是新課程改革中的一個熱詞,是促進學校教學與科學研究相融合的實踐舉措??茖W探究的基本路徑是:發現問題,提出假設,制定方案,實踐探究,分析數據,得出結論。之所以會梳理出這樣一個探究的路徑,與我們對問題知曉的信息過少有關。換句話說,對所要研究的事物,我們知道的數據很少,需要從這些很小的數據出發,通過猜想和假設,進行試探性的研究,如果研究得出的結果和自己的假想是一致的,則說明我們的假說是正確的,這些假說會上升為對該事物描述的知識,我們掌握該事物的數據也隨之增加。

利用測量所獲得的點滴數據,從一個局部來推測世界是怎樣的,這是科學探究的基本思路和方式。長期以來,我們總是通過這樣的方式來認識世界,對其有宗教般的信仰。盡管我們知道,決策者總是先有了想法,才會提出假設。如果決策者自身對所研究的事情存在著偏見,所提出的`假設就很難得到實證的支持,這往往會導致探究花費了很長的時間、很大的物力和財力,也常常勞而無功。但科學研究者還是堅定不移地沿著這條道路前行,學校在教學中也將其作為科學研究的基本規范來傳授。

在大數據時代,這樣的研究方式收到了極大的挑戰。先舉個事例來說吧。手機輻射是否能夠致癌?關于這個問題,無論我們的假設如何,實驗的設計都很難進行。首先,樣本選擇過少,沒有統計學上的意義;其次,不能拿人做研究對象;第三,短時間的研究很難觀察到變化。有了大數據之后,這樣的難題就可以迎刃而解了。前段時間,丹麥就進行了這樣的研究。丹麥擁有1985年手機推出以來所有手機用戶的數據庫。他們從這個數據庫中分析了1990年至20xx年擁有手機的所用用戶的數據,同時,他們還收集了這一期間醫院收集的所有癌癥患者的數據,然后分析手機用戶是否比非手機用戶有更高的癌癥發病率。這兩個數據庫本身是完全獨立的,在作分析之前從來沒有想過可以做這樣的研究。結果表明,使用移動用戶和癌癥風險增加之間不存在任何關系。20xx年10月,這一研究的結果發表在《英國醫學雜志》上。

上述的案例告訴我們,在獲得了大量的數據,能夠對事物的整體進行全面的認識之后,假想就沒有意義了,我們可以直接根據全面的數據做出結論。

第二,傳統的思維習慣受到挑戰

因果關系思維,是人們生活中最為普遍的一種思維方式。既是看上去沒有關系的事情,人們也總是從因果的角度去理解他。比如說,1885年7月6日,巴斯德接診了一個被帶有狂犬病毒的狗咬傷的孩子,他把自己剛研制出來的狂犬疫苗給孩子注射,結果孩子活下來了。巴斯德的這一舉措,使得狂犬疫苗和孩子的生存之間建立起了一個因果關系。但事實上,人被狂犬病狗咬傷后換上狂犬病的概率是只有七分之一,就算沒有狂犬疫苗,這個孩子活下來的幾率還是有85%。

在哲學界,關于因果關系的爭論已經持續了幾個世紀。爭論的焦點在于:如果因果關系是普遍存在的,每一個果都有一個因和他相對應,世界上的所有事情都有因果的話,我們就沒有決定任何事情的自由了。盡管哲學領域的爭論很熱烈,但并不耽誤人們在日常生活中通過因果關系來思考問題。不僅如此,由于掌握的數據過少,人們還容易從線性關系的角度找尋事物之間的因果關系。在物理學中,有一種處理數據的方式之一就是“化曲為直”,設法找到兩個變量之間的線性因果關系,從而進行定量的描述。事實上,由于很多事情之間的關系是很復雜的,簡單的線性處理容易導致人們對事物本質屬性的誤解。

在大數據時代,相關關系比因果關系重要。20xx年甲型H1N1流感發生之后,美國的衛生系統極力想從因果關系上來找到流感的源頭,但信息反饋的速度太慢,讓專家們束手無策。谷歌公司做出了快速反應,把5000萬條美國人最頻繁檢索的詞條和美國疾控中心在20xx年至20xx年間季節性流感傳播時期的數據進行比較,研究特定檢索詞條的頻繁使用與流感在時間和空間上的傳播之間的聯系,很快就確定了流感是從哪個地方傳播出來的。谷歌采取的就是相關關系分析的方法,而不是因果關系分析的方法。這是大數據時代,對數據進行處理的一種典型方法。

第三,數據化比數字化更加重要

數字化是將模擬數據轉化成0和1的二進制碼,以便電腦進行數據處理的過程。過去的很長時間,我們所做的事情,就是對文本進行數字化。很多書籍包括教材,通過PDF等格式,變成了數字形態的資料,存入了電腦或者網路之中。

但是,這些數字化的資料要查詢起來并不方便。首先你要知道所需的資料在那本書中,其次你還要仔細地去翻閱這些數字化的資源,以便找到你所需要的信息。這和到書本里去找沒有本質的區別。

如果這些數字文本能夠被數據化,文本中的字、詞和段落能夠一一被識別,利用搜索殷勤加以檢索就會方便很多。所謂數據化就是將一種現象轉化為可以制表分析的可量化的過程,量化,是數據化的核心。信息只能被數據化,其巨大的潛在價值才有可能被釋放出來。

數字化帶來了數據化,但數字化不能替代數據化。今天,很多學校都在進行“電子書包”的課程教學實踐,但有不少實踐者認為,所為電子書包,就是將紙質的課本和教輔資料數字化,裝入電腦中讓學生上課中使用,這其實是對電子書包最大的誤解。電子書包的核心在于數據化,要通過對學生學習過程所記錄的大數據分析,把握學生的個性化學習特征,以便給予更有針對性的指導。

三、需要關注的一些問題

從教育的角度看,大數據時代的來臨,對教育的變革將帶來巨大的影響。

首先是教育內容要進行革新。大數據使得傳統的因果思維方式、科學研究方式不再是生活、工作起主導地位的方式,這必然要求我們在教學中要將這些變化和學生講清楚,以便他們能夠在今后走上社會的時候有足夠的能力迎接挑戰。

其次是教學方式要進行革新。過去的教學,因為沒有大量數據的支撐,該教什么全憑教師自己跟著感覺走。今天,我們可以將教師的教學視頻掛在晚上,通過深度分析學生在觀看視頻的過程中在哪些地方停頓或者重放的頻次比較高,來找出學生不明確或者課程吸引人的地方,幫助教師改進教學、確定教學重點。這必然導致教師教學方式的變革。

第三是學習路徑會發生變化。在過去,如果你想成為一個優秀的生物學家,一定要認識很多生物學家。今天,要解決一個生物難題,可能與天體物理學家或者數據視圖設計師聯系就可以實現。

第四是要防止對數據的癡迷。一方面,我們要研究學校長期以來儲存下來的大量數據,同時積累學校每天的教育數據,為進入大數據時代做好充分的思想準備;另一方面,要喚醒學校里沉睡的數據,讓其在學校管理和教師教學中發揮更大的作用;再一方面,也要防止出現另一個極端,那就是對數據的癡迷。能僅僅為了收集數據而收集數據,要讓數據在如何全面反映一個學生的能力、全面反映教師的教育質量等方面做出實踐和探索。

大數據時代讀書心得體會2

書名中的時代二字讓我陷入了深深的誤區,big data就只是大數據而已。讀完全書,也沒有發現作者有說大數據會引領一個時代的觀點,我們知道當今是一個數字化、信息化的時代,但絕不還是大數據的時代。但大數據的重要性不嚴而喻,生活、工作、學習中許多有關大數據的例子的確離我們很近,我們甚至就是眾多大數據的一部分。那大數據對我這樣一名工科大學生有什么用,對于我這一名國防生又什么用呢,這樣的一本書是否能夠更好的幫助我在未來的工作崗位上博得頭籌,取得一番成績!還有為了接觸、利用大數據并防范大數據所帶來的弊病,我又該怎么做呢?書中有這樣一句話:大數據是一種資源,也是一種工具。大數據為我們提供暫時的幫助,以便等待更好的方法和答案出現。這也提醒我們在使用這個工具的時候,應當懷有謙恭之心,銘記人性之本。

所說的謙恭之心和人性之本都強調了人在大數據時代的.重要性。我們才是數據之源,我們才應是數據的受益者。當我還沒讀完思維變革這一部分的時候,我就在思考這樣的思維變革對我會有著怎樣的影響?參加過兩次數學建模競賽的我,在兩次的參賽過程中,學會了許多數據處理和數學建模方法。數學模型所具有的對事件或數據的描述性、預測性、說明性是與大數據完全不同的。大數據下的思維變革不再追求數據的準確性和因果關系。如果我在數學建模提出一種產生某個結果的原因,我是需要明明白白地把其他因素的影響一一剔除。我記得在參加比賽最后關頭寫論文的時候,對于所研究的問題,我們必須在前面把各種變量給寫進去,然后再有選擇性的在可接受的條件下忽略掉很多變量的影響,但我們在很多時候卻給不出一個剔除這個因素的理由??扇绻悴荒芘懦羝渌囊蛩氐挠绊懀麄€的數學模型建立及計算過程就會太復雜甚至是不能得出一個結果。但是在大數據時代,一個結論是可以通過足夠多的數據得出來的,不需要明白其中的為什么。如果真是這樣,我只覺得我需要思維上的變革,可我做不到,我接受不了事物與事物之間的黑盒子。這離我太遙遠。

可我又不敢在此時否認自己將來的工作與大數據的相關性,書中第三部分——大數據時代的管理變革中就舉到一個羅伯特。麥克納馬拉的例子,他是五角大樓"統計控制隊"中一名精英,這個隊伍讓之前不知道飛機備用零件種類、數量和放置位置的軍方在制定了綜合清單之后,為部隊節省下了36億美元。而我的專業就是飛行器動力,我很清楚我國航空發動機的研究制造水平是深深限制了空軍力量的發展。在夏季學期去黎明航空發動機廠實習的時候,許多講解的師傅都會強調一點,發動機的每一個零件上都是有標號的。零件的工藝卡片上會記錄其每一個工序的加工時間、地點,加工、組裝、調試人員等的資料,這些卡片將會一直保存下去。這不僅能夠方便維修和更換,在出現事故之后,還可以追根溯源,查出事故的原因。我當時就在想還好這東西產量不是很高,一臺渦扇發動機僅僅葉片數量就是數千了。這樣的大數據肯定還可以好好利用,幫助我們去發現科技研發和制造生產中矛盾與不足,并做出改進。但航空發動機的發展需要的更多的是技術的積累,特別是關鍵技術的實驗數據我們還有著很大的缺失。我們不能像BAT這些互聯網巨頭可以輕松收集數據,航空發動機的技術積累需要一代代人在理論、實驗上的積累,才有可能在這種大數據的支撐下做出真正屬于自己的航空發動機。

這種積累利用方法可能與書中作者所說的利用大數據進行預測、創新相比起來不是足夠高端,但是新的方法需要人去摸索,我也愿意成為這樣的第一人,我也堅信大數據能夠給這樣一個領域帶來另一片天空。只是在航空發動機的領域我們是不能只停留在"是什么"這一步的!精心策劃數據的因果關系研究和控制實驗很有必要。

最后,我提出一個疑問,那就是大數據能不能創造出另一個畢加索呢?

第三篇:大數據時代心得體會

《大數據時代》心得體會

信息時代的到來,我們感受到的是技術變化日新月異,隨之而來的是生活方式的轉變,我們這樣評論著的信息時代已經變為曾經。如今,大數據時代成為炙手可熱的話題。

信息和數據的定義。維基百科解釋:信息,又稱資訊,是一個高度概括抽象概念,是一個發展中的動態范疇,是進行互相交換的內容和名稱,信息的界定沒有統一的定義,但是信息具備客觀、動態、傳遞、共享、經濟等特性卻是大家的共識。數據:或稱資料,指描述事物的符號記錄,是可定義為意義的實體,它涉及到事物的存在形式。它是關于事件之一組離散且客觀的事實描述,是構成信息和知識的原始材料。數據可分為模擬數據和數字數據兩大類。數據指計算機加工的“原料”,如圖形、聲音、文字、數、字符和符號等。從定義看來,數據是原始的處女地,需要耕耘。信息則是已經處理過的可以傳播的資訊。信息時代依賴于數據的爆發,只是當數據爆發到無法駕馭的狀態,大數據時代應運而生。

在大數據時代,大數據時代區別與轉變就是,放棄對因果關系的渴求,而取而代之關注相關關系。也就是說只要知道“是什么”,而不需要知道“為什么”。數據的更多、更雜,導致應用主意只能盡量觀察,而不是傾其所有進行推理。小數據停留在說明過去,大數據用驅動過去來預測未來。數據的用途意在何為,與數據本身無關,而與數據的解讀者有關,而相關關系更有利于預測未來。大數據更多的體現在海量非結構化數據本身與處理方法的整合。大數據更像是理論與現實齊頭并進,理論來創立處理非結構化數據的方法,處理結果與未來進行驗證。大數據是在互聯網背景下數據從量變到質變的過程。小數據時代也即是信息時代,是大數據時代的前提,大數據時代是升華和進化,本質是相輔相成,而并非相離互斥。

數據未來的故事。數據的發展,給我們帶來什么預期和啟示?金融業業天然有大數據的潛質??蛻魯祿?、交易數據、管理數據等海量數據不斷增長,海量機遇和挑戰也隨之而來,適應變革,適者生存。我們可以有更廣闊的學習空間、可以有更精準的決策判斷能力這些都基于數據的收集、整理、駕馭、分析能力,基于脫穎而出的創新思維和執行。因此,建設“數據倉庫”,培養“數據思維”,養成“數據治理”,創造“數據融合”,實現“數據應用”才能擁抱“大數據”時代,從數據中攫取價值,笑看風云變換,穩健贏取未來。

第四篇:大數據時代來臨讀書月心得體會

一部似乎還沒有寫完的書

——讀《大數據時代》有感及所思 讀了《大數據時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰栗起來?!霸谛祿r代,我們會假象世界是怎樣運作的,然后通過收集和分析數據來驗證這種假想。”“隨著由假想時代到數據時代的過渡,我們也很可能認為我們不在需要理論了。”書中幾乎肯定要顛覆統計學的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學的理論已經脫離實際”來“終結”量子力學。對此我很高興,因為統計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認為”這樣的保護傘。近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統,跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發展的大帽子。既然大數據是“通往未來的必然改變”,那我就必須“不受限于傳統的思維模式和特定領域里隱含的固 有偏見”,跟作者一起先把統計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。

當我們人類的數據收集和處理能力達到拍字節甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調查為基礎的統計學了。但是由統計學和量子力學以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!

《大數據時代》第16頁“大數據的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關系規則。兩者似乎是做同一件事??纱髷祿摹安皇且蚬P系,而是相關關系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基于因果關系。兩者好像又是對立的。在同一件事上兩種方法對立,應該只有一個結果,就是要否定掉其中之一。這就是讓我很擔心的原因。

可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!

更何況還有兩個更可怕的事情。

其一:量子力學搞了一百多年,為了處理好混雜性問題,把質量 和速度結合到能量上去了,為了調和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關系,因為爸爸就是爸爸,兒子就是兒子。那么大數據會不會通過正視混雜性,放棄因果關系最后反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢? 其二:人和機器的根本區別在于人有邏輯思維而機器沒有。《大數據時代》也擔心“最后做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現科幻電影上描述的機器主宰世界消滅人類的結果,那我還不如現在就趁早跳樓。

還好我知道自己對什么統計學、量子力學、邏輯學和大數據來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。

所以想向《大數據時代》的作者提一個合理化建議:把這本書繼續寫下去,至少加一個第四部分——大數據時代的邏輯思維。

合纖部 車民

2013年11月10日篇二:大數據時代書面記錄與心得體會

大數據時代書面記錄與心得體會 2015年5月12日,聽取了大數據時代相關技術的技術講座。當今,大數據的到來,已經成為現實生活中無法逃避的挑戰。每當我們要做出決策的時候,大數據就無處不在。大數據術語廣泛地出現也使得人們漸漸明白了它的重要性。大數據漸漸向人們展現了它為學術、工業和政府帶來的巨大機遇。與此同時,大數據也向參與的各方提出了巨大的挑戰。大數據,其影響除了經濟方面的,它同時也能在政治、文化等方面產生深遠的影響,大數據可以幫助人們開啟循“數”管理的模式,也是我們當下“大社會”的集中體現,三分技術,七分數據,得數據者得天下?!按髷祿钡挠绊懀黾恿藢π畔⒐芾韺<业男枨?。事實上,大數據的影響并不僅僅限于信息通信產業,而是正在“吞噬”和重構很多傳統行業,廣泛運用數據分析手段管理和優化運營的公司其實質都是一個數據公司。麥當勞、肯德基以及蘋果公司等旗艦專賣店的位置都是建立在數據分析基礎之上的精準選址。而在零售業中,數據分析的技術與手段更是得到廣泛的應用,傳統企業如沃爾瑪通過數據挖掘重塑并優化供應鏈,新崛起的電商如卓越亞馬遜、淘寶等則通過對海量數據的掌握和分析,為用戶提供更加專業化和個性化的服務。大數據在個人隱私的方面,大量數據經常含有一些詳細的潛在的能夠展示有關我們的信息,逐漸引起了我們對個人隱私的擔憂。一些處理大數據公司需要認真的對待這個問題。例如美國天睿資訊給人留下比較深刻印象的是他的一個科學家提出,我們不應該簡單地服從法

律方面的隱私保護問題,這些遠遠不夠的,公司都應該遵從谷歌不作惡的原則,甚至更應該做出更積極的努力。

生活,工作以及思維的大變革

——讀《大數據時代》有感及所思

讀了《大數據時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰栗起來。

本書從思維、商業、管理三個方面闡述了在大數據時代在下的變革,這些變革涉及到我們生活的方方面面,幾乎其影響程度可以與兩次工業革命相媲美。作者在第一部分提出了三個比較令人震驚的觀點,也就是大數據的精髓在于我們分析信息時的三個轉變,這三個轉變將改變我們的理解和組建社會的方法。并且作者將生活,工作思維的大變革和這幾個方面緊緊聯系在一起。

第一個轉變是,在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴于隨機采樣。也就是說樣本等于總體;第二個轉變是對研究數據不會追求精度,而且追求混雜性,小數據時代下,追求精確度是合理的,因為我們收集的數據很少,所以要越精確越好,包括如今仍然也在使用這種辦法;但是在某些時代,尤其是在大數據時代背景下,快速獲得一個大概輪廓和發展脈絡,要比精確性重要得多,既然選擇了整體性,肯定要忽視細節和確定性;第三個改變是不是因果關系而是相關關系,在大數據時代,我們更需要了解一個東西是什么,而不是為什么,要找到關聯無,通過一個良好的關聯物的相關關系可以幫助我們捕捉預測未來。

這三個方面是大數據時代所給我們帶來的思維上的改變,所謂思路決定出路,思路有了創新,有了拓展,相應的社會也就會有很大的變化。緊接著第二部分作者從萬事萬物數據化和數據交叉復用的巨大價值兩個方面,講述驅動大數據戰車在材質和智力方面向前滾動的最根本動力。第三部分則是闡述了大數據時代下的弊端以及在管理上的措施。個人認為本書的精髓部分是第一部分,第一部分的三個觀點涉及的面很廣,包括統計學、邏輯學、哲學等。后兩個部分都是以第一部分這三個觀點為基礎展開闡述的。這本書給我感觸最深的就是這三個轉變,或者說是三個觀點,可以說是哲學上說的世界觀,因為世界觀決定方法論,所以這三個觀點對傳統看法的顛覆,就會導致各種變革的發生。首先是第一個,作者認為在抽樣研究時期,由于研究條件的欠缺,只能以少量的數據獲取最大的信息,而在大數據時代,我們可以獲得海量的數據,抽樣自然就失去它的意義了。放棄了隨機分析法這種捷徑,采用所有的數據。作者用大數據與喬布斯的癌癥治療例子說明了使用全部數據而非樣本的意義,列舉了日本“相撲”等來證明使用全體數據的重要性。這個觀點足以引起統計學乃至社會文明的變革,因為統計抽樣和幾何學定理、萬有引力一樣被看做文明得以建立牢固的基石。我對這個觀點還是比較認同的,如果真能收集到整體的數據而且分析數據的工具也足夠先進,自然是全體數據研究得出的結果更令人信服。但是這個觀點也過于絕對,就算是在大數據時代要想收集到全體數據還是不太可能實現的,因為收集全體數據要付出的代價有時會很大。比如說,你要檢測食品中致癌物質是否超標,你不可能每一件食品你都檢測一遍吧。第二,要效率不要絕對的精確。作者說,執迷于精確性是信息缺乏時代和模擬時代的產物,只有5%的數據是結構化且能適用于傳統數據庫的。如果不接受混亂,剩下95%的非結構化數據都無法被利用。作者是基于數據不可能百分之百正確的考慮而做出這樣的判斷的,如果采用小數據一個數據的錯誤就會導致結 果的誤差很大,但是如果數據足夠多、數據足夠雜那得出的結果就越靠近正確答案。大數據時代要求我們重新審視精確性的優劣,甚至還說到大數據不僅讓我們不再期待精確性,也讓我們無法實現精確性。谷歌翻譯的成功很好地證明了這一點,谷歌的翻譯系統不像candide那樣精確地翻譯每一句話,它谷歌翻譯之所以優于ibm的candide系統并不是因為它擁有更好的算法機制,和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數據,并且接受了有錯誤的數據。而在閱讀這本書時,發現這本書中爭議最大的一個觀點,不僅是讀者,就算是本書的譯者也在序言中明確地說到他不認同“相關關系比因果關系更重要”的觀點。作者覺得相關關系對于預測一些事情已經足夠了,不用花大力氣去研究他們的因果關系。作者用林登的亞馬遜推薦系統的成功,證實了大數據在分析相關性方面的優勢以及在銷售中獲得的成功。沃爾瑪也是充分利用并挖掘各類數據信息的代表,從啤酒和尿布的案例,以及作者舉的有關蛋撻和颶風天氣的案例,都說明了掌握了相關關系對于他們策略的幫助。一句話,知道是什么就夠了,不用知道為什么。很明顯作者所舉的例子都是屬于商業領域的,但是對于其他領域來說這個觀點就值得商榷了。比如說,在科學研究領域,你需要知其然也需要知道其所以然,找到事件發生的原理。用文中的一個例子說明,喬布斯測出整個基因圖譜來治療癌癥,但是你治療癌癥你必須知道癌癥發病的原理,知道哪一段基因導致了這種疾病,不可能只是說收集各種數據,然后利用其相關性來判斷哪里出現了問題。

過度依賴所帶來的后果。也用《少數派的報告》這部電影來說明如果癡迷于數據會導致我們將生活在一個沒有獨立選擇和自由意志的社會,如果一切變為現實,我們將被禁錮在大數據的可能性之中。所以書中提出了幾種解決方法,一種是使用數據時征詢數據所有個人的知曉和授權。第二個技術途徑就是匿名化。毫無疑問,大數據將會給社會管理帶來巨大的變革。

在這個信息爆炸的時代,大數據給人類社會的方方面面帶來了巨大的變革,這是社會發展的潮流,不可逆轉,我們只有順應這種潮流,把握住大數據時代變革的思想,才能在時代潮流中成為佼佼者,在思維上思路上略高一籌,才能在行動中占得先機!篇四:《大數據時代》讀書心得

大數據時代,引領信息全球化

——讀《大數據時代》有感

如今說起新媒體和互聯網,必提大數據,似乎不這樣說就out了。而且人云亦云的居多,不少談論者甚至還沒有認真讀過這方面的經典著作——舍恩佰格的《大數據時代》。維克托·邁爾——舍恩伯格何許人也?他現任牛津大學網絡學院互聯網研究所治理與監管專業教授,曾任哈佛大學肯尼迪學院信息監管科研項目負責人。他的咨詢客戶包括微軟、惠普和ibm等全球頂級企業,他是歐盟互聯網官方政策背后真正的制定者和參與者,他還先后擔任多國政府高層的智囊。這位被譽為:大數據時代的預言家“的牛津教授真牛!那么,這位大師說的都是金科玉律嗎?并不一定,讀大師的作品一定要做些功課才好讀懂,如果能做足功課又具備相應的理論功底,就能與之進行一場思想上的對話。

粗淺認識之我見

舍恩伯格分三部分來討論大數據,即思維變革、商業變革和管理變革。在第一部分“大數據時代的思維變革”中,舍恩伯格旗幟鮮明的亮出他的三個觀點:

一、更多:不是隨機樣本,而是全體數據;

二、更雜:不是精確性,而是混雜性;

三、更好:不是因果關系,而是相關關系。對于第一個觀點,我不敢茍同。一方面是對全體數據進行處理,在技術和設備上有相當高的難度。另一方面是不是都有此必要,對于簡單事實進行判斷的數據分析難道也要采集全體數據嗎?我曾與香港城市大學的祝建華教授討論過。祝教授是傳播學研究方法和數據分析的專家,他認為一定可以找到一種數理統計方法來進行分析,并不一定需要全部數據。聯系到舍恩伯格第二個觀點中所說的相關關系,我理解他說的全體數據不是指數量而是指范圍,即大數據的隨機樣本不限于目標數據,還包括目標以外的所有數據。我認為大數據分析不能排除隨機抽樣,只是抽樣的方法和范圍要加以拓展。

我同意舍恩伯格的第二觀點,我認為這是對他第一個觀點很好的補充,這也是對精準傳播和精準營銷的一種反思。“大數據的簡單算法比小數據的復雜算法更有效?!备哂泻暧^視野和東方哲學思維。對于舍恩伯格的第三個觀點,我也不能完全贊同?!安皇且蚬P系,而是相關關系?!辈恍枰馈盀槭裁础保恍枰馈笆鞘裁础?。傳播即數據,數據即關系。在小數據時代人們只關心因果關系,對相關關系認識不足,大數據時代相關關系舉足輕重,如何強調都不為過,但不應該完全排斥它。大數據從何而來?為何而用?如果我們完全忽略因果關系,不知道大數據產生的前因后果,也就消解了大數據的人文價值。如今不少學者為了闡述和傳播其觀點往往語出驚人,對舊有觀念進行徹底的否定。

世間萬物的復雜性多樣化并非非此即彼那么簡單,舍恩伯格也是這種二元對立的幼稚思維嗎?其實不然,讀者在閱讀時一定要看清楚他是在什么語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤

讀。比如說舍恩伯格在提出“不是因果關系,而是相關關系。”這一論斷時,他在書中還說道:“在大多數情況下,一旦我們完成了對大數據的相關關系分析,而又不再滿足于僅僅知道‘是什么’時,我們就會繼續向更深層次研究的因果關系,找出背后的‘為什么’?!庇纱丝梢姡f的全體數據和相關關系都在特定語境下的,是在數據挖掘中的選項。

大數據研究的一大驅動力就是商用,舍恩伯格在第二部分里討論了大數據時代的商業變革。舍恩伯格認為數據化就是一切皆可“量化”,大數據的定量分析有力地回答“是什么”這一問題,但仍然無法完全回答“為什么”。因此,我認為并不能排除定性分析和質化研究。數據創新可以創造價值,這是毫無疑問的。舍恩伯格在討論大數據的角色定位時仍把它置于數據應用的商業系統中,而沒有把它置于整個社會系統里,但他在第二部分大數據時代的管理變革中討論了這個問題。在風險社會中信息安全問題日趨凸顯,數據獨裁與隱私保護成為一對矛盾。如何擺脫大數據的困境?舍恩伯格在最后一節“掌控”中試圖回答,但基本上屬于老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個問題?至少可以提供更多的思考維度。正如舍恩伯格在結語中所道:“大數據并不是一個充斥著算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來?!敝x謝舍恩伯格!讓大數據討論從自然科學回到人文

社科。由此推斷,《大數據時代》不是最終答案,也不是標準答案,只是參考答案。

此外,在閱讀此書之前還必須具備一些數據科學的基本知識和基本概念,比如說什么叫數據?什么叫大數據?數據分析與數據挖掘的區別,數字化與數據化有什么不同?讀前做些功課讀起來就比較好懂了。

淺薄之語抒我意

概念是研究的邏輯起點,“大數據”到底是什么?在百度上搜索到的解釋是,“大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊?!贝髷祿?v特點:數量(volume)、速度(velocity)、品種(variety)和真實性(veracity)。但舍恩伯格認為大數據并非一個確切的概念。他在書中的一段詮釋更具人文色彩和社會意義:“大數據是人們獲得新的認知、創造新的價值的源泉;大數據還是改變市場、組織機構,以及政府與公民關系的方法。”其實,概念的界定要看研究者從哪個角度來研究它而定。

科學家的治學態度是嚴謹的,而人文學家更具有想象力。一些對大數據不甚了然的人往往夸大了它的作用,甚至把它神化。舍恩伯格認為大數據的核心是預測?!按髷祿皇且虣C器像人一樣思考。相

反,把數學算法運用到海量的數據上來預期事情發生的可能性。”舍恩伯格甚至不回避大數據所產生的負面影響,他在第七章里談到讓數據主宰一切的隱憂。我覺得這是實事求是的科學態度。在量子力學里有一個測不準原理:一個微觀粒子的某些物理量(如位置和動量,或方位角與動量矩,還有時間和能量等),不可能同時具有確定的數值,其中一個量越確定,另一個量的不確定程度就越大。它是解釋微觀世界的物理現象,信息社會中的大數據會不會也有類似情況呢?如果我們再把凱文·凱利的《失控》對比來讀的話就更有意思了,這樣我們對整個物質世界及至人類社會就有了更全面更深刻的洞察,從物理王國到生物世界,再到信息社會。從公共衛生到商業應用,從個人隱私到政府管理,大數據無處不在。與此同時,從哪個角度探討用什么方法研究,舍恩伯格都不會忘記大數據服務人類造福人類的終極目的和價值所在?!按髷祿⒉皇且粋€充斥著運算法則和機器的冰冷世界,其中仍需要人類扮演重要角色。人類獨有的弱點、錯覺、錯誤都是十分必要的,因為這些特性的另一頭牽著的是人類的創造力、直覺和天賦。偶爾也會帶來屈辱或固執的同樣混亂的大腦運作,也能帶來成功,或在偶然間促成我們的偉大。這提示我們應該樂于接受類似的不準確,因為不準確正是我們之所以為人的特征之一?!庇弥袊拋碚f就是“人無完人”,人類在收獲大數據帶來的紅利的同時也要承受它帶來的危害。這不是對立統一的辯證唯物主義?我把它看作帶著歐洲批判學派色彩的科學發展觀。篇五:《大數據時代》讀書心得

大數據時代,引領信息全球化

——讀《大數據時代》有感

如今說起新媒體和互聯網,必提大數據,似乎不這樣說就out了。而且人云亦云的居多,不少談論者甚至還沒有認真讀過這方面的經典著作——舍恩佰格的《大數據時代》。維克托·邁爾——舍恩伯格何許人也?他現任牛津大學網絡學院互聯網研究所治理與監管專業教授,曾任哈佛大學肯尼迪學院信息監管科研項目負責人。他的咨詢客戶包括微軟、惠普和ibm等全球頂級企業,他是歐盟互聯網官方政策背后真正的制定者和參與者,他還先后擔任多國政府高層的智囊。這位被譽為:大數據時代的預言家“的牛津教授真牛!那么,這位大師說的都是金科玉律嗎?并不一定,讀大師的作品一定要做些功課才好讀懂,如果能做足功課又具備相應的理論功底,就能與之進行一場思想上的對話。粗淺認識之我見 舍恩伯格分三部分來討論大數據,即思維變革、商業變革和管理變革。在第一部分“大數據時代的思維變革”中,舍恩伯格旗幟鮮明的亮出他的三個觀點:

一、更多:不是隨機樣本,而是全體數據;

二、更雜:不是精確性,而是混雜性;

三、更好:不是因果關系,而是相關關系。對于第一個觀點,我不敢茍同。一方面是對全體數據進行處理,在技術和設備上有相當高的難度。

第五篇:大數據時代讀書報告

這本書里主要介紹的是大數據在現代商業運作上的應用,以及它對現代商業運作的影響?!?大數據時代》這本書的結構框架遵從了學術性書籍的普遍方式。也既,從現象入手,繼而通過對現象的解剖提出對這一現象的解釋。然后在通過解釋在對未來進行預測,并對未來可能出現的問題提出自己看法與對策。

下面來重點介紹《大數據時代》這本書的主要內容。

《大數據時代》開篇就講了google通過人們在搜索引擎上搜索關鍵字留下的數據提前成功的預測了2009年美國的h1n1的爆發地與傳播方向以及可能的潛在患者的事情。google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發一兩個周之后才可以弄到相關的數據。同時google的預測與政府數據的相關性高達97%,這也就意味著google預測數據的置信區間為3%,這個數字遠遠小于傳統統計學上的常規置信區間5%!而這個數字就是大數據時代預測結果的相對準確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數據時代“樣本=總體”的思想。我們都知道當樣本無限趨近于總體的時候,通過計算得到的描述性數據將無限的趨近于事件本身的性質。而之前采取的“樣本<總體”的做法很大程度上無法做到更進一步的描述事物,因為之前的時代數據的獲取與存儲處理本身有很大的難度只導致人們采取抽樣的方式來測量事物。而互聯網終端與計算機的出現使數據的獲取、存儲與處理難度大大降低,因而相對準確性更高的“樣本=總體”的測算方式將成為大數據時代的主流,同時大數據時代本身也是建立在大批量數據的存儲與處理的基礎之上的。

接下來,維克多又通過了ibm追求高精確性的電腦翻譯計劃的失敗與google只是將所有出現過的相應的文字語句掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯系google詞庫就會出現翻譯,雖然有的時候的翻譯很無厘頭,但是大多數時候還是正確的,所以google的電腦翻譯的計劃的成功,表明大數據時代對準確性的追求并不是特別明顯,但是相反大數據時代是建立在大數據的基礎住上的,所以大數據時代追求的是全方位覆蓋的數字測度而不管其準確性到底有多高,因為大量的數據會湮埋少數有問題的數據所帶來的影響。同時大量的數據也會無限的逼近事物的原貌。

之后,維克托又預測了一個在大數據時代催生的重要職業——數據科學家,這是一群數學家、統計學與編程家的綜合體,這一群人將能夠從獲取的數據中得到任何他們想要的結果。換言之,只要數據充足我們的一切外在的與內在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現得淋漓盡致。所以為了避免個人隱私在大數據時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數據為商業部門服務,而另一群人則負責審查這一些人是否合法的獲得與應用數據,是否侵犯了個人隱私。無論如何,大數據時代將會到來,不管我們接受還是不接受!而且這兩年,大數據這個詞突然變得很火,不僅出現在阿里巴巴、谷歌等互聯網公司的戰略規劃中,同時在我國國務院和其他國家的政府報告中多次提及,無疑成為當今互聯網世界中的新寵兒。我對大數據一直好奇已久,閱讀了很多資料仍不得其解,直到讀完《大數據時代》才有了粗略的認識。

我側重于從第一部分中的這三個觀點談談自己的看法,這三個觀點可以說是哲學上說的世界觀,這三個觀點可以說是哲學上說的世界觀,因為世界觀決定方法論,所以這三個觀點對傳統看法的顛覆,就會導致各種變革的發生。首先是第一個,作者認為在抽樣研究時期,由于研究條件的欠缺,只能以少量的數據獲取最大的信息,而在大數據時代,我們可以獲得海量的數據,抽樣自然就失去它的意義了。放棄了隨機分析法這種捷徑,采用所有的數據。作者用大數據與喬布斯的癌癥治療例子說明了使用全部數據而非樣本的意義,列舉了日本“相撲”等來證明使用全體數據的重要性。這個觀點足以這個觀點足以引起統計學乃至社會文明的變革,因為統計抽樣和幾何學定理、萬有引力一樣被看做文明得以建立牢固的基石。我對這個觀點還是比較認同的,如果真能收集到整體的數據而且分析數據的工具也足夠先進,自然是全體數據研究得出的結果更令人信服。但是這個觀點也過于絕對,就算是在大數據時代要想收集到全體數據還是不太可能實現的,因為收集全體數據要付出的代價有時會很大。比如說,你要檢測食品中致癌物質是否超標,你不可能每一件食品你都檢測一遍吧。

第二,要效率不要絕對的精確。作者說,執迷于精確性是信息缺乏時代和模擬時代的產物,只有5%的數據是結構化且能適用于傳統數據庫的。如果不接受混亂,剩下95%的非結構化數據都無法被利用。作者是基于數據不可能百分之百正確的考慮而做出這樣的判斷的,如果采用小數據一個數據的錯誤就會導致結果的誤差很大,但是如果數據足夠多、數據足夠雜那得出的結果就越靠近正確答案。大數據時代要求我們重新審視精確性的優劣,甚至還說到大數據不僅讓我們不再期待精確性,也讓我們無法實現精確性。谷歌翻譯的成功很好地證明了這一點,谷歌的翻譯系統不像candide那樣精確地翻譯每一句話,它谷歌翻譯之所以優于ibm的

candide系統并不是因為它擁有更好的算法機制,和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數據,并且接受了有錯誤的數據。第三個觀點,不是因果性,而是相關性,這是這本書中爭議最大的一個觀點,不僅是讀者,就算是本書的譯者也在序言中明確地說到他不認同“相關關系比因果關系更重要”的觀點。作者覺得相關關系對于預測一些事情已經足夠了,不用花大力氣去研究他們的因果關系。作者用林登的亞馬遜推薦系統的成功,證實了大數據在分析相關性方面的優勢以及在銷售中獲得的成功。沃爾瑪也是充分利用并挖掘各類數據信息的代表,從啤酒和尿布的案例,以及作者舉的有 關蛋撻和颶風天氣的案例,都說明了掌握了相關關系對于他們策略的幫助。一句話,知道是什么就夠了,不用知道為什么。很明顯作者所舉的例子都是屬于商業領域的,但是對于其他領域來說這個觀點就值得商榷了。比如說,在科學研究領域,你需要知其然也需要知道其所以然,找到事件發生的原理。用文中的一個例子說明,喬布斯測出整個基因圖譜來治療癌癥,但是你治療癌癥你必須知道癌癥發病的原理,知道哪一段基因導致了這種疾病,不可能只是說收集各種數據,然后利用其相關性來判斷哪里出現了問題

作者在書中把大數據說的很厲害,在最后一部分分析大數據帶來無數好處的同時帶來的不良影響以及如何面對這些影響。用麥克納馬拉的例子來說明對數據過度依賴所帶來的后果。也用《少數派的報告》這部電影來說明如果癡迷于數據會導致我們將生活在一個沒有獨立選擇和自由意志的社會,如果一切變為現實,我們將被禁錮在大數據的可能性之中。所以書中提出了幾種解決方法,一種是使用數據時征詢數據所有個人的知曉和授權。第二個技術途徑就是匿名化。毫無疑問,大數據將會給社會管理帶來巨大的變革。

大數據給人類社會的方方面面帶來了巨大的變革,這是社會發展的潮流,不可逆轉,我們只有順應這種潮流,在思想上和技能上做好準備才能成為時代的弄潮兒。對于一家公司或一個國家,要從根本上改變思維和觀念,盡早適應這種潮流。

最后,附上一段來自原著的結語:

大數據并不是一個充斥著算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。篇二:《大數據時代》讀書報告

讀書報告

——讀《大數據時代》

坦白地說,這是我第一本看了睡不著的書,我還記得第一次閱讀時的興奮和激動,就像一場頭腦風暴。書里的事例是那么的鮮活與生動,完全顛覆我的思維方式,打破了我大腦中解決問題原有的枷鎖。這本書讓我明白了太多~~~ 它讓我明白生活必須要主動。有些人碰到了不公就自認倒霉,能干一點的可能還會去討個說法,但并沒有解決實際問題,這一次可能挽回了那么一點點的損失,但下次遇到了仍是如此,無限循環。當你絞盡腦汁為了節約成本而提前一個月去購買一張你自以為廉價的飛機票,回頭卻發現,比那些只提前一天購買的人所付的錢還要高出很多時,不知你會怎么想?是被動的接受還是想方法讓現實變得更美好? 它讓我更好地去理解現實生活的很多情況?,F在才理解,為什么網絡上有這么多驗證碼的存在,為什么社交網要用實名制注冊,為什么有這么多的“我猜你喜歡”~~~ 雖然我很喜歡那些“黑匣子”,會讓我感覺很神奇,但當我真正理解的他的原理時,其實更讓我興奮不已。原來谷歌翻譯背后是這樣操作的,原來那些每天時不時闖進我們眼球的廣告并非偶然,原來預測流感不需要疾控中心而是網絡詞條,原來電影在開播前就已經知道了收視率和票房~~~ 當然以上這些相當抓人眼球,但這只是大數據的表面,其真正的價值遠不僅如此。人類總是以為自己很強大,能控制一切,當然最好還能預測未來。其實大數據真的可以做到,雖然不可能很精確。在我看來這樣更好,大致結果可以意料,這就夠了,如果發現結果不盡如人意,我們可以提前控制。當然還會有我們意想不到的情況發生,這樣會讓未來更充滿想象,更加充滿期待。

它讓我懂得不能墨守成規,也不能自以為是。大數據環境是那些微型企業發展的福地,它是行業競爭重新洗牌的動力源泉。在大數據面前,小公司不需要妄自菲薄,大的商業帝國也只有打氣十二分的精神才可能讓自己立于不敗之地。

他讓我知道沒有做不得,只有想不到?,F在的賺取資本的方式已經不再是單靠苦力就可以解決問題的時代了,看見朋友圈里的那些做代購的,都在自我催眠“不要看我們現在是微商~~~微商將來前途無量~~~·”我一直都抱著看看不說話的心態,難免也會哂笑,真的不知道他們和菜場賣菜的有什么本質區別~~~現在是一個依靠知識科技來富國強兵的時代了,真正的優勢來源于你提前想到了別人還沒去想的,提早完成了別人還沒有籌備的計劃。

他讓我學會世界上沒有光桿司令,我們必須學會合作。一個人的能力是有限的,一個人的時間也是有限的,同樣公司,國家都是一樣的。我們知道谷歌,亞馬遜,facebook以及中國的阿里巴巴,百度,新浪這些企業都很強大,可是他們仍然在不斷收購合并整合其他一些小的公司,為的是引用他們的科技技術來強大自己的事業版圖。

它還教會我在機會面前必須要眼疾手快。在你還在猶豫不決或是自我陶醉的時候,你的對手已經用一個非常低廉的價格得到了他想要翻身的王牌,當你發現時,要么花大血本去換取一張相似的王牌,要與他赤身搏斗。大部分情況下那些聰明的人往往會選擇前者,因為他們知道寧可為自己現在的失誤埋單也不會讓自己靠近萬丈深淵。因為若喪失了主動權,那么很有可能導致的結果就是,那個原來看起來微不足道的“小木樁”卻扳倒了你這體積龐大的“大象”。

說了這么多大數據給我的啟示,其實就是想突出大數據背后的那種神奇的力量。在近代我們似乎與每一樣新的科技都失之交臂,但是這一次我們似乎還有機會和時代同步伐,甚至如果我們足夠重視,可能還會走在時代的前沿。雖然我們現在誰都沒有把握中國到底會利用大數據到什么程度,但已經有好多像周濤一樣的有志之士看好中國在利用大數據上的實力,并且付諸了他們的努力。他們一直都堅信以前的落后僅僅是時間上的后知后覺,他們在這一次想

要做到與世界同步,和歐美同步發行此書,在最早一刻就向大家推廣大數據這一新名詞,向大家灌輸著大數據的思維。對此,我也很慶幸,在恰當的時間點與大數據的偶遇。

當然,世界上沒有十全十美的東西,再好的發明總是有它的缺陷,大數據也不會例外。舍恩伯格這個對大數據最有權威發言權的人,既然有能力將大數據的好處講得淋漓盡致,毫無疑問自然也是最清楚大數據危險的人。我很尊敬他的嚴謹和坦誠,他在細致入微地解釋大數據革命性優勢的同時,毫無修飾地點明了大數據的劣根性。他很準確地說明了如果我們濫用或誤用數據,我們將會受到毀滅性的打擊,后果將會如何不堪設想,并且這篇幅一點都不敷衍。作者非常專業,他并沒有像某些專家一樣,一味地鼓吹自己的“一家之言”。而是在我們頭腦發熱,一哄而上之前,就給我們非常而且深刻的警醒。這也正是大數據思維的其中之一:饋前控制。

讀完這本書以后,我有的確一點蠢蠢欲動,因為它讓我覺得大數據并沒有像想象的那么遙不可及。書中說,會好好利用大數據的有三種人:第一種是擁有龐大數據庫的政府或者商業機構,他們之前只是不知道那些塵封已久的數據還可以創造巨大的價值。第二種是利用技術手段,讓數據發揮它獨特功能,從而幫他們解決實際問題的數據分析學家,統計師,精算師和其他一些有關于處理數據的相關人員,他們非常了解數據的狀態,結構和特征。的確這兩類人實力雄厚,前者擁有數據本身,而后者擁有技術。但他們有著同樣的短板,那就是他們沒有更為創新,靈動的視野,他們很難或者說沒有更多的時間去發現那些數據的真正力量。因為他們有太多的思維定式,但種種利用大數據的成功事例表明,每次數據創造的奇跡總在那么的偶然和不經意之間。而這正是我們第三種人的長處,我們沒有思維定式,更有閑暇的時間來感受生活,激發靈感。篇三:大數據時代讀書筆記

大數據時代——讀書筆記

一、引論

1.大數據時代的三個轉變: 1.可以分析更多的數據,處理和某個現象相關的所有數據,而不是隨機采樣 2.不熱衷于精確度

3.不熱衷與尋找因果關系 2.習慣:用來決策的信息必須是少量而精確的。實際:數據量變大,數據處理速度變快,數據不在精確

3.危險:不是隱私的泄露而是未來行動的預判

二、大數據時代的思維變革 1.原因:沒有意識到處理大規模數據的能力,假設信息匱乏,發展一些使用少量信息的技

術(隨機采樣)

1.1086年 末日審判書 英國對人的記載 2.約翰·格朗特:統計學,采樣分析精確性隨著采樣隨機性上升而大幅上升,與樣本數

量關系不大

3.1890年,穿孔卡片制表機,人口普查 4.隨機采樣有固有的缺陷 1.采樣過程中存在偏差 2.采樣不適合考察子類別

3.只能得出實現設計好的問題的結果 4.忽視了細節考察

2.全數據模式:樣本=總體 1.通過異常量判斷信用卡詐騙 2.大數據分析:不用隨機抽樣,而是采用所有數據。不是絕對意義而是相對意義。

(xroom信用卡詐騙,日本相撲比賽)3.多樣性的價值(社區外聯系很多》社區內聯系很多)3.混雜性而非精確性 1.葡萄樹溫度測量:數據變多,雖然可能有錯誤數據,但總體而言會更加精確。2.包容錯誤有更大好處

3.word語法檢查:語料庫》算法發展 4.google翻譯:讓計算機自己估算對應關系,尋找成千上萬對譯

結論:大數據的簡單算法好過小數據的復雜算法 5.大數據讓我們不執著于也無法執著于精確 6.mit的通貨緊縮軟件:即時的大數據 7.標簽:不精確

8.想要獲得大規模數據的好處,混亂是一種標準途經 9.新的數據庫:大部分數據是非結構化的,無法被利用 10.hadoop:與mapreduce系統相對的開源式分布系統,輸出結果不精確,但是非???結論:相比于依賴小數據和精確性的時代,大數據因為更強調數據的完整性和混雜性,幫助我們進一步接近事情的真相?!安糠帧焙汀贝_切“的吸引力是可以理解的。但是當我們的視野局限在我們可以分析和確定的數據上時,我們對世界的整體影響就會產生偏差和錯誤。不僅失去了盡力收集一切數據和活力,也失去了從不同角度觀察時間的權利。

三、不是因果是相關 1.知道是什么就夠了,不需要知道為什么。1.亞馬遜放棄書評組,使用大數據預測人們的未來購書需求 2.2.在小數據世界,相關關系有用,但是大數據背景,相關關系大放異彩。通過找關聯 物,相關關系可以幫助我們捕捉現在和預測未來 1.a和b經常一起發生,那么a發生時可以預測b發生 2.例子:沃爾瑪把颶風用具和蛋撻放在一起 3.過時的尋找關聯物的方法 a)原因:數據少且收集花時間 b)在建立,應用假想和選擇關聯物時容易犯錯誤 c)結論:我們不需要人工選擇關聯物 3.大數據的相關分析法更準確,更快 1.例子:fico我們知道你明天會做什么 2.伊百麗:根據個人信用卡交易記錄預測個人收入,防止逃稅 3.aviva:根據生活方式數據預測疾病 4.美國零售商target:通過購買習慣預測是否懷孕 4.通過找出新種類數據的相互聯系解決日常需要:找到關聯物并監控,我們可以預知未來

1.例子:ups與汽車修理預測 2.新生兒健康監測:肉眼看不到,但是計算機能看到 5.當收集分析和儲存數據的成本較高時,應當適當丟棄一些數據 6.數據的非線性關系 1.幸福的非線性關系 7.快速思維模式使人們偏向于用因果關系看待周圍的一切,因此經常對世界產生錯誤認識。這也使大腦為了避免辛苦思考而產生的捷徑。大數據會經常被用來證明我們習慣的思維方式是錯誤的。8.證明因果關系的實驗開銷大,難于操作;相關關系很有用,不僅是因為能為我們提供新的視角,而且提供的視角都很清晰。一旦我們考慮因果關系,這些視角會被蒙蔽。9.大數據并非是理論消亡的時代。

四、一切皆可量化 1.莫里的信息交換計劃:總結所有船只的航海日志已獲得好的航線,為第一根大西洋電纜奠定基礎

2.坐姿研究與汽車防盜系統 3.數據化

1.把現象轉變成可指標分析的量化形式的過程 2.計量和記錄促成了數據: 1.阿拉伯數字 2.計數板 3.復式記賬法

3.數字化與數據化的區別

1.例子:google的數字圖書館:開始使用掃描-》數字化,進而光學識別-》數

據化。google借此改進自己的翻譯 2.文化組學:定量分析揭示人類行為 4.文字變成數據:人可以閱讀,機器可以分析 5.方位變成數據:需要一套標準的標記系統和收集,記錄數據的工具。1. 始于古希臘

2.1884年,國際子午線會議 3.1978年,全球定位系統 4.英國汽車保險

5. ups的最佳行車路線:減少左轉 6.收集用戶地理位置數據,以便進行忠誠度計劃?;蛘呖梢灶A測交通情況 6.現實挖掘

1.處理大量手機數據,發現并預測人類的行為。2.例子:預測流感隔離區域 3.例子:通過非洲預付費用戶的位置信息和他們賬戶的資金,發現貧民窟是

經濟繁榮的跳板 7.溝通變成數據

1.facebook:社交關系數據化

號。新推特頻率可以預測電影票房

可能性呈現正相關 8.萬物數據化

1.觸覺地板:適時開關燈,確定身份,某人摔倒之后是否站起來 2.人體傳感器:監控健康狀態 4.結論:世界的本質是信息和數據,大數據提供新視角。

五、大數據的潛在價值 1.例子:captcha(驗證碼,全自動區分人類和電腦的圖靈測試)與數據再利用。作者使用了新的驗證碼recaptcha,人們從計算機光學字符識別程序無法識別的文本掃面項目中讀入單詞并輸出,知道他們都輸出正確后才確定(用來破譯數字化文本中不清楚的單詞)2.大數據時代,所有的數據都是有價值的?,F在,我們能夠以較低成本獲取并存儲數據。數據的真實價值就像漂浮在海洋中的冰山,絕大部分隱藏在表面之下。3. 不同于物質性的東西,數據的價值不會隨它的使用而減少,而且可不斷被處理。意味著數據的最終價值遠遠大于它的最初價值。在基本用途完成后,數據的價值仍然存在,數據的價值是其所有可能用途的總和。4.例子:ibm與電力汽車動力系統的優化預測:大數據預測模型,甚至考慮天氣預報 5.數據再利用:

1. 搜索關鍵詞,搜索結果預測夏天流行色 2.google保存語音翻譯記錄,開發自己的語音識別技術 3.移動運營商長期使用大數據微調網絡性能 4.有些公司可能會收集到大量的數據,但是他們并不急需使用,也不擅長使用數據,但是別的公司可以借此探尋數據的潛在價值 8.重組數據 1.例子:丹麥癌癥協會與手機致癌調查:使用所有的手機用戶信息和所有的中樞神經系統腫瘤信息。

隨著大數據的出現,數據的總和比部分更有價值,當我們將多個數據集的總和重組在一起,重組總和本身的價值也比單個總和更大 9.可拓展數據 1.google街景和gps采集,不僅將其用于基本用途,而且進行了大量的二次利用。例如,對google自動駕駛汽車的運作 10.數據的折舊值

1.隨著時間的推移,大多數數據都會失去一部分基礎用途,不應用此破壞新數據 2.挑戰:如何得知某些數據不再有價值 3.并非所有數據都會貶值。例子:google希望得到每年的同比數據

結論:組織機構應收集盡可能多的使用數據并保存盡可能長的時間。同時也應該與第三方分享數據

11.數據廢氣:用戶在線交互的副產品,包括瀏覽哪些頁面,停留多久,輸入信息等 1.數據再利用的方式很隱蔽 2.例子:google的拼寫檢查:搜集每天處理的查詢中數據搜索框的錯誤拼寫 3.例子:google的過濾噪音技術:如果用戶點擊搜索結果靠后的鏈接,說明這個結果更加有相關性,google會把這個頁面的排名相應提升。4.當用戶指出了各種自動化程序的錯誤,實際上是訓練了系統 5.例子:巴諾與數據快照,電子書閱讀器捕捉人們閱讀書籍的習慣 6.例子:coursera通過捕捉學生犯的錯誤來提示未來犯錯誤者

結論:數據廢氣可以成為公司的巨大競爭優勢,和對手的強大進入堡壘 12.開放數據 1.最大的數據收集者:政府,可以強迫人們提供信息,但是信息利用效率低下。最好允許私人運營部門和社會大眾訪問

2.例子:flyontime網站,通過開放的數據分析航班延誤可能性。3.給數據估值:從數據持有人在價值提取上所采取的不同策略入手,將數據授權給第三方

三、角色定位:數據,技術與思維 2.思維轉變的重要性 3.三種大數據公司

1.基于數據本身的公司:twitter 大數據最值錢的是他本身,所以應該優先考慮數據擁有者

例子:機票預訂系統ita不直接使用數據:擔心暴露利潤

例子:mastercard通過大數據預測客戶的消費習慣 2.基于技能的公司:咨詢公司,技術供應商或者分析公司:teradata 例子:埃森哲公司利用大數據檢測汽車零件并節省費用

例子:微軟分析公司利用大數據降低病人的再入院率 3.基于思維的公司:創新思維

例子:flightcaster飛機晚點預測

例子:prismatic分析新聞并排序 4.大數據先驅者一般有跨學科的知識 5.例子:google和amazon三者兼備 6.全新的數據中間商:從各個地方搜集數據,提取有用的信息進行利用,并不威脅數據擁有者的利益

1.社會需要定向廣告

例子:inrix:分析各種汽車制造者的數據和用戶的數據,提供衛星導航服務

汽車制造商們本身數據量不夠,自身也沒有技術利用大數據,也并不介意數據會被中間商利用。同時可以提供失業率等相關數據

例子:quantcast:收集用戶訪問信息來測評用戶年齡等,之后發定向廣告

例子:hcci收集醫療保單,分析美國醫療費用上漲是否合理

結論:

1.數據價值的轉移:從技術到數據本身和大數據思維 2.傳統商業模式顛覆:交易數據而不是交易技術 3.傳統專家的光芒會被統計和數據學家取代,因為后者只關心數據 1.例子:谷歌翻譯團隊的工程師都不會說出翻譯的語言 2.真正的專家不會消亡,但是主導地位會改變 3.專業技能只適用于小數據時代,因為那是需要依靠直覺和經驗指導,但是

遭遇海量數據時,可以通過數據挖掘得到更多 4.數據和統計學知識將成為現代工廠的基礎,人類的價值體現在交流上,以進行廣泛而深刻的傳播

1.例子:交互式游戲,會根據用戶來改良,以數據為基礎運作 5.大數據決定企業核心競爭力 1.數據規模決定價值

2.例子:勞斯萊斯通過大數據監測引擎,預測可能出問題的引擎 3.例子:蘋果進軍手機 4.大數據為小公司帶來了機遇:能享受非固有資產規模的好處,低成本傳播創新結果,只需要創新思維

5.大數據擁有者會想辦法增加數據存儲量 6.消費者成為數據擁有者并與中間商交易 7.大數據對中等規模的公司幫助不大:既沒有靈活性也沒有規模效應 6.大數據撼動國家競爭力:西方世界優勢減少

四、大數據時代的管理

1.大數據會帶來很多危險,因為其核心思想是用規模劇增來改變現狀。2.濫用大數據的力量會傷害人身安全 3.大數據的二次利用顛覆了隱私保護法:無法征得個人同意 4.如果所有人的信息在數據庫里,有意識地避免就是此地無銀三百兩 5.匿名化:交叉檢驗會檢驗出來 6.大數據預測:罪責判定基于對個人未來行為的預測。大數據可能會否定人的自由意志 7.數據有其局限性,數據的質量可能會很差,有誤導性。8.卓越的才華并不依賴數據:apple喬布斯的才能

五、掌握大數據 1.個人隱私保護:從個人許可到讓數據使用者承擔責任,因為將責任從民眾轉移到數據使用者很有意義因為數據使用者比其他人更明白他們想怎么樣使用數據,也因為他們是最大利益獲得者:監管機制可以決定不同種類的個人數據必須刪除的時間 2.信息模糊處理

3.個人應該為他們的行動而非傾向負責 4.打破大數據的黑盒子:大數據算法師:評估數據源,分析數據工具,解讀運算結果 1.外部算法師:審計大數據的準確程度和有效性篇四:讀書筆記-《大數據時代》

讀《大數據時代》 初次見到維克多·邁爾-舍恩伯格教授是在《對話》欄目中,當時談及當今各種科技信息的變化,然后在主持人的各種提問下,我逐漸了解到“大數據”這個名詞,他也是現在對于大數據最有發言權的預言家。一位睿智的人總是能夠給人留下很深的印象。然后在中央財經頻道的特別節目《指尖上的商機》系列節目中,也談及到大數據對于當今時代的影響和蘊藏的巨大商機。

讀一本好書就像與智者交談。今天我翻讀《大數據時代》,細細品讀這位智者給我們的禮物。我們首先應該明白一個概念“大數據”,他不是單單的說數據很大,或者數據很多的意思,真正的意思是:不用隨機分析法這樣的捷徑,而采用所有數據的方法。它告訴我們一種超越現在的對于數據的一種分析方法,這個方法建立在盡可能多的數據上。下面讓我們合上此書,讓他從我們的思想深處開始發聲吧。

首先,大數據時代是建立的基礎就是有一個很龐大的數據庫,我們分析的對象不是抽取樣本,而是用全部的數據作為樣本,“樣本=總體”。這樣我們能夠把要調查的對象精確到每一個個體,我們能夠對每一個個體提供個性化分析和服務。我們會擺脫抽樣樣本的誤差和失誤,同樣我們能夠細化我們研究的對象和分析的數據。我們分析的適合一個大的整體,也適合每一個個體。這是大數據分析的基礎。

第二,大數據是由很多不同的紛繁復雜的數據匯總在一起的,我們必須接受他們的復雜性和不精確性,我們的研究方向除了尋找因果關系之外,增加了一種相關關系的研究。我們通過數據之間的關系,分析得到我們想要得到的結論或者是模型。在這里我們應該重點看一下,相關關系是我們打開的另一扇窗,而不能關閉因果關系的現在開著的窗戶。我們開始重視相關關系,但是不能放棄對于因果關系的研究。作者也在文中闡釋我們的生活還是需要因果關系的,甚至我們需要大數據算法師,我們需要了解“黑匣子”中的神秘。這是大數據時代我們應該正確認識的。

第三,大數據的原始來源是用不同的方法收集,為了有盡可能多的數據,我們現在有了電腦,搜索引擎,智能手機,可穿戴設備,社交平臺,還有無數的傳感器等等,我們可以把文字,位置,動作,喜好等所有的世界進行量化,他都可以用數字表示,這就是我們所有的紛繁復雜的原始數據,他們是一座鉆石礦,由于無數種的相關組合可以不斷地挖掘出我們所需要的信息。這是我們不斷利用大數據的基礎。我們需要不斷更新的數據。

第四,未來在過去的塵埃中。我們分析大數據最大的作用就是預測未來,知道下一步你會做什么,知道下一個最危險的事物或人。我們用什么方法預測未來。這是一個商業,政府,甚至世界的時代,我們分析的方法就是動用自己敏銳的思維發現相關性,然后動用我們的數據分析工具對其進行相關性分析,最后我們用統計學研究出一個模型。通過模型我們能夠預測未來。大數據分析的關鍵就在于數據,思維和技術?,F在我們有快速分析的工具,正在不斷收集數據,那么最重要的就是人類的思維,一個能夠分析相關性,能夠創新使用數據的思維。在大數據時代我們需要把統計學,軟件工程師和創新思維結合在一起的人才。

第五,我們能夠知道每一個人的位置,喜好,關注什么,即將干什么等等,對于每個人來說都是一個很可怕的事情,如果我們赤裸裸的暴露在陽光之下,或者我們正在暴露中,我們的隱私應該受到保護,這也是大數據時代一個亟待解決的問題,盡管我們匿名分析信息,到最后我們還是能夠精確到個人,我們需要有人負責,這是安全問題,自由和科技或商業的發展產生矛盾,我們應該何去何從?我們擔憂的,相信會有人來解決。這涉及到我們每個人的利益。

來暴露我們需要的產品;我們用百度、google來暴露我們所關注的事情。我想有好多雙眼睛正在盯著我們,只是我們還不知道。這是一件可怕的事情。

下載大數據時代讀書心得體會word格式文檔
下載大數據時代讀書心得體會.doc
將本文檔下載到自己電腦,方便修改和收藏,請勿使用迅雷等下載。
點此處下載文檔

文檔為doc格式


聲明:本文內容由互聯網用戶自發貢獻自行上傳,本網站不擁有所有權,未作人工編輯處理,也不承擔相關法律責任。如果您發現有涉嫌版權的內容,歡迎發送郵件至:645879355@qq.com 進行舉報,并提供相關證據,工作人員會在5個工作日內聯系你,一經查實,本站將立刻刪除涉嫌侵權內容。

相關范文推薦

    大數據時代讀書心得

    生活,工作以及思維的大變革 ——讀《大數據時代》有感及所思 讀了《大數據時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯......

    大數據時代讀書心得

    一部似乎還沒有寫完的書——讀《大數據時代》有感及所思讀了《大數據時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作......

    讀大數據時代心得體會

    利用周末,一口氣讀完了涂子沛的大作《大數據》。這本書很好看,行文如流水,引人入勝。書中,你讀到的不是大數據技術,更多是與大數據相關的美國政治、經濟、社會和文化的演進。作......

    讀書報告——《大數據時代》觀后感

    讀書報告——《大數據時代》觀后感 大數據時代,一個被嚼爛的詞匯,不知從何時起,興起了數據科學的狂潮,本書核心論點,第一,要全體不要抽樣,第二,要相關不要因果,第三,要效率不要精確。......

    市場營銷讀書報告--《大數據時代》

    市場營銷讀書報告--《大數據時代》 讀書報告題目:大數據時代的生活、工作和思維變革 書名:大數據時代作者:[英]維克托·邁爾-舍恩伯格,肯尼思·庫克耶 出版社:浙江人民出版社出版......

    學習《大數據時代》讀書心得

    讀《大數據時代》心得體會 根據公司《關于下發中國共產黨員全年學習計劃的通知》組織分公司全體黨員個人學習《大數據時代》,讀了《大數據時代》后,感覺到一個大變革的時代將......

    大數據時代

    大數據時代近年來,隨著互聯網、移動互聯網、智能手機及傳感器等的普及,信息流量有了爆發性的增長,兩會以后,互聯網里最熱的詞匯,就是李克強總理在政府工作在報告里面提到的“互......

    大數據時代

    “大”數據時代 眾所周知,數據本身就蘊藏著價值,但是將有用的數據與沒有價值的數據進行區分看起來可能是一個棘手的問題。 顯然,您所掌握的人員情況、工資表和客戶記錄對于企業......

主站蜘蛛池模板: 亚洲精品无码专区久久同性男| 无码 制服 丝袜 国产 另类| 久久99国产精一区二区三区| 丝袜自慰一区二区三区| 国产成人精品午夜福利不卡| 久久精品国产亚洲一区二区| 无遮挡高潮国产免费观看| 特级国产午夜理论不卡| 少妇高潮流白浆在线观看| 亚洲中文字幕久久精品无码va| 国产精品亚洲精品久久精品| 久久精品国产自在天天线| 亚洲精品拍拍央视网出文| 日本一区不卡高清更新二区| 亚洲第一区欧美国产综合86| 精品久久国产综合婷婷五月| 国产精品99久久久久久董美香| 人妻暴雨中被强制侵犯在线| 国产美女精品视频线免费播放软件| 夜夜爽妓女8888视频免费观看| 青青青国产成人久久111网站| 伊人久久大香线蕉亚洲| 亚洲精品日本久久一区二区三区| 亚洲欧洲美洲在线观看| 无码制服丝袜人妻在线视频精品| 国产极品美女到高潮| 午夜视频在线在免费| 狠狠色丁香久久婷婷综合_中| 久久无码av三级| 成在人线av无码免费| 免费a级毛片无码无遮挡| 野花社区www视频最新资源| 亚洲日韩片无码中文字幕| 国产成人精品999视频| 国产成人综合日韩精品无码| 日本牲交大片免费观看| 亚洲国产精品无码久久久高潮| 中文字幕精品久久久久人妻| 亚洲熟妇av一区二区三区下载| 欧美成人在线观看| 少妇高潮流白浆在线观看|