久久99精品久久久久久琪琪,久久人人爽人人爽人人片亞洲,熟妇人妻无码中文字幕,亚洲精品无码久久久久久久

學習《大數據時代》讀書心得

時間:2019-05-12 16:04:40下載本文作者:會員上傳
簡介:寫寫幫文庫小編為你整理了多篇相關的《學習《大數據時代》讀書心得》,但愿對你工作學習有幫助,當然你在寫寫幫文庫還可以找到更多《學習《大數據時代》讀書心得》。

第一篇:學習《大數據時代》讀書心得

讀《大數據時代》心得體會

根據公司《關于下發中國共產黨員全年學習計劃的通知》組織分公司全體黨員個人學習《大數據時代》,讀了《大數據時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰栗起來。

“在小數據時代,我們會假象世界是怎樣運作的,然后通過收集和分析數據來驗證這種假想?!薄半S著由假想時代到數據時代的過渡,我們也很可能認為我們不在需要理論了?!睍袔缀蹩隙ㄒ嵏步y計學的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學的理論已經脫離實際”來“終結”量子力學。對此我很高興,因為統計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認為”這樣的保護傘。

近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統,跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發展的大帽子。既然大數據是“通往未來的必然改變”,那我就必須“不受限于傳統的思維模式和特定領域里隱含的固有偏見”,跟作者一起先把統計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。

當我們人類的數據收集和處理能力達到拍字節甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調查為基礎的統計學了。但是由統計學和量子力學以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!

《大數據時代》第16頁“大數據的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關系規則。兩者似乎是做同一件事??纱髷祿摹安皇且蚬P系,而是相關關系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基于因果關系。兩者好像又是對立的。在同一件事上兩種方法對立,應該只有一個結果,就是要否定掉其中之一。這就是讓我很擔心的原因??晌覅s不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!

更何況還有兩個更可怕的事情。

其一:量子力學搞了一百多年,為了處理好混雜性問題,把質量和速度結合到能量上去了,為了調和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關系,因為爸爸就是爸爸,兒子就是兒子。那么大數據會不會通過正視混雜性,放棄因果關系最后反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?

其二:人和機器的根本區別在于人有邏輯思維而機器沒有?!洞髷祿r代》也擔心“最后做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現科幻電影上描述的機器主宰世界消滅人類的結果,那我還不如現在就趁早跳樓。

還好我知道自己對什么統計學、量子力學、邏輯學和大數據來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。

第二篇:大數據時代讀書心得

生活,工作以及思維的大變革

——讀《大數據時代》有感及所思

讀了《大數據時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰栗起來。

本書從思維、商業、管理三個方面闡述了在大數據時代在下的變革,這些變革涉及到我們生活的方方面面,幾乎其影響程度可以與兩次工業革命相媲美。作者在第一部分提出了三個比較令人震驚的觀點,也就是大數據的精髓在于我們分析信息時的三個轉變,這三個轉變將改變我們的理解和組建社會的方法。并且作者將生活,工作思維的大變革和這幾個方面緊緊聯系在一起。

第一個轉變是,在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴于隨機采樣。也就是說樣本等于總體;第二個轉變是對研究數據不會追求精度,而且追求混雜性,小數據時代下,追求精確度是合理的,因為我們收集的數據很少,所以要越精確越好,包括如今仍然也在使用這種辦法;但是在某些時代,尤其是在大數據時代背景下,快速獲得一個大概輪廓和發展脈絡,要比精確性重要得多,既然選擇了整體性,肯定要忽視細節和確定性;第三個改變是不是因果關系而是相關關系,在大數據時代,我們更需要了解一個東西是什么,而不是為什么,要找到關聯無,通過一個良好的關聯物的相關關系可以幫助我們捕捉預測未來。

這三個方面是大數據時代所給我們帶來的思維上的改變,所謂思路決定出路,思路有了創新,有了拓展,相應的社會也就會有很大的變化。緊接著第二部分作者從萬事萬物數據化和數據交叉復用的巨大價值兩個方面,講述驅動大數據戰車在材質和智力方面向前滾動的最根本動力。第三部分則是闡述了大數據時代下的弊端以及在管理上的措施。個人認為本書的精髓部分是第一部分,第一部分的三個觀點涉及的面很廣,包括統計學、邏輯學、哲學等。后兩個部分都是以第一部分這三個觀點為基礎展開闡述的。

這本書給我感觸最深的就是這三個轉變,或者說是三個觀點,可以說是哲學上說的世界觀,因為世界觀決定方法論,所以這三個觀點對傳統看法的顛覆,就會導致各種變革的發生。首先是第一個,作者認為在抽樣研究時期,由于研究條件的欠缺,只能以少量的數據獲取最大的信息,而在大數據時代,我們可以獲得海量的數據,抽樣自然就失去它的意義了。放棄了隨機分析法這種捷徑,采用所有的數據。作者用大數據與喬布斯的癌癥治療例子說明了使用全部數據而非樣本的意義,列舉了日本“相撲”等來證明使用全體數據的重要性。這個觀點足以引起統計學乃至社會文明的變革,因為統計抽樣和幾何學定理、萬有引力一樣被看做文明得以建立牢固的基石。我對這個觀點還是比較認同的,如果真能收集到整體的數據而且分析數據的工具也足夠先進,自然是全體數據研究得出的結果更令人信服。但是這個觀點也過于絕對,就算是在大數據時代要想收集到全體數據還是不太可能實現的,因為收集全體數據要付出的代價有時會很大。比如說,你要檢測食品中致癌物質是否超標,你不可能每一件食品你都檢測一遍吧。

第二,要效率不要絕對的精確。作者說,執迷于精確性是信息缺乏時代和模擬時代的產物,只有5%的數據是結構化且能適用于傳統數據庫的。如果不接受混亂,剩下95%的非結構化數據都無法被利用。作者是基于數據不可能百分之百正確的考慮而做出這樣的判斷的,如果采用小數據一個數據的錯誤就會導致結 果的誤差很大,但是如果數據足夠多、數據足夠雜那得出的結果就越靠近正確答案。大數據時代要求我們重新審視精確性的優劣,甚至還說到大數據不僅讓我們不再期待精確性,也讓我們無法實現精確性。谷歌翻譯的成功很好地證明了這一點,谷歌的翻譯系統不像Candide那樣精確地翻譯每一句話,它谷歌翻譯之所以優于IBM的Candide系統并不是因為它擁有更好的算法機制,和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數據,并且接受了有錯誤的數據。

而在閱讀這本書時,發現這本書中爭議最大的一個觀點,不僅是讀者,就算是本書的譯者也在序言中明確地說到他不認同“相關關系比因果關系更重要”的觀點。作者覺得相關關系對于預測一些事情已經足夠了,不用花大力氣去研究他們的因果關系。作者用林登的亞馬遜推薦系統的成功,證實了大數據在分析相關性方面的優勢以及在銷售中獲得的成功。沃爾瑪也是充分利用并挖掘各類數據信息的代表,從啤酒和尿布的案例,以及作者舉的有關蛋撻和颶風天氣的案例,都說明了掌握了相關關系對于他們策略的幫助。一句話,知道是什么就夠了,不用知道為什么。很明顯作者所舉的例子都是屬于商業領域的,但是對于其他領域來說這個觀點就值得商榷了。比如說,在科學研究領域,你需要知其然也需要知道其所以然,找到事件發生的原理。用文中的一個例子說明,喬布斯測出整個基因圖譜來治療癌癥,但是你治療癌癥你必須知道癌癥發病的原理,知道哪一段基因導致了這種疾病,不可能只是說收集各種數據,然后利用其相關性來判斷哪里出現了問題。

過度依賴所帶來的后果。也用《少數派的報告》這部電影來說明如果癡迷于數據會導致我們將生活在一個沒有獨立選擇和自由意志的社會,如果一切變為現實,我們將被禁錮在大數據的可能性之中。所以書中提出了幾種解決方法,一種是使用數據時征詢數據所有個人的知曉和授權。第二個技術途徑就是匿名化。毫無疑問,大數據將會給社會管理帶來巨大的變革。

在這個信息爆炸的時代,大數據給人類社會的方方面面帶來了巨大的變革,這是社會發展的潮流,不可逆轉,我們只有順應這種潮流,把握住大數據時代變革的思想,才能在時代潮流中成為佼佼者,在思維上思路上略高一籌,才能在行動中占得先機!

第三篇:《大數據時代》讀書心得

大數據時代,引領信息全球化

——讀《大數據時代》有感

如今說起新媒體和互聯網,必提大數據,似乎不這樣說就OUT了。而且人云亦云的居多,不少談論者甚至還沒有認真讀過這方面的經典著作——舍恩佰格的《大數據時代》。維克托·邁爾——舍恩伯格何許人也?他現任牛津大學網絡學院互聯網研究所治理與監管專業教授,曾任哈佛大學肯尼迪學院信息監管科研項目負責人。他的咨詢客戶包括微軟、惠普和IBM等全球頂級企業,他是歐盟互聯網官方政策背后真正的制定者和參與者,他還先后擔任多國政府高層的智囊。這位被譽為:大數據時代的預言家“的牛津教授真牛!那么,這位大師說的都是金科玉律嗎?并不一定,讀大師的作品一定要做些功課才好讀懂,如果能做足功課又具備相應的理論功底,就能與之進行一場思想上的對話。

粗淺認識之我見

舍恩伯格分三部分來討論大數據,即思維變革、商業變革和管理變革。在第一部分“大數據時代的思維變革”中,舍恩伯格旗幟鮮明的亮出他的三個觀點:

一、更多:不是隨機樣本,而是全體數據;

二、更雜:不是精確性,而是混雜性;

三、更好:不是因果關系,而是相關關系。對于第一個觀點,我不敢茍同。一方面是對全體數據進行處理,在技術和設備上有相當高的難度。另一方面是不是都有此必要,對于簡單事實進行判斷的數據分析難道也要采集全體數據嗎?我曾與香港城市大學的祝建華教授討論過。祝教授是傳播學研究方法和數據分析的專家,他認為一定可以找到一種數理統計方法來進行分析,并不一定需要全部數據。聯系到舍恩伯格第二個觀點中所說的相關關系,我理解他說的全體數據不是指數量而是指范圍,即大數據的隨機樣本不限于目標數據,還包括目標以外的所有數據。我認為大數據分析不能排除隨機抽樣,只是抽樣的方法和范圍要加以拓展。

我同意舍恩伯格的第二觀點,我認為這是對他第一個觀點很好的補充,這也是對精準傳播和精準營銷的一種反思。“大數據的簡單算法比小數據的復雜算法更有效。”更具有宏觀視野和東方哲學思維。對于舍恩伯格的第三個觀點,我也不能完全贊同。“不是因果關系,而是相關關系?!辈恍枰馈盀槭裁础?,只需要知道“是什么”。傳播即數據,數據即關系。在小數據時代人們只關心因果關系,對相關關系認識不足,大數據時代相關關系舉足輕重,如何強調都不為過,但不應該完全排斥它。大數據從何而來?為何而用?如果我們完全忽略因果關系,不知道大數據產生的前因后果,也就消解了大數據的人文價值。如今不少學者為了闡述和傳播其觀點往往語出驚人,對舊有觀念進行徹底的否定。

世間萬物的復雜性多樣化并非非此即彼那么簡單,舍恩伯格也是這種二元對立的幼稚思維嗎?其實不然,讀者在閱讀時一定要看清楚他是在什么語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出“不是因果關系,而是相關關系?!边@一論斷時,他在書中還說道:“在大多數情況下,一旦我們完成了對大數據的相關關系分析,而又不再滿足于僅僅知道‘是什么’時,我們就會繼續向更深層次研究的因果關系,找出背后的‘為什么’。”由此可見,他說的全體數據和相關關系都在特定語境下的,是在數據挖掘中的選項。

大數據研究的一大驅動力就是商用,舍恩伯格在第二部分里討論了大數據時代的商業變革。舍恩伯格認為數據化就是一切皆可“量化”,大數據的定量分析有力地回答“是什么”這一問題,但仍然無法完全回答“為什么”。因此,我認為并不能排除定性分析和質化研究。數據創新可以創造價值,這是毫無疑問的。舍恩伯格在討論大數據的角色定位時仍把它置于數據應用的商業系統中,而沒有把它置于整個社會系統里,但他在第二部分大數據時代的管理變革中討論了這個問題。在風險社會中信息安全問題日趨凸顯,數據獨裁與隱私保護成為一對矛盾。如何擺脫大數據的困境?舍恩伯格在最后一節“掌控”中試圖回答,但基本上屬于老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個問題?至少可以提供更多的思考維度。正如舍恩伯格在結語中所道:“大數據并不是一個充斥著算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來?!敝x謝舍恩伯格!讓大數據討論從自然科學回到人文社科。由此推斷,《大數據時代》不是最終答案,也不是標準答案,只是參考答案。

此外,在閱讀此書之前還必須具備一些數據科學的基本知識和基本概念,比如說什么叫數據?什么叫大數據?數據分析與數據挖掘的區別,數字化與數據化有什么不同?讀前做些功課讀起來就比較好懂了。

淺薄之語抒我意

概念是研究的邏輯起點,“大數據”到底是什么?在百度上搜索到的解釋是,“大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊?!贝髷祿?V特點:數量(Volume)、速度(Velocity)、品種(Variety)和真實性(Veracity)。但舍恩伯格認為大數據并非一個確切的概念。他在書中的一段詮釋更具人文色彩和社會意義:“大數據是人們獲得新的認知、創造新的價值的源泉;大數據還是改變市場、組織機構,以及政府與公民關系的方法?!逼鋵?,概念的界定要看研究者從哪個角度來研究它而定。

科學家的治學態度是嚴謹的,而人文學家更具有想象力。一些對大數據不甚了然的人往往夸大了它的作用,甚至把它神化。舍恩伯格認為大數據的核心是預測?!按髷祿皇且虣C器像人一樣思考。相反,把數學算法運用到海量的數據上來預期事情發生的可能性?!鄙岫鞑裆踔敛换乇艽髷祿a生的負面影響,他在第七章里談到讓數據主宰一切的隱憂。我覺得這是實事求是的科學態度。在量子力學里有一個測不準原理:一個微觀粒子的某些物理量(如位置和動量,或方位角與動量矩,還有時間和能量等),不可能同時具有確定的數值,其中一個量越確定,另一個量的不確定程度就越大。它是解釋微觀世界的物理現象,信息社會中的大數據會不會也有類似情況呢?如果我們再把凱文·凱利的《失控》對比來讀的話就更有意思了,這樣我們對整個物質世界及至人類社會就有了更全面更深刻的洞察,從物理王國到生物世界,再到信息社會。從公共衛生到商業應用,從個人隱私到政府管理,大數據無處不在。與此同時,從哪個角度探討用什么方法研究,舍恩伯格都不會忘記大數據服務人類造福人類的終極目的和價值所在。“大數據并不是一個充斥著運算法則和機器的冰冷世界,其中仍需要人類扮演重要角色。人類獨有的弱點、錯覺、錯誤都是十分必要的,因為這些特性的另一頭牽著的是人類的創造力、直覺和天賦。偶爾也會帶來屈辱或固執的同樣混亂的大腦運作,也能帶來成功,或在偶然間促成我們的偉大。這提示我們應該樂于接受類似的不準確,因為不準確正是我們之所以為人的特征之一。”用中國話來說就是“人無完人”,人類在收獲大數據帶來的紅利的同時也要承受它帶來的危害。這不是對立統一的辯證唯物主義?我把它看作帶著歐洲批判學派色彩的科學發展觀。問題是研究的價值基點,“大數據”不是舍恩伯格研究的問題,而是研究對象,他研究的是數據處理和信息管理問題,同時也討論信息安全和網絡倫理問題,還引發哲學上的思考,哲學史上爭論不休的世界可知論和不可知論轉變為實證科學中的具體問題。可知性是絕對的,不可知性是相對的。“大數據”之所以為大是因它引發人類生活、工作和思維的大變革,從這個意義上來看,《大數據時代》的意義不僅在于它討論了若干重大問題,而且對研究者開出了一個問題清單,從而引發更多人來探討這些有趣的問題。

《大數據時代》實際上主要是一本討論數據挖掘的書,數據挖掘與數據分析是不同的概念,數據挖掘一般是指從大量的數據中自動搜索隱藏于其中的有著特殊關系性的信息的過程。數據挖掘通常與計算機科學有關,并通過統計、在線分析處理、情報檢索、機器學習、專家系統(依靠過去的經驗法則)和模式識別等諸多方法來實現上述目標。而數據分析的目的是把隱沒在一大批看來雜亂無章的數據中的信息集中、萃取和提煉出來,以找出所研究對象的內在規律。數據挖掘主要運用計算機來進行處理,而數據分析既要用計算機也要人工分析,是計算機科學與人文價值判斷的統一結合。換言之,《大數據時代》并不是一本討論大數據所有問題的書。

《大數據時代》也是一本討論互聯網發展的書,從數字化到數據化,同時有濃厚的未來學色彩。當文字變成數據,我們進入了互聯網;當方位變成數據,我們進入了物聯網;當溝通變成數據,我們進入了下一代互聯網。一切可量化,萬物皆數據,正是當今互聯網世界的真實寫照。面對于這樣的世界及世界的未來,在《大數據時代》出現最多的詞是“思維”和“方法”,因此也可以把這本書視為思維科學應用研究的書。

此外,在閱讀此書之前還必須具備一些數據科學的基本知識和基本概念,比如說什么叫數據?什么叫大數據?數據分析與數據挖掘的區別,數字化與數據化有什么不同?讀前做些功課讀起來就比較好懂了。

走出去,理論聯系實際之我看

今年的9月30日,總書記將他命名為“烈士紀念日”。在新一屆黨中央領導班子的領導下,舉國上下開展了系列的調研、講解、討論創新驅動發展戰略。包括總書記、李克強總理在內的七位常委全部出動來到中關村,這是歷史上沒有過的,百度、聯想和小米的負責人,有了一次直面最高層匯報工作的機會。雷軍和柳傳志,講解的都是本公司的各種情況,李彥宏則沒有講百度的廣告業務發展得如何好,而是講起了大數據。在講解中,李彥宏認為大數據有兩個重要價值,一是促進信息消費,加快經濟轉型升級;二是關注社會民生,帶動社會管理創新。這些價值也是目前黨和國家領導人最為重視的,可見《大數據時代》既有理論價值也有現實意義。當今大數據正在影響著新聞傳媒業,大數據新聞、大數據營銷、輿情分析、受眾(用戶)研究??數據分析師變身新聞編輯,大數據正改變新聞生產流程、大數據在創造傳媒新業態。“不妨想象一下,隨著數據的進一步增加,坐擁用戶資源的新媒體們完全有能力通過數據挖掘,分析用戶癖好,向電視臺定制一部電視劇甚至向好萊塢定制一部電影。到那個時候,電視臺一如那些家電廠商們,曾經產業鏈的上游‘王者’,將徹底成為一個產業鏈最低端的內容代工廠?!比欢?,情形也遠沒有人們想象的那么樂觀,李彥宏指出目前多數所謂的大數據公司其實還是空殼子,因為數據還沒有完全開放。他認為必須在政府層面上推動才能真正實現大數據的開發與利用。我在討論大數據時代的輿情監測與預警時說道:“經典自由主義傳播學說對媒體的定位:秉持公正、客觀立場的媒體被稱為代表公眾監督政府行為的‘看門狗’。其實,媒體既是公眾利益也是國家利益的‘看門狗’。要看好門就要瞭望、洞察社情民意,傳統媒體信息反饋渠道單一,視野、人力十分有限。而開放互動的新媒體平臺卻大有可為。作為公共信息發布平臺的微博可以成為政府及時了解社情民意,從而選擇正確治理路徑的‘導盲犬’?!边z憾的是目前我國的數據平臺還沒有完全開放,真正的大數據時代還沒有到來。

與國內不少教科書寫法的專著相比,國外的書寫得更有趣,尤其是大學者寫的,不僅視野開闊,而且能夠深入淺出。《大數據時代》不到22萬字,卻有上百個學術和商業的實例,豐富翔實的例子讓讀者感到通俗易懂,深奧的理論看起來也不費勁。這恐怕與舍恩伯格既是學者也是專家,既有理論又有實踐有關。反觀我們些學者故弄玄虛而示高明,實際上是把讀者拒之門外。我覺得優秀的科學家也應該是一個科普作家,優秀的學者也應該是一個不錯的傳播者。當然國外學術著作也有一個翻譯問題,這本書譯得還不錯。此外,《大數據時代》還附有不少IT界名流的推薦意見,雖是出版商的發行所為,對解讀此書也不無益處。

除了《大數據時代》,舍恩伯格還有一本《刪除》也值得一讀。要研究大數據不能只讀一本書,該書譯者周濤教授還推薦了三部國內出版的大數據方面的專著:《證析》、《大數據》、《個性化:商業的未來》。相比《大數據時代》的宏大視野,這些書就大數據某一局部問題給出深刻的介紹和洞見。我也推薦讀一讀中國工程院李國杰院士和中科院計算所副總工程學旗合寫的文章《大數據研究:未來科技及經濟社會發展的重大戰略領域——大數據的研究現狀與科學思考》。

雖說開卷有益,但是由于每個人的時間精力有限,對于一個研究者來說,不讀什么書甚至比讀什么書更重要。我認為書有三種:有用的書,主要是應用類的專業書;無用的書,主要是形而上的思想類;無字的書,人間百態,社會現實??善氐粦珡U。對于學生來講這三類“書”都該讀一些,對于研究者則要讀哪些解決關鍵問題的書,《大數據時代》就是這樣一部書。當然,并非第一個讀者都是研究大數據的,但進入大數據時代,還有什么東西與數據完全沒有關系呢?麥肯錫全球研究機構認為,未來十年里有12項對經濟發展產生重大影響的技術,其中包括三項新媒體技術:移動互聯網、物聯網和云計算。這三項新媒體技術都與大數據密切相關,而這些新媒體新技術的發展都影響著當今的新聞傳播業。閱讀此書至少給我們研究新聞傳播學帶來一些啟迪。我覺得一本書的價值不在于讓你頂禮膜拜,而是引發廣泛而深入的討論。

“凡是過去,皆為序曲?!弊x完此書,我們對大數據的認識才剛剛開始。

第四篇:大數據時代讀書心得

一部似乎還沒有寫完的書

——讀《大數據時代》有感及所思

讀了《大數據時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰栗起來?!霸谛祿r代,我們會假象世界是怎樣運作的,然后通過收集和分析數據來驗證這種假想?!薄半S著由假想時代到數據時代的過渡,我們也很可能認為我們不在需要理論了?!睍袔缀蹩隙ㄒ嵏步y計學的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學的理論已經脫離實際”來“終結”量子力學。對此我很高興,因為統計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認為”這樣的保護傘。

近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統,跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發展的大帽子。既然大數據是“通往未來的必然改變”,那我就必須“不受限于傳統的思維模式和特定領域里隱含的固

有偏見”,跟作者一起先把統計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。

當我們人類的數據收集和處理能力達到拍字節甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調查為基礎的統計學了。但是由統計學和量子力學以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!

《大數據時代》第16頁“大數據的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關系規則。兩者似乎是做同一件事??纱髷祿摹安皇且蚬P系,而是相關關系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基于因果關系。兩者好像又是對立的。在同一件事上兩種方法對立,應該只有一個結果,就是要否定掉其中之一。這就是讓我很擔心的原因。

可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!

更何況還有兩個更可怕的事情。

其一:量子力學搞了一百多年,為了處理好混雜性問題,把質量

和速度結合到能量上去了,為了調和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關系,因為爸爸就是爸爸,兒子就是兒子。那么大數據會不會通過正視混雜性,放棄因果關系最后反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?

其二:人和機器的根本區別在于人有邏輯思維而機器沒有。《大數據時代》也擔心“最后做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現科幻電影上描述的機器主宰世界消滅人類的結果,那我還不如現在就趁早跳樓。

還好我知道自己對什么統計學、量子力學、邏輯學和大數據來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。

所以想向《大數據時代》的作者提一個合理化建議:把這本書繼續寫下去,至少加一個第四部分——大數據時代的邏輯思維。

合纖部車民

2013年11月10日

第五篇:大數據時代讀書報告

這本書里主要介紹的是大數據在現代商業運作上的應用,以及它對現代商業運作的影響?!?大數據時代》這本書的結構框架遵從了學術性書籍的普遍方式。也既,從現象入手,繼而通過對現象的解剖提出對這一現象的解釋。然后在通過解釋在對未來進行預測,并對未來可能出現的問題提出自己看法與對策。

下面來重點介紹《大數據時代》這本書的主要內容。

《大數據時代》開篇就講了google通過人們在搜索引擎上搜索關鍵字留下的數據提前成功的預測了2009年美國的h1n1的爆發地與傳播方向以及可能的潛在患者的事情。google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發一兩個周之后才可以弄到相關的數據。同時google的預測與政府數據的相關性高達97%,這也就意味著google預測數據的置信區間為3%,這個數字遠遠小于傳統統計學上的常規置信區間5%!而這個數字就是大數據時代預測結果的相對準確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數據時代“樣本=總體”的思想。我們都知道當樣本無限趨近于總體的時候,通過計算得到的描述性數據將無限的趨近于事件本身的性質。而之前采取的“樣本<總體”的做法很大程度上無法做到更進一步的描述事物,因為之前的時代數據的獲取與存儲處理本身有很大的難度只導致人們采取抽樣的方式來測量事物。而互聯網終端與計算機的出現使數據的獲取、存儲與處理難度大大降低,因而相對準確性更高的“樣本=總體”的測算方式將成為大數據時代的主流,同時大數據時代本身也是建立在大批量數據的存儲與處理的基礎之上的。

接下來,維克多又通過了ibm追求高精確性的電腦翻譯計劃的失敗與google只是將所有出現過的相應的文字語句掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯系google詞庫就會出現翻譯,雖然有的時候的翻譯很無厘頭,但是大多數時候還是正確的,所以google的電腦翻譯的計劃的成功,表明大數據時代對準確性的追求并不是特別明顯,但是相反大數據時代是建立在大數據的基礎住上的,所以大數據時代追求的是全方位覆蓋的數字測度而不管其準確性到底有多高,因為大量的數據會湮埋少數有問題的數據所帶來的影響。同時大量的數據也會無限的逼近事物的原貌。

之后,維克托又預測了一個在大數據時代催生的重要職業——數據科學家,這是一群數學家、統計學與編程家的綜合體,這一群人將能夠從獲取的數據中得到任何他們想要的結果。換言之,只要數據充足我們的一切外在的與內在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現得淋漓盡致。所以為了避免個人隱私在大數據時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數據為商業部門服務,而另一群人則負責審查這一些人是否合法的獲得與應用數據,是否侵犯了個人隱私。無論如何,大數據時代將會到來,不管我們接受還是不接受!而且這兩年,大數據這個詞突然變得很火,不僅出現在阿里巴巴、谷歌等互聯網公司的戰略規劃中,同時在我國國務院和其他國家的政府報告中多次提及,無疑成為當今互聯網世界中的新寵兒。我對大數據一直好奇已久,閱讀了很多資料仍不得其解,直到讀完《大數據時代》才有了粗略的認識。

我側重于從第一部分中的這三個觀點談談自己的看法,這三個觀點可以說是哲學上說的世界觀,這三個觀點可以說是哲學上說的世界觀,因為世界觀決定方法論,所以這三個觀點對傳統看法的顛覆,就會導致各種變革的發生。首先是第一個,作者認為在抽樣研究時期,由于研究條件的欠缺,只能以少量的數據獲取最大的信息,而在大數據時代,我們可以獲得海量的數據,抽樣自然就失去它的意義了。放棄了隨機分析法這種捷徑,采用所有的數據。作者用大數據與喬布斯的癌癥治療例子說明了使用全部數據而非樣本的意義,列舉了日本“相撲”等來證明使用全體數據的重要性。這個觀點足以這個觀點足以引起統計學乃至社會文明的變革,因為統計抽樣和幾何學定理、萬有引力一樣被看做文明得以建立牢固的基石。我對這個觀點還是比較認同的,如果真能收集到整體的數據而且分析數據的工具也足夠先進,自然是全體數據研究得出的結果更令人信服。但是這個觀點也過于絕對,就算是在大數據時代要想收集到全體數據還是不太可能實現的,因為收集全體數據要付出的代價有時會很大。比如說,你要檢測食品中致癌物質是否超標,你不可能每一件食品你都檢測一遍吧。

第二,要效率不要絕對的精確。作者說,執迷于精確性是信息缺乏時代和模擬時代的產物,只有5%的數據是結構化且能適用于傳統數據庫的。如果不接受混亂,剩下95%的非結構化數據都無法被利用。作者是基于數據不可能百分之百正確的考慮而做出這樣的判斷的,如果采用小數據一個數據的錯誤就會導致結果的誤差很大,但是如果數據足夠多、數據足夠雜那得出的結果就越靠近正確答案。大數據時代要求我們重新審視精確性的優劣,甚至還說到大數據不僅讓我們不再期待精確性,也讓我們無法實現精確性。谷歌翻譯的成功很好地證明了這一點,谷歌的翻譯系統不像candide那樣精確地翻譯每一句話,它谷歌翻譯之所以優于ibm的

candide系統并不是因為它擁有更好的算法機制,和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數據,并且接受了有錯誤的數據。第三個觀點,不是因果性,而是相關性,這是這本書中爭議最大的一個觀點,不僅是讀者,就算是本書的譯者也在序言中明確地說到他不認同“相關關系比因果關系更重要”的觀點。作者覺得相關關系對于預測一些事情已經足夠了,不用花大力氣去研究他們的因果關系。作者用林登的亞馬遜推薦系統的成功,證實了大數據在分析相關性方面的優勢以及在銷售中獲得的成功。沃爾瑪也是充分利用并挖掘各類數據信息的代表,從啤酒和尿布的案例,以及作者舉的有 關蛋撻和颶風天氣的案例,都說明了掌握了相關關系對于他們策略的幫助。一句話,知道是什么就夠了,不用知道為什么。很明顯作者所舉的例子都是屬于商業領域的,但是對于其他領域來說這個觀點就值得商榷了。比如說,在科學研究領域,你需要知其然也需要知道其所以然,找到事件發生的原理。用文中的一個例子說明,喬布斯測出整個基因圖譜來治療癌癥,但是你治療癌癥你必須知道癌癥發病的原理,知道哪一段基因導致了這種疾病,不可能只是說收集各種數據,然后利用其相關性來判斷哪里出現了問題

作者在書中把大數據說的很厲害,在最后一部分分析大數據帶來無數好處的同時帶來的不良影響以及如何面對這些影響。用麥克納馬拉的例子來說明對數據過度依賴所帶來的后果。也用《少數派的報告》這部電影來說明如果癡迷于數據會導致我們將生活在一個沒有獨立選擇和自由意志的社會,如果一切變為現實,我們將被禁錮在大數據的可能性之中。所以書中提出了幾種解決方法,一種是使用數據時征詢數據所有個人的知曉和授權。第二個技術途徑就是匿名化。毫無疑問,大數據將會給社會管理帶來巨大的變革。

大數據給人類社會的方方面面帶來了巨大的變革,這是社會發展的潮流,不可逆轉,我們只有順應這種潮流,在思想上和技能上做好準備才能成為時代的弄潮兒。對于一家公司或一個國家,要從根本上改變思維和觀念,盡早適應這種潮流。

最后,附上一段來自原著的結語:

大數據并不是一個充斥著算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據為我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。篇二:《大數據時代》讀書報告

讀書報告

——讀《大數據時代》

坦白地說,這是我第一本看了睡不著的書,我還記得第一次閱讀時的興奮和激動,就像一場頭腦風暴。書里的事例是那么的鮮活與生動,完全顛覆我的思維方式,打破了我大腦中解決問題原有的枷鎖。這本書讓我明白了太多~~~ 它讓我明白生活必須要主動。有些人碰到了不公就自認倒霉,能干一點的可能還會去討個說法,但并沒有解決實際問題,這一次可能挽回了那么一點點的損失,但下次遇到了仍是如此,無限循環。當你絞盡腦汁為了節約成本而提前一個月去購買一張你自以為廉價的飛機票,回頭卻發現,比那些只提前一天購買的人所付的錢還要高出很多時,不知你會怎么想?是被動的接受還是想方法讓現實變得更美好? 它讓我更好地去理解現實生活的很多情況。現在才理解,為什么網絡上有這么多驗證碼的存在,為什么社交網要用實名制注冊,為什么有這么多的“我猜你喜歡”~~~ 雖然我很喜歡那些“黑匣子”,會讓我感覺很神奇,但當我真正理解的他的原理時,其實更讓我興奮不已。原來谷歌翻譯背后是這樣操作的,原來那些每天時不時闖進我們眼球的廣告并非偶然,原來預測流感不需要疾控中心而是網絡詞條,原來電影在開播前就已經知道了收視率和票房~~~ 當然以上這些相當抓人眼球,但這只是大數據的表面,其真正的價值遠不僅如此。人類總是以為自己很強大,能控制一切,當然最好還能預測未來。其實大數據真的可以做到,雖然不可能很精確。在我看來這樣更好,大致結果可以意料,這就夠了,如果發現結果不盡如人意,我們可以提前控制。當然還會有我們意想不到的情況發生,這樣會讓未來更充滿想象,更加充滿期待。

它讓我懂得不能墨守成規,也不能自以為是。大數據環境是那些微型企業發展的福地,它是行業競爭重新洗牌的動力源泉。在大數據面前,小公司不需要妄自菲薄,大的商業帝國也只有打氣十二分的精神才可能讓自己立于不敗之地。

他讓我知道沒有做不得,只有想不到?,F在的賺取資本的方式已經不再是單靠苦力就可以解決問題的時代了,看見朋友圈里的那些做代購的,都在自我催眠“不要看我們現在是微商~~~微商將來前途無量~~~·”我一直都抱著看看不說話的心態,難免也會哂笑,真的不知道他們和菜場賣菜的有什么本質區別~~~現在是一個依靠知識科技來富國強兵的時代了,真正的優勢來源于你提前想到了別人還沒去想的,提早完成了別人還沒有籌備的計劃。

他讓我學會世界上沒有光桿司令,我們必須學會合作。一個人的能力是有限的,一個人的時間也是有限的,同樣公司,國家都是一樣的。我們知道谷歌,亞馬遜,facebook以及中國的阿里巴巴,百度,新浪這些企業都很強大,可是他們仍然在不斷收購合并整合其他一些小的公司,為的是引用他們的科技技術來強大自己的事業版圖。

它還教會我在機會面前必須要眼疾手快。在你還在猶豫不決或是自我陶醉的時候,你的對手已經用一個非常低廉的價格得到了他想要翻身的王牌,當你發現時,要么花大血本去換取一張相似的王牌,要與他赤身搏斗。大部分情況下那些聰明的人往往會選擇前者,因為他們知道寧可為自己現在的失誤埋單也不會讓自己靠近萬丈深淵。因為若喪失了主動權,那么很有可能導致的結果就是,那個原來看起來微不足道的“小木樁”卻扳倒了你這體積龐大的“大象”。

說了這么多大數據給我的啟示,其實就是想突出大數據背后的那種神奇的力量。在近代我們似乎與每一樣新的科技都失之交臂,但是這一次我們似乎還有機會和時代同步伐,甚至如果我們足夠重視,可能還會走在時代的前沿。雖然我們現在誰都沒有把握中國到底會利用大數據到什么程度,但已經有好多像周濤一樣的有志之士看好中國在利用大數據上的實力,并且付諸了他們的努力。他們一直都堅信以前的落后僅僅是時間上的后知后覺,他們在這一次想

要做到與世界同步,和歐美同步發行此書,在最早一刻就向大家推廣大數據這一新名詞,向大家灌輸著大數據的思維。對此,我也很慶幸,在恰當的時間點與大數據的偶遇。

當然,世界上沒有十全十美的東西,再好的發明總是有它的缺陷,大數據也不會例外。舍恩伯格這個對大數據最有權威發言權的人,既然有能力將大數據的好處講得淋漓盡致,毫無疑問自然也是最清楚大數據危險的人。我很尊敬他的嚴謹和坦誠,他在細致入微地解釋大數據革命性優勢的同時,毫無修飾地點明了大數據的劣根性。他很準確地說明了如果我們濫用或誤用數據,我們將會受到毀滅性的打擊,后果將會如何不堪設想,并且這篇幅一點都不敷衍。作者非常專業,他并沒有像某些專家一樣,一味地鼓吹自己的“一家之言”。而是在我們頭腦發熱,一哄而上之前,就給我們非常而且深刻的警醒。這也正是大數據思維的其中之一:饋前控制。

讀完這本書以后,我有的確一點蠢蠢欲動,因為它讓我覺得大數據并沒有像想象的那么遙不可及。書中說,會好好利用大數據的有三種人:第一種是擁有龐大數據庫的政府或者商業機構,他們之前只是不知道那些塵封已久的數據還可以創造巨大的價值。第二種是利用技術手段,讓數據發揮它獨特功能,從而幫他們解決實際問題的數據分析學家,統計師,精算師和其他一些有關于處理數據的相關人員,他們非常了解數據的狀態,結構和特征。的確這兩類人實力雄厚,前者擁有數據本身,而后者擁有技術。但他們有著同樣的短板,那就是他們沒有更為創新,靈動的視野,他們很難或者說沒有更多的時間去發現那些數據的真正力量。因為他們有太多的思維定式,但種種利用大數據的成功事例表明,每次數據創造的奇跡總在那么的偶然和不經意之間。而這正是我們第三種人的長處,我們沒有思維定式,更有閑暇的時間來感受生活,激發靈感。篇三:大數據時代讀書筆記

大數據時代——讀書筆記

一、引論

1.大數據時代的三個轉變: 1.可以分析更多的數據,處理和某個現象相關的所有數據,而不是隨機采樣 2.不熱衷于精確度

3.不熱衷與尋找因果關系 2.習慣:用來決策的信息必須是少量而精確的。實際:數據量變大,數據處理速度變快,數據不在精確

3.危險:不是隱私的泄露而是未來行動的預判

二、大數據時代的思維變革 1.原因:沒有意識到處理大規模數據的能力,假設信息匱乏,發展一些使用少量信息的技

術(隨機采樣)

1.1086年 末日審判書 英國對人的記載 2.約翰·格朗特:統計學,采樣分析精確性隨著采樣隨機性上升而大幅上升,與樣本數

量關系不大

3.1890年,穿孔卡片制表機,人口普查 4.隨機采樣有固有的缺陷 1.采樣過程中存在偏差 2.采樣不適合考察子類別

3.只能得出實現設計好的問題的結果 4.忽視了細節考察

2.全數據模式:樣本=總體 1.通過異常量判斷信用卡詐騙 2.大數據分析:不用隨機抽樣,而是采用所有數據。不是絕對意義而是相對意義。

(xroom信用卡詐騙,日本相撲比賽)3.多樣性的價值(社區外聯系很多》社區內聯系很多)3.混雜性而非精確性 1.葡萄樹溫度測量:數據變多,雖然可能有錯誤數據,但總體而言會更加精確。2.包容錯誤有更大好處

3.word語法檢查:語料庫》算法發展 4.google翻譯:讓計算機自己估算對應關系,尋找成千上萬對譯

結論:大數據的簡單算法好過小數據的復雜算法 5.大數據讓我們不執著于也無法執著于精確 6.mit的通貨緊縮軟件:即時的大數據 7.標簽:不精確

8.想要獲得大規模數據的好處,混亂是一種標準途經 9.新的數據庫:大部分數據是非結構化的,無法被利用 10.hadoop:與mapreduce系統相對的開源式分布系統,輸出結果不精確,但是非???結論:相比于依賴小數據和精確性的時代,大數據因為更強調數據的完整性和混雜性,幫助我們進一步接近事情的真相?!安糠帧焙汀贝_切“的吸引力是可以理解的。但是當我們的視野局限在我們可以分析和確定的數據上時,我們對世界的整體影響就會產生偏差和錯誤。不僅失去了盡力收集一切數據和活力,也失去了從不同角度觀察時間的權利。

三、不是因果是相關 1.知道是什么就夠了,不需要知道為什么。1.亞馬遜放棄書評組,使用大數據預測人們的未來購書需求 2.2.在小數據世界,相關關系有用,但是大數據背景,相關關系大放異彩。通過找關聯 物,相關關系可以幫助我們捕捉現在和預測未來 1.a和b經常一起發生,那么a發生時可以預測b發生 2.例子:沃爾瑪把颶風用具和蛋撻放在一起 3.過時的尋找關聯物的方法 a)原因:數據少且收集花時間 b)在建立,應用假想和選擇關聯物時容易犯錯誤 c)結論:我們不需要人工選擇關聯物 3.大數據的相關分析法更準確,更快 1.例子:fico我們知道你明天會做什么 2.伊百麗:根據個人信用卡交易記錄預測個人收入,防止逃稅 3.aviva:根據生活方式數據預測疾病 4.美國零售商target:通過購買習慣預測是否懷孕 4.通過找出新種類數據的相互聯系解決日常需要:找到關聯物并監控,我們可以預知未來

1.例子:ups與汽車修理預測 2.新生兒健康監測:肉眼看不到,但是計算機能看到 5.當收集分析和儲存數據的成本較高時,應當適當丟棄一些數據 6.數據的非線性關系 1.幸福的非線性關系 7.快速思維模式使人們偏向于用因果關系看待周圍的一切,因此經常對世界產生錯誤認識。這也使大腦為了避免辛苦思考而產生的捷徑。大數據會經常被用來證明我們習慣的思維方式是錯誤的。8.證明因果關系的實驗開銷大,難于操作;相關關系很有用,不僅是因為能為我們提供新的視角,而且提供的視角都很清晰。一旦我們考慮因果關系,這些視角會被蒙蔽。9.大數據并非是理論消亡的時代。

四、一切皆可量化 1.莫里的信息交換計劃:總結所有船只的航海日志已獲得好的航線,為第一根大西洋電纜奠定基礎

2.坐姿研究與汽車防盜系統 3.數據化

1.把現象轉變成可指標分析的量化形式的過程 2.計量和記錄促成了數據: 1.阿拉伯數字 2.計數板 3.復式記賬法

3.數字化與數據化的區別

1.例子:google的數字圖書館:開始使用掃描-》數字化,進而光學識別-》數

據化。google借此改進自己的翻譯 2.文化組學:定量分析揭示人類行為 4.文字變成數據:人可以閱讀,機器可以分析 5.方位變成數據:需要一套標準的標記系統和收集,記錄數據的工具。1. 始于古希臘

2.1884年,國際子午線會議 3.1978年,全球定位系統 4.英國汽車保險

5. ups的最佳行車路線:減少左轉 6.收集用戶地理位置數據,以便進行忠誠度計劃?;蛘呖梢灶A測交通情況 6.現實挖掘

1.處理大量手機數據,發現并預測人類的行為。2.例子:預測流感隔離區域 3.例子:通過非洲預付費用戶的位置信息和他們賬戶的資金,發現貧民窟是

經濟繁榮的跳板 7.溝通變成數據

1.facebook:社交關系數據化

號。新推特頻率可以預測電影票房

可能性呈現正相關 8.萬物數據化

1.觸覺地板:適時開關燈,確定身份,某人摔倒之后是否站起來 2.人體傳感器:監控健康狀態 4.結論:世界的本質是信息和數據,大數據提供新視角。

五、大數據的潛在價值 1.例子:captcha(驗證碼,全自動區分人類和電腦的圖靈測試)與數據再利用。作者使用了新的驗證碼recaptcha,人們從計算機光學字符識別程序無法識別的文本掃面項目中讀入單詞并輸出,知道他們都輸出正確后才確定(用來破譯數字化文本中不清楚的單詞)2.大數據時代,所有的數據都是有價值的。現在,我們能夠以較低成本獲取并存儲數據。數據的真實價值就像漂浮在海洋中的冰山,絕大部分隱藏在表面之下。3. 不同于物質性的東西,數據的價值不會隨它的使用而減少,而且可不斷被處理。意味著數據的最終價值遠遠大于它的最初價值。在基本用途完成后,數據的價值仍然存在,數據的價值是其所有可能用途的總和。4.例子:ibm與電力汽車動力系統的優化預測:大數據預測模型,甚至考慮天氣預報 5.數據再利用:

1. 搜索關鍵詞,搜索結果預測夏天流行色 2.google保存語音翻譯記錄,開發自己的語音識別技術 3.移動運營商長期使用大數據微調網絡性能 4.有些公司可能會收集到大量的數據,但是他們并不急需使用,也不擅長使用數據,但是別的公司可以借此探尋數據的潛在價值 8.重組數據 1.例子:丹麥癌癥協會與手機致癌調查:使用所有的手機用戶信息和所有的中樞神經系統腫瘤信息。

隨著大數據的出現,數據的總和比部分更有價值,當我們將多個數據集的總和重組在一起,重組總和本身的價值也比單個總和更大 9.可拓展數據 1.google街景和gps采集,不僅將其用于基本用途,而且進行了大量的二次利用。例如,對google自動駕駛汽車的運作 10.數據的折舊值

1.隨著時間的推移,大多數數據都會失去一部分基礎用途,不應用此破壞新數據 2.挑戰:如何得知某些數據不再有價值 3.并非所有數據都會貶值。例子:google希望得到每年的同比數據

結論:組織機構應收集盡可能多的使用數據并保存盡可能長的時間。同時也應該與第三方分享數據

11.數據廢氣:用戶在線交互的副產品,包括瀏覽哪些頁面,停留多久,輸入信息等 1.數據再利用的方式很隱蔽 2.例子:google的拼寫檢查:搜集每天處理的查詢中數據搜索框的錯誤拼寫 3.例子:google的過濾噪音技術:如果用戶點擊搜索結果靠后的鏈接,說明這個結果更加有相關性,google會把這個頁面的排名相應提升。4.當用戶指出了各種自動化程序的錯誤,實際上是訓練了系統 5.例子:巴諾與數據快照,電子書閱讀器捕捉人們閱讀書籍的習慣 6.例子:coursera通過捕捉學生犯的錯誤來提示未來犯錯誤者

結論:數據廢氣可以成為公司的巨大競爭優勢,和對手的強大進入堡壘 12.開放數據 1.最大的數據收集者:政府,可以強迫人們提供信息,但是信息利用效率低下。最好允許私人運營部門和社會大眾訪問

2.例子:flyontime網站,通過開放的數據分析航班延誤可能性。3.給數據估值:從數據持有人在價值提取上所采取的不同策略入手,將數據授權給第三方

三、角色定位:數據,技術與思維 2.思維轉變的重要性 3.三種大數據公司

1.基于數據本身的公司:twitter 大數據最值錢的是他本身,所以應該優先考慮數據擁有者

例子:機票預訂系統ita不直接使用數據:擔心暴露利潤

例子:mastercard通過大數據預測客戶的消費習慣 2.基于技能的公司:咨詢公司,技術供應商或者分析公司:teradata 例子:埃森哲公司利用大數據檢測汽車零件并節省費用

例子:微軟分析公司利用大數據降低病人的再入院率 3.基于思維的公司:創新思維

例子:flightcaster飛機晚點預測

例子:prismatic分析新聞并排序 4.大數據先驅者一般有跨學科的知識 5.例子:google和amazon三者兼備 6.全新的數據中間商:從各個地方搜集數據,提取有用的信息進行利用,并不威脅數據擁有者的利益

1.社會需要定向廣告

例子:inrix:分析各種汽車制造者的數據和用戶的數據,提供衛星導航服務

汽車制造商們本身數據量不夠,自身也沒有技術利用大數據,也并不介意數據會被中間商利用。同時可以提供失業率等相關數據

例子:quantcast:收集用戶訪問信息來測評用戶年齡等,之后發定向廣告

例子:hcci收集醫療保單,分析美國醫療費用上漲是否合理

結論:

1.數據價值的轉移:從技術到數據本身和大數據思維 2.傳統商業模式顛覆:交易數據而不是交易技術 3.傳統專家的光芒會被統計和數據學家取代,因為后者只關心數據 1.例子:谷歌翻譯團隊的工程師都不會說出翻譯的語言 2.真正的專家不會消亡,但是主導地位會改變 3.專業技能只適用于小數據時代,因為那是需要依靠直覺和經驗指導,但是

遭遇海量數據時,可以通過數據挖掘得到更多 4.數據和統計學知識將成為現代工廠的基礎,人類的價值體現在交流上,以進行廣泛而深刻的傳播

1.例子:交互式游戲,會根據用戶來改良,以數據為基礎運作 5.大數據決定企業核心競爭力 1.數據規模決定價值

2.例子:勞斯萊斯通過大數據監測引擎,預測可能出問題的引擎 3.例子:蘋果進軍手機 4.大數據為小公司帶來了機遇:能享受非固有資產規模的好處,低成本傳播創新結果,只需要創新思維

5.大數據擁有者會想辦法增加數據存儲量 6.消費者成為數據擁有者并與中間商交易 7.大數據對中等規模的公司幫助不大:既沒有靈活性也沒有規模效應 6.大數據撼動國家競爭力:西方世界優勢減少

四、大數據時代的管理

1.大數據會帶來很多危險,因為其核心思想是用規模劇增來改變現狀。2.濫用大數據的力量會傷害人身安全 3.大數據的二次利用顛覆了隱私保護法:無法征得個人同意 4.如果所有人的信息在數據庫里,有意識地避免就是此地無銀三百兩 5.匿名化:交叉檢驗會檢驗出來 6.大數據預測:罪責判定基于對個人未來行為的預測。大數據可能會否定人的自由意志 7.數據有其局限性,數據的質量可能會很差,有誤導性。8.卓越的才華并不依賴數據:apple喬布斯的才能

五、掌握大數據 1.個人隱私保護:從個人許可到讓數據使用者承擔責任,因為將責任從民眾轉移到數據使用者很有意義因為數據使用者比其他人更明白他們想怎么樣使用數據,也因為他們是最大利益獲得者:監管機制可以決定不同種類的個人數據必須刪除的時間 2.信息模糊處理

3.個人應該為他們的行動而非傾向負責 4.打破大數據的黑盒子:大數據算法師:評估數據源,分析數據工具,解讀運算結果 1.外部算法師:審計大數據的準確程度和有效性篇四:讀書筆記-《大數據時代》

讀《大數據時代》 初次見到維克多·邁爾-舍恩伯格教授是在《對話》欄目中,當時談及當今各種科技信息的變化,然后在主持人的各種提問下,我逐漸了解到“大數據”這個名詞,他也是現在對于大數據最有發言權的預言家。一位睿智的人總是能夠給人留下很深的印象。然后在中央財經頻道的特別節目《指尖上的商機》系列節目中,也談及到大數據對于當今時代的影響和蘊藏的巨大商機。

讀一本好書就像與智者交談。今天我翻讀《大數據時代》,細細品讀這位智者給我們的禮物。我們首先應該明白一個概念“大數據”,他不是單單的說數據很大,或者數據很多的意思,真正的意思是:不用隨機分析法這樣的捷徑,而采用所有數據的方法。它告訴我們一種超越現在的對于數據的一種分析方法,這個方法建立在盡可能多的數據上。下面讓我們合上此書,讓他從我們的思想深處開始發聲吧。

首先,大數據時代是建立的基礎就是有一個很龐大的數據庫,我們分析的對象不是抽取樣本,而是用全部的數據作為樣本,“樣本=總體”。這樣我們能夠把要調查的對象精確到每一個個體,我們能夠對每一個個體提供個性化分析和服務。我們會擺脫抽樣樣本的誤差和失誤,同樣我們能夠細化我們研究的對象和分析的數據。我們分析的適合一個大的整體,也適合每一個個體。這是大數據分析的基礎。

第二,大數據是由很多不同的紛繁復雜的數據匯總在一起的,我們必須接受他們的復雜性和不精確性,我們的研究方向除了尋找因果關系之外,增加了一種相關關系的研究。我們通過數據之間的關系,分析得到我們想要得到的結論或者是模型。在這里我們應該重點看一下,相關關系是我們打開的另一扇窗,而不能關閉因果關系的現在開著的窗戶。我們開始重視相關關系,但是不能放棄對于因果關系的研究。作者也在文中闡釋我們的生活還是需要因果關系的,甚至我們需要大數據算法師,我們需要了解“黑匣子”中的神秘。這是大數據時代我們應該正確認識的。

第三,大數據的原始來源是用不同的方法收集,為了有盡可能多的數據,我們現在有了電腦,搜索引擎,智能手機,可穿戴設備,社交平臺,還有無數的傳感器等等,我們可以把文字,位置,動作,喜好等所有的世界進行量化,他都可以用數字表示,這就是我們所有的紛繁復雜的原始數據,他們是一座鉆石礦,由于無數種的相關組合可以不斷地挖掘出我們所需要的信息。這是我們不斷利用大數據的基礎。我們需要不斷更新的數據。

第四,未來在過去的塵埃中。我們分析大數據最大的作用就是預測未來,知道下一步你會做什么,知道下一個最危險的事物或人。我們用什么方法預測未來。這是一個商業,政府,甚至世界的時代,我們分析的方法就是動用自己敏銳的思維發現相關性,然后動用我們的數據分析工具對其進行相關性分析,最后我們用統計學研究出一個模型。通過模型我們能夠預測未來。大數據分析的關鍵就在于數據,思維和技術?,F在我們有快速分析的工具,正在不斷收集數據,那么最重要的就是人類的思維,一個能夠分析相關性,能夠創新使用數據的思維。在大數據時代我們需要把統計學,軟件工程師和創新思維結合在一起的人才。

第五,我們能夠知道每一個人的位置,喜好,關注什么,即將干什么等等,對于每個人來說都是一個很可怕的事情,如果我們赤裸裸的暴露在陽光之下,或者我們正在暴露中,我們的隱私應該受到保護,這也是大數據時代一個亟待解決的問題,盡管我們匿名分析信息,到最后我們還是能夠精確到個人,我們需要有人負責,這是安全問題,自由和科技或商業的發展產生矛盾,我們應該何去何從?我們擔憂的,相信會有人來解決。這涉及到我們每個人的利益。

來暴露我們需要的產品;我們用百度、google來暴露我們所關注的事情。我想有好多雙眼睛正在盯著我們,只是我們還不知道。這是一件可怕的事情。

下載學習《大數據時代》讀書心得word格式文檔
下載學習《大數據時代》讀書心得.doc
將本文檔下載到自己電腦,方便修改和收藏,請勿使用迅雷等下載。
點此處下載文檔

文檔為doc格式


聲明:本文內容由互聯網用戶自發貢獻自行上傳,本網站不擁有所有權,未作人工編輯處理,也不承擔相關法律責任。如果您發現有涉嫌版權的內容,歡迎發送郵件至:645879355@qq.com 進行舉報,并提供相關證據,工作人員會在5個工作日內聯系你,一經查實,本站將立刻刪除涉嫌侵權內容。

相關范文推薦

    大數據時代讀書心得體會

    《大數據時代》是英國維克托·邁爾-舍恩伯格教授的著作,這本書也被尊為國外大數據研究的先河之作。下面是帶來的大數據時代讀書心得,歡迎查看。大數據時代讀書心得體會范文1《......

    《大數據》讀書心得

    《大數據》讀書心得 進入2012年大數據一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產生的海量數據,并命名與之相關的技術發展與創新,人們對于海量數據的挖掘和運用,......

    讀書報告——《大數據時代》觀后感

    讀書報告——《大數據時代》觀后感 大數據時代,一個被嚼爛的詞匯,不知從何時起,興起了數據科學的狂潮,本書核心論點,第一,要全體不要抽樣,第二,要相關不要因果,第三,要效率不要精確。......

    市場營銷讀書報告--《大數據時代》

    市場營銷讀書報告--《大數據時代》 讀書報告題目:大數據時代的生活、工作和思維變革 書名:大數據時代作者:[英]維克托·邁爾-舍恩伯格,肯尼思·庫克耶 出版社:浙江人民出版社出版......

    大數據時代

    大數據時代近年來,隨著互聯網、移動互聯網、智能手機及傳感器等的普及,信息流量有了爆發性的增長,兩會以后,互聯網里最熱的詞匯,就是李克強總理在政府工作在報告里面提到的“互......

    大數據時代

    “大”數據時代 眾所周知,數據本身就蘊藏著價值,但是將有用的數據與沒有價值的數據進行區分看起來可能是一個棘手的問題。 顯然,您所掌握的人員情況、工資表和客戶記錄對于企業......

    大數據時代

    《大數據時代》讀書筆記 作者:邁爾舍恩伯格 出版發行:浙江人民出版社 版次:2013年1月第一版 讀者:物流一班、時菲陽 一、作者觀點 谷歌有一個名為“谷歌流感趨勢”的工具,它通過......

    大數據時代來臨讀書月心得體會

    一部似乎還沒有寫完的書 ——讀《大數據時代》有感及所思 讀了《大數據時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯......

主站蜘蛛池模板: av成人午夜无码一区二区| 闺蜜张开腿让我爽了一夜| 男女真人国产牲交a做片野外| 国产v亚洲v天堂a无码| 一区二区三区四区在线不卡高清| 国产成人精品午夜福利不卡| 色婷婷综合和线在线| 2018国产精华国产精品| 97超级碰碰碰久久久久app| 久久久国产99久久国产久一| 国产精品高清一区二区不卡| 熟睡被义子侵犯中文字幕| 亚洲国产精品不卡av在线| 日韩人妻无码精品久久久不卡| 久久综合给合久久狠狠狠97色69| 8av国产精品爽爽ⅴa在线观看| 精品亚洲成a人片在线观看少妇| 香蕉久久av一区二区三区| 无码人妻丰满熟妇区五十路在线| 国产成a人亚洲精品无码久久网| 麻豆av字幕无码中文| 无码aⅴ在线观看| 少妇一晚三次一区二区三区| 亚洲精品午睡沙发系列| 久久精品人人做人人妻人人玩| 精品深夜av无码一区二区| 国产免费无码一区二区视频| 国产精品黑色丝袜高跟鞋| 久在线中文字幕亚洲日韩| 国产成人精品午夜福利在线观看| 亚洲成a人片77777kkkk| 国产成人免费视频| 成人妇女免费播放久久久| 午夜精品一区二区三区免费视频| 免费国产午夜高清在线视频| 亚洲男女羞羞无遮挡久久丫| 久久综合丝袜日本网| 中文字幕人妻无码一夲道| 色噜噜av亚洲色一区二区| 免费的国产成人av网站装睡的| 国产精品人人做人人爽人人添|