久久99精品久久久久久琪琪,久久人人爽人人爽人人片亞洲,熟妇人妻无码中文字幕,亚洲精品无码久久久久久久

對(duì)醫(yī)療大數(shù)據(jù)的認(rèn)識(shí)

時(shí)間:2019-05-11 23:39:58下載本文作者:會(huì)員上傳
簡(jiǎn)介:寫(xiě)寫(xiě)幫文庫(kù)小編為你整理了多篇相關(guān)的《對(duì)醫(yī)療大數(shù)據(jù)的認(rèn)識(shí)》,但愿對(duì)你工作學(xué)習(xí)有幫助,當(dāng)然你在寫(xiě)寫(xiě)幫文庫(kù)還可以找到更多《對(duì)醫(yī)療大數(shù)據(jù)的認(rèn)識(shí)》。

第一篇:對(duì)醫(yī)療大數(shù)據(jù)的認(rèn)識(shí)

重慶大學(xué)研究生文獻(xiàn)綜述

對(duì)醫(yī)療大數(shù)據(jù)的認(rèn)識(shí)

名: 學(xué)

號(hào): 指導(dǎo)教師: 專(zhuān)

業(yè):

重慶大學(xué)光電工程學(xué)院

二O一六年十一月 醫(yī)療大數(shù)據(jù)產(chǎn)生的背景

在任何一個(gè)初具規(guī)模的醫(yī)院,每天接待上萬(wàn)的患者前來(lái)就診,患者的基本信息、影像信息與其他特殊診療信息匯集在一起是一個(gè)龐大的數(shù)據(jù)。據(jù)統(tǒng)計(jì),上海市區(qū)域醫(yī)療信息平臺(tái)(上海市“醫(yī)聯(lián)工程”及縣區(qū)衛(wèi)生數(shù)據(jù)中心)已經(jīng)積累了覆蓋3900萬(wàn)人群、1400TB數(shù)據(jù)量的電子診療與健康檔案等醫(yī)療衛(wèi)生數(shù)據(jù)(涵蓋了全市38家三級(jí)醫(yī)院3900萬(wàn)就診人群的醫(yī)療信息,包括患者基本信息、就診信息、健康檔案、檢驗(yàn)及影像檢查報(bào)告、醫(yī)學(xué)影像圖像文件、住院相關(guān)病歷、醫(yī)保結(jié)算等醫(yī)療衛(wèi)生數(shù)據(jù),涉及就診記錄2.1億條,處方記錄9.1億條)。

日積月累,這個(gè)數(shù)據(jù)量將會(huì)持續(xù)快速增長(zhǎng),為醫(yī)院的數(shù)據(jù)存儲(chǔ)、集成、調(diào)用等應(yīng)用帶來(lái)巨大壓力。除了數(shù)據(jù)規(guī)模巨大之外,醫(yī)療行業(yè)的數(shù)據(jù)類(lèi)型和結(jié)構(gòu)極其復(fù)雜,如PACS影像、B超、病例分析等業(yè)務(wù)產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)存儲(chǔ)復(fù)雜,并且對(duì)傳統(tǒng)的處理方法和技術(shù)帶來(lái)巨大挑戰(zhàn)【1】。醫(yī)療大數(shù)據(jù)得到人們的關(guān)注,并渴望有一種新的技術(shù)可以從這些看似雜亂無(wú)章的數(shù)據(jù)中得到價(jià)值。目前,為了提高人們的健康水平以及醫(yī)療水平,醫(yī)療行業(yè)在大數(shù)據(jù)環(huán)境下的各個(gè)領(lǐng)域異常活躍[2]。醫(yī)療大數(shù)據(jù)的相關(guān)概念

2.1 醫(yī)療大數(shù)據(jù)的定義

醫(yī)療數(shù)據(jù)是醫(yī)生對(duì)患者診療和治療過(guò)程中產(chǎn)生的數(shù)據(jù),包括患者基本數(shù)據(jù)、入出轉(zhuǎn)數(shù)據(jù)、電子病歷、診療數(shù)據(jù)、醫(yī)學(xué)影像數(shù)據(jù)、醫(yī)學(xué)管理、經(jīng)濟(jì)數(shù)據(jù)等,以患者為中心,成為醫(yī)療信息的主要來(lái)源。

隨著醫(yī)療衛(wèi)生信息化建設(shè)進(jìn)程的不斷加快,醫(yī)療數(shù)據(jù)的類(lèi)型和規(guī)模正以前所未有的速度快速的增長(zhǎng),以至于無(wú)法利用目前主流軟件工具,在合理的時(shí)間內(nèi)達(dá)到擷取、管理并整合成為能夠幫助醫(yī)院進(jìn)行更積極目的經(jīng)營(yíng)決策的有用信息。規(guī)模巨大的臨床實(shí)驗(yàn)數(shù)據(jù)、疾病診斷數(shù)據(jù)以及居民行為健康數(shù)據(jù)等匯聚在一起形成了醫(yī)療大數(shù)據(jù)。

2.2 醫(yī)療大數(shù)據(jù)的主要來(lái)源

2.2.1 制藥企業(yè)、生命科學(xué)

藥物研發(fā)所產(chǎn)生的數(shù)據(jù)是相當(dāng)密集的,對(duì)于中小型的企業(yè)也在百億字節(jié)(TB)以上的。在生命科學(xué)領(lǐng)域,隨著計(jì)算能力和基因測(cè)序能力逐步增加,美國(guó)哈弗醫(yī)學(xué)院個(gè)人基因組項(xiàng)目負(fù)責(zé)人詹姆·鮑比就認(rèn)為,到2015年,將會(huì)有5000萬(wàn)人擁有個(gè)人基因圖譜,而一個(gè)基因組序列文件大小約為750MB[3]。

2.2.2 臨床醫(yī)療、實(shí)驗(yàn)室數(shù)據(jù)

臨床和實(shí)驗(yàn)室數(shù)據(jù)整合在一起,使得醫(yī)療機(jī)構(gòu)面臨的數(shù)據(jù)增長(zhǎng)非常快,一張普通CT圖像含有大約150MB的數(shù)據(jù),一個(gè)標(biāo)準(zhǔn)的病理圖則接近5GB。如果將這些數(shù)據(jù)量乘

以人口數(shù)量和平均壽命,僅一個(gè)社區(qū)醫(yī)院積累的數(shù)據(jù)量就可達(dá)數(shù)萬(wàn)億字節(jié)甚至數(shù)千萬(wàn)億字節(jié)(PB)之多。

2.2.3 費(fèi)用、醫(yī)療保險(xiǎn)、利用率

患者在就醫(yī)過(guò)程中產(chǎn)生的費(fèi)用信息、報(bào)銷(xiāo)信息、新農(nóng)合基金使用情況等。

2.2.4 健康管理、社交網(wǎng)絡(luò)

隨著移動(dòng)設(shè)備和移動(dòng)互聯(lián)網(wǎng)的飛速發(fā)展,便攜化的生理設(shè)備正在普及,如果個(gè)人健康信息都能連入互聯(lián)網(wǎng),那么由此產(chǎn)生的數(shù)據(jù)量將不可估量。

2.3 醫(yī)療數(shù)據(jù)的基本類(lèi)型

2.3.1 醫(yī)院信息系統(tǒng)(HIS)數(shù)據(jù)

HIS是醫(yī)院的核心系統(tǒng),是對(duì)醫(yī)院及其所屬各部門(mén)的人流、物流、財(cái)流進(jìn)行綜合管理的系統(tǒng),圍繞著醫(yī)療活動(dòng)的各個(gè)階段產(chǎn)生相關(guān)數(shù)據(jù),包括各門(mén)診數(shù)據(jù)及病房數(shù)據(jù)兩大主流數(shù)據(jù)流。

2.3.2 檢驗(yàn)信息系統(tǒng)(LIS)數(shù)據(jù)

LIS是HIS的一個(gè)重要組成部分,其主要功能是將實(shí)驗(yàn)儀器傳出的檢驗(yàn)數(shù)據(jù)經(jīng)分析后,生成檢驗(yàn)報(bào)告,通過(guò)網(wǎng)絡(luò)存儲(chǔ)在數(shù)據(jù)庫(kù)中,使醫(yī)生能夠方便、及時(shí)的看到患者的檢驗(yàn)結(jié)果。

2.3.3 醫(yī)學(xué)影像存檔和傳輸系統(tǒng)(PACS)數(shù)據(jù)

PACS數(shù)據(jù)主要是將數(shù)字化醫(yī)院影像科室日常核磁、CT、超聲、各種X線機(jī)、各種紅外儀等設(shè)備產(chǎn)生的圖像存儲(chǔ)起來(lái)。

2.3.4 電子病歷(EMR)數(shù)據(jù)

EMR不同于以醫(yī)療機(jī)構(gòu)為中心的門(mén)診或者住院病歷,是真正以患者為中心的診斷和其他檢驗(yàn)數(shù)據(jù)的“數(shù)據(jù)池”,它將患者診斷過(guò)程中生成的影像和信號(hào),如X線檢查、CT掃描等納入電子病歷中,并以統(tǒng)一的形式組織起來(lái)。

2.4 醫(yī)療大數(shù)據(jù)的特性

2.4.1 數(shù)據(jù)規(guī)模大(volume)

例如一個(gè)CT圖像含有大約150MB的數(shù)據(jù),而一個(gè)基因組序列文件大小約為750MB,一個(gè)標(biāo)準(zhǔn)的病理圖則大得多,接近5GB。

2.4.2 數(shù)據(jù)結(jié)構(gòu)多樣(variety)

相對(duì)于其他行業(yè),醫(yī)學(xué)中的數(shù)據(jù)類(lèi)型更加多種多樣,如電子病案中關(guān)于人口學(xué)特征的數(shù)據(jù)為純文本型;檢驗(yàn)科中有關(guān)患者生理、生化指標(biāo)為數(shù)字型;影像科中如B超、CT、MR、X線片等為圖像資料。

醫(yī)療數(shù)據(jù)通常會(huì)包含各種結(jié)構(gòu)化表、非(半)結(jié)構(gòu)化文本文檔(XML和敘述文本)、醫(yī)療影像等多種多樣的數(shù)據(jù)存儲(chǔ)形式。

2.4.3 數(shù)據(jù)增長(zhǎng)快速(velocity)

一方面,醫(yī)療信息服務(wù)中包含大量在線或?qū)崟r(shí)數(shù)據(jù)分析處理,例如,臨床決策支持中的診斷和用藥建議、流行病分析報(bào)表生成、健康指標(biāo)預(yù)警等;另一方面,得益于信息技術(shù)的發(fā)展,越來(lái)越多的醫(yī)療信息被數(shù)字化,因此在很長(zhǎng)一段時(shí)間里,醫(yī)療衛(wèi)生領(lǐng)域數(shù)據(jù)的增長(zhǎng)速度將依然會(huì)很快。

2.4.4 數(shù)據(jù)價(jià)值巨大(value)

毋庸置疑,數(shù)據(jù)是石油,是資產(chǎn),是資源,醫(yī)療大數(shù)據(jù)不僅與每個(gè)人的個(gè)人生活息息相關(guān),對(duì)這些數(shù)據(jù)的有效利用更關(guān)系到國(guó)家乃至全球的疾病防控、新藥品研發(fā)和頑疾攻克的能力。

2.4.5 多態(tài)性

醫(yī)療大數(shù)據(jù)包括純數(shù)據(jù)(如體檢、化驗(yàn)結(jié)果)、信號(hào)(如腦電信號(hào)、心電信號(hào)等)、圖像(如B超、X線等)、文字(如主訴、現(xiàn)/往病史、過(guò)敏史、檢測(cè)報(bào)告等),以及用以科普、咨詢的動(dòng)畫(huà)、語(yǔ)音盒視頻信息等多種形態(tài)的數(shù)據(jù),是區(qū)別于其他領(lǐng)域數(shù)據(jù)的最顯著特征。

2.4.6 不完整性

醫(yī)療數(shù)據(jù)的搜集和處理過(guò)程經(jīng)常相互脫節(jié),這使得醫(yī)療數(shù)據(jù)庫(kù)不可能對(duì)任何疾病信息都能全面反映。大量數(shù)據(jù)來(lái)源于人工記錄,導(dǎo)致數(shù)據(jù)記錄的偏差和殘缺,許多數(shù)據(jù)的表達(dá)、記錄本身也具有不確定性,病例和病案尤為突出,這些都造成了醫(yī)療大數(shù)據(jù)的不完整性

2.4.7 時(shí)間性

患者的就診、疾病的發(fā)生過(guò)程在時(shí)間上有一個(gè)進(jìn)度,醫(yī)學(xué)檢測(cè)的波形、圖像都是時(shí)間函數(shù),這些都具有一定的時(shí)序性。

2.4.8 冗余性

醫(yī)學(xué)數(shù)據(jù)量大,每天都會(huì)產(chǎn)生大量信息,其中可能會(huì)包含重復(fù)、無(wú)關(guān)緊要甚至是互相矛盾的記錄。醫(yī)療大數(shù)據(jù)的主要應(yīng)用

根據(jù)全球管理咨詢公司麥肯錫的一份最新報(bào)告顯示,醫(yī)療保健領(lǐng)域如果能夠充分有效地利用大數(shù)據(jù)資源,醫(yī)療機(jī)構(gòu)和消費(fèi)者便可節(jié)省高達(dá)4500億美元的費(fèi)用[4]。

3.1 服務(wù)居民

居民健康指導(dǎo)服務(wù)系統(tǒng),提供精準(zhǔn)醫(yī)療、個(gè)性化健康保健指導(dǎo),使居民能在醫(yī)院、社區(qū)及線上的服務(wù)保持持續(xù)性。例如,提供心血管、癌癥、高血壓、糖尿病等慢病干

預(yù)、管理、健康預(yù)警及健康宣教(保健方案訂閱、推送)。

醫(yī)療機(jī)構(gòu)物聯(lián)網(wǎng)的建設(shè),包括移動(dòng)醫(yī)療、臨床監(jiān)控、遠(yuǎn)程患者監(jiān)控等(例如,充血性心臟的標(biāo)志之一是由于保水而增加體重,通過(guò)遠(yuǎn)程監(jiān)控體重發(fā)現(xiàn)相關(guān)疾病,提醒醫(yī)生及時(shí)采取治療措施,防止急性狀況發(fā)生),減少患者住院時(shí)間,減少急診量,提高家庭護(hù)理比例和門(mén)診醫(yī)生預(yù)約量。

3.2 服務(wù)醫(yī)生

臨床決策支持,如用藥分析、藥品不良反應(yīng)、疾病并發(fā)癥、治療療效相關(guān)性分析、抗生素應(yīng)用分析;或是制定個(gè)性化治療方案。

3.3 服務(wù)科研

包括疾病診斷與預(yù)測(cè)、提高臨床試驗(yàn)設(shè)計(jì)的統(tǒng)計(jì)工具和算法、臨床實(shí)驗(yàn)數(shù)據(jù)的分析與處理等方面,如針對(duì)重大疾病識(shí)別疾病易感染基因、極端表型人群;提供最佳治療路徑。

3.4 服務(wù)管理機(jī)構(gòu)

規(guī)范性用藥評(píng)價(jià)、管理績(jī)效分析;流行病、急病等預(yù)防干預(yù)及措施評(píng)價(jià);公眾健康監(jiān)測(cè),付款(或定價(jià))、臨床路徑的優(yōu)化等。

3.5 公眾健康服務(wù)

包括危及健康因素的監(jiān)控與預(yù)警、網(wǎng)絡(luò)平臺(tái)、社區(qū)服務(wù)等方面。國(guó)內(nèi)外醫(yī)療大數(shù)據(jù)技術(shù)應(yīng)用現(xiàn)狀

4.1 國(guó)外醫(yī)療大數(shù)據(jù)技術(shù)應(yīng)用現(xiàn)狀

美國(guó)遠(yuǎn)程醫(yī)療(telemedicine)公司研制成功了一款功能強(qiáng)大的醫(yī)療設(shè)備“智能心臟”(smartheart),把手機(jī)變成了一款功能齊全的醫(yī)療工具,用來(lái)監(jiān)測(cè)用戶可能存在的心臟病問(wèn)題。智能心臟與智能手機(jī)相連,在安裝運(yùn)行了相應(yīng)的程序后,手機(jī)擁有“醫(yī)療級(jí)”的心臟監(jiān)測(cè)功能,并能夠在30s內(nèi)在手機(jī)屏幕上顯示用戶的心電圖。醫(yī)生可隨時(shí)對(duì)患者的心臟進(jìn)行監(jiān)測(cè)和分析,提前做好預(yù)防措施。智能心臟解決了心臟病預(yù)防方面最關(guān)鍵的問(wèn)題—時(shí)間。這在心臟病預(yù)防領(lǐng)域是一項(xiàng)重大的突破性技術(shù)。目前,“智能心臟”設(shè)備已經(jīng)開(kāi)始在網(wǎng)上銷(xiāo)售。

意大利電信近期推出了Nuvola It Home Docto 系統(tǒng),可讓在都靈Molinette 醫(yī)院的慢性病患者通過(guò)手機(jī)在家中監(jiān)測(cè)自己的生理參數(shù),相關(guān)數(shù)據(jù)將自動(dòng)的通過(guò)手機(jī)發(fā)送到醫(yī)療平臺(tái),也可以通過(guò)ADSL、WiFi 和衛(wèi)星網(wǎng)絡(luò)得到應(yīng)用。醫(yī)生通過(guò)網(wǎng)頁(yè)接入這

個(gè)平臺(tái),及時(shí)獲取數(shù)據(jù)并調(diào)整治療方案。

4.2 國(guó)內(nèi)醫(yī)療大數(shù)據(jù)技術(shù)應(yīng)用現(xiàn)狀

IBM在上海的部分醫(yī)院推出了BYOD系統(tǒng),即員工自費(fèi)終端,用來(lái)提高醫(yī)生和護(hù)士在醫(yī)院的移動(dòng)性。通過(guò)和開(kāi)發(fā)商合作,推出移動(dòng)護(hù)理應(yīng)用,將醫(yī)生和護(hù)士的各種移動(dòng)終端連在同一網(wǎng)絡(luò)下,便于醫(yī)生和護(hù)士了解患者在醫(yī)院的位置和健康狀況,也提高了醫(yī)生和護(hù)士的移動(dòng)性。

在上海,醫(yī)聯(lián)工程橫向覆蓋全市三級(jí)醫(yī)院,縱向連通各區(qū)屬醫(yī)療機(jī)構(gòu),已覆蓋3900萬(wàn)患者,建成國(guó)內(nèi)最大的患者診療檔案庫(kù),擁有8.2億條醫(yī)囑、1.8億個(gè)病案、8100萬(wàn)份檢驗(yàn)檢查報(bào)告和107太字節(jié)醫(yī)學(xué)影像數(shù)據(jù);醫(yī)聯(lián)工程在服務(wù)醫(yī)改、支撐資源整合、分布式影像網(wǎng)絡(luò)會(huì)診、三級(jí)醫(yī)院診療信息社區(qū)調(diào)閱等方面,大幅度提升了區(qū)域衛(wèi)生服務(wù)水平。

醫(yī)聯(lián)工程建成以來(lái),對(duì)于患者,就醫(yī)更方便,“一院辦卡,跨院就醫(yī)”“就醫(yī)一站式付費(fèi)”,共發(fā)放1300余萬(wàn)張醫(yī)聯(lián)卡,每月提供70萬(wàn)專(zhuān)家預(yù)約號(hào)源,人均節(jié)約就診時(shí)間60min、排隊(duì)時(shí)間45min;對(duì)于醫(yī)生,服務(wù)看診、提高醫(yī)療質(zhì)量,支持每日5000人次實(shí)時(shí)診療檔案調(diào)閱、1.25萬(wàn)人次重復(fù)醫(yī)療智能提醒,節(jié)約大量醫(yī)療費(fèi)用;對(duì)于管理者,實(shí)現(xiàn)精細(xì)化管理,建成集醫(yī)療管理、績(jī)效考核和統(tǒng)計(jì)分析為一體的整合平臺(tái),為醫(yī)院管理提供決策支持。醫(yī)療大數(shù)據(jù)安全

5.1 人的安全

醫(yī)療大數(shù)據(jù)安全中“人”的安全,涉及的是數(shù)據(jù)隱私保護(hù)問(wèn)題。在醫(yī)療過(guò)程中,患者的個(gè)人隱私主要有:在體檢、診斷、治療、疾病控制、醫(yī)學(xué)研究過(guò)程中涉及的個(gè)人肌體特征、健康狀況、人際接觸、遺傳基因、病史病歷等[5]。這些內(nèi)容還能被分為顯性與隱性,顯性一般是醫(yī)囑、診斷書(shū)、X線片、檢查結(jié)果、報(bào)告單、病歷、病案、住院患者床頭卡等數(shù)據(jù);隱性則是指蘊(yùn)藏在這些數(shù)據(jù)歷的信息,如患者血液組織所蘊(yùn)含著的基因信息,患者罹患疾病所反應(yīng)出的生活方式或者折射出的家族遺傳歷史等。

5.2 數(shù)據(jù)安全

一是易成為網(wǎng)絡(luò)攻擊的顯著目標(biāo),在網(wǎng)絡(luò)空間中,醫(yī)療大數(shù)據(jù)的關(guān)注高,其中含有的敏感數(shù)據(jù)會(huì)吸引潛在的攻擊者;二是對(duì)現(xiàn)有存儲(chǔ)或者安全防范措施提出挑戰(zhàn),特別是數(shù)據(jù)大集中后復(fù)雜多樣的數(shù)據(jù)存放在一起,常規(guī)的安全掃描手段無(wú)法滿足安全要求。這些問(wèn)題將表現(xiàn)在數(shù)據(jù)資源共享、數(shù)據(jù)資產(chǎn)界定和盤(pán)活,以及數(shù)據(jù)真實(shí)性判斷等各個(gè)方面。醫(yī)療大數(shù)據(jù)的未來(lái)展望

6.1 社會(huì)化醫(yī)學(xué)

曾任美國(guó)克利夫蘭醫(yī)學(xué)中心(Cleveland Clinic)心血管科主任的美國(guó)心臟病學(xué)家埃里克·托普(Eric Topol),新近出版了一本名為《顛覆醫(yī)療》[6]的書(shū),在此書(shū)中他認(rèn)為:互聯(lián)網(wǎng)的沉浸式和參與式文化培育了消費(fèi)者,“每10個(gè)美國(guó)人中就有超過(guò)8位在網(wǎng)絡(luò)上查詢與健康相關(guān)的問(wèn)題”,甚至有的“患者會(huì)自帶著一系列摘自網(wǎng)絡(luò)的醫(yī)學(xué)問(wèn)題”去訪問(wèn)醫(yī)生,對(duì)自身病情、疾病和藥物的知悉程度較過(guò)去高出很多,與此同時(shí),醫(yī)生的權(quán)威性大幅度降低。由此可見(jiàn),這就是未來(lái)的趨勢(shì)—社會(huì)化醫(yī)學(xué)。

6.2 個(gè)性化醫(yī)學(xué)

個(gè)性化醫(yī)療,是指以個(gè)人基因組數(shù)據(jù)位基礎(chǔ),結(jié)合蛋白質(zhì)組和代謝組等相關(guān)內(nèi)環(huán)境數(shù)據(jù),考察遺傳變異、對(duì)特定疾病的易感性和對(duì)特殊藥物的反應(yīng)的關(guān)系,為患者量身設(shè)計(jì)出最佳治療方案,以期達(dá)到治療效果最大化和副作用最小化的定制醫(yī)療模式。實(shí)施個(gè)性化醫(yī)療,首先針對(duì)特定疾病亞群進(jìn)行分類(lèi),然后根據(jù)這些亞群的特異性發(fā)病機(jī)制進(jìn)行藥物開(kāi)發(fā),最終對(duì)這些亞群患者進(jìn)行針對(duì)性治療。這些涉及醫(yī)學(xué)、生物、環(huán)境、社會(huì)和心理等諸多因素,傳統(tǒng)的數(shù)據(jù)分析技術(shù)會(huì)遭遇瓶頸,很難以開(kāi)展針對(duì)性研究,故而引發(fā)了大數(shù)據(jù)技術(shù)的介入。在現(xiàn)有研究中,通過(guò)對(duì)醫(yī)療大數(shù)據(jù)的分析和利用,可以完善個(gè)性化醫(yī)療。較著名的是德國(guó)默克公司正與Regenstrief研究院一起實(shí)施的個(gè)性化醫(yī)療項(xiàng)目。考察遺傳變異、對(duì)特定疾病的易感染性和對(duì)特殊藥物的反應(yīng)三者之間的關(guān)系,然后在藥物研發(fā)和用藥過(guò)程中考慮個(gè)人的遺傳變異因素。針對(duì)不同的患者采取不同的治療方案,或者根據(jù)患者的實(shí)際情況調(diào)整藥物劑量,可以減少副作用。總結(jié)

根據(jù)國(guó)際數(shù)據(jù)公司(International Data Corporation,IDC)的預(yù)測(cè),中國(guó)的大數(shù)據(jù)市場(chǎng)在2012~2016年將增長(zhǎng)5倍,其中最多份額將集中在政府、銀行、醫(yī)療衛(wèi)生、電信等四大行業(yè)【7】。醫(yī)療行業(yè)的數(shù)據(jù)已進(jìn)入大數(shù)據(jù)時(shí)代,使用大數(shù)據(jù)庫(kù)作為工具,將會(huì)輔助產(chǎn)生更有效、更加經(jīng)濟(jì)的醫(yī)療政策,更好的產(chǎn)品和服務(wù)[8]醫(yī)療大數(shù)據(jù)為我國(guó)帶來(lái)了機(jī)遇的同時(shí)也帶來(lái)了挑戰(zhàn),雖然只是剛剛起步,但是前景還是值得期待的。

參考文獻(xiàn)

[1](于廣軍 楊佳泓主編 醫(yī)療大數(shù)據(jù) 上海科學(xué)技術(shù)出版社P14)

[2](Kayyali B,Knott D,Van Kuilen S.The big-data revolution in US health care: Accelerating value and innovation[J].Mc Kinsey & Company,2013)[3](David Marco,John Wiley.Building and managing the meta data repository: a full lifecycle guide[M].New York: John Wiley & Sons Inc,2000)

[4](Kayyali B,Knott D,Van Kuilen S.The big-data revolution in US health care: Accelerating value and innovation[J].Mc Kinsey & Company,2013)[5](湯嘯天.個(gè)人健康醫(yī)療信息和隱私權(quán)保護(hù)[J].同濟(jì)大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2006,17(3):117-123)

[6](http://)

[7](Inmon W.Building the data warehouse[M].3rd ed.New York: John Wiley & Sons Inc,2002)

[8](郭曉科主編 《大數(shù)據(jù)》 清華大學(xué)出版社 p22)

第二篇:對(duì)大數(shù)據(jù)的認(rèn)識(shí)

對(duì)于大數(shù)據(jù)的認(rèn)識(shí)和理解

這學(xué)期選修了網(wǎng)絡(luò)工程這門(mén)課程,當(dāng)時(shí)是抱著掃盲的態(tài)度選的這門(mén)課程,給自己定的目標(biāo)不高,只需要對(duì)一些基礎(chǔ)的概念和網(wǎng)絡(luò)結(jié)構(gòu)有些認(rèn)識(shí)就可以,以免以后在人前談?wù)摰臅r(shí)候不至于成為IT文盲,被一些專(zhuān)業(yè)性的技術(shù)人員所嚇倒。事實(shí)證明,態(tài)度決定一切,由于自己剛開(kāi)始設(shè)定的目標(biāo)就比較低,所以注定能夠上升到的水平也就不高。

經(jīng)過(guò)這幾周的學(xué)習(xí),對(duì)計(jì)算機(jī)網(wǎng)絡(luò)的基礎(chǔ)知識(shí)和大致結(jié)構(gòu)有了一個(gè)粗淺的認(rèn)識(shí)。由于學(xué)生本身這方面的基礎(chǔ)不扎實(shí),知識(shí)結(jié)構(gòu)在這方面比較薄弱,所以不能在技術(shù)方面進(jìn)行深入的研究,只能對(duì)一些理論性的知識(shí)做一些了解和認(rèn)識(shí),建立起大概的知識(shí)框架。在學(xué)習(xí)過(guò)程中,魏忠老師所提及的知識(shí)中有一點(diǎn)印象最為深刻,關(guān)于大數(shù)據(jù)Big Data方面的提及引起了我很大的興趣,越是自己私下里做了一些閱讀和查詢(主要是維克托·邁爾-舍恩伯格的《大數(shù)據(jù)時(shí)代》和網(wǎng)絡(luò)上查看的一些資料)。最后提交的這篇課程總結(jié)就著重報(bào)告一下自己在閱讀了他人關(guān)于大數(shù)據(jù)的一些理論后自身的認(rèn)識(shí)。

在這之前,我發(fā)現(xiàn)身邊很多人都提起過(guò)大數(shù)據(jù),其中包括老師和同學(xué)。可是對(duì)于這些熱門(mén)的新技術(shù)、新趨勢(shì)人們往往趨之若鶩卻又很難說(shuō)的透徹,如果你問(wèn)他大數(shù)據(jù)和你有什么關(guān)系?估計(jì)很少同學(xué)能說(shuō)出一二三來(lái)。究其原因,一是因?yàn)榇蠹覍?duì)新技術(shù)有著相同的原始渴求,至少知其然在聊天時(shí)不會(huì)顯得很“無(wú)知”,因?yàn)楝F(xiàn)在人們普遍都有以一種信息焦慮感,別人知道的東西我不知道,就會(huì)感到焦慮,無(wú)論這些信息對(duì)你有沒(méi)有用;二是在工作和生活環(huán)境中真正能參與實(shí)踐大數(shù)據(jù)的案例實(shí)在太少了,所以大家沒(méi)有必要花時(shí)間去知其所以然。當(dāng)然我也一樣,雖然我希望能有些不一樣,但是自己實(shí)在欠缺IT這方面的知識(shí),所以也只能查閱一些資料,翻閱了最新的專(zhuān)業(yè)書(shū)籍,在自己局限的認(rèn)識(shí)下把這些些零散的資料碎片或不同理解論述綜合起來(lái)做一個(gè)類(lèi)似于文獻(xiàn)綜述的報(bào)告,其實(shí)我很真誠(chéng)的希望進(jìn)入事物探尋本質(zhì)。下面就從理論、技術(shù)、實(shí)踐這三個(gè)層面寫(xiě)一下大數(shù)據(jù)的認(rèn)識(shí)

大數(shù)據(jù)的一些相關(guān)理論:

最早提出大數(shù)據(jù)時(shí)代到來(lái)的是麥肯錫:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對(duì)于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來(lái)。”

業(yè)界(IBM 最早定義)將大數(shù)據(jù)的特征歸納為4個(gè)“V”(量Volume,多樣Variety,價(jià)值Value,速Velocity),或者說(shuō)特點(diǎn)有四個(gè)層面:第一,數(shù)據(jù)體量巨大。大數(shù)據(jù)的起始計(jì)量單位至少是P(1000個(gè)T)、E(100萬(wàn)個(gè)T)或Z(10億個(gè)T);第二,數(shù)據(jù)類(lèi)型繁多。比如,網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等等。第三,價(jià)值密度低,商業(yè)價(jià)值高。第四,處理速度快。最后這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。

很早就流傳著一句話:三分技術(shù),七分?jǐn)?shù)據(jù),得數(shù)據(jù)者得天下。先不論這句話是誰(shuí)說(shuō)得,但是這句話的正確性已經(jīng)不用去論證了。維克托·邁爾-舍恩伯格在《大數(shù)據(jù)時(shí)代》一書(shū)中舉了很多例證,都是為了說(shuō)明一個(gè)道理:在大數(shù)據(jù)時(shí)代已經(jīng)到來(lái)的時(shí)候要用大數(shù)據(jù)思維去發(fā)掘大數(shù)據(jù)的潛在價(jià)值。書(shū)中,作者提及最多的

是Google如何利用人們的搜索記錄挖掘數(shù)據(jù)二次利用價(jià)值,比如預(yù)測(cè)某地流感爆發(fā)的趨勢(shì);Amazon如何利用用戶的購(gòu)買(mǎi)和瀏覽歷史數(shù)據(jù)進(jìn)行有針對(duì)性的書(shū)籍購(gòu)買(mǎi)推薦,以此有效提升銷(xiāo)售量;Fare cast如何利用過(guò)去十年所有的航線機(jī)票價(jià)格打折數(shù)據(jù),來(lái)預(yù)測(cè)用戶購(gòu)買(mǎi)機(jī)票的時(shí)機(jī)是否合適。這里維克托·邁爾-舍恩伯格所認(rèn)為的大數(shù)據(jù)思維是:1需要全部數(shù)據(jù)樣本而不是抽樣;2關(guān)注效率而不是精確度;3關(guān)注相關(guān)性而不是因果關(guān)系。

大數(shù)據(jù)是什么?投資者眼里是金光閃閃的兩個(gè)字:資產(chǎn)。比如,F(xiàn)acebook上市時(shí),評(píng)估機(jī)構(gòu)評(píng)定的有效資產(chǎn)中大部分都是其社交網(wǎng)站上的數(shù)據(jù)。如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實(shí)現(xiàn)盈利的關(guān)鍵,在于提高對(duì)數(shù)據(jù)的“加工能力”,通過(guò)“加工”實(shí)現(xiàn)數(shù)據(jù)的“增值”。

大數(shù)據(jù)的一些相關(guān)技術(shù): 1)云技術(shù):

大數(shù)據(jù)常和云計(jì)算聯(lián)系到一起,因?yàn)閷?shí)時(shí)的大型數(shù)據(jù)集分析需要分布式處理框架來(lái)向數(shù)

十、數(shù)百或甚至數(shù)萬(wàn)的電腦分配工作。可以說(shuō),云計(jì)算充當(dāng)了工業(yè)革命時(shí)期的發(fā)動(dòng)機(jī)的角色,而大數(shù)據(jù)則是電。

云計(jì)算思想的起源是麥卡錫在上世紀(jì)60年代提出的:把計(jì)算能力作為一種像水和電一樣的公用事業(yè)提供給用戶。如今,在Google、Amazon、Facebook等一批互聯(lián)網(wǎng)企業(yè)引領(lǐng)下,一種行之有效的模式出現(xiàn)了:云計(jì)算提供基礎(chǔ)架構(gòu)平臺(tái),大數(shù)據(jù)應(yīng)用運(yùn)行在這個(gè)平臺(tái)上。

業(yè)內(nèi)是這么形容兩者的關(guān)系:沒(méi)有大數(shù)據(jù)的信息積淀,則云計(jì)算的計(jì)算能力再?gòu)?qiáng)大,也難以找到用武之地;沒(méi)有云計(jì)算的處理能力,則大數(shù)據(jù)的信息積淀再豐富,也終究只是鏡花水月。

那么大數(shù)據(jù)到底需要哪些云計(jì)算技術(shù)呢?

這里暫且列舉一些,比如虛擬化技術(shù),分布式處理技術(shù),海量數(shù)據(jù)的存儲(chǔ)和管理技術(shù),NOSQL、實(shí)時(shí)流數(shù)據(jù)處理、智能分析技術(shù)(類(lèi)似模式識(shí)別以及自然語(yǔ)言理解)等。

2)分布式技術(shù):

分布式處理系統(tǒng)可以將不同地點(diǎn)的或具有不同功能的或擁有不同數(shù)據(jù)的多臺(tái)計(jì)算機(jī)用通信網(wǎng)絡(luò)連接起來(lái),在控制系統(tǒng)的統(tǒng)一管理控制下,協(xié)調(diào)地完成信息處理任務(wù)—這就是分布式處理系統(tǒng)的定義。

3)感知技術(shù):

大數(shù)據(jù)的采集和感知技術(shù)的發(fā)展是緊密聯(lián)系的。以傳感器技術(shù),指紋識(shí)別技術(shù),RFID技術(shù),坐標(biāo)定位技術(shù)等為基礎(chǔ)的感知能力提升同樣是物聯(lián)網(wǎng)發(fā)展的基石。全世界的工業(yè)設(shè)備、汽車(chē)、電表上有著無(wú)數(shù)的數(shù)碼傳感器,隨時(shí)測(cè)量和傳遞著有關(guān)位置、運(yùn)動(dòng)、震動(dòng)、溫度、濕度乃至空氣中化學(xué)物質(zhì)的變化,都會(huì)產(chǎn)生海量的數(shù)據(jù)信息。

其實(shí),這些感知被逐漸捕獲的過(guò)程就是就世界被數(shù)據(jù)化的過(guò)程,一旦世界被完全數(shù)據(jù)化了,那么世界的本質(zhì)也就是信息了

大數(shù)據(jù)的實(shí)踐:

政府各個(gè)部門(mén)都握有構(gòu)成社會(huì)基礎(chǔ)的原始數(shù)據(jù),比如,氣象數(shù)據(jù),金融數(shù)據(jù),信用數(shù)據(jù),電力數(shù)據(jù),煤氣數(shù)據(jù),自來(lái)水?dāng)?shù)據(jù),道路交通數(shù)據(jù),客運(yùn)數(shù)據(jù),安全刑事案件數(shù)據(jù),住房數(shù)據(jù),海關(guān)數(shù)據(jù),出入境數(shù)據(jù),旅游數(shù)據(jù),醫(yī)療數(shù)據(jù),教育數(shù)據(jù),環(huán)保數(shù)據(jù)等等。這些數(shù)據(jù)在每個(gè)政府部門(mén)里面看起來(lái)是單一的,靜態(tài)的。

但是,如果政府可以將這些數(shù)據(jù)關(guān)聯(lián)起來(lái),并對(duì)這些數(shù)據(jù)進(jìn)行有效的關(guān)聯(lián)分析和統(tǒng)一管理,這些數(shù)據(jù)必定將獲得新生,其價(jià)值是無(wú)法估量的。

具體來(lái)說(shuō),現(xiàn)在城市都在走向智能和智慧,比如,智能電網(wǎng)、智慧交通、智慧醫(yī)療、智慧環(huán)保、智慧城市,這些都依托于大數(shù)據(jù),可以說(shuō)大數(shù)據(jù)是智慧的核心能源。從國(guó)內(nèi)整體投資規(guī)模來(lái)看,到2012年底全國(guó)開(kāi)建智慧城市的城市數(shù)超過(guò)180個(gè),通信網(wǎng)絡(luò)和數(shù)據(jù)平臺(tái)等基礎(chǔ)設(shè)施建設(shè)投資規(guī)模接近5000億元。“十二五”期間智慧城市建設(shè)拉動(dòng)的設(shè)備投資規(guī)模將達(dá)1萬(wàn)億元人民幣。大數(shù)據(jù)為智慧城市的各個(gè)領(lǐng)域提供決策支持。在城市規(guī)劃方面,通過(guò)對(duì)城市地理、氣象等自然信息和經(jīng)濟(jì)、社會(huì)、文化、人口等人文社會(huì)信息的挖掘,可以為城市規(guī)劃提供決策,強(qiáng)化城市管理服務(wù)的科學(xué)性和前瞻性。在交通管理方面,通過(guò)對(duì)道路交通信息的實(shí)時(shí)挖掘,能有效緩解交通擁堵,并快速響應(yīng)突發(fā)狀況,為城市交通的良性運(yùn)轉(zhuǎn)提供科學(xué)的決策依據(jù)。在輿情監(jiān)控方面,通過(guò)網(wǎng)絡(luò)關(guān)鍵詞搜索及語(yǔ)義智能分析,能提高輿情分析的及時(shí)性、全面性,全面掌握社情民意,提高公共服務(wù)能力,應(yīng)對(duì)網(wǎng)絡(luò)突發(fā)的公共事件,打擊違法犯罪。在安防與防災(zāi)領(lǐng)域,通過(guò)大數(shù)據(jù)的挖掘,可以及時(shí)發(fā)現(xiàn)人為或自然災(zāi)害、恐怖事件,提高應(yīng)急處理能力和安全防范能力。

學(xué)生在閱讀了大數(shù)據(jù)相關(guān)的一些書(shū)籍和文章之后,提取出的一些觀點(diǎn)和理論,并稍加了自己對(duì)大數(shù)據(jù)的一些認(rèn)識(shí),寫(xiě)成了這篇課程總結(jié),因?yàn)樽陨淼膶?zhuān)業(yè)性不強(qiáng),欠缺這方面的知識(shí)和技術(shù),所以有些說(shuō)法可能存在漏洞或者錯(cuò)誤,希望老師不要見(jiàn)笑并加以指正。最后感謝老師這兩個(gè)月來(lái)的教導(dǎo)。老師幽默的語(yǔ)言,靈活的教學(xué)方式營(yíng)造了活躍的課堂環(huán)境,這些都得到了同學(xué)們的廣泛好評(píng)。最后再次感謝教授!

第三篇:大數(shù)據(jù)認(rèn)識(shí)

大數(shù)據(jù)認(rèn)識(shí)

班級(jí):B200216電商本科2 姓名:陳家瑋 學(xué)號(hào):20021624

大數(shù)據(jù)(big data),指無(wú)法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。

大數(shù)據(jù)的5V特點(diǎn):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價(jià)值密度)、Veracity(真實(shí)性)。

層面

第一層面是理論,理論是認(rèn)知的必經(jīng)途徑,也是被廣泛認(rèn)同和傳播的基線。在這里從大數(shù)據(jù)的特征定義理解行業(yè)對(duì)大數(shù)據(jù)的整體描繪和定性;從對(duì)大數(shù)據(jù)價(jià)值的探討來(lái)深入解析大數(shù)據(jù)的珍貴所在;洞悉大數(shù)據(jù)的發(fā)展趨勢(shì);從大數(shù)據(jù)隱私這個(gè)特別而重要的視角審視人和數(shù)據(jù)之間的長(zhǎng)久博弈。

第二層面是技術(shù),技術(shù)是大數(shù)據(jù)價(jià)值體現(xiàn)的手段和前進(jìn)的基石。在這里分別從云計(jì)算、分布式處理技術(shù)、存儲(chǔ)技術(shù)和感知技術(shù)的發(fā)展來(lái)說(shuō)明大數(shù)據(jù)從采集、處理、存儲(chǔ)到形成結(jié)果的整個(gè)過(guò)程。

第三層面是實(shí)踐,實(shí)踐是大數(shù)據(jù)的最終價(jià)值體現(xiàn)。在這里分別從互聯(lián)網(wǎng)的大數(shù)據(jù),政府的大數(shù)據(jù),企業(yè)的大數(shù)據(jù)和個(gè)人的大數(shù)據(jù)四個(gè)方面來(lái)描繪大數(shù)據(jù)已經(jīng)展現(xiàn)的美好景象及即將實(shí)現(xiàn)的藍(lán)圖。

價(jià)值

1)對(duì)大量消費(fèi)者提供產(chǎn)品或服務(wù)的企業(yè)可以利用大數(shù)據(jù)進(jìn)行精準(zhǔn)營(yíng)銷(xiāo) 2)做小而美模式的中小微企業(yè)可以利用大數(shù)據(jù)做服務(wù)轉(zhuǎn)型

3)面臨互聯(lián)網(wǎng)壓力之下必須轉(zhuǎn)型的傳統(tǒng)企業(yè)需要與時(shí)俱進(jìn)充分利用大數(shù)據(jù)的價(jià)值 趨勢(shì)

趨勢(shì)一:數(shù)據(jù)的資源化

何為資源化,是指大數(shù)據(jù)成為企業(yè)和社會(huì)關(guān)注的重要戰(zhàn)略資源,并已成為大家爭(zhēng)相搶奪的新焦點(diǎn)。因而,企業(yè)必須要提前制定大數(shù)據(jù)營(yíng)銷(xiāo)戰(zhàn)略計(jì)劃,搶占市場(chǎng)先機(jī)。

趨勢(shì)二:與云計(jì)算的深度結(jié)合

大數(shù)據(jù)離不開(kāi)云處理,云處理為大數(shù)據(jù)提供了彈性可拓展的基礎(chǔ)設(shè)備,是產(chǎn)生大數(shù)據(jù)的平臺(tái)之一。自2013年開(kāi)始,大數(shù)據(jù)技術(shù)已開(kāi)始和云計(jì)算技術(shù)緊密結(jié)合,預(yù)計(jì)未來(lái)兩者關(guān)系將更為密切。除此之外,物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)等新興計(jì)算形態(tài),也將一齊助力大數(shù)據(jù)革命,讓大數(shù)據(jù)營(yíng)銷(xiāo)發(fā)揮出更大的影響力。趨勢(shì)三:科學(xué)理論的突破

隨著大數(shù)據(jù)的快速發(fā)展,就像計(jì)算機(jī)和互聯(lián)網(wǎng)一樣,大數(shù)據(jù)很有可能是新一輪的技術(shù)革命。隨之興起的數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和人工智能等相關(guān)技術(shù),可能會(huì)改變數(shù)據(jù)世界里的很多算法和基礎(chǔ)理論,實(shí)現(xiàn)科學(xué)技術(shù)上的突破。

趨勢(shì)四:數(shù)據(jù)科學(xué)和數(shù)據(jù)聯(lián)盟的成立

未來(lái),數(shù)據(jù)科學(xué)將成為一門(mén)專(zhuān)門(mén)的學(xué)科,被越來(lái)越多的人所認(rèn)知。各大高校將設(shè)立專(zhuān)門(mén)的數(shù)據(jù)科學(xué)類(lèi)專(zhuān)業(yè),也會(huì)催生一批與之相關(guān)的新的就業(yè)崗位。與此同時(shí),基于數(shù)據(jù)這個(gè)基礎(chǔ)平臺(tái),也將建立起跨領(lǐng)域的數(shù)據(jù)共享平臺(tái),之后,數(shù)據(jù)共享將擴(kuò)展到企業(yè)層面,并且成為未來(lái)產(chǎn)業(yè)的核心一環(huán)。

趨勢(shì)五:數(shù)據(jù)泄露泛濫

未來(lái)幾年數(shù)據(jù)泄露事件的增長(zhǎng)率也許會(huì)達(dá)到100%,除非數(shù)據(jù)在其源頭就能夠得到安全保障。可以說(shuō),在未來(lái),每個(gè)財(cái)富500強(qiáng)企業(yè)都會(huì)面臨數(shù)據(jù)攻擊,無(wú)論他們是否已經(jīng)做好安全防范。而所有企業(yè),無(wú)論規(guī)模大小,都需要重新審視今天的安全定義。在財(cái)富500強(qiáng)企業(yè)中,超過(guò)50%將會(huì)設(shè)置首席信息安全官這一職位。企業(yè)需要從新的角度來(lái)確保自身以及客戶數(shù)據(jù),所有數(shù)據(jù)在創(chuàng)建之初便需要獲得安全保障,而并非在數(shù)據(jù)保存的最后一個(gè)環(huán)節(jié),僅僅加強(qiáng)后者的安全措施已被證明于事無(wú)補(bǔ)。

趨勢(shì)六:數(shù)據(jù)管理成為核心競(jìng)爭(zhēng)力

數(shù)據(jù)管理成為核心競(jìng)爭(zhēng)力,直接影響財(cái)務(wù)表現(xiàn)。當(dāng)“數(shù)據(jù)資產(chǎn)是企業(yè)核心資產(chǎn)”的概念深入人心之后,企業(yè)對(duì)于數(shù)據(jù)管理便有了更清晰的界定,將數(shù)據(jù)管理作為企業(yè)核心競(jìng)爭(zhēng)力,持續(xù)發(fā)展,戰(zhàn)略性規(guī)劃與運(yùn)用數(shù)據(jù)資產(chǎn),成為企業(yè)數(shù)據(jù)管理的核心。數(shù)據(jù)資產(chǎn)管理效率與主營(yíng)業(yè)務(wù)收入增長(zhǎng)率、銷(xiāo)售收入增長(zhǎng)率顯著正相關(guān);此外,對(duì)于具有互聯(lián)網(wǎng)思維的企業(yè)而言,數(shù)據(jù)資產(chǎn)競(jìng)爭(zhēng)力所占比重為36.8%,數(shù)據(jù)資產(chǎn)的管理效果將直接影響企業(yè)的財(cái)務(wù)表現(xiàn)。

趨勢(shì)七:數(shù)據(jù)質(zhì)量是BI(商業(yè)智能)成功的關(guān)鍵

采用自助式商業(yè)智能工具進(jìn)行大數(shù)據(jù)處理的企業(yè)將會(huì)脫穎而出。其中要面臨的一個(gè)挑戰(zhàn)是,很多數(shù)據(jù)源會(huì)帶來(lái)大量低質(zhì)量數(shù)據(jù)。想要成功,企業(yè)需要理解原始數(shù)據(jù)與數(shù)據(jù)分析之間的差距,從而消除低質(zhì)量數(shù)據(jù)并通過(guò)BI獲得更佳決策。

趨勢(shì)八:數(shù)據(jù)生態(tài)系統(tǒng)復(fù)合化程度加強(qiáng)

大數(shù)據(jù)的世界不只是一個(gè)單一的、巨大的計(jì)算機(jī)網(wǎng)絡(luò),而是一個(gè)由大量活動(dòng)構(gòu)件與多元參與者元素所構(gòu)成的生態(tài)系統(tǒng),終端設(shè)備提供商、基礎(chǔ)設(shè)施提供商、網(wǎng)絡(luò)服務(wù)提供商、網(wǎng)絡(luò)接入服務(wù)提供商、數(shù)據(jù)服務(wù)使能者、數(shù)據(jù)服務(wù)提供商、觸點(diǎn)服務(wù)、數(shù)據(jù)服務(wù)零售商等等一系列的參與者共同構(gòu)建的生態(tài)系統(tǒng)。而今,這樣一套數(shù)據(jù)生態(tài)系統(tǒng)的基本雛形已然形成,接下來(lái)的發(fā)展將趨向于系統(tǒng)內(nèi)部角色的細(xì)分,也就是市場(chǎng)的細(xì)分;系統(tǒng)機(jī)制的調(diào)整,也就是商業(yè)模式的創(chuàng)新;系統(tǒng)結(jié)構(gòu)的調(diào)整,也就是競(jìng)爭(zhēng)環(huán)境的調(diào)整等等,從而使得數(shù)據(jù)生態(tài)系統(tǒng)復(fù)合化程度逐漸增強(qiáng)。

Hadoop實(shí)現(xiàn)了一個(gè)分布式文件系統(tǒng)(Hadoop Distributed File System),簡(jiǎn)稱(chēng)HDFS。HDFS有高容錯(cuò)性的特點(diǎn),并且設(shè)計(jì)用來(lái)部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)來(lái)訪問(wèn)應(yīng)用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集(large data set)的應(yīng)用程序。HDFS放寬了(relax)POSIX的要求,可以以流的形式訪問(wèn)(streaming access)文件系統(tǒng)中的數(shù)據(jù)。

優(yōu)點(diǎn)

高可靠性。Hadoop按位存儲(chǔ)和處理數(shù)據(jù)的能力值得人們信賴。

高擴(kuò)展性。Hadoop是在可用的計(jì)算機(jī)集簇間分配數(shù)據(jù)并完成計(jì)算任務(wù)的,這些集簇可以方便地?cái)U(kuò)展到數(shù)以千計(jì)的節(jié)點(diǎn)中。

高效性。Hadoop能夠在節(jié)點(diǎn)之間動(dòng)態(tài)地移動(dòng)數(shù)據(jù),并保證各個(gè)節(jié)點(diǎn)的動(dòng)態(tài)平衡,因此處理速度非常快。

高容錯(cuò)性。Hadoop能夠自動(dòng)保存數(shù)據(jù)的多個(gè)副本,并且能夠自動(dòng)將失敗的任務(wù)重新分配。

低成本。與一體機(jī)、商用數(shù)據(jù)倉(cāng)庫(kù)以及QlikView、Yonghong Z-Suite等數(shù)據(jù)集市相比,hadoop是開(kāi)源的,項(xiàng)目的軟件成本因此會(huì)大大降低。

hadoop大數(shù)據(jù)處理的意義

Hadoop得以在大數(shù)據(jù)處理應(yīng)用中廣泛應(yīng)用得益于其自身在數(shù)據(jù)提取、變形和加載(ETL)方面上的天然優(yōu)勢(shì)。Hadoop的分布式架構(gòu),將大數(shù)據(jù)處理引擎盡可能的靠近存儲(chǔ),對(duì)例如像ETL這樣的批處理操作相對(duì)合適,因?yàn)轭?lèi)似這樣操作的批處理結(jié)果可以直接走向存儲(chǔ)。Hadoop的MapReduce功能實(shí)現(xiàn)了將單個(gè)任務(wù)打碎,并將碎片任務(wù)(Map)發(fā)送到多個(gè)節(jié)點(diǎn)上,之后再以單個(gè)數(shù)據(jù)集的形式加載(Reduce)到數(shù)據(jù)倉(cāng)庫(kù)里。

大數(shù)據(jù)精髓

A.不是隨機(jī)樣本,而是全體數(shù)據(jù):在大數(shù)據(jù)時(shí)代,我們可以分析更多的數(shù)據(jù),有時(shí)候甚至可以處理和某個(gè)特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴于隨機(jī)采樣(隨機(jī)采樣,以前我們通常把這看成是理所應(yīng)當(dāng)?shù)南拗疲咝阅艿臄?shù)字技術(shù)讓我們意識(shí)到,這其實(shí)是一種人為限制)B.不是精確性,而是混雜性:研究數(shù)據(jù)如此之多,以至于我們不再熱衷于追求精確度;之前需要分析的數(shù)據(jù)很少,所以我們必須盡可能精確地量化我們的記錄,隨著規(guī)模的擴(kuò)大,對(duì)精確度的癡迷將減弱;擁有了大數(shù)據(jù),我們不再需要對(duì)一個(gè)現(xiàn)象刨根問(wèn)底,只要掌握了大體的發(fā)展方向即可,適當(dāng)忽略微觀層面上的精確度,會(huì)讓我們?cè)诤暧^層面擁有更好的洞察力

C.不是因果關(guān)系,而是相關(guān)關(guān)系:我們不再熱衷于找因果關(guān)系,尋找因果關(guān)系是人類(lèi)長(zhǎng)久以來(lái)的習(xí)慣,在大數(shù)據(jù)時(shí)代,我們無(wú)須再緊盯事物之間的因果關(guān)系,而應(yīng)該尋找事物之間的相關(guān)關(guān)系;相關(guān)關(guān)系也許不能準(zhǔn)確地告訴我們某件事情為何會(huì)發(fā)生,但是它會(huì)提醒我們這件事情正在發(fā)生。

開(kāi)源大數(shù)據(jù)生態(tài)圈:

1、Hadoop HDFS、HadoopMapReduce, HBase、Hive 漸次誕生,早期Hadoop生態(tài)圈逐步形成。

2、.Hypertable是另類(lèi)。它存在于Hadoop生態(tài)圈之外,但也曾經(jīng)有一些用戶。

3、NoSQL,membase、MongoDb 商用大數(shù)據(jù)生態(tài)圈:

1、一體機(jī)數(shù)據(jù)庫(kù)/數(shù)據(jù)倉(cāng)庫(kù):IBM PureData(Netezza), OracleExadata, SAP Hana等等。

2、數(shù)據(jù)倉(cāng)庫(kù):TeradataAsterData, EMC GreenPlum, HPVertica 等等。

3、數(shù)據(jù)集市:QlikView、Tableau、以及國(guó)內(nèi)的Yonghong Data Mart。大數(shù)據(jù)分析

Analytic Visualizations(可視化分析)

不管是對(duì)數(shù)據(jù)分析專(zhuān)家還是普通用戶,數(shù)據(jù)可視化是數(shù)據(jù)分析工具最基本的要求。可視化可以直觀的展示數(shù)據(jù),讓數(shù)據(jù)自己說(shuō)話,讓觀眾聽(tīng)到結(jié)果。

Data Mining Algorithms(數(shù)據(jù)挖掘算法)

可視化是給人看的,數(shù)據(jù)挖掘就是給機(jī)器看的。集群、分割、孤立點(diǎn)分析還有其他的算法讓我們深入數(shù)據(jù)內(nèi)部,挖掘價(jià)值。這些算法不僅要處理大數(shù)據(jù)的量,也要處理大數(shù)據(jù)的速度。

Predictive Analytic Capabilities(預(yù)測(cè)性分析能力)

數(shù)據(jù)挖掘可以讓分析員更好的理解數(shù)據(jù),而預(yù)測(cè)性分析可以讓分析員根據(jù)可視化分析和數(shù)據(jù)挖掘的結(jié)果做出一些預(yù)測(cè)性的判斷。

Semantic Engines(語(yǔ)義引擎)

我們知道由于非結(jié)構(gòu)化數(shù)據(jù)的多樣性帶來(lái)了數(shù)據(jù)分析的新的挑戰(zhàn),我們需要一系列的工具去解析,提取,分析數(shù)據(jù)。語(yǔ)義引擎需要被設(shè)計(jì)成能夠從“文檔”中智能提取信息。

Data Quality and Master Data Management(數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理)

數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理是一些管理方面的最佳實(shí)踐。通過(guò)標(biāo)準(zhǔn)化的流程和工具對(duì)數(shù)據(jù)進(jìn)行處理可以保證一個(gè)預(yù)先定義好的高質(zhì)量的分析結(jié)果。

假如大數(shù)據(jù)真的是下一個(gè)重要的技術(shù)革新的話,我們最好把精力關(guān)注在大數(shù)據(jù)能給我們帶來(lái)的好處,而不僅僅是挑戰(zhàn)。

數(shù)據(jù)存儲(chǔ),數(shù)據(jù)倉(cāng)庫(kù)

數(shù)據(jù)倉(cāng)庫(kù)是為了便于多維分析和多角度展示數(shù)據(jù)按特定模式進(jìn)行存儲(chǔ)所建立起來(lái)的關(guān)系型數(shù)據(jù)庫(kù)。在商業(yè)智能系統(tǒng)的設(shè)計(jì)中,數(shù)據(jù)倉(cāng)庫(kù)的構(gòu)建是關(guān)鍵,是商業(yè)智能系統(tǒng)的基礎(chǔ),承擔(dān)對(duì)業(yè)務(wù)系統(tǒng)數(shù)據(jù)整合的任務(wù),為商業(yè)智能系統(tǒng)提供數(shù)據(jù)抽取、轉(zhuǎn)換和加載(ETL),并按主題對(duì)數(shù)據(jù)進(jìn)行查詢和訪問(wèn),為聯(lián)機(jī)數(shù)據(jù)分析和數(shù)據(jù)挖掘提供數(shù)據(jù)平臺(tái)。

第四篇:醫(yī)療大數(shù)據(jù)及精準(zhǔn)醫(yī)療

醫(yī)療大數(shù)據(jù)及精準(zhǔn)醫(yī)療

謝邦昌

臺(tái)北醫(yī)學(xué)大學(xué)管理學(xué)院及大數(shù)據(jù)研究中心院長(zhǎng)/主任

大數(shù)據(jù)的趨勢(shì)以及價(jià)值是現(xiàn)在最熱門(mén)的話題,也改變了許多企業(yè)經(jīng)營(yíng)的方式,對(duì)于各行各業(yè)來(lái)說(shuō)是勢(shì)必是一個(gè)大挑戰(zhàn),能否將大數(shù)據(jù)的力量從危機(jī)到轉(zhuǎn)機(jī)就要看現(xiàn)代經(jīng)營(yíng)者有沒(méi)有轉(zhuǎn)變傳統(tǒng)型態(tài)的思維?

首先什么是大數(shù)據(jù)?傳統(tǒng)數(shù)據(jù)一年的數(shù)據(jù)量大概為3TB左右,以現(xiàn)今數(shù)據(jù)來(lái)說(shuō)一天的資料量為50TB,由這簡(jiǎn)單的數(shù)據(jù)量差就可以得知傳統(tǒng)數(shù)據(jù)跟現(xiàn)今數(shù)據(jù)的差異多么龐大,也就是現(xiàn)在俗稱(chēng)的大數(shù)據(jù)時(shí)代。數(shù)據(jù)龐大之下,不管是銀行業(yè)、傳統(tǒng)零售業(yè)、社會(huì)建設(shè)公共方面甚至是醫(yī)療保健產(chǎn)業(yè)對(duì)數(shù)據(jù)處理、分析方式以及經(jīng)營(yíng)企業(yè)的模式將會(huì)有所改變。

在過(guò)往的醫(yī)療診斷歷史,到醫(yī)院看病時(shí)必須耗費(fèi)許多時(shí)間等待看診,而醫(yī)生看診又要再花費(fèi)時(shí)間。當(dāng)醫(yī)生要求病患拍攝X光片或檢驗(yàn)時(shí),又要再花額外許多時(shí)間診斷。而在現(xiàn)今醫(yī)療信息高度發(fā)展的臺(tái)灣,看診程序從網(wǎng)絡(luò)掛號(hào)、候診順序、診間病歷調(diào)閱、醫(yī)師醫(yī)令、處方開(kāi)立、放射影像存取、檢查檢驗(yàn)數(shù)據(jù)儲(chǔ)存等,無(wú)數(shù)的數(shù)據(jù)信息便在醫(yī)院中傳遞、交換、儲(chǔ)存。同時(shí)大多數(shù)的生理檢驗(yàn)信息在你回診時(shí)得以從電子病歷中檢索,這些我們認(rèn)為理所當(dāng)然的信息處理,在臺(tái)灣我們只要花費(fèi)少許的時(shí)間如一個(gè)早上便完成了,而這一切正是仰賴醫(yī)學(xué)信息分析與醫(yī)療大數(shù)據(jù)的交換處理。

醫(yī)學(xué)大數(shù)據(jù)的產(chǎn)生,主要?dú)w功于醫(yī)療設(shè)備數(shù)字化及電子化病歷發(fā)展兩大領(lǐng)域的突破,透過(guò)儀器數(shù)字化,醫(yī)院得以獲得更多病人疾病與健康信息紀(jì)錄。而在病人醫(yī)療診斷方面,為了完善紀(jì)錄病患個(gè)人資料、診斷數(shù)據(jù)與過(guò)往醫(yī)療紀(jì)錄等,即促成了電子病歷系統(tǒng)發(fā)展。醫(yī)學(xué)大數(shù)據(jù)發(fā)展由過(guò)去紙張記錄、紙本信息數(shù)字化、醫(yī)學(xué)紀(jì)錄儲(chǔ)存到現(xiàn)今多信息整合,其數(shù)據(jù)量有著爆炸性的成長(zhǎng),不僅由過(guò)去個(gè)人社經(jīng)信息、診斷信息等文字媒介,更拓展到多媒體影像信息,如X光影像,動(dòng)態(tài)視訊影像信息,如核磁共振MRI以及電訊號(hào)信息,如心電圖等等,這些龐大醫(yī)學(xué)數(shù)據(jù)的匯集與高度整合技術(shù)能力,正是臺(tái)灣醫(yī)學(xué)信息領(lǐng)域發(fā)展領(lǐng)先的原因,同時(shí)更顯得醫(yī)學(xué)數(shù)據(jù)發(fā)展的多元應(yīng)用及其重要性。

而由醫(yī)療健保產(chǎn)業(yè)來(lái)說(shuō),個(gè)人醫(yī)療信息終端的產(chǎn)生給醫(yī)療產(chǎn)業(yè)帶來(lái)革命性的變化,連結(jié)了傳統(tǒng)醫(yī)院、政府(社會(huì)保障)、保險(xiǎn)公司、藥物生產(chǎn)公司等相關(guān)產(chǎn)業(yè),形成新的行業(yè)生態(tài)圈。將互聯(lián)網(wǎng)+醫(yī)療保健去建構(gòu)一個(gè)智能的健康系統(tǒng),在整個(gè)健康系統(tǒng)下會(huì)有智能的合作伙伴,包含醫(yī)院、醫(yī)生、診所、學(xué)術(shù)中心、保險(xiǎn)公司、藥廠、醫(yī)療設(shè)備制造商、政府等相關(guān)人員等,接著產(chǎn)生出個(gè)人化的護(hù)理體系,其中包含個(gè)人健康、成本節(jié)約、提高效率、病人教育、增強(qiáng)通信、績(jī)效度量、預(yù)防等相關(guān)內(nèi)容,使得人們有著更健康的社會(huì)。

經(jīng)常聽(tīng)到的醫(yī)療云、照護(hù)云以及健康云都是運(yùn)用云端技術(shù)結(jié)合大數(shù)據(jù)去提供健康咨詢的服務(wù)。在網(wǎng)絡(luò)普及下,人手一臺(tái)智能型手機(jī)讓這些云更能夠去發(fā)揮,客戶只需要使用健康感知的終端,其中包含穿戴型裝置、愛(ài)睡寶、電視機(jī)以及相關(guān)的智能型測(cè)量裝置,就能夠讓親人、醫(yī)生以及相關(guān)的護(hù)理人員得知目前的身體狀態(tài),不僅如此,還可以遠(yuǎn)程監(jiān)護(hù)以及遠(yuǎn)程門(mén)診,一切都透過(guò)遠(yuǎn)程醫(yī)療平臺(tái)讓人們有著安全、方便、快速及健康舒適的生活環(huán)境。

大數(shù)據(jù)在生技醫(yī)療衛(wèi)生發(fā)展?fàn)顩r及應(yīng)用,大數(shù)據(jù)已深耕于經(jīng)濟(jì)領(lǐng)域且創(chuàng)造了巨大的經(jīng)濟(jì)價(jià)值

美國(guó)的大數(shù)據(jù)產(chǎn)業(yè)已經(jīng)創(chuàng)造了巨大的價(jià)值,具體表現(xiàn)在:大數(shù)據(jù)使美國(guó)醫(yī)療服務(wù)質(zhì)量得到提高。

對(duì)于醫(yī)療服務(wù)的提供方和支付方來(lái)說(shuō),在減少醫(yī)療成本的同時(shí)不斷提高醫(yī)療質(zhì)量和效率仍然是一個(gè)難以實(shí)現(xiàn)的目標(biāo),而這也是改善民生的重大機(jī)遇。2010年,全美醫(yī)療支出占國(guó)內(nèi)生產(chǎn)總值的17.9%,比2000年增長(zhǎng)13.8%。而且,某些慢性疾病如糖尿病的患病率正在增加,正在消耗更多的醫(yī)療資源。

對(duì)這些疾病和其他相關(guān)健康服務(wù)的管理將深刻地影響國(guó)家的福祉。在這方面大數(shù)據(jù)可以發(fā)揮作用。為在廣大人群中取得最有效的醫(yī)療效果,更多地使用電子健康記錄(電子健康檔案),并與新的分析工具相結(jié)合,將提供挖掘信息的機(jī)會(huì)。研究人員可以利用信息尋找有效的統(tǒng)計(jì)趨勢(shì),并依據(jù)真實(shí)的醫(yī)療服務(wù)質(zhì)量開(kāi)展醫(yī)療評(píng)估。

大數(shù)據(jù)在醫(yī)療及生技業(yè)之應(yīng)用

醫(yī)療及生技業(yè)大數(shù)據(jù)應(yīng)用的當(dāng)前需求來(lái)自疫情和健康趨勢(shì)分析、電子病例、醫(yī)學(xué)研發(fā)、臨床試驗(yàn)等領(lǐng)域。

疫情和健康分析趨勢(shì)

利用大數(shù)據(jù)進(jìn)行疫情分析,說(shuō)明這個(gè)地方可能處于某種疾病蔓延,實(shí)時(shí)掌握病情。

Google和疾管局一樣能夠掌握流感疫情

2009年又冒出了一種新的流感病毒,稱(chēng)為H1N1。這種新菌株結(jié)合了禽流感和豬流感病毒,迅速蔓延。短短幾星期內(nèi),全球的公共衛(wèi)生機(jī)構(gòu)都憂心忡忡,擔(dān)心即將爆發(fā)流感大流行。有些人發(fā)出警訊,認(rèn)為這次爆發(fā)可能與1918年的西班牙流感不相上下,當(dāng)時(shí)感染人數(shù)達(dá)到五億人,最后奪走數(shù)千萬(wàn)人的性命。雪上加霜的是,面對(duì)流感可能爆發(fā),卻還沒(méi)有能派上用場(chǎng)的疫苗,公共衛(wèi)生當(dāng)局唯一能努力的,就是減緩其蔓延的速度。為了達(dá)到這項(xiàng)目的,必須先知道當(dāng)前流行感染的范圍及程度。在美國(guó),疾病管制局(CDC)要求醫(yī)生一碰到新流感病例,就必須立刻通報(bào)。即使如此,通報(bào)的速度仍然總是慢了病毒一步,大約是慢上一到兩星期。畢竟,民眾覺(jué)得身體不舒服之后,通常還是會(huì)過(guò)個(gè)幾天才就醫(yī),而層層通報(bào)回到疾管局也需要時(shí)間,更別提疾管局要每星期才整理一次通報(bào)來(lái)的數(shù)據(jù)。但是面對(duì)迅速蔓延的疫情,拖個(gè)兩星期簡(jiǎn)直就像是拖了一個(gè)世紀(jì),會(huì)在最關(guān)鍵的時(shí)刻,讓公共衛(wèi)生當(dāng)局完全無(wú)法掌握真實(shí)情況。

說(shuō)巧不巧,就在H1N1躍上新聞?lì)^條的幾星期前,網(wǎng)絡(luò)巨擘Google旗下的幾位工程師,在著名的《自然》科學(xué)期刊發(fā)表了一篇重要的論文,當(dāng)時(shí)并未引起一般人的注意,只在衛(wèi)生當(dāng)局和計(jì)算機(jī)科學(xué)圈里引起討論。該篇論文解釋了Google能如何「預(yù)測(cè)」美國(guó)在冬天即將爆發(fā)流感,甚至還能精準(zhǔn)定位到是哪些州。谷歌的秘訣,就是看看民眾在網(wǎng)絡(luò)上搜尋些什么。由于Google每天會(huì)接收到超過(guò)三十億筆的搜尋,而且會(huì)把它們?nèi)績(jī)?chǔ)存起來(lái),那就會(huì)有大量的數(shù)據(jù)得以運(yùn)用。

Google先挑出美國(guó)人最常使用的前五千萬(wàn)個(gè)搜尋字眼,再與美國(guó)疾病管制局在2003年到2008年之間的流感傳播數(shù)據(jù),加以比對(duì)。Google的想法,是想靠著民眾在網(wǎng)絡(luò)上搜尋什么關(guān)鍵詞,找出那些感染了流感的人。雖然也曾有人就網(wǎng)絡(luò)搜尋字眼做過(guò)類(lèi)似的努力,但是從來(lái)沒(méi)人能像Google一樣掌握巨量數(shù)據(jù)(big data,直譯為大數(shù)據(jù)),并具備強(qiáng)大的處理能力和在統(tǒng)計(jì)上的專(zhuān)業(yè)技能。

雖然Google已經(jīng)猜到,民眾的搜尋字眼可能與流感有關(guān),像是「止咳退燒」,但相不相關(guān)其實(shí)不是真正的重點(diǎn),他們?cè)O(shè)計(jì)的系統(tǒng)也不是從這個(gè)角度出發(fā)。Google這套系統(tǒng)真正做的,是要針對(duì)搜尋字眼的搜尋頻率,找出和流感傳播的時(shí)間、地區(qū),有沒(méi)有統(tǒng)計(jì)上的相關(guān)性。他們總共用上了高達(dá)4億5千萬(wàn)種不同的數(shù)學(xué)模型,測(cè)試各種搜尋字眼,再與疾管局在2007年與2008年的實(shí)際流感病例加以比較。這套軟件找出了一組共四十五個(gè)搜尋字眼,放進(jìn)數(shù)學(xué)模型之后,預(yù)測(cè)結(jié)果會(huì)與官方公布的全美真實(shí)數(shù)據(jù)十分符合,有強(qiáng)烈的相關(guān)性。

于是,他們就像疾管局一樣能夠掌握流感疫情,但可不是

一、兩星期之后的事,而是幾近實(shí)時(shí)同步的掌握!因此,在2009年發(fā)生H1N1危機(jī)的時(shí)候,比起政府手中的數(shù)據(jù)(以及無(wú)可避免的通報(bào)延遲),Google系統(tǒng)能提供更有用、更及時(shí)的信息。公衛(wèi)當(dāng)局有了這種寶貴的信息,控制疫情如虎添翼。

最驚人的是,Google的這套方法并不需要去采集檢體、也不用登門(mén)造訪各家醫(yī)院診所,而只是好好利用了巨量數(shù)據(jù),也就是用全新的方式來(lái)使用信息,以取得實(shí)用且價(jià)值非凡的見(jiàn)解、商機(jī)或服務(wù)。有了Google這套系統(tǒng),下次爆發(fā)流感的時(shí)候,全球就有了更佳的工具能夠加以預(yù)測(cè)、并防止疫情蔓延。

電子病例

將分散在醫(yī)院中的各個(gè)部門(mén)、各式各樣的病例集中在云端,醫(yī)生們可透過(guò)語(yǔ)意搜查找出任何病例中的相關(guān)訊息,進(jìn)而為醫(yī)學(xué)診斷提供更加豐富的數(shù)據(jù)。可提供以病患為中心的個(gè)人化療程建議,或幫助對(duì)醫(yī)療問(wèn)題及其患病率進(jìn)行自動(dòng)診斷。臺(tái)灣的醫(yī)療黑金:健保數(shù)據(jù)庫(kù) Google臺(tái)灣董事總經(jīng)理簡(jiǎn)立峰曾表示:「我認(rèn)為最有價(jià)值的寶藏,就是臺(tái)灣的全民健保數(shù)據(jù)庫(kù)。」,臺(tái)灣醫(yī)療產(chǎn)業(yè)貫穿上下游的數(shù)據(jù),全在健保數(shù)據(jù)庫(kù)里面,而且?guī)缀跛腥硕家尤耄澜缰挥信_(tái)灣擁有如此完整的數(shù)據(jù)庫(kù)。美國(guó)麻省理工學(xué)院電機(jī)與計(jì)算機(jī)科學(xué)院教授約John Guttag也說(shuō),相較于美國(guó),臺(tái)灣的健保是由政府買(mǎi)單,這讓醫(yī)療數(shù)據(jù)取得變得容易,「這是臺(tái)灣的機(jī)會(huì),未來(lái)也很有機(jī)會(huì)從中獲利。」

累積15年來(lái)、2千3百萬(wàn)人民的健保數(shù)據(jù)庫(kù),正等待著識(shí)貨的伯樂(lè)來(lái)挖寶。臺(tái)中榮總醫(yī)生、陽(yáng)明大學(xué)教授吳俊穎以親身經(jīng)驗(yàn)說(shuō)明,過(guò)去醫(yī)學(xué)界只知道,幽門(mén)螺旋桿菌跟胃癌有關(guān),但是卻沒(méi)有規(guī)模夠大、時(shí)間夠長(zhǎng)的臨床實(shí)驗(yàn)可以證實(shí),他與研究團(tuán)隊(duì)藉由探勘臺(tái)灣的健保數(shù)據(jù)庫(kù),發(fā)現(xiàn)服藥根除幽門(mén)螺旋桿菌,可以降低胃癌的發(fā)生率。

這篇論文不只發(fā)表在腸胃科排名第一的雜志《腸胃病學(xué)》上,更震撼了日本醫(yī)學(xué)界。日本是全球胃癌罹患率最高的國(guó)家,當(dāng)?shù)蒯t(yī)生特別把這篇論文翻譯成日文,并且說(shuō)服日本厚生省,對(duì)幽門(mén)螺旋桿菌感染患者全面給付殺菌療程,不僅影響醫(yī)師的臨床運(yùn)作、政府決策,甚至有可能改變國(guó)際性醫(yī)療行為準(zhǔn)則。

吳俊穎認(rèn)為,臺(tái)灣的健保數(shù)據(jù)庫(kù)內(nèi)容巨細(xì)靡遺,所有醫(yī)療項(xiàng)目都記錄得一清二楚,「它像是永不干涸的黑金,當(dāng)數(shù)據(jù)越來(lái)越多串聯(lián)和使用,就會(huì)越來(lái)越有價(jià)值。」然而,吳俊穎也提到,健保數(shù)據(jù)庫(kù)有個(gè)缺點(diǎn),就是缺乏診斷和檢測(cè)結(jié)果。麻省理工學(xué)院教授Peter Szolovits也曾舉例說(shuō)明過(guò),如果有一位病患發(fā)現(xiàn)關(guān)節(jié)腫起來(lái),醫(yī)生跟他說(shuō)這「疑似」是風(fēng)濕性關(guān)節(jié)炎,因此記錄風(fēng)濕性關(guān)節(jié)炎的費(fèi)用,可能后來(lái)病人發(fā)現(xiàn)根本不是這個(gè)病,如果把這筆數(shù)據(jù)用在風(fēng)濕性關(guān)節(jié)炎的醫(yī)療研究上,那就會(huì)變成糟糕的數(shù)據(jù),影響研究結(jié)果。

「如果能夠把健保數(shù)據(jù)庫(kù)與醫(yī)院病歷的數(shù)據(jù)庫(kù)做結(jié)合,那它就會(huì)變成最完美的醫(yī)療數(shù)據(jù)庫(kù)!」吳俊穎提到,病歷數(shù)據(jù)包含檢測(cè)和治療的結(jié)果,不只對(duì)于臺(tái)灣醫(yī)療產(chǎn)業(yè)來(lái)說(shuō)非常有價(jià)值,國(guó)內(nèi)外的生技和醫(yī)藥大廠,也都會(huì)搶著要跟臺(tái)灣合作。想象一個(gè)情境,有天當(dāng)你到南部度假,突然感到身體不適,就近到當(dāng)?shù)氐脑\所就醫(yī)。第一次跟你見(jiàn)面的醫(yī)生,登入全臺(tái)灣共享的醫(yī)療數(shù)據(jù)庫(kù),調(diào)出你在其他醫(yī)院的病歷數(shù)據(jù),花幾分鐘就能對(duì)你的身體了如指掌,還能透過(guò)臨床決策輔助系統(tǒng),顯示出跟你有相同癥狀的病友群體、使用各種藥物的治療狀況,透過(guò)大數(shù)據(jù)分析可以協(xié)助醫(yī)生在最短時(shí)間內(nèi),找出最適合的治療方式。

「很多人以為這樣的愿景,離現(xiàn)實(shí)生活非常遙遠(yuǎn),其實(shí)臺(tái)灣已經(jīng)走在半路上了。」臺(tái)大醫(yī)院竹東分院院長(zhǎng)王明巨如此說(shuō)道。的確,臺(tái)灣醫(yī)療機(jī)構(gòu)的病歷電子化程度很高,很有可能成為全球第一個(gè)全國(guó)醫(yī)院流通電子病歷的國(guó)家。醫(yī)學(xué)研發(fā)

運(yùn)用實(shí)時(shí)監(jiān)測(cè)及分析大量的儀器數(shù)據(jù),建構(gòu)預(yù)測(cè)模型,并利用統(tǒng)計(jì)工具改善臨床試驗(yàn)設(shè)計(jì),分析臨床試驗(yàn)數(shù)據(jù)。發(fā)展個(gè)人化醫(yī)學(xué)及疾病發(fā)作模式等醫(yī)療研發(fā)。利用大數(shù)據(jù)解決多發(fā)性硬化癥的算法運(yùn)算復(fù)雜度

位于水牛城的紐約州立大學(xué)(SUNY)是一個(gè)領(lǐng)先全球的多發(fā)性硬化癥(MS)研 究中心。MS是一種具破壞性的、面性的神經(jīng)系統(tǒng)疾病,影養(yǎng)全球近百人。這種疾病會(huì)使人的大腦和骨隨發(fā)炎并產(chǎn)生神經(jīng)病,導(dǎo)致患者可能出現(xiàn)行動(dòng)不便、視力受損、疼痛等癥狀。

MS的病因是很復(fù)雜的,沒(méi)有一個(gè)單一基因是可能的致病源。因此自2007年以來(lái),SUNY就一直希望透過(guò)掃描MS患者的基因組的變化來(lái)開(kāi)發(fā)新的治療方式,透過(guò)從原本成千上萬(wàn)的基因序列的變異SNP,SNP指的是單核桃多型性,來(lái)獲得單一樣品,研究基因產(chǎn)物和其他基因產(chǎn)物及環(huán)境因素進(jìn)行的交互作用。

研究人員的想法是以多個(gè)SNP變異點(diǎn)結(jié)合不同的環(huán)境變因,并使用一種被稱(chēng)之為「AMBIENCE」的算法,來(lái)檢測(cè)縣性和非線性兩種數(shù)據(jù)數(shù)據(jù)中的相關(guān)性,以識(shí)別這些交互作用之間的關(guān)系。但是這個(gè)想法就如同大海撈針,因?yàn)榄h(huán)境變因包括像是實(shí)驗(yàn)對(duì)象曝曬太陽(yáng)的時(shí)間長(zhǎng)短、維生素D產(chǎn)生的量、吸煙的情況等皆有可能影響研究結(jié)果。況且人類(lèi)的基因由23對(duì)染色體所組成,其中包含約30億個(gè)DNA堿基對(duì),這些因變量和應(yīng)變量數(shù)量多到嚇人,必須靠建構(gòu)一套計(jì)算量高達(dá)1018的高等分析模型才能解決。

因此SUNY與IBM合作,建構(gòu)一套搭配軟硬件的數(shù)據(jù)分析系統(tǒng),以往平均需要27.2小時(shí)的工作,縮短到現(xiàn)在只要11.7分鐘即可完成。而且這套系統(tǒng)不僅大大簡(jiǎn)化和加速了復(fù)雜的分析過(guò)程,還提供了不同類(lèi)型的變量值,如:分類(lèi)變量、分配卜瓦松變量或連續(xù)常態(tài)變量等。過(guò)去,只要研究中增加一個(gè)新的變量值,研究團(tuán)隊(duì)就必須重新編寫(xiě)整個(gè)算法,而現(xiàn)在只需按幾個(gè)鍵即可完成。

大數(shù)據(jù)系統(tǒng)分析的應(yīng)用除了MS的研究以外,全球估計(jì)超過(guò)3300萬(wàn)人感染,至今沒(méi)有方法可以完全治愈的艾滋病,以及罕見(jiàn)疾病等,都已開(kāi)始利用大數(shù)據(jù)進(jìn)行大型的醫(yī)學(xué)研究。

臨床實(shí)驗(yàn)

臨床試驗(yàn)藉由大數(shù)據(jù)而有了重大的改變,可利用臨床驗(yàn)數(shù)據(jù)、儀器讀數(shù)等,進(jìn)行比較效果研究、臨床決策支持系統(tǒng)、遠(yuǎn)距病人監(jiān)測(cè)及加強(qiáng)醫(yī)學(xué)數(shù)據(jù)透明度等方面。

擁有數(shù)據(jù)數(shù)據(jù)保護(hù)的早產(chǎn)兒

所謂的早產(chǎn)兒是指懷孕不到37周就提早出世的寶寶。這些提早降臨人世的小仙子,如果出生后體重不到1500公克,很可能會(huì)因?yàn)槊庖呦到y(tǒng)尚未發(fā)育完全而受到感染,一旦感染之后就很容易引起呼吸衰竭、肺出血及敗血癥。

不過(guò),加拿大多倫多市立兒童醫(yī)院里的早產(chǎn)兒,卻可以睡得特別安詳,因?yàn)樗麄兪怯袛?shù)據(jù)數(shù)據(jù)保護(hù)的「data baby」。隨著醫(yī)療設(shè)備的發(fā)展,利用醫(yī)療監(jiān)測(cè)儀器監(jiān)測(cè)病患的生命征象,如血壓、心跳和體溫等,已經(jīng)是非常普遍的事了。通常這些儀器還具有警報(bào)功能,一旦生理的數(shù)據(jù)數(shù)值超出正常范圍時(shí)就會(huì)發(fā)出警示,醫(yī)療人員就會(huì)采取因應(yīng)行動(dòng)。但是即使醫(yī)術(shù)再精湛、經(jīng)驗(yàn)再豐富的醫(yī)護(hù)人員,可能也無(wú)法準(zhǔn)確地察覺(jué)這些異常的發(fā)生時(shí)間和嚴(yán)重性,尤其當(dāng)發(fā)生在脆弱的早產(chǎn)兒生身上。根據(jù)美國(guó)弗吉尼亞大學(xué)追蹤以往的數(shù)據(jù)顯示,新生兒受到感染初期的12到24小時(shí),因?yàn)槊}搏和心跳幾乎都可在接受的范圍內(nèi),因此醫(yī)護(hù)人員很難從生命征象數(shù)據(jù)的改變中察覺(jué),等到警示燈響起,常常為時(shí)已晚。

連續(xù)監(jiān)測(cè)和記錄這些生理性數(shù)據(jù),可以觀察出新生兒是否遭受感染的早期征兆,但數(shù)據(jù)量實(shí)在太過(guò)龐大了。估計(jì)這些監(jiān)測(cè)設(shè)備每一秒鐘就會(huì)產(chǎn)生1000個(gè)讀數(shù)。以往是30到60分鐘由醫(yī)護(hù)人員歸納出一個(gè)數(shù)據(jù)做為紀(jì)錄,然后儲(chǔ)存72小時(shí)。如果要把這些讀數(shù)統(tǒng)統(tǒng)記錄起來(lái),根本是不可能的事。

但這項(xiàng)不可能的任務(wù),并沒(méi)有嚇跑安大略省理工學(xué)院和IBM。他們使用來(lái)自懷生研究中心的最新技術(shù),利用江河運(yùn)算平臺(tái)支持大量數(shù)據(jù)的收集和分析,一天24小時(shí)不間斷地收集和記錄著包括早產(chǎn)兒的體溫、心跳、血氧飽和濃度和血壓等電子監(jiān)測(cè)儀器產(chǎn)生的大量數(shù)據(jù),以及周遭環(huán)境如溫度、濕度等相關(guān)數(shù)據(jù)。在保護(hù)病人的隱私安全考慮下,這些數(shù)據(jù)會(huì)直接傳到安大略省理工學(xué)院研究中心和IBM華生研究中心;系統(tǒng)會(huì)分析和研究哪些因素的交互作用會(huì)造成感染,甚至哪幾床的新生兒因?yàn)榉蠗l件較多,可能出現(xiàn)疾病或感染的風(fēng)險(xiǎn)較大。之后,系統(tǒng)再將分析結(jié)果提供給醫(yī)護(hù)人員比較判讀。這些動(dòng)作都在數(shù)秒內(nèi)完成。藉由這項(xiàng)計(jì)劃,兒童病房里的醫(yī)護(hù)人員已經(jīng)可以提前18到24小時(shí),預(yù)防新生兒敗血癥的發(fā)生。

由于大數(shù)據(jù)在規(guī)模(Volume)、增加速度(Velocity),以及價(jià)值性(Value)上正呈現(xiàn)幾何上升,而其數(shù)據(jù)所表現(xiàn)的多樣性變化(Variety)與數(shù)據(jù)的有效性(Validation),更容易成為企業(yè)的風(fēng)險(xiǎn)源頭。面對(duì)排山倒海而來(lái)的大數(shù)據(jù),企業(yè)需運(yùn)用大數(shù)據(jù),迅速將數(shù)據(jù)轉(zhuǎn)化成商業(yè)智能,運(yùn)用分析信息,提升市場(chǎng)的洞察能力,做出更準(zhǔn)確的營(yíng)運(yùn)決策。例如:電信業(yè)者可以分析手機(jī)在基地臺(tái)漫游的特性,提供更好的在地費(fèi)率;信用卡業(yè)者可以每天定期分析各種信用貸款所產(chǎn)生的風(fēng)險(xiǎn),動(dòng)態(tài)調(diào)整信貸利率;便利超商可以分析消費(fèi)者的購(gòu)買(mǎi)習(xí)慣,動(dòng)態(tài)調(diào)整架上存貨數(shù)量等;制造業(yè)者可透過(guò)現(xiàn)場(chǎng)制造系統(tǒng)所記錄的大量在線實(shí)時(shí)生產(chǎn)數(shù)據(jù)進(jìn)行分析,以協(xié)助制造業(yè)改善制程、提升良率,并減少物料浪費(fèi)。因此大數(shù)據(jù)將是企業(yè)未來(lái)所面臨的關(guān)鍵挑戰(zhàn)。鑒于目前信息以超乎想象的速度產(chǎn)生、累積、消逝,而企業(yè)所面臨的商機(jī)亦有相同的循環(huán)表現(xiàn)。透過(guò)海量信息的實(shí)時(shí)性分析與運(yùn)用,將可對(duì)不同信息的需求者,產(chǎn)生不一樣的價(jià)值與意義。若能持續(xù)在既有的數(shù)據(jù)中發(fā)掘價(jià)值,同時(shí)考慮動(dòng)態(tài)信息所帶動(dòng)的巨大沖擊,并藉此掌握瞬息萬(wàn)變的市場(chǎng)契機(jī),則大數(shù)據(jù)的分析與應(yīng)用,將有助于各類(lèi)型企業(yè)在相關(guān)營(yíng)運(yùn)領(lǐng)域中,引領(lǐng)下一階段的企業(yè)永續(xù)發(fā)展。基于以上的發(fā)展潮流與態(tài)勢(shì),麥肯錫(Mckinsey)管理顧問(wèn)公司于2010年已指出未來(lái)引領(lǐng)企業(yè)發(fā)展趨勢(shì)的十大科技,其中即包含了大數(shù)據(jù)的獲取與分析、云端運(yùn)算服務(wù)的公共價(jià)值,以及企業(yè)多層面的參與互動(dòng)及服務(wù)。在這些技術(shù)與行動(dòng)通訊網(wǎng)絡(luò)的整合應(yīng)用下,企業(yè)未來(lái)所產(chǎn)生的數(shù)據(jù)量將呈現(xiàn)倍數(shù)成長(zhǎng),并導(dǎo)致過(guò)去傳統(tǒng)的儲(chǔ)存技術(shù)即將遇到瓶頸,因此,虛擬化的云端運(yùn)算分析技術(shù),以及大數(shù)據(jù)的管理,將成為各方面所即將面臨處理的新課題。從目前的技術(shù)發(fā)展 來(lái)看,未來(lái)各項(xiàng)實(shí)體化設(shè)施,將可能在未來(lái)藉由虛擬化的技術(shù),得以降低各項(xiàng)成本的支出,然而云端運(yùn)算與大數(shù)據(jù)的應(yīng)用,絕非僅為建置一個(gè)大型數(shù)據(jù)中心即可,對(duì)于后續(xù)所產(chǎn)生大量數(shù)據(jù)下的數(shù)量管控、數(shù)據(jù)的質(zhì)量與分析結(jié)果,以及這些數(shù)據(jù)所衍生之相關(guān)應(yīng)用與服務(wù),才是現(xiàn)階段所應(yīng)關(guān)心的重點(diǎn)。計(jì)算設(shè)施(Computer)網(wǎng)絡(luò)設(shè)施(Network)儲(chǔ)存設(shè)施(Storage)數(shù)據(jù)數(shù)量管控?cái)?shù)據(jù)應(yīng)用服務(wù)數(shù)據(jù)質(zhì)量分析虛擬化(Virtualization)為了結(jié)合技術(shù)、數(shù)據(jù),以及應(yīng)用分析與服務(wù)等三項(xiàng)議題的探討,本演講大數(shù)據(jù)主要闡述BIG DATA 在生技醫(yī)療衛(wèi)生上之應(yīng)用與研究;拋磚引玉系望能激起大家投入醫(yī)療大數(shù)據(jù)的研究!

第五篇:大數(shù)據(jù)+精準(zhǔn)醫(yī)療

大數(shù)據(jù)+精準(zhǔn)醫(yī)療

2012年全國(guó)居民慢性病死亡率為533/10萬(wàn),占總死亡人數(shù)的86.6%。心腦血管病、癌癥和慢性呼吸系統(tǒng)疾病為主要死因,占總死亡的79.4%,其中心腦血管病死亡率為271.8/10萬(wàn),癌癥死亡率為144.3/10萬(wàn)(前五位分別是肺癌、肝癌、胃癌、食道癌、結(jié)直腸癌),慢性呼吸系統(tǒng)疾病死亡率為68/10過(guò)標(biāo)化處理后,除冠心病、肺癌等少數(shù)疾病死亡率有所上升外,多數(shù)慢性病死亡率呈下降趨勢(shì)。慢性病的患病、死亡與經(jīng)濟(jì)、社會(huì)、人口、行為、環(huán)境等因素密切相關(guān)。一方面,隨著人們生活質(zhì)量和保健水平不斷提高,人均預(yù)期壽命不斷增長(zhǎng),老年人口數(shù)量不斷增加,我國(guó)慢性病患者的基數(shù)也在不斷擴(kuò)大;另一方面,隨著深化醫(yī)藥衛(wèi)生體制改革的不斷推進(jìn),城鄉(xiāng)居民對(duì)醫(yī)療衛(wèi)生服務(wù)需求不斷增長(zhǎng),公共衛(wèi)生和醫(yī)療服務(wù)水平不斷提升,慢性病患者的生存期也在不斷延長(zhǎng)。慢性病患病率的上升和死亡率的下降,反映了國(guó)家社會(huì)經(jīng)濟(jì)條件和醫(yī)療衛(wèi)生水平的發(fā)展,是國(guó)民生活水平提高和壽命延長(zhǎng)的必然結(jié)果。當(dāng)然,我們也應(yīng)該清醒地認(rèn)識(shí)到個(gè)人不健康的生活方式對(duì)慢性病發(fā)病所帶來(lái)的影響,綜合考慮人口老齡化等社會(huì)因素和吸煙等危險(xiǎn)因素現(xiàn)狀及變化趨勢(shì),我國(guó)慢性病的總體防控形勢(shì)依然嚴(yán)峻,防控工作仍面臨著巨大挑戰(zhàn)。

大數(shù)據(jù)的分析和應(yīng)用都將在醫(yī)療行業(yè)發(fā)揮巨大的作用,提高醫(yī)療效率和醫(yī)療效果。

一、臨床操作

在臨床操作方面,有5個(gè)主要場(chǎng)景的大數(shù)據(jù)應(yīng)用: 1.比較效果研究

通過(guò)全面分析病人特征數(shù)據(jù)和療效數(shù)據(jù),然后比較多種干預(yù)措施的有效性,可以找到針對(duì)特定病人的最佳治療途徑。

基于療效的研究包括比較效果研究(Comparative Effectiveness Research,CER)。研究表明,對(duì)同一病人來(lái)說(shuō),醫(yī)療服務(wù)提供方不同,醫(yī)療護(hù)理方法和效果不同,成本上也存在著很大的差異。精準(zhǔn)分析包括病人體征數(shù)據(jù)、費(fèi)用數(shù)據(jù)和療效數(shù)據(jù)在內(nèi)的大型數(shù)據(jù)集,可以幫助醫(yī)生確定臨床上最有效和最具有成本效益的治療方法。醫(yī)療護(hù)理系統(tǒng)實(shí)現(xiàn)CER,將有可能減少過(guò)度治療(比如避免那些副作用比療效明顯的治療方式),以及治療不足。從長(zhǎng)遠(yuǎn)來(lái)看,不管是過(guò)度治療還是治療不足都將給病人身體帶來(lái)負(fù)面影響,以及產(chǎn)生更高的醫(yī)療費(fèi)用。

2.臨床決策支持系統(tǒng)

臨床決策支持系統(tǒng)可以提高工作效率和診療質(zhì)量。目前的臨床決策支持系統(tǒng)分析醫(yī)生輸入的條目,比較其與醫(yī)學(xué)指引不同的地方,從而提醒醫(yī)生防止?jié)撛诘腻e(cuò)誤,如藥物不良反應(yīng)。通過(guò)部署這些系統(tǒng),醫(yī)療服務(wù)提供方可以降低醫(yī)療事故率和索賠數(shù),尤其是那些臨床錯(cuò)誤引起的醫(yī)療事故。在美國(guó)Metropolitan兒科重癥病房的研究中,兩個(gè)月內(nèi),臨床決策支持系統(tǒng)就削減了40%的藥品不良反應(yīng)事件數(shù)量。

3.醫(yī)療數(shù)據(jù)透明度

提高醫(yī)療過(guò)程數(shù)據(jù)的透明度,可以使醫(yī)療從業(yè)者、醫(yī)療機(jī)構(gòu)的績(jī)效更透明,間接促進(jìn)醫(yī)療服務(wù)質(zhì)量的提高。

根據(jù)醫(yī)療服務(wù)提供方設(shè)置的操作和績(jī)效數(shù)據(jù)集,可以進(jìn)行數(shù)據(jù)分析并創(chuàng)建可視化的流程圖和儀表盤(pán),促進(jìn)信息透明。流程圖的目標(biāo)是識(shí)別和分析臨床變異和醫(yī)療廢物的來(lái)源,然后優(yōu)化流程。僅僅發(fā)布成本、質(zhì)量和績(jī)效數(shù)據(jù),即使沒(méi)有與之相應(yīng)的物質(zhì)上的獎(jiǎng)勵(lì),也往往可以促進(jìn)績(jī)效的提高,使醫(yī)療服務(wù)機(jī)構(gòu)提供更好的服務(wù),從而更有競(jìng)爭(zhēng)力。

4.遠(yuǎn)程病人監(jiān)控

從對(duì)慢性病人的遠(yuǎn)程監(jiān)控系統(tǒng)收集數(shù)據(jù),并將分析結(jié)果反饋給監(jiān)控設(shè)備(查看病人是否正在遵從醫(yī)囑),從而確定今后的用藥和治療方案。

2010年,美國(guó)有1.5億慢性病患者,如糖尿病、充血性心臟衰竭、高血壓患者,他們的醫(yī)療費(fèi)用占到了醫(yī)療衛(wèi)生系統(tǒng)醫(yī)療成本的80%。遠(yuǎn)程病人監(jiān)護(hù)系統(tǒng)對(duì)治療慢性病患者是非常有用的。遠(yuǎn)程病人監(jiān)護(hù)系統(tǒng)包括家用心臟監(jiān)測(cè)設(shè)備、血糖儀,甚至還包括芯片藥片,芯片藥片被患者攝入后,實(shí)時(shí)傳送數(shù)據(jù)到電子病歷數(shù)據(jù)庫(kù)。舉個(gè)例子,遠(yuǎn)程監(jiān)控可以提醒醫(yī)生對(duì)充血性心臟衰竭病人采取及時(shí)治療措施,防止緊急狀況發(fā)生,因?yàn)槌溲孕呐K衰竭的標(biāo)志之一是由于保水產(chǎn)生的體重增加現(xiàn)象,這可以通過(guò)遠(yuǎn)程監(jiān)控實(shí)現(xiàn)預(yù)防。更多的好處是,通過(guò)對(duì)遠(yuǎn)程監(jiān)控系統(tǒng)產(chǎn)生的數(shù)據(jù)的分析,可以減少病人住院時(shí)間,減少急診量,實(shí)現(xiàn)提高家庭護(hù)理比例和門(mén)診醫(yī)生預(yù)約量的目標(biāo)。

5.對(duì)病人檔案的先進(jìn)分析

在病人檔案方面應(yīng)用高級(jí)分析可以確定哪些人是某類(lèi)疾病的易感人群。舉例說(shuō),應(yīng)用高級(jí)分析可以幫助識(shí)別哪些病人有患糖尿病的高風(fēng)險(xiǎn),使他們盡早接受預(yù)防性保健方案。這些方法也可以幫患者從已經(jīng)存在的疾病管理方案中找到最好的治療方案。

二、付款/定價(jià) 對(duì)醫(yī)療支付方來(lái)說(shuō),通過(guò)大數(shù)據(jù)分析可以更好地對(duì)醫(yī)療服務(wù)進(jìn)行定價(jià)。以美國(guó)為例,這將有潛力創(chuàng)造每年500億美元的價(jià)值,其中一半來(lái)源于國(guó)家醫(yī)療開(kāi)支的降低。

1.自動(dòng)化系統(tǒng)

自動(dòng)化系統(tǒng)(例如機(jī)器學(xué)習(xí)技術(shù))檢測(cè)欺詐行為。業(yè)內(nèi)人士評(píng)估,每年有2%~4%的醫(yī)療索賠是欺詐性的或不合理的,因此檢測(cè)索賠欺詐具有巨大的經(jīng)濟(jì)意義。通過(guò)一個(gè)全面的一致的索賠數(shù)據(jù)庫(kù)和相應(yīng)的算法,可以檢測(cè)索賠準(zhǔn)確性,查出欺詐行為。這種欺詐檢測(cè)可以是追溯性的,也可以是實(shí)時(shí)的。在實(shí)時(shí)檢測(cè)中,自動(dòng)化系統(tǒng)可以在支付發(fā)生前就識(shí)別出欺詐,避免重大的損失。

2.基于衛(wèi)生經(jīng)濟(jì)學(xué)和療效研究的定價(jià)計(jì)劃

在藥品定價(jià)方面,制藥公司可以參與分擔(dān)治療風(fēng)險(xiǎn),比如基于治療效果制定定價(jià)策略。這對(duì)醫(yī)療支付方的好處顯而易見(jiàn),有利于控制醫(yī)療保健成本支出。對(duì)患者來(lái)說(shuō),好處更加直接。他們能夠以合理的價(jià)格獲得創(chuàng)新的藥物,并且這些藥物經(jīng)過(guò)基于療效的研究。而對(duì)醫(yī)藥產(chǎn)品公司來(lái)說(shuō),更好的定價(jià)策略也是好處多多。他們可以獲得更高的市場(chǎng)準(zhǔn)入可能性,也可以通過(guò)創(chuàng)新的定價(jià)方案,更有針對(duì)性療效藥品的推出,獲得更高的收入。

在歐洲,現(xiàn)在有一些基于衛(wèi)生經(jīng)濟(jì)學(xué)和療效的藥品定價(jià)試點(diǎn)項(xiàng)目。

三、研發(fā)

醫(yī)療產(chǎn)品公司可以利用大數(shù)據(jù)提高研發(fā)效率。拿美國(guó)為例,這將創(chuàng)造每年超過(guò)1000億美元的價(jià)值。

1.預(yù)測(cè)建模

醫(yī)藥公司在新藥物的研發(fā)階段,可以通過(guò)數(shù)據(jù)建模和分析,確定最有效率的投入產(chǎn)出比,從而配備最佳資源組合。模型基于藥物臨床試驗(yàn)階段之前的數(shù)據(jù)集及早期臨床階段的數(shù)據(jù)集,盡可能及時(shí)地預(yù)測(cè)臨床結(jié)果。評(píng)價(jià)因素包括產(chǎn)品的安全性、有效性、潛在的副作用和整體的試驗(yàn)結(jié)果。通過(guò)預(yù)測(cè)建模可以降低醫(yī)藥產(chǎn)品公司的研發(fā)成本,在通過(guò)數(shù)據(jù)建模和分析預(yù)測(cè)藥物臨床結(jié)果后,可以暫緩研究次優(yōu)的藥物,或者停止在次優(yōu)藥物上的昂貴的臨床試驗(yàn)。

2.提高臨床試驗(yàn)設(shè)計(jì)的統(tǒng)計(jì)工具和算法 使用統(tǒng)計(jì)工具和算法,可以提高臨床試驗(yàn)設(shè)計(jì)水平,并在臨床試驗(yàn)階段更容易地招募到患者。通過(guò)挖掘病人數(shù)據(jù),評(píng)估招募患者是否符合試驗(yàn)條件,從而加快臨床試驗(yàn)進(jìn)程,提出更有效的臨床試驗(yàn)設(shè)計(jì)建議,并能找出最合適的臨床試驗(yàn)基地。比如那些擁有大量潛在符合條件的臨床試驗(yàn)患者的試驗(yàn)基地可能是更理想的,或者在試驗(yàn)患者群體的規(guī)模和特征二者之間找到平衡。

3.臨床實(shí)驗(yàn)數(shù)據(jù)的分析

分析臨床試驗(yàn)數(shù)據(jù)和病人記錄可以確定藥品更多的適應(yīng)癥和發(fā)現(xiàn)副作用。在對(duì)臨床試驗(yàn)數(shù)據(jù)和病人記錄進(jìn)行分析后,可以對(duì)藥物進(jìn)行重新定位,或者實(shí)現(xiàn)針對(duì)其他適應(yīng)癥的營(yíng)銷(xiāo)。實(shí)時(shí)或者近乎實(shí)時(shí)地收集不良反應(yīng)報(bào)告可以促進(jìn)藥物警戒(藥物警戒是上市藥品的安全保障體系,對(duì)藥物不良反應(yīng)進(jìn)行監(jiān)測(cè)、評(píng)價(jià)和預(yù)防)。或者在一些情況下,臨床實(shí)驗(yàn)暗示出了一些情況但沒(méi)有足夠的統(tǒng)計(jì)數(shù)據(jù)去證明,現(xiàn)在基于臨床試驗(yàn)大數(shù)據(jù)的分析可以給出證據(jù)。

這些分析項(xiàng)目是非常重要的。可以看到最近幾年藥品撤市數(shù)量屢創(chuàng)新高,藥品撤市可能給醫(yī)藥公司帶來(lái)毀滅性的打擊。2004年從市場(chǎng)上撤下的止痛藥Vioxx,給默克公司造成70億美元的損失,短短幾天內(nèi)就造成股東價(jià)值33%的損失。

四、更具體一些,大數(shù)據(jù)已經(jīng)得到實(shí)際應(yīng)用的已經(jīng)有如下場(chǎng)景

1.組學(xué)大數(shù)據(jù)精準(zhǔn)醫(yī)療

人類(lèi)通過(guò)開(kāi)展組學(xué)研究及不同組學(xué)間的關(guān)聯(lián)研究,從環(huán)境、生活方式和行為等暴露組學(xué),至個(gè)體細(xì)胞分子水平上的基因組學(xué)、表觀組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白組學(xué)、代謝組學(xué)、宏基因組學(xué),再到個(gè)體健康和疾病狀態(tài)的表型組學(xué)等。利用大數(shù)據(jù)將各種組學(xué)進(jìn)行綜合及整合,既能為疾病發(fā)生、預(yù)防和治療提供全面、全新的認(rèn)識(shí),也有利于開(kāi)展個(gè)體化醫(yī)學(xué),即通過(guò)系統(tǒng)整合生物醫(yī)學(xué)與臨床數(shù)據(jù),可以更準(zhǔn)確地預(yù)測(cè)個(gè)體患病風(fēng)險(xiǎn)和預(yù)后,有針對(duì)性地實(shí)施預(yù)防和治療。

2.大數(shù)據(jù)虛擬藥物研發(fā)

快速識(shí)別生物標(biāo)志物和研發(fā)藥物。利用某種疾病患者人群的臨床數(shù)據(jù)和組學(xué)數(shù)據(jù),可以快速識(shí)別有關(guān)疾病發(fā)生、預(yù)后或治療效果的生物標(biāo)志物。在藥物研發(fā)方面,醫(yī)學(xué)大數(shù)據(jù)使得人們對(duì)病因和疾病發(fā)生機(jī)制的理解更加深入,從而有助于識(shí)別生物靶點(diǎn)和研發(fā)藥物。同時(shí),充分利用海量臨床數(shù)據(jù)和組學(xué)數(shù)據(jù)、已有藥物的研究數(shù)據(jù)和高通量藥物篩選,能加速藥物篩選過(guò)程。

3.生物大數(shù)據(jù)流行病防治

快速篩檢未知病原和發(fā)現(xiàn)可疑致病微生物。通過(guò)采集未知病原樣本數(shù)據(jù),對(duì)病原進(jìn)行測(cè)序,并將未知病原與已知病原的基因序列進(jìn)行比對(duì),從而判斷其為已知病原或與其最接近的病原類(lèi)型,據(jù)此推測(cè)其來(lái)源和傳播路線、開(kāi)展藥物篩選和相應(yīng)的流行疾病防治。

4.互聯(lián)網(wǎng)大數(shù)據(jù)公衛(wèi)監(jiān)測(cè)

利用互聯(lián)網(wǎng)大數(shù)據(jù)以及有關(guān)專(zhuān)業(yè)數(shù)據(jù)實(shí)時(shí)開(kāi)展公共衛(wèi)生監(jiān)測(cè)。公共衛(wèi)生監(jiān)測(cè)包括傳染病監(jiān)測(cè)、慢性非傳染性疾病及相關(guān)危險(xiǎn)因素監(jiān)測(cè)、健康相關(guān)監(jiān)測(cè),如出生缺陷監(jiān)測(cè)、食品安全風(fēng)險(xiǎn)監(jiān)測(cè)等。此外,還可以通過(guò)覆蓋全國(guó)的患者電子病歷數(shù)據(jù)庫(kù)進(jìn)行疫情監(jiān)測(cè),通過(guò)監(jiān)測(cè)社交媒體或頻繁檢索的詞條來(lái)預(yù)測(cè)某些傳染病的流行。

5.大數(shù)據(jù)健康管理

實(shí)時(shí)開(kāi)展大數(shù)據(jù)健康管理,通過(guò)可穿戴設(shè)備對(duì)個(gè)體體征數(shù)據(jù),如心率、脈率、呼吸頻率、體溫、熱消耗量、血壓、血糖、血氧、體脂含量等數(shù)據(jù)的實(shí)時(shí)、連續(xù)監(jiān)測(cè)和流數(shù)據(jù)挖掘、分析,提供實(shí)時(shí)健康指導(dǎo)與建議,更科學(xué)地實(shí)施個(gè)性化健康管理。

6.大數(shù)據(jù)疾病譜研究

了解人群疾病譜的改變,這有助于制定新的疾病防治策略。全球疾病負(fù)擔(dān)研究是一個(gè)應(yīng)用大數(shù)據(jù)的實(shí)例,該研究應(yīng)用的數(shù)據(jù)范圍廣、數(shù)據(jù)量巨大,近4700臺(tái)并行臺(tái)式計(jì)算機(jī)完成了數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)倉(cāng)庫(kù)建立和數(shù)據(jù)挖掘分析的自動(dòng)化和規(guī)范化計(jì)算,應(yīng)用大數(shù)據(jù)研究人群疾病譜。

7.大數(shù)據(jù)人群隊(duì)列研究

以大數(shù)據(jù)為導(dǎo)向的人群隊(duì)列研究逐漸成為醫(yī)學(xué)研究的熱點(diǎn)。超大規(guī)模隊(duì)列研究具有大樣本-如數(shù)十萬(wàn)人群,前瞻性-如數(shù)十年長(zhǎng)期隨訪,多學(xué)科-如基礎(chǔ)、臨床、預(yù)防、信息等多學(xué)科合作,多病種-如對(duì)多種疾病進(jìn)行研究,多因素-如探討多種危險(xiǎn)因素,整合性-如監(jiān)測(cè)系統(tǒng)、信息系統(tǒng)、醫(yī)保系統(tǒng)的整合,共享性-如生物標(biāo)本和數(shù)據(jù)資源的共享,等特點(diǎn),經(jīng)過(guò)長(zhǎng)期隨訪能夠產(chǎn)出大量人群數(shù)據(jù),基于大數(shù)據(jù)的人群隊(duì)列研究更具有科學(xué)性、可靠性和權(quán)威性。

下載對(duì)醫(yī)療大數(shù)據(jù)的認(rèn)識(shí)word格式文檔
下載對(duì)醫(yī)療大數(shù)據(jù)的認(rèn)識(shí).doc
將本文檔下載到自己電腦,方便修改和收藏,請(qǐng)勿使用迅雷等下載。
點(diǎn)此處下載文檔

文檔為doc格式


聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn)自行上傳,本網(wǎng)站不擁有所有權(quán),未作人工編輯處理,也不承擔(dān)相關(guān)法律責(zé)任。如果您發(fā)現(xiàn)有涉嫌版權(quán)的內(nèi)容,歡迎發(fā)送郵件至:645879355@qq.com 進(jìn)行舉報(bào),并提供相關(guān)證據(jù),工作人員會(huì)在5個(gè)工作日內(nèi)聯(lián)系你,一經(jīng)查實(shí),本站將立刻刪除涉嫌侵權(quán)內(nèi)容。

相關(guān)范文推薦

    大數(shù)據(jù)時(shí)代的醫(yī)療

    進(jìn)入21世紀(jì)后,計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)得到了高速發(fā)展,現(xiàn)在網(wǎng)絡(luò)已經(jīng)深入了人們生活的各個(gè)部分,可以說(shuō)人們已經(jīng)離不開(kāi)網(wǎng)絡(luò)了。面對(duì)大數(shù)據(jù)時(shí)代的到來(lái),醫(yī)療行業(yè)又該何去何從呢。科技發(fā)展到今......

    大數(shù)據(jù)本科專(zhuān)業(yè)申報(bào)及認(rèn)識(shí)

    大數(shù)據(jù)本科專(zhuān)業(yè)申報(bào)及認(rèn)識(shí) 摘要:從產(chǎn)業(yè)發(fā)展、數(shù)據(jù)科學(xué)的學(xué)科特征、大數(shù)據(jù)專(zhuān)業(yè)與其他相關(guān)專(zhuān)業(yè)的不同等3個(gè)方面,闡述增設(shè)大數(shù)據(jù)本科專(zhuān)業(yè)的合理性和必要性;以對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)專(zhuān)業(yè)......

    關(guān)愛(ài)地球聯(lián)盟:青少年對(duì)水資源的認(rèn)識(shí)調(diào)查數(shù)據(jù)

    CFE RDC 關(guān)愛(ài)地球聯(lián)盟調(diào)查與數(shù)據(jù)中心數(shù)據(jù)調(diào)查問(wèn)題1:了解世界水日的日期嗎?(A了解B不了解)數(shù)據(jù)結(jié)果:A了解:66%B不了解:32%調(diào)查問(wèn)題2:知道全球的水只有3%是淡水,其余均不可食用?(A知道B不......

    2017國(guó)家對(duì)醫(yī)療政策

    2017國(guó)家對(duì)醫(yī)療政策 醫(yī)藥醫(yī)療問(wèn)題是各個(gè)國(guó)家都關(guān)注的世界性問(wèn)題,一個(gè)國(guó)家的醫(yī)藥醫(yī)療水平關(guān)系著這個(gè)國(guó)家人民的健康以及人口的發(fā)展。以下是學(xué)習(xí)啦小編為大家整理的關(guān)于2017國(guó)......

    對(duì)π的認(rèn)識(shí)

    對(duì)π的認(rèn)識(shí) 圓周率—π ·什么是圓周率? 圓周率是一個(gè)常數(shù),是代表圓周和直徑的比例。它是一個(gè)無(wú)理數(shù),即是一個(gè)無(wú)限不循環(huán)小數(shù)。但在日常生活中,通常都用3.14來(lái)代表圓周率......

    對(duì)美的認(rèn)識(shí)[最終定稿]

    愛(ài)美之心,人皆有之;尚美之道,千古之風(fēng)然而美不應(yīng)當(dāng)只美在天然上,還應(yīng)該美在靈魂上。 愛(ài)美是人的天性,現(xiàn)代女性為了追求美麗,花費(fèi)了很多金錢(qián)來(lái)整容、塑身,或是購(gòu)買(mǎi)高級(jí)化妝品,所以......

    對(duì)IT的認(rèn)識(shí)[合集]

    對(duì)IT 營(yíng)銷(xiāo)的認(rèn)知 一個(gè)學(xué)期的IT營(yíng)銷(xiāo)的學(xué)習(xí),讓我無(wú)論是在書(shū)本中,還是日常生活中都學(xué)到了很多東西。老師帶領(lǐng)我們做的各種活動(dòng)(上臺(tái)演說(shuō)、小組做游戲),不僅鍛煉了我們的表達(dá)能力,還增......

    對(duì)美的認(rèn)識(shí)范文

    何為美 美是人們對(duì)事物,行為等肯定性的評(píng)價(jià)。任何能夠給人們帶來(lái)協(xié)調(diào)舒暢的感覺(jué),給社會(huì)帶來(lái)正能量或者利益的行為或事件都可以用美來(lái)評(píng)價(jià)。例如好吃的食物,我們用美食,美味,美味......

主站蜘蛛池模板: 国产亚洲日韩欧美一区二区三区| 国产av夜夜欢一区二区三区| 国产成人无码a区在线| 国产精品第12页| 久久久久国产a免费观看rela| 粉嫩极品国产在线观看| 亚洲精品国偷自产在线99人热| 玖玖资源站无码专区| 国产六月婷婷爱在线观看| 与子乱对白在线播放单亲国产| 久久人爽人人爽人人片av| 成人网站免费观看入口| 国产又色又爽又黄又免费| 国产av天堂无码一区二区三区| 国产成人av男人的天堂| 蜜柚av久久久久久久| 黄色成人网站免费无码av| 国产精品高潮呻吟av久久软件| 人妻少妇偷人精品无码| 欧美换爱交换乱理伦片| 无码久久精品国产亚洲av影片| 青青草国产精品一区二区| 亚洲综合另类小说色区色噜噜| 国内精品久久久久影院蜜芽| 色综合久久中文娱乐网| 肉体裸交137日本大胆摄影| 日韩精品国产另类专区| 亚洲国产人成在线观看69网站| 亚洲av成人无码一二三在线观看| 亚洲国产精品久久久天堂麻豆宅男| 国产成人精品热玖玖玖| 久久亚洲私人国产精品va| 中文字幕无线码| av中文字幕潮喷人妻系列| 97国产精华最好的产品| 人妻被按摩师玩弄到潮喷| 四虎影视在线影院在线观看免费视频| 中国熟妇内谢69xxxxx| 久久人爽人人爽人人片av| 亚洲色婷婷一区二区三区| 久久er热在这里只有精品66|