第一篇:大數據+精準醫療
大數據+精準醫療
2012年全國居民慢性病死亡率為533/10萬,占總死亡人數的86.6%。心腦血管病、癌癥和慢性呼吸系統疾病為主要死因,占總死亡的79.4%,其中心腦血管病死亡率為271.8/10萬,癌癥死亡率為144.3/10萬(前五位分別是肺癌、肝癌、胃癌、食道癌、結直腸癌),慢性呼吸系統疾病死亡率為68/10過標化處理后,除冠心病、肺癌等少數疾病死亡率有所上升外,多數慢性病死亡率呈下降趨勢。慢性病的患病、死亡與經濟、社會、人口、行為、環境等因素密切相關。一方面,隨著人們生活質量和保健水平不斷提高,人均預期壽命不斷增長,老年人口數量不斷增加,我國慢性病患者的基數也在不斷擴大;另一方面,隨著深化醫藥衛生體制改革的不斷推進,城鄉居民對醫療衛生服務需求不斷增長,公共衛生和醫療服務水平不斷提升,慢性病患者的生存期也在不斷延長。慢性病患病率的上升和死亡率的下降,反映了國家社會經濟條件和醫療衛生水平的發展,是國民生活水平提高和壽命延長的必然結果。當然,我們也應該清醒地認識到個人不健康的生活方式對慢性病發病所帶來的影響,綜合考慮人口老齡化等社會因素和吸煙等危險因素現狀及變化趨勢,我國慢性病的總體防控形勢依然嚴峻,防控工作仍面臨著巨大挑戰。
大數據的分析和應用都將在醫療行業發揮巨大的作用,提高醫療效率和醫療效果。
一、臨床操作
在臨床操作方面,有5個主要場景的大數據應用: 1.比較效果研究
通過全面分析病人特征數據和療效數據,然后比較多種干預措施的有效性,可以找到針對特定病人的最佳治療途徑。
基于療效的研究包括比較效果研究(Comparative Effectiveness Research,CER)。研究表明,對同一病人來說,醫療服務提供方不同,醫療護理方法和效果不同,成本上也存在著很大的差異。精準分析包括病人體征數據、費用數據和療效數據在內的大型數據集,可以幫助醫生確定臨床上最有效和最具有成本效益的治療方法。醫療護理系統實現CER,將有可能減少過度治療(比如避免那些副作用比療效明顯的治療方式),以及治療不足。從長遠來看,不管是過度治療還是治療不足都將給病人身體帶來負面影響,以及產生更高的醫療費用。
2.臨床決策支持系統
臨床決策支持系統可以提高工作效率和診療質量。目前的臨床決策支持系統分析醫生輸入的條目,比較其與醫學指引不同的地方,從而提醒醫生防止潛在的錯誤,如藥物不良反應。通過部署這些系統,醫療服務提供方可以降低醫療事故率和索賠數,尤其是那些臨床錯誤引起的醫療事故。在美國Metropolitan兒科重癥病房的研究中,兩個月內,臨床決策支持系統就削減了40%的藥品不良反應事件數量。
3.醫療數據透明度
提高醫療過程數據的透明度,可以使醫療從業者、醫療機構的績效更透明,間接促進醫療服務質量的提高。
根據醫療服務提供方設置的操作和績效數據集,可以進行數據分析并創建可視化的流程圖和儀表盤,促進信息透明。流程圖的目標是識別和分析臨床變異和醫療廢物的來源,然后優化流程。僅僅發布成本、質量和績效數據,即使沒有與之相應的物質上的獎勵,也往往可以促進績效的提高,使醫療服務機構提供更好的服務,從而更有競爭力。
4.遠程病人監控
從對慢性病人的遠程監控系統收集數據,并將分析結果反饋給監控設備(查看病人是否正在遵從醫囑),從而確定今后的用藥和治療方案。
2010年,美國有1.5億慢性病患者,如糖尿病、充血性心臟衰竭、高血壓患者,他們的醫療費用占到了醫療衛生系統醫療成本的80%。遠程病人監護系統對治療慢性病患者是非常有用的。遠程病人監護系統包括家用心臟監測設備、血糖儀,甚至還包括芯片藥片,芯片藥片被患者攝入后,實時傳送數據到電子病歷數據庫。舉個例子,遠程監控可以提醒醫生對充血性心臟衰竭病人采取及時治療措施,防止緊急狀況發生,因為充血性心臟衰竭的標志之一是由于保水產生的體重增加現象,這可以通過遠程監控實現預防。更多的好處是,通過對遠程監控系統產生的數據的分析,可以減少病人住院時間,減少急診量,實現提高家庭護理比例和門診醫生預約量的目標。
5.對病人檔案的先進分析
在病人檔案方面應用高級分析可以確定哪些人是某類疾病的易感人群。舉例說,應用高級分析可以幫助識別哪些病人有患糖尿病的高風險,使他們盡早接受預防性保健方案。這些方法也可以幫患者從已經存在的疾病管理方案中找到最好的治療方案。
二、付款/定價 對醫療支付方來說,通過大數據分析可以更好地對醫療服務進行定價。以美國為例,這將有潛力創造每年500億美元的價值,其中一半來源于國家醫療開支的降低。
1.自動化系統
自動化系統(例如機器學習技術)檢測欺詐行為。業內人士評估,每年有2%~4%的醫療索賠是欺詐性的或不合理的,因此檢測索賠欺詐具有巨大的經濟意義。通過一個全面的一致的索賠數據庫和相應的算法,可以檢測索賠準確性,查出欺詐行為。這種欺詐檢測可以是追溯性的,也可以是實時的。在實時檢測中,自動化系統可以在支付發生前就識別出欺詐,避免重大的損失。
2.基于衛生經濟學和療效研究的定價計劃
在藥品定價方面,制藥公司可以參與分擔治療風險,比如基于治療效果制定定價策略。這對醫療支付方的好處顯而易見,有利于控制醫療保健成本支出。對患者來說,好處更加直接。他們能夠以合理的價格獲得創新的藥物,并且這些藥物經過基于療效的研究。而對醫藥產品公司來說,更好的定價策略也是好處多多。他們可以獲得更高的市場準入可能性,也可以通過創新的定價方案,更有針對性療效藥品的推出,獲得更高的收入。
在歐洲,現在有一些基于衛生經濟學和療效的藥品定價試點項目。
三、研發
醫療產品公司可以利用大數據提高研發效率。拿美國為例,這將創造每年超過1000億美元的價值。
1.預測建模
醫藥公司在新藥物的研發階段,可以通過數據建模和分析,確定最有效率的投入產出比,從而配備最佳資源組合。模型基于藥物臨床試驗階段之前的數據集及早期臨床階段的數據集,盡可能及時地預測臨床結果。評價因素包括產品的安全性、有效性、潛在的副作用和整體的試驗結果。通過預測建模可以降低醫藥產品公司的研發成本,在通過數據建模和分析預測藥物臨床結果后,可以暫緩研究次優的藥物,或者停止在次優藥物上的昂貴的臨床試驗。
2.提高臨床試驗設計的統計工具和算法 使用統計工具和算法,可以提高臨床試驗設計水平,并在臨床試驗階段更容易地招募到患者。通過挖掘病人數據,評估招募患者是否符合試驗條件,從而加快臨床試驗進程,提出更有效的臨床試驗設計建議,并能找出最合適的臨床試驗基地。比如那些擁有大量潛在符合條件的臨床試驗患者的試驗基地可能是更理想的,或者在試驗患者群體的規模和特征二者之間找到平衡。
3.臨床實驗數據的分析
分析臨床試驗數據和病人記錄可以確定藥品更多的適應癥和發現副作用。在對臨床試驗數據和病人記錄進行分析后,可以對藥物進行重新定位,或者實現針對其他適應癥的營銷。實時或者近乎實時地收集不良反應報告可以促進藥物警戒(藥物警戒是上市藥品的安全保障體系,對藥物不良反應進行監測、評價和預防)。或者在一些情況下,臨床實驗暗示出了一些情況但沒有足夠的統計數據去證明,現在基于臨床試驗大數據的分析可以給出證據。
這些分析項目是非常重要的。可以看到最近幾年藥品撤市數量屢創新高,藥品撤市可能給醫藥公司帶來毀滅性的打擊。2004年從市場上撤下的止痛藥Vioxx,給默克公司造成70億美元的損失,短短幾天內就造成股東價值33%的損失。
四、更具體一些,大數據已經得到實際應用的已經有如下場景
1.組學大數據精準醫療
人類通過開展組學研究及不同組學間的關聯研究,從環境、生活方式和行為等暴露組學,至個體細胞分子水平上的基因組學、表觀組學、轉錄組學、蛋白組學、代謝組學、宏基因組學,再到個體健康和疾病狀態的表型組學等。利用大數據將各種組學進行綜合及整合,既能為疾病發生、預防和治療提供全面、全新的認識,也有利于開展個體化醫學,即通過系統整合生物醫學與臨床數據,可以更準確地預測個體患病風險和預后,有針對性地實施預防和治療。
2.大數據虛擬藥物研發
快速識別生物標志物和研發藥物。利用某種疾病患者人群的臨床數據和組學數據,可以快速識別有關疾病發生、預后或治療效果的生物標志物。在藥物研發方面,醫學大數據使得人們對病因和疾病發生機制的理解更加深入,從而有助于識別生物靶點和研發藥物。同時,充分利用海量臨床數據和組學數據、已有藥物的研究數據和高通量藥物篩選,能加速藥物篩選過程。
3.生物大數據流行病防治
快速篩檢未知病原和發現可疑致病微生物。通過采集未知病原樣本數據,對病原進行測序,并將未知病原與已知病原的基因序列進行比對,從而判斷其為已知病原或與其最接近的病原類型,據此推測其來源和傳播路線、開展藥物篩選和相應的流行疾病防治。
4.互聯網大數據公衛監測
利用互聯網大數據以及有關專業數據實時開展公共衛生監測。公共衛生監測包括傳染病監測、慢性非傳染性疾病及相關危險因素監測、健康相關監測,如出生缺陷監測、食品安全風險監測等。此外,還可以通過覆蓋全國的患者電子病歷數據庫進行疫情監測,通過監測社交媒體或頻繁檢索的詞條來預測某些傳染病的流行。
5.大數據健康管理
實時開展大數據健康管理,通過可穿戴設備對個體體征數據,如心率、脈率、呼吸頻率、體溫、熱消耗量、血壓、血糖、血氧、體脂含量等數據的實時、連續監測和流數據挖掘、分析,提供實時健康指導與建議,更科學地實施個性化健康管理。
6.大數據疾病譜研究
了解人群疾病譜的改變,這有助于制定新的疾病防治策略。全球疾病負擔研究是一個應用大數據的實例,該研究應用的數據范圍廣、數據量巨大,近4700臺并行臺式計算機完成了數據準備、數據倉庫建立和數據挖掘分析的自動化和規范化計算,應用大數據研究人群疾病譜。
7.大數據人群隊列研究
以大數據為導向的人群隊列研究逐漸成為醫學研究的熱點。超大規模隊列研究具有大樣本-如數十萬人群,前瞻性-如數十年長期隨訪,多學科-如基礎、臨床、預防、信息等多學科合作,多病種-如對多種疾病進行研究,多因素-如探討多種危險因素,整合性-如監測系統、信息系統、醫保系統的整合,共享性-如生物標本和數據資源的共享,等特點,經過長期隨訪能夠產出大量人群數據,基于大數據的人群隊列研究更具有科學性、可靠性和權威性。
第二篇:醫療大數據及精準醫療
醫療大數據及精準醫療
謝邦昌
臺北醫學大學管理學院及大數據研究中心院長/主任
大數據的趨勢以及價值是現在最熱門的話題,也改變了許多企業經營的方式,對于各行各業來說是勢必是一個大挑戰,能否將大數據的力量從危機到轉機就要看現代經營者有沒有轉變傳統型態的思維?
首先什么是大數據?傳統數據一年的數據量大概為3TB左右,以現今數據來說一天的資料量為50TB,由這簡單的數據量差就可以得知傳統數據跟現今數據的差異多么龐大,也就是現在俗稱的大數據時代。數據龐大之下,不管是銀行業、傳統零售業、社會建設公共方面甚至是醫療保健產業對數據處理、分析方式以及經營企業的模式將會有所改變。
在過往的醫療診斷歷史,到醫院看病時必須耗費許多時間等待看診,而醫生看診又要再花費時間。當醫生要求病患拍攝X光片或檢驗時,又要再花額外許多時間診斷。而在現今醫療信息高度發展的臺灣,看診程序從網絡掛號、候診順序、診間病歷調閱、醫師醫令、處方開立、放射影像存取、檢查檢驗數據儲存等,無數的數據信息便在醫院中傳遞、交換、儲存。同時大多數的生理檢驗信息在你回診時得以從電子病歷中檢索,這些我們認為理所當然的信息處理,在臺灣我們只要花費少許的時間如一個早上便完成了,而這一切正是仰賴醫學信息分析與醫療大數據的交換處理。
醫學大數據的產生,主要歸功于醫療設備數字化及電子化病歷發展兩大領域的突破,透過儀器數字化,醫院得以獲得更多病人疾病與健康信息紀錄。而在病人醫療診斷方面,為了完善紀錄病患個人資料、診斷數據與過往醫療紀錄等,即促成了電子病歷系統發展。醫學大數據發展由過去紙張記錄、紙本信息數字化、醫學紀錄儲存到現今多信息整合,其數據量有著爆炸性的成長,不僅由過去個人社經信息、診斷信息等文字媒介,更拓展到多媒體影像信息,如X光影像,動態視訊影像信息,如核磁共振MRI以及電訊號信息,如心電圖等等,這些龐大醫學數據的匯集與高度整合技術能力,正是臺灣醫學信息領域發展領先的原因,同時更顯得醫學數據發展的多元應用及其重要性。
而由醫療健保產業來說,個人醫療信息終端的產生給醫療產業帶來革命性的變化,連結了傳統醫院、政府(社會保障)、保險公司、藥物生產公司等相關產業,形成新的行業生態圈。將互聯網+醫療保健去建構一個智能的健康系統,在整個健康系統下會有智能的合作伙伴,包含醫院、醫生、診所、學術中心、保險公司、藥廠、醫療設備制造商、政府等相關人員等,接著產生出個人化的護理體系,其中包含個人健康、成本節約、提高效率、病人教育、增強通信、績效度量、預防等相關內容,使得人們有著更健康的社會。
經常聽到的醫療云、照護云以及健康云都是運用云端技術結合大數據去提供健康咨詢的服務。在網絡普及下,人手一臺智能型手機讓這些云更能夠去發揮,客戶只需要使用健康感知的終端,其中包含穿戴型裝置、愛睡寶、電視機以及相關的智能型測量裝置,就能夠讓親人、醫生以及相關的護理人員得知目前的身體狀態,不僅如此,還可以遠程監護以及遠程門診,一切都透過遠程醫療平臺讓人們有著安全、方便、快速及健康舒適的生活環境。
大數據在生技醫療衛生發展狀況及應用,大數據已深耕于經濟領域且創造了巨大的經濟價值
美國的大數據產業已經創造了巨大的價值,具體表現在:大數據使美國醫療服務質量得到提高。
對于醫療服務的提供方和支付方來說,在減少醫療成本的同時不斷提高醫療質量和效率仍然是一個難以實現的目標,而這也是改善民生的重大機遇。2010年,全美醫療支出占國內生產總值的17.9%,比2000年增長13.8%。而且,某些慢性疾病如糖尿病的患病率正在增加,正在消耗更多的醫療資源。
對這些疾病和其他相關健康服務的管理將深刻地影響國家的福祉。在這方面大數據可以發揮作用。為在廣大人群中取得最有效的醫療效果,更多地使用電子健康記錄(電子健康檔案),并與新的分析工具相結合,將提供挖掘信息的機會。研究人員可以利用信息尋找有效的統計趨勢,并依據真實的醫療服務質量開展醫療評估。
大數據在醫療及生技業之應用
醫療及生技業大數據應用的當前需求來自疫情和健康趨勢分析、電子病例、醫學研發、臨床試驗等領域。
疫情和健康分析趨勢
利用大數據進行疫情分析,說明這個地方可能處于某種疾病蔓延,實時掌握病情。
Google和疾管局一樣能夠掌握流感疫情
2009年又冒出了一種新的流感病毒,稱為H1N1。這種新菌株結合了禽流感和豬流感病毒,迅速蔓延。短短幾星期內,全球的公共衛生機構都憂心忡忡,擔心即將爆發流感大流行。有些人發出警訊,認為這次爆發可能與1918年的西班牙流感不相上下,當時感染人數達到五億人,最后奪走數千萬人的性命。雪上加霜的是,面對流感可能爆發,卻還沒有能派上用場的疫苗,公共衛生當局唯一能努力的,就是減緩其蔓延的速度。為了達到這項目的,必須先知道當前流行感染的范圍及程度。在美國,疾病管制局(CDC)要求醫生一碰到新流感病例,就必須立刻通報。即使如此,通報的速度仍然總是慢了病毒一步,大約是慢上一到兩星期。畢竟,民眾覺得身體不舒服之后,通常還是會過個幾天才就醫,而層層通報回到疾管局也需要時間,更別提疾管局要每星期才整理一次通報來的數據。但是面對迅速蔓延的疫情,拖個兩星期簡直就像是拖了一個世紀,會在最關鍵的時刻,讓公共衛生當局完全無法掌握真實情況。
說巧不巧,就在H1N1躍上新聞頭條的幾星期前,網絡巨擘Google旗下的幾位工程師,在著名的《自然》科學期刊發表了一篇重要的論文,當時并未引起一般人的注意,只在衛生當局和計算機科學圈里引起討論。該篇論文解釋了Google能如何「預測」美國在冬天即將爆發流感,甚至還能精準定位到是哪些州。谷歌的秘訣,就是看看民眾在網絡上搜尋些什么。由于Google每天會接收到超過三十億筆的搜尋,而且會把它們全部儲存起來,那就會有大量的數據得以運用。
Google先挑出美國人最常使用的前五千萬個搜尋字眼,再與美國疾病管制局在2003年到2008年之間的流感傳播數據,加以比對。Google的想法,是想靠著民眾在網絡上搜尋什么關鍵詞,找出那些感染了流感的人。雖然也曾有人就網絡搜尋字眼做過類似的努力,但是從來沒人能像Google一樣掌握巨量數據(big data,直譯為大數據),并具備強大的處理能力和在統計上的專業技能。
雖然Google已經猜到,民眾的搜尋字眼可能與流感有關,像是「止咳退燒」,但相不相關其實不是真正的重點,他們設計的系統也不是從這個角度出發。Google這套系統真正做的,是要針對搜尋字眼的搜尋頻率,找出和流感傳播的時間、地區,有沒有統計上的相關性。他們總共用上了高達4億5千萬種不同的數學模型,測試各種搜尋字眼,再與疾管局在2007年與2008年的實際流感病例加以比較。這套軟件找出了一組共四十五個搜尋字眼,放進數學模型之后,預測結果會與官方公布的全美真實數據十分符合,有強烈的相關性。
于是,他們就像疾管局一樣能夠掌握流感疫情,但可不是
一、兩星期之后的事,而是幾近實時同步的掌握!因此,在2009年發生H1N1危機的時候,比起政府手中的數據(以及無可避免的通報延遲),Google系統能提供更有用、更及時的信息。公衛當局有了這種寶貴的信息,控制疫情如虎添翼。
最驚人的是,Google的這套方法并不需要去采集檢體、也不用登門造訪各家醫院診所,而只是好好利用了巨量數據,也就是用全新的方式來使用信息,以取得實用且價值非凡的見解、商機或服務。有了Google這套系統,下次爆發流感的時候,全球就有了更佳的工具能夠加以預測、并防止疫情蔓延。
電子病例
將分散在醫院中的各個部門、各式各樣的病例集中在云端,醫生們可透過語意搜查找出任何病例中的相關訊息,進而為醫學診斷提供更加豐富的數據。可提供以病患為中心的個人化療程建議,或幫助對醫療問題及其患病率進行自動診斷。臺灣的醫療黑金:健保數據庫 Google臺灣董事總經理簡立峰曾表示:「我認為最有價值的寶藏,就是臺灣的全民健保數據庫。」,臺灣醫療產業貫穿上下游的數據,全在健保數據庫里面,而且幾乎所有人都要加入,全世界只有臺灣擁有如此完整的數據庫。美國麻省理工學院電機與計算機科學院教授約John Guttag也說,相較于美國,臺灣的健保是由政府買單,這讓醫療數據取得變得容易,「這是臺灣的機會,未來也很有機會從中獲利。」
累積15年來、2千3百萬人民的健保數據庫,正等待著識貨的伯樂來挖寶。臺中榮總醫生、陽明大學教授吳俊穎以親身經驗說明,過去醫學界只知道,幽門螺旋桿菌跟胃癌有關,但是卻沒有規模夠大、時間夠長的臨床實驗可以證實,他與研究團隊藉由探勘臺灣的健保數據庫,發現服藥根除幽門螺旋桿菌,可以降低胃癌的發生率。
這篇論文不只發表在腸胃科排名第一的雜志《腸胃病學》上,更震撼了日本醫學界。日本是全球胃癌罹患率最高的國家,當地醫生特別把這篇論文翻譯成日文,并且說服日本厚生省,對幽門螺旋桿菌感染患者全面給付殺菌療程,不僅影響醫師的臨床運作、政府決策,甚至有可能改變國際性醫療行為準則。
吳俊穎認為,臺灣的健保數據庫內容巨細靡遺,所有醫療項目都記錄得一清二楚,「它像是永不干涸的黑金,當數據越來越多串聯和使用,就會越來越有價值。」然而,吳俊穎也提到,健保數據庫有個缺點,就是缺乏診斷和檢測結果。麻省理工學院教授Peter Szolovits也曾舉例說明過,如果有一位病患發現關節腫起來,醫生跟他說這「疑似」是風濕性關節炎,因此記錄風濕性關節炎的費用,可能后來病人發現根本不是這個病,如果把這筆數據用在風濕性關節炎的醫療研究上,那就會變成糟糕的數據,影響研究結果。
「如果能夠把健保數據庫與醫院病歷的數據庫做結合,那它就會變成最完美的醫療數據庫!」吳俊穎提到,病歷數據包含檢測和治療的結果,不只對于臺灣醫療產業來說非常有價值,國內外的生技和醫藥大廠,也都會搶著要跟臺灣合作。想象一個情境,有天當你到南部度假,突然感到身體不適,就近到當地的診所就醫。第一次跟你見面的醫生,登入全臺灣共享的醫療數據庫,調出你在其他醫院的病歷數據,花幾分鐘就能對你的身體了如指掌,還能透過臨床決策輔助系統,顯示出跟你有相同癥狀的病友群體、使用各種藥物的治療狀況,透過大數據分析可以協助醫生在最短時間內,找出最適合的治療方式。
「很多人以為這樣的愿景,離現實生活非常遙遠,其實臺灣已經走在半路上了。」臺大醫院竹東分院院長王明巨如此說道。的確,臺灣醫療機構的病歷電子化程度很高,很有可能成為全球第一個全國醫院流通電子病歷的國家。醫學研發
運用實時監測及分析大量的儀器數據,建構預測模型,并利用統計工具改善臨床試驗設計,分析臨床試驗數據。發展個人化醫學及疾病發作模式等醫療研發。利用大數據解決多發性硬化癥的算法運算復雜度
位于水牛城的紐約州立大學(SUNY)是一個領先全球的多發性硬化癥(MS)研 究中心。MS是一種具破壞性的、面性的神經系統疾病,影養全球近百人。這種疾病會使人的大腦和骨隨發炎并產生神經病,導致患者可能出現行動不便、視力受損、疼痛等癥狀。
MS的病因是很復雜的,沒有一個單一基因是可能的致病源。因此自2007年以來,SUNY就一直希望透過掃描MS患者的基因組的變化來開發新的治療方式,透過從原本成千上萬的基因序列的變異SNP,SNP指的是單核桃多型性,來獲得單一樣品,研究基因產物和其他基因產物及環境因素進行的交互作用。
研究人員的想法是以多個SNP變異點結合不同的環境變因,并使用一種被稱之為「AMBIENCE」的算法,來檢測縣性和非線性兩種數據數據中的相關性,以識別這些交互作用之間的關系。但是這個想法就如同大海撈針,因為環境變因包括像是實驗對象曝曬太陽的時間長短、維生素D產生的量、吸煙的情況等皆有可能影響研究結果。況且人類的基因由23對染色體所組成,其中包含約30億個DNA堿基對,這些因變量和應變量數量多到嚇人,必須靠建構一套計算量高達1018的高等分析模型才能解決。
因此SUNY與IBM合作,建構一套搭配軟硬件的數據分析系統,以往平均需要27.2小時的工作,縮短到現在只要11.7分鐘即可完成。而且這套系統不僅大大簡化和加速了復雜的分析過程,還提供了不同類型的變量值,如:分類變量、分配卜瓦松變量或連續常態變量等。過去,只要研究中增加一個新的變量值,研究團隊就必須重新編寫整個算法,而現在只需按幾個鍵即可完成。
大數據系統分析的應用除了MS的研究以外,全球估計超過3300萬人感染,至今沒有方法可以完全治愈的艾滋病,以及罕見疾病等,都已開始利用大數據進行大型的醫學研究。
臨床實驗
臨床試驗藉由大數據而有了重大的改變,可利用臨床驗數據、儀器讀數等,進行比較效果研究、臨床決策支持系統、遠距病人監測及加強醫學數據透明度等方面。
擁有數據數據保護的早產兒
所謂的早產兒是指懷孕不到37周就提早出世的寶寶。這些提早降臨人世的小仙子,如果出生后體重不到1500公克,很可能會因為免疫系統尚未發育完全而受到感染,一旦感染之后就很容易引起呼吸衰竭、肺出血及敗血癥。
不過,加拿大多倫多市立兒童醫院里的早產兒,卻可以睡得特別安詳,因為他們是有數據數據保護的「data baby」。隨著醫療設備的發展,利用醫療監測儀器監測病患的生命征象,如血壓、心跳和體溫等,已經是非常普遍的事了。通常這些儀器還具有警報功能,一旦生理的數據數值超出正常范圍時就會發出警示,醫療人員就會采取因應行動。但是即使醫術再精湛、經驗再豐富的醫護人員,可能也無法準確地察覺這些異常的發生時間和嚴重性,尤其當發生在脆弱的早產兒生身上。根據美國弗吉尼亞大學追蹤以往的數據顯示,新生兒受到感染初期的12到24小時,因為脈搏和心跳幾乎都可在接受的范圍內,因此醫護人員很難從生命征象數據的改變中察覺,等到警示燈響起,常常為時已晚。
連續監測和記錄這些生理性數據,可以觀察出新生兒是否遭受感染的早期征兆,但數據量實在太過龐大了。估計這些監測設備每一秒鐘就會產生1000個讀數。以往是30到60分鐘由醫護人員歸納出一個數據做為紀錄,然后儲存72小時。如果要把這些讀數統統記錄起來,根本是不可能的事。
但這項不可能的任務,并沒有嚇跑安大略省理工學院和IBM。他們使用來自懷生研究中心的最新技術,利用江河運算平臺支持大量數據的收集和分析,一天24小時不間斷地收集和記錄著包括早產兒的體溫、心跳、血氧飽和濃度和血壓等電子監測儀器產生的大量數據,以及周遭環境如溫度、濕度等相關數據。在保護病人的隱私安全考慮下,這些數據會直接傳到安大略省理工學院研究中心和IBM華生研究中心;系統會分析和研究哪些因素的交互作用會造成感染,甚至哪幾床的新生兒因為符合條件較多,可能出現疾病或感染的風險較大。之后,系統再將分析結果提供給醫護人員比較判讀。這些動作都在數秒內完成。藉由這項計劃,兒童病房里的醫護人員已經可以提前18到24小時,預防新生兒敗血癥的發生。
由于大數據在規模(Volume)、增加速度(Velocity),以及價值性(Value)上正呈現幾何上升,而其數據所表現的多樣性變化(Variety)與數據的有效性(Validation),更容易成為企業的風險源頭。面對排山倒海而來的大數據,企業需運用大數據,迅速將數據轉化成商業智能,運用分析信息,提升市場的洞察能力,做出更準確的營運決策。例如:電信業者可以分析手機在基地臺漫游的特性,提供更好的在地費率;信用卡業者可以每天定期分析各種信用貸款所產生的風險,動態調整信貸利率;便利超商可以分析消費者的購買習慣,動態調整架上存貨數量等;制造業者可透過現場制造系統所記錄的大量在線實時生產數據進行分析,以協助制造業改善制程、提升良率,并減少物料浪費。因此大數據將是企業未來所面臨的關鍵挑戰。鑒于目前信息以超乎想象的速度產生、累積、消逝,而企業所面臨的商機亦有相同的循環表現。透過海量信息的實時性分析與運用,將可對不同信息的需求者,產生不一樣的價值與意義。若能持續在既有的數據中發掘價值,同時考慮動態信息所帶動的巨大沖擊,并藉此掌握瞬息萬變的市場契機,則大數據的分析與應用,將有助于各類型企業在相關營運領域中,引領下一階段的企業永續發展。基于以上的發展潮流與態勢,麥肯錫(Mckinsey)管理顧問公司于2010年已指出未來引領企業發展趨勢的十大科技,其中即包含了大數據的獲取與分析、云端運算服務的公共價值,以及企業多層面的參與互動及服務。在這些技術與行動通訊網絡的整合應用下,企業未來所產生的數據量將呈現倍數成長,并導致過去傳統的儲存技術即將遇到瓶頸,因此,虛擬化的云端運算分析技術,以及大數據的管理,將成為各方面所即將面臨處理的新課題。從目前的技術發展 來看,未來各項實體化設施,將可能在未來藉由虛擬化的技術,得以降低各項成本的支出,然而云端運算與大數據的應用,絕非僅為建置一個大型數據中心即可,對于后續所產生大量數據下的數量管控、數據的質量與分析結果,以及這些數據所衍生之相關應用與服務,才是現階段所應關心的重點。計算設施(Computer)網絡設施(Network)儲存設施(Storage)數據數量管控數據應用服務數據質量分析虛擬化(Virtualization)為了結合技術、數據,以及應用分析與服務等三項議題的探討,本演講大數據主要闡述BIG DATA 在生技醫療衛生上之應用與研究;拋磚引玉系望能激起大家投入醫療大數據的研究!
第三篇:精準醫療
美國總統奧巴馬在2015年國情咨文演講中談到“人類基因組計劃”所取得的成果,并宣布了新的項目——精準醫療計劃(Precision Medicine Initiative)。
精準醫療是由個性化醫療(personalized medicine)的概念衍生而來的。個性化醫療所關注的疾病治療和預防的核心是個體,根據每個病人的個人特征制定個性化治療方案。當前的藥物越來越趨向于精確面向患有特定疾病的大量患者中少量特定人群,這部分人群有相同的分子特征,同時在分子層面上產生的問題上也保持一致。在具體實踐過程中,精準醫療是指以個人基因組信息為基礎,結合蛋白質組、代謝組等相關內環境信息,為患者量身設計出最佳治療方案,以期達到治療效果最大化和副作用最小化的一門定制醫療模式。
精準醫療的概念——即針對不同個體采取不同的預防與治療措施——并非新鮮事物,事實上,在一個多世紀前,血型分析以及用來指導輸血了。但有關精準醫療的廣泛應用,還是在開發了大規模的生物數據庫、通過組學等手段有效區分不同病人、以及大數據分析工具得以改進的基礎上才實現的。
該計劃主要包括兩個方面:近期對癌癥治療的關注以及長遠對健康和疾病整個范圍知識應用的認識。
精準醫療的短期目標:癌癥治療
腫瘤治療被選為精準醫療的短期目標。隨著人口老齡化的進程加快,癌癥已是美國以及全球其他地區主要的死亡原因。研究人員已發現,許多分子病變是驅動癌癥的誘因,這表明不同癌癥都有自己的基因印記、腫瘤標記物以及變異類型。雖然癌癥主要是由日常生活中基因損傷積累所導致的,但可遺傳性基因變異通常會增加患癌風險。這種對致癌機制的新理解已影響了在藥物和抗體設計過程中,對癌癥風險、分類診斷以及治療策略的評估。許多靶向療法已經或正在研發。
但目前常用的抗腫瘤化療藥物對患者治療的有效性低于70%,約20%-35%的患者接受了不恰當的藥物治療。由于患者沒有時間承受反復實驗和不斷摸索,如果在腫瘤治療過程中能夠實施個體化治療,將能夠大大提高療效,避免過度治療和降低患者經濟負擔,減少醫療資源的浪費。
隨著藥物基因組學以及蛋白質組學、轉錄組學等高通量分子檢測技術的出現,分子靶向技術治療癌癥的個體化治療手段——即從個體基因組中分析和鑒別患者之間存在的疾病相關的個體差異,并利用這些差異來合理的指導臨床治療,已經成為醫學界廣泛共識。所謂靶向治療是指根據腫瘤的不同的特異性位點,抗腫瘤藥物靶向性地與其發生作用從而殺死腫瘤細胞,而對正常組織影響較小。這是目前最理想的治療模式。然而,同化療藥物一樣,不同靶向藥物對所有患者的有效率都非常低,通常在25%以下。造成有效率低下的主要原因在于患者體內存在單核苷酸多態性(SNP)。SNP的復雜性,決定了藥物反應的多態性,藥物療效及最佳用藥劑量很大程度上取決于藥物相關基因變異。所以個體化用藥,及個體化治療已經成為惡性腫瘤、高血壓、糖尿病等重大慢性疾病臨床治療的發展方向和最有效的手段。
例如,衛生部2010年11月首次發布了《結直腸癌診療規范》,明確規定:確診為復發或轉移性結直腸癌時,應進行相關基因狀態檢測,制定個體化治療方案,患者確定為復發或轉移性結直腸癌接受愛必妥、帕尼單抗(抗EGFR單抗)時,必須檢測腫瘤組織的KRAS基因狀態。腫瘤細胞表面存在著接收不同信號的通道。抗EGFR單抗通過阻斷EGFR二聚體的形成,抑制其下游的細胞內信號傳導,從而抑制腫瘤細胞的存活、增值等。但如果KRAS基因突變可旁路激活細胞內信號傳導,從而導致抗EGFR單抗失效。所以,通過檢測KRAS基因有否突變,醫生就可以有針對性的區別給藥。
精準醫療的長遠目標:健康管理
精準醫療計劃的第二部分是將加大科研進步,從而提升對疾病風險評估、疾病機制把握以及許多疾病最佳治療方案的預測,這對擴大精準醫療在健康和衛生保健等諸多領域帶來益處。
該計劃將鼓勵和支持新一代的科學家開發創造性的新方法來檢測、測量和分析范圍廣泛的生物醫學信息——包括分子、基因、細胞、臨床、行為、生理和環境參數在內。在未來:今天的血液計數可能被數以百計的不同類型的免疫細胞普查所被取代;醫療移動設備可實現實時提供監測血糖、血壓和心臟節律等方面的數據;基因型可能會揭示特定的基因變異,從而為特定的疾病提供保護;對糞便的取樣可識別導致肥胖的腸道微生物。另外,血液檢測也可檢測出癌癥早期出現或復發的腫瘤細胞或腫瘤DNA等。
精準醫療能提供一個強大的框架方案,加快其在不同領域的應用,最明顯的是遺傳疾病和傳染病領域,在其他疾病和環境響應中也已獲得積極反饋。
中國精準醫療計劃將在2015下半年或明年啟動,在2030年前,中國精準醫療將投入600億元。今年2月,總書記批示科技部和國家衛生計生委,要求國家成立中國精準醫療戰略專家組,共19位專家組成了國家精準醫療戰略專家委員會。有了領導的重視,人力和經費的保障,相信我國在精準醫療領域必將大有作為。
如前所述,目前精準醫療的產品主要集中在腫瘤突變分子檢測的用藥指導方面,目前相關產品包括有關腫瘤基因突變、融合、表達等檢測項目。由于在多項腫瘤診療規范中都規定了使用靶向藥物等之前,必須要對相關基因突變情況進行檢測,因此該市場潛力巨大。
腫瘤領域的基因測序是精準醫療最重要的組成部分,其應用將覆蓋腫瘤的易感基因檢測,早期篩查,疾病確診,個性化用藥指導,隨診與療效評價等眾多治療環節。根據世衛組織(WHO)發表的《全球癌癥報告2014》,全球癌癥病例增長快速,從2012年的1400萬人到2025年的1900萬人和2035年的2400萬人,全球癌癥患者和死亡病例都在令人不安地增加,新增癌癥病例有近一半出現在亞洲,其中大部分在中國,中國新增癌癥病例高居第一位,腫瘤作為人類壽命的頭號威脅其發病率和消費剛性遠超產前篩查等市場。
基因測序技術是腫瘤個體化治療的必備,一是檢測腫瘤易感基因,利用DNA測序技術確認導致患者患病的基因或者受檢者是否攜帶有腫瘤易感基因,尋找患者適用的腫瘤靶向治療藥物或者其他適宜的治療手段。如果能在腫瘤早期階段發現,并干預治療,將極大地提高治愈率,顯著延長患者生存時間,無論是CTC,還是ctDNA,都是聚焦外周血腫瘤早期篩查,高通量測序是主要技術手段。二是檢測腫瘤靶向藥靶點,在分子靶向藥使用之前檢測病人是否攜帶藥物靶點,實現腫瘤的個體化治療,以提高用藥效率,達到最佳療效并減少治療費用。目前FDA已經批準了部分基因診斷腫瘤個體化治療方案,高通量測序技術未來在現有的腫瘤個體化治療基礎上,或將提供更為詳盡的治療與用藥方案,并能夠更為高效地發現和藥物作用機制有關的基因靶點,這些都具有重要的臨床意義。
精準醫療具有廣闊的前景,但就目前市場推廣而言,還有些不能忽視的要素,譬如監管部門的控制力度、醫療保險的覆蓋程度。以及醫生的接受程度等。
第四篇:精準醫學和大數據將成為醫療行業的助力(模版)
精準醫學和大數據將成為醫療行業的助力
到目前為止,醫療行業還是采取通用型(one-size-fits-all)方式,但是如果我們能夠根據看護人員和衛生保健專業人員收集到的數據點來評估治療會怎么樣呢?這就是精準醫學,一種基于數據、算法和精準分子工具的新型醫療形式。
例如,在精準醫學方面處于領先地位的加州大學舊金山分校目前正在訓練醫生在診斷和治療的過程中要和他們的病人進行不同的對話,以便于對他們的而社會、環境和經濟等背景情況有所了解。精準醫學將人們對醫療的關注點從識別癥狀到了解并治療疾病機制。另外,精準醫學還在環境和社會因素對健康的影響有所側重。那些了解科技和醫學目標的人能夠為解讀和聯系這些數據點提供平臺,在精準醫學的價值鏈當中創造價值。精準醫學的概念不是美國總統奧巴馬首次提出的,但是卻因為去年初奧巴馬在在美國國會作國情咨文報告時提出精準醫學一詞,使其成為世界各國關注的熱點。我國也在去年成立了19人的國家精準醫療戰略專家委員會,并計劃在2030年前投入600億元。
精準醫療是增加療效,降低副作用,降低治療費用的重要手段。詹啟敏院士表示,目前的醫療技術很多都已經達到了“天花板”,臨床治療方案的效果已經達到極限。比如,同樣的腫瘤類型和同樣的疾病分期病人,采用相同的治療方案情況下,只有不到50%的病人產生理想療效,50%~70%的病人效果不明顯或者沒有療效。治療過程中有很大的被動和盲目性。根據前瞻產業研究院的數據顯示,精準醫學中的基因測序市場規模年均復合增速達到21.2%,到2018年預計將會突破1.1萬億的市場規模。
詹啟敏院士表示,精準醫學的發展離不開生物樣本庫、多組學分析平臺及大數據三大平臺的支撐。“誰擁有生物樣本資源誰就掌握了醫學科技的主動權,誰就能占據醫學競爭的制高點。”而多組學分析平臺是大數據的重要來源,包括測序技術、芯片技術以及培養培養組學、大數據、醫學復合型人才團隊等。第三,大數據平臺本身包括數據的搜集、儲存、分析、利用、共享和安全。這些數據包括了社區數據、隊列數據、臨床數據、組學數據還有結構生物學、藥物分子信息等等,大數據在藥物研發里面可以幫助確立新靶點、新結構,研發新藥物,幫助制訂新的診療方案以及確定在診療過程當中新的標準、新的規范
和指南。
近年來,資本在精準醫學領域的布局呈現出日趨火熱的態勢。有相關統計顯示,截止目前,國內精準醫療投資標的共計171家,領域分布于基因測序、PCR、基因芯片、液體活檢、細胞免疫治療、抗體藥物以及腫瘤大數據、抗體相關、精準診斷等。此前曾有分析指出,目前精準醫療正處于絕佳布局良機。一方面精準醫療行業正在蓬勃興起,未來將涌現出非常多的投資標的;另一方面,精準醫療目前正處于想象到現實的爆發臨界點,如基因測序成本已經降到1000美元以下,未來還仍將繼續呈下降趨勢,這讓精準醫療的大規模應用指日可待,而大數據技術的發展,也使基金測序數據的處理能力快速顯著提升。
第五篇:“數據”引領 “精準”扶貧
《人民郵電》“數據”引領 “精準”扶貧
——中國電信甘肅公司以大數據服務地方扶貧項目紀實
【發布日期: 2016/1/8 15:06:35】 【瀏覽量: 565】
“貧困人口多、貧困程度深,致貧因素多、脫貧難度大”,這是甘肅省委書記王三運對甘肅現階段基本省情的判斷。基于這樣的認識,甘肅各級政府和企業都對扶貧開發給予了足夠的重視并注入大量資源,中國電信甘肅公司也不例外。
“政府的需求和人民大眾的利益,就是甘肅公司業務發展的力量源泉,更是目標和方向。”這是中國電信甘肅公司總經理、萬維公司董事長秦學壽的堅持,也是甘肅電信以大數據服務地方精準扶貧脫貧的動力。
從最初的村通電話,到現在的雙聯“8分卡”、4G網絡覆蓋;從之前的寬帶進村到如今的光纖入戶、信息扶貧,每一項技術的革新和業務的推出,無不體現著甘肅電信服務民生的實際行動。如今,由其旗下全資子公司甘肅萬維承建并提供服務支撐的“甘肅大數據精準扶貧管理平臺”更是吹響了以大數據開展行業扶貧的號角,并憑借著雄厚的硬件和技術實力,將政府精準扶貧、精準脫貧的“精準”二字詮釋得淋漓盡致。
大數據的“魔力”
針對基本省情,近年來,甘肅相繼實施了“聯村聯戶為民富民”行動、“1236”扶貧攻堅行動,有效凝聚了各方資源和力量,使全省貧困人口由692萬減少到417萬,貧困面由33.2%下降到19.8%。隨著貧困人口的減少,過去“修一條路就能給群眾打開一扇脫貧致富大門”的“撒胡椒面”式粗放扶貧已不能適應當前省情,必須向“個性化定制”的精準扶貧轉變。2015年6月,甘肅省圍繞“精準扶貧、精準脫貧”的總體要求,在全國率先出臺了“1+17”的精準扶貧系統性工作方案。這套組合拳整合醫療、教育、農牧等所有與扶貧相關的職能部門,針對貧困戶“量體裁衣”,釋放政策疊加效應。在此基礎上,11月底,又出臺了“853”精準脫貧管理辦法,狠抓精準識別,力求將軍令狀細化為作戰圖,把作戰圖轉化為戰果圖。
但如何做到精準?417萬貧困人口主要分布在哪、為何貧困、怎么讓幫扶措施落實?非嚴謹細致不足以求公平,非實事求是不足以樹公信。靠全省14個市州、86個縣的工作人員零散的記錄和統計肯定不行,這種情況下,甘肅省委、省政府提出用互聯網信息化技術作為抓手,建立全省精準扶貧大數據平臺。
作為“精準扶貧大數據平臺”的承建者,甘肅電信萬維公司第一時間與省扶貧辦進行了需求對接。2015年6月11日,“全省精準扶貧精準脫貧工作會議”召開后,省長劉偉平組織召開辦公會議,將“精準扶貧大數據平臺”建設作為落實全省精準扶貧政策的第一件大事,進行了專題研究,提出了運用互聯網平臺和大數據分析等現代信息技術,通過對扶貧對象的識別、扶貧措施的落實、信息數據的分析、扶貧成效的跟蹤等,形成扶貧動態化、全過程閉環管理的要求。6月12日,甘肅電信萬維公司抽調70多名技術人員組成平臺建設團隊,正式開始平臺的搭建和功能研發。
從中央到地方,從政府到企業,從工作人員到貧困戶,“精準扶貧大數據平臺”的建設被寄予厚望,也贏得了眾多關注的目光。平臺建設啟動以來,省長劉偉平,省委副書記歐陽堅,省委常委、統戰部部長王璽玉多次聽取進度匯報,分析存在的問題,提出建設意見和要求。
2015年9月10日,甘肅省被列為國家扶貧辦全國大數據平臺建設試點省份,成為在全國率先探索建設精準扶貧大數據管理平臺的省。
9月18日,“三西”扶貧開發現場會議召開之際,國務院副總理汪洋在甘肅省委書記王三運的陪同下,專程赴定西市安定區李家堡鎮窯坡村考察精準扶貧工作,其間詳細了解了“精準扶貧大數據管理平臺”的建設和使用情況,對甘肅省用大數據手段進行精準扶貧工作給予肯定。
同日,國務院扶貧辦主任劉永富帶領八部委九省區的相關領導觀看了“甘肅省精準扶貧大數據管理平臺”演示,要求通過大數據平臺的管理,使精準扶貧工作得到進一步提升。
9月21日,在全國扶貧辦主任座談會上,甘肅省專門就“精準扶貧大數據管理平臺”進行了匯報、演示,獲得與會人員的廣泛認可……
用“數據”說話
準確的數據提取和分析能力是大數據平臺贏得各方關注的關鍵,也是價值所在。
近年來,中國電信甘肅公司依托豐富的通信基礎設施,以先進的網絡技術、強大的網絡運行維護能力和豐富的網絡管理經驗為支撐,積極運用大數據、“互聯網+”服務社會大眾和行業發展,在政務、教育、金融、交通等各個領域取得了顯著成效。此次與政府部門合作建設精準扶貧大數據平臺,就是甘肅電信以智力支持和技術服務全面參與行業扶貧的積極探索與嘗試。
建成后的平臺按照功能分為扶貧對象、扶貧措施、扶貧成效、數據分析、績效考核五個模塊,模塊間相互依存又互相獨立。拿扶貧對象模塊來說,在貧困戶管理欄,任意選擇一位貧困戶,就可以看到該貧困戶的生產生活情況、幫扶措施、幫扶成效等。在此基礎上,平臺還打通了與扶貧開發工作相關的行業部門之間的信息通道,可以通過與民政、銀行、教育、住建等行業部門數據對接,建立智能分析模型,準確評估“1+17”扶貧措施疊加效應,使得扶貧對象、措施到戶、項目安排、資金使用、脫貧成效更精準。
目前,大數據平臺已與省衛計委新農合報銷平臺無縫對接,精準扶貧平臺中的417萬貧困戶在醫院就醫時,刷新農合的報銷卡就會自動享受特殊優惠政策,不但簡化了報銷流程,而且使數據實時同步,方便了資金監管。基礎數據的“精準”是平臺所有功能的基礎,為此,平臺還增加用戶審計功能,與其他系統互聯互通,統一識別標志,統一數據口徑,實現扶貧對象全方位對比,為基層實現扶貧對象實名制動態管理提供數據依據。
通過“互聯網+”和大數據對扶貧項目進行精準管理,其最終目的就是要徹底改變過去那種項目點多面廣、資金零星分散、投向不準、程序不規范的狀況,實現扶貧項目監管信息化、精準化和動態化,從制度上、程序上、行為上堵塞漏洞。
2015年6月底,甘肅省教育廳和扶貧辦制定“精準扶貧教育支持計劃”,對納入扶貧大數據庫的貧困家庭子女免收學前教育階段保教費;對貧困家庭中職學生按照每人每年2000元標準發放助學金;對進入省內高職院校的貧困家庭學生免除學費和書本費;對貧困家庭考入高職、本科院校的學生給予每學年最高8000元的助學貸款。與此同時,省教育廳還將依據大數據平臺,精準開展招生扶貧,到2017年,全省每年將有約8萬名貧困家庭中職學生和約4.6萬名貧困家庭高職(專科)學生接受免費職業教育。
“大數據平臺的采集摸底,讓我們進一步掌握了貧困家庭各個學齡段學生的狀況,哪些孩子是適齡入學兒童,哪一家享受什么優惠政策,真正不讓一個孩子因為貧困而失學,不讓一戶貧困家庭在享受國家政策上漏掉。”隴西縣教育局局長楊海賓說。
大數據平臺與政府的需求相融合,與貧困戶的渴望相碰撞,還產生了改善農業生產條件和發展現代農業的蓬勃力量。天水市秦州區針對農戶在諸如種植、養殖業建設,以及化肥、地膜、農藥等配套設施中資金鏈斷裂的瓶頸制約,依據大數據平臺,以3~5戶聯保形式進行貸款扶持,真正把“扶貧之水”精準滴灌到“最干旱禾苗”上。太京鎮張吳山村村民賈壩求就是這種模式的受益者,他家依托扶貧項目種植了5畝蘋果園,現在又申請到政府提供的5萬元扶貧貼息貸款,為果園設施大棚建設提供了資金保障。
“政府派來的幫扶工作隊已經把我們家的經濟情況錄入檔案,將根據這個檔案給我爭取扶貧幫扶政策,幫助我發展養殖業。到2020年,我家的人均純收入將達到1萬元。”這是目前家庭人均純收入只有3000元的隴南成縣二郎鄉店子村村民張志強的打算。
事實上,在大數據管理平臺的支撐和不斷完善下,像賈壩求、張志強這樣的貧困戶今后將會不斷獲得來自政府和企業更多具有針對性的幫扶,實現脫貧致富的夢想。
基于“數據”的合力
“精準扶貧大數據管理平臺”的建設,經歷了頂層設計、軟件開發、數據采集三個層面的工作。在設計中,省扶貧辦組織涉及精準扶貧方案的23個省直相關行業部門,先后召開20余次業務研討會議,將“1+17”各項政策措施設計成信息采集表,分為戶級、村級、縣級數據結構,嵌入大數據云平臺,精準掌握貧困戶的情況;數據采集中,全省共有15萬名工作人員參與,對貧困戶的信息進行核實錄入,省直各行業部門對平臺匯總數據進行確認對接,確保數據準確有效;甘肅電信萬維公司則根據平臺建設需求,75個團隊成員同時開工,放棄休息,高速運轉,邊研發、邊試點、邊應用,使平臺在短短的幾個月時間內不斷完善并穩步運營。
2015年6月11日,專題部署平臺建設所需人員及資源保障;
6月12日,召開項目啟動會,開始框架設計;
6月18日,進行需求對接,正式開始軟件開發;
6月26日,大數據平臺1.0版上線;
8月,配合省扶貧辦進行第一次數據采集; 9月10日,對照問題開始2.0版本研發;
10月8日,2.0版上線,并緊接著配合用戶單位進行了第二次、第三次數據采集……
這份平臺建設時間表直觀反映了甘肅電信萬維公司建設團隊的工作效率。團隊制定了詳細周密的“作戰計劃”,需求統籌、業務開發、大數據分析、運行維護、移動App開發,各個“作戰”單元各司其職,認真研究每一個需求,探討每一個技術細節。由于平臺涉及面廣,用戶一點小小的需求,往往需要開發人員進行數個甚至數十個步驟的設計和程序編寫,根據需求設計的平臺“宏觀框架圖”達到近10米,堪稱萬維公司之最。
要保質保量完成平臺建設任務,整個團隊70多個成員的工作進度就要保持高度一致,在2015年6月團隊組建到7月初第一階段工作結束的25天、600個小時中,大家吃住在單位,夜以繼日、通宵達旦地工作。團隊成員管信莉還為此改變了自己已經定好的婚期,成員王富則兩次推遲自己的訂婚日期……
為了做好支撐服務,使平臺頂層設計更加科學、更加符合各地實際,甘肅電信萬維公司技術人員還配合相關行業部門先后6次深入天水市、隴南市、定西市、臨夏回族自治州、平涼市等6個市州、9個縣市區開展實地調研測試及試點工作;平臺數據采集工作開展后,他們又認真配合省扶貧辦對各級工作人員進行培訓,并與省扶貧辦共同起草了《甘肅省精準扶貧大數據管理平臺運行管理辦法》。數據采集中,大數據平臺并發量最高達到15萬次,甘肅電信萬維公司還緊急調配增加10臺服務器,使服務器總數達到96臺,網絡帶寬由2G緊急擴展到10G,保障了各項工作的順利開展。
“目前,我們的3.0版正在研發中,預計1月就能上線。”萬維公司精準扶貧平臺部負責人郭真滿懷信心。截至目前,平臺已完成對全省101萬貧困戶、417萬貧困人口的動態管理,匯集到戶、到村措施1100萬條,數據量達到7億個,具備精準管理功能。
按照規劃,下一步,甘肅電信萬維公司將在進一步完善平臺頂層設計和功能的基礎上,積極與各級政府進行深入合作,依托省級扶貧平臺,建設市縣級特色服務平臺,提供更具個性化的服務,推動產業扶貧項目發展。未來,將積極打造涉及全省各個行業和部門的大數據平臺,在更大范圍、更廣領域服務民生。
《人民郵電》2016年1月8日 一版 作者:肖成年 楊愛芬