大數據分析技術主要包括是以最新應用數學、前沿計算科學和信息工程學為核心,以數據挖掘、數據倉庫、商務智能等智能化的信息科技技術為手段,它不僅能夠大幅提高傳統的醫學科研技術,而且在最新的分子生物技術的發展中也發揮著關鍵的作用。
壹項新技術的采用,往往意味著全新的方向。如同倫琴射線在醫學上的應用,開創了全新的醫學視角壹樣,隨後的CT,MRI,B-US,PETS等新技術的采用壹次次的推動了醫學的發展,擴展了醫生的視野,如今,影像學已經是不可缺少的組成部分。信息學的重點是對壹切可觀測的指標(如年齡,住址,性別,化驗,治療,影像等壹切通過現有手段可以觀測的數據)整合後,結合應用數學,系統工程學,進行再分析、再處理。
少量的個案往往不足以揭示規律和知識,當數量足夠大時,規律才有可能顯現。所以整合成數據倉庫也是必要的。而規律並不僅僅浮在數據表面,所以統計學和數據挖掘成為必要的手段,而在線式的方法提高了速度,基於系統工程的向導式結構有利於穩定大數據分析質量。
當年倫琴射線引入醫學的時候,壹定不會想到今日的局面。而將KDD引入醫學領域,在中國廣闊地域,巨大的人口基數下,基於這些特點形成的巨大的衛生信息數據,僅僅是用在線式的傳統方法就可以發現大量有價值的醫學知識,而結合數據挖掘,數據倉庫,系統工程,發現新知識的可能性更是大大增加了。
健康大數據分析技術
大數據分析技術主要包括:
以數據挖掘為核心的知識發現技術,
以數據倉庫為核心的數據整合技術,
以商務智能為核心的智能決策技術。
壹、以數據挖掘為核心的知識發現技術
以數據挖掘為核心的知識發現技術可以直接挖掘醫學新知識,幫助科研人員加速取得科研成果,甚至重大科研發現。
運用多種數據挖掘技術探索數據規律,為科研人員的科研設計提供科學依據,為科研命題指明方向,保證了科研的成功率。
數據挖掘是壹種突破傳統的分析手段,為各類科研技術提供新的技術方法,大大縮短科研和分析周期,深入揭示醫學潛在規律。
數據挖掘,又稱知識發現(KDD),是從大量的數據中,抽取潛在的、有價值的知識的過程。數據挖掘所探尋的模式是壹種客觀存在的、但隱藏在數據中未被發現的知識。例如,KDD可直接挖掘疾病高發人群,疾病及癥狀間的未知聯系,化驗指標間的影響關系及化驗指標與疾病間的潛在影響,對未知的檢驗項值進行預測等等。通過可觀測指標推斷不可觀測指標,或通過簡單易行的觀測指標推斷昂貴的或有創的指標。由簡而知繁,由易而知難。再如,在科研設計中利用聚類分析、因子權重分析,我們可以對數據進行科學分組、考察多因素的不同權重、幫助確定析因分析或嵌套分析等不同的科研設計。KDD在醫學中應用非常廣泛,為醫學研究提供傳統方法不能企及的前沿技術手段,例如:
聚類分析關聯規則分析因子權重分析回歸預測分析特性抽取分析
二、以數據倉庫為核心的數據整合技術
以數據倉庫技術為核心的醫學數據整合系統,獨立於已有的醫療機構業務系統,以全新的設計將分散的業務系統產生的不壹致的數據進行整理、變換、集成,整合得到全面、高效、壹致的信息。
數據倉庫技術還使得對歷史的全部海量數據進行在線的、實時的、深入的分析成為可能,並使其變得很輕松。
直接利用積累的現有醫學數據,使科研成本大大降低,相同的的科研經費取得更多科研成果。
應用數據倉庫的整合技術,使獲得大數據科研樣本數據易如反掌。
結合中國龐大的人口基數和橫跨寒帶溫帶熱帶的廣闊地域,可建成世界上最大的衛生信息數據倉庫,其全面的信息量是每個醫務人員夢寐以求的。如能與世界各國合作,***享,整合,將成為與人類基因組計劃齊名的壯舉。
三、以商務智能為核心的智能決策技術
應用成熟的專業分析系統提供壹致的準確的實時的數據分析,為各級各方面衛生決策提供可靠依據,使資源和效率得到優化,還能從經營決策和管理上獲取經濟效益和社會效益。
將商務智能技術(BI)應用於衛生決策分析,使決策者擺脫傳統報表的束縛,以全新的先進的分析手段多維度地深入理解需要的數據,為廣泛而深入的分析提供了新的有力工具。
專業的分析報表如累計貢獻度分析,分攤百分比分析,嵌套排名分析等專業分析報表使決策者對歷史和現狀壹目了然,對各種業務表現的因果關系能輕松的了如指掌。
健康大數據分析的應用
健康大數據分析技術在如下四個方面得到應用:
疾病與健康研究
環境與健康研究
醫藥生物技術研究
衛生宏觀決策支持
大數據分析技術將在以上方面發揮著特殊的作用。