制服丝袜成人电影|欧洲美女激情AV|久久天堂无码AV|日本一及黄色电影一及黄色|天摸天操天啪欧美|AA级黄色一级特黄成人大片|日韩特级AAA毛片|特级黄色成人录像|激情啪啪综合亚洲A黄|特黄一级AAA日本在线观看

歡迎訪問智慧醫(yī)療網(wǎng) | 網(wǎng)站首頁
 

臨床數(shù)據(jù)挖掘的概念與特點(diǎn)

發(fā)布時(shí)間:2023-07-22 來源:醫(yī)信邦 瀏覽量: 字號(hào):【加大】【減小】 手機(jī)上觀看

打開手機(jī)掃描二維碼
即可在手機(jī)端查看

國內(nèi)數(shù)據(jù)挖掘研究起步雖然較晚,但是發(fā)展特別迅速,特別是醫(yī)學(xué)研究領(lǐng)域。目前,我國絕大部分醫(yī)院信息管理系統(tǒng)只具備簡單數(shù)據(jù)的查詢與基本統(tǒng)計(jì)功能,隱藏在臨床數(shù)據(jù)背后的潛在關(guān)聯(lián)與知識(shí)并沒有被充分挖掘利用,大量臨床診療活動(dòng)記錄數(shù)據(jù)有待挖掘開發(fā)。

一、數(shù)據(jù)挖掘的概念

數(shù)據(jù)挖掘(Data Mining,DM)是近年來十分活躍的一個(gè)研究領(lǐng)域,是隨著數(shù)據(jù)庫、人工智能、統(tǒng)計(jì)分析和模式識(shí)別等技術(shù)發(fā)展而出現(xiàn)的一門新興技術(shù),最早由美國第十一屆人工智能協(xié)會(huì)(American Association for Artificial Intelligence,AAAI)在 1989 年舉辦的全國人工智能大會(huì)(The National Conference on Artificial Intelligence)上提出。
數(shù)據(jù)挖掘又稱為數(shù)據(jù)庫知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Databases,KDD),指從大量不完全、有噪聲、模糊并隨機(jī)的業(yè)務(wù)數(shù)據(jù)中,提取隱含其中的事先不知道但有潛在利用價(jià)值的信息和知識(shí)的過程,數(shù)據(jù)挖掘結(jié)果多以概念、規(guī)則、規(guī)律、模式等形式呈現(xiàn)。
二、數(shù)據(jù)挖掘的目標(biāo)

數(shù)據(jù)挖掘主要任務(wù)是描述和預(yù)測(cè)。描述的目標(biāo)是概括數(shù)據(jù)中潛在的關(guān)聯(lián)模式,關(guān)聯(lián)模式可以是相關(guān)、趨勢(shì)、聚類、軌跡和異常分布,主要分析方法包括關(guān)聯(lián)分析、聚類分析、差異分析等。預(yù)測(cè)的目標(biāo)是利用容易觀察的特征變量如體重指數(shù)、空腹血糖,預(yù)測(cè)不容易或不能觀察的特征變量如經(jīng)皮腎鏡取石術(shù)后患者是否發(fā)生嚴(yán)重感染,主要分析方法包括分類和回歸等。在數(shù)據(jù)挖掘算法基礎(chǔ)上,一些重要數(shù)據(jù)挖掘技術(shù)還包括關(guān)聯(lián)規(guī)則、鏈分析、決策樹、人工神經(jīng)網(wǎng)絡(luò)、遺傳算法、模糊處理等。

相對(duì)于經(jīng)典統(tǒng)計(jì)分析,數(shù)據(jù)挖掘有獨(dú)有的本質(zhì)特征。數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下,去挖掘未知信息,進(jìn)而發(fā)現(xiàn)新知識(shí)并加以驗(yàn)證。數(shù)據(jù)挖掘所得結(jié)論或知識(shí),具有先前未知或認(rèn)知不充分、真實(shí)性、實(shí)用性三個(gè)基本特征。特別需要指出的是,數(shù)據(jù)挖掘的出現(xiàn)不是為了替代經(jīng)典統(tǒng)計(jì)分析方法,而是經(jīng)典統(tǒng)計(jì)分析方法學(xué)的延伸、擴(kuò)展、整合而成的數(shù)據(jù)分析流程(Workflows)。
三、數(shù)據(jù)挖掘?qū)εR床研究的變革
(一)推動(dòng)從循證醫(yī)學(xué)到精準(zhǔn)醫(yī)學(xué)的變革
循證醫(yī)學(xué)研究(Evidence-based Medicine)是求證醫(yī)學(xué)、實(shí)證醫(yī)學(xué),即遵循證據(jù)的醫(yī)學(xué),是慎重、準(zhǔn)確和明智地應(yīng)用當(dāng)前所能獲得的最好的研究證據(jù),依托醫(yī)生個(gè)人專業(yè)技能和多年臨床經(jīng)驗(yàn),結(jié)合患者的價(jià)值和愿望,將三者完美結(jié)合制定患者適宜的診療方案。隨著生物醫(yī)學(xué)特別是基因組學(xué)、蛋白質(zhì)組學(xué)等生物信息學(xué)發(fā)展,出現(xiàn)了轉(zhuǎn)化醫(yī)學(xué)(Translational Medicine)。轉(zhuǎn)化醫(yī)學(xué)促進(jìn)基礎(chǔ)醫(yī)學(xué)研究成果向臨床診療實(shí)踐轉(zhuǎn)化,其中最成功的是腫瘤靶向治療(Targeted Therapy)。
2015 年 1 月 20 日,美國總統(tǒng)奧巴馬在國情咨文演講時(shí)提出了精準(zhǔn)醫(yī)學(xué)(Precision Medicine)計(jì)劃,是繼 2011 年美國基因組學(xué)與生物醫(yī)學(xué)智庫發(fā)表《邁向精準(zhǔn)醫(yī)學(xué) :建立生物醫(yī)學(xué)與疾病新分類學(xué)的知識(shí)網(wǎng)絡(luò)》后提供的更明確和詳細(xì)的路徑規(guī)劃。精準(zhǔn)醫(yī)學(xué)是在利用生物組學(xué)技術(shù)采集數(shù)據(jù)基礎(chǔ)上,借助數(shù)據(jù)挖掘?qū)崿F(xiàn)計(jì)算機(jī)生物學(xué)分析,尋找疾病臨床表型特異標(biāo)志物和分子網(wǎng)絡(luò)。數(shù)據(jù)挖掘?yàn)檠C醫(yī)學(xué)向精準(zhǔn)醫(yī)學(xué)、從對(duì)癥醫(yī)療模式向個(gè)體醫(yī)療模式轉(zhuǎn)換鋪平了道路,實(shí)現(xiàn)以個(gè)人臨床表型數(shù)據(jù)為基礎(chǔ)、結(jié)合生物組學(xué)數(shù)據(jù)信息,為患者量身設(shè)計(jì)出最佳治療方案,以達(dá)到治療效益最大化和醫(yī)療資源配置最優(yōu)化的醫(yī)療模式。
以精準(zhǔn)醫(yī)學(xué)為導(dǎo)向的數(shù)據(jù)挖掘,仍需要解決如常規(guī)思維模式桎梏、大數(shù)據(jù)管理能力不足、復(fù)雜網(wǎng)絡(luò)環(huán)境下動(dòng)態(tài)數(shù)據(jù)利用與隱私保護(hù)之間的矛盾、平衡大數(shù)據(jù)共享機(jī)制與知識(shí)產(chǎn)權(quán)保護(hù)等問題。
(二)推動(dòng)從隨機(jī)抽樣研究到真實(shí)世界研究
在現(xiàn)代科學(xué)研究中,人們主要依賴抽樣數(shù)據(jù)、局部數(shù)據(jù)和方便數(shù)據(jù),甚至在無法獲得觀察數(shù)據(jù)的時(shí)候,純粹依賴經(jīng)驗(yàn)、理論、假設(shè)和價(jià)值觀去發(fā)現(xiàn)醫(yī)療領(lǐng)域的未知規(guī)律。由于局部數(shù)據(jù)和方便數(shù)據(jù)的局限性,使人們的認(rèn)識(shí)世界往往帶著一定的表面、膚淺、簡單、低效等偏倚色彩。
大數(shù)據(jù)時(shí)代的來臨,使人類第一次有機(jī)會(huì)和條件在更多領(lǐng)域、更深層次獲取利用全局?jǐn)?shù)據(jù)、完整數(shù)據(jù)和系統(tǒng)數(shù)據(jù),更深入地探索現(xiàn)實(shí)世界規(guī)律,獲取過去不可能獲取的數(shù)據(jù)和知識(shí)。大數(shù)據(jù)不只是用隨機(jī)抽樣調(diào)查分析,而是主要采用觀察對(duì)象的整體特征數(shù)據(jù)進(jìn)行分析,這就使臨床數(shù)據(jù)挖掘研究具有要全體不拒抽樣、要效率不拒精確、要相關(guān)不拒因果的特征。

臨床隨機(jī)對(duì)照試驗(yàn)?zāi)軌蛱峁┳罡叩燃?jí)的臨床證據(jù),嚴(yán)格控制試驗(yàn)條件下,在可能有效的受控目標(biāo)人群中進(jìn)行標(biāo)準(zhǔn)化治療,所需樣本量小,隨訪時(shí)間也短。然而,隨機(jī)對(duì)照試驗(yàn)并不能解決所有的臨床問題。利用真實(shí)世界數(shù)據(jù)開展挖掘研究,用產(chǎn)生的真實(shí)世界證據(jù)(Real World Evidence)取代傳統(tǒng)臨床試驗(yàn),進(jìn)行更廣適應(yīng)證研究。醫(yī)療大數(shù)據(jù)來自真實(shí)的臨床診療活動(dòng)場(chǎng)景,納入以非隨機(jī)方式分配治療措施的有多種疾病的患者進(jìn)行研究,其結(jié)果反映實(shí)際診療過程和真實(shí)條件下的診療情況,是一種非隨機(jī)、開放性、無安慰劑研究,因而結(jié)論具有很高的外部真實(shí)性。
以臨床數(shù)據(jù)挖掘?yàn)閷?dǎo)向的真實(shí)世界研究,以臨床應(yīng)用場(chǎng)景為底層邏輯基礎(chǔ)。在臨床診療實(shí)踐中,根據(jù)患者病情和全身狀況,臨床醫(yī)師變化策略采用多種治療措施、確定治療劑量。同時(shí),有更長期限觀察干預(yù)措施的遠(yuǎn)期效果和不良結(jié)局,也觀察更多類型的結(jié)局指標(biāo),如機(jī)體功能指標(biāo)、患者自主報(bào)告結(jié)局、成本效益等。
利用真實(shí)世界數(shù)據(jù)開展數(shù)據(jù)挖掘,需要多角度評(píng)價(jià)數(shù)據(jù)質(zhì)量,嚴(yán)格的數(shù)據(jù)質(zhì)量管理才能提高臨床數(shù)據(jù)挖掘研究水平,確保研究結(jié)果的外部真實(shí)性和臨床實(shí)用價(jià)值。
四、臨床數(shù)據(jù)挖掘的特點(diǎn)
臨床醫(yī)學(xué)地位特殊、診療結(jié)果生死攸關(guān),這就賦予了臨床數(shù)據(jù)挖掘的特殊性和復(fù)雜性。且其涉及醫(yī)學(xué)倫理與法律問題,使得臨床數(shù)據(jù)挖掘與常規(guī)數(shù)據(jù)挖掘之間存在著較大差異。
第一,臨床數(shù)據(jù)挖掘研究有更好的人群代表性和外部真實(shí)性(External validity),或者普遍性(Generalizability)。研究對(duì)象的整體性和真實(shí)性,彌補(bǔ)了隨機(jī)對(duì)照試驗(yàn)研究對(duì)象的局限性和特殊性,為解決臨床問題提供了真實(shí)的臨床實(shí)踐場(chǎng)景,研究結(jié)果和證據(jù)更接近,也更有助于臨床實(shí)踐。
第二,臨床表型存在著個(gè)體差異(Variation)。這賦予了臨床數(shù)據(jù)挖掘區(qū)別于常規(guī)數(shù)據(jù)挖掘的本質(zhì)特征。從理論上來講,臨床特征相同的患者對(duì)治療或藥物反應(yīng)是相似的,但先天遺傳性因素或后天環(huán)境因素的差異,使得少數(shù)患者出現(xiàn)或質(zhì)或量上的差異性個(gè)性化反應(yīng)。如腫瘤患者對(duì)新輔助放化療的完全應(yīng)答、部分應(yīng)答、不應(yīng)答及特異性進(jìn)展等。因此,臨床數(shù)據(jù)挖掘需針對(duì)患者進(jìn)行個(gè)體化判斷或預(yù)測(cè),為個(gè)體化治療方案提供依據(jù)。
第三,因?yàn)橹苯用鎸?duì)臨床數(shù)據(jù)的復(fù)雜結(jié)構(gòu),故臨床數(shù)據(jù)挖掘很難有通用方法(General Solution)解決各種臨床科學(xué)問題。相較于可以將數(shù)據(jù)直接代入公式或模型來反映特征變量關(guān)系的理化學(xué)科,沒有一個(gè)普適性模型能夠指導(dǎo)臨床數(shù)據(jù)挖掘研究,而是需要多模型、多方法、多階段反復(fù)迭代地探索研究。計(jì)算機(jī)信息技術(shù)的發(fā)展,數(shù)據(jù)挖掘新技術(shù)的出現(xiàn),雖有助于克服這一難題,但迭代反復(fù)仍是臨床數(shù)據(jù)挖掘的顯著特征。
第四,臨床數(shù)據(jù)挖掘具有倫理性、法律性和社會(huì)性。臨床數(shù)據(jù)所有權(quán)、數(shù)據(jù)隱私、數(shù)據(jù)安全、預(yù)期收益以及管理成本等都使得臨床數(shù)據(jù)挖掘與常規(guī)數(shù)據(jù)挖掘存在顯著不同。
人類疾病的復(fù)雜性、健康重要性、數(shù)據(jù)特殊性,個(gè)人、團(tuán)體和人群水平的臨床結(jié)局變異性以及數(shù)據(jù)挖掘技術(shù)共同促進(jìn)了臨床數(shù)據(jù)挖掘的快速進(jìn)步。同時(shí),復(fù)雜多變的臨床數(shù)據(jù)也為數(shù)據(jù)挖掘技術(shù)的進(jìn)步提供了廣闊的舞臺(tái)。


Copyright ? 2022 上海科雷會(huì)展服務(wù)有限公司 旗下「智慧醫(yī)療網(wǎng)」版權(quán)所有    ICP備案號(hào):滬ICP備17004559號(hào)-5