日前,成都一家科技公司舉行了國(guó)內(nèi)首次人工智能AI醫(yī)生與真人醫(yī)生一致性評(píng)測(cè),直接讓GPT醫(yī)生和人類(lèi)主治級(jí)別以上的醫(yī)生直接現(xiàn)場(chǎng)診斷直播PK,現(xiàn)場(chǎng)有120多位真實(shí)患者及10位主治及以上醫(yī)師,這10位醫(yī)生是來(lái)自四川大學(xué)華西醫(yī)院的心內(nèi)科、消化內(nèi)科、呼吸內(nèi)科、內(nèi)分泌科、腎臟內(nèi)科、骨科、泌尿外科的主治及以上醫(yī)師,然后跟GPT醫(yī)生同時(shí)現(xiàn)場(chǎng)開(kāi)展對(duì)患者問(wèn)診。最終,經(jīng)過(guò)來(lái)自北大人民醫(yī)院、中日友好醫(yī)院、阜外醫(yī)院和友誼醫(yī)院的7位專(zhuān)家教授,針對(duì)GPT醫(yī)生和人類(lèi)醫(yī)生現(xiàn)場(chǎng)診斷所形成的91份有效病例進(jìn)行審核,重點(diǎn)針對(duì)AI醫(yī)生的問(wèn)診準(zhǔn)確性、診斷準(zhǔn)確性、治療建議準(zhǔn)確性、輔助檢查方案準(zhǔn)確性、數(shù)據(jù)分析準(zhǔn)確性、提供可解釋信息、自然語(yǔ)言問(wèn)診與交互這7個(gè)評(píng)價(jià)維度的打分之后。
最終,真人醫(yī)生綜合得分為 7.5分,AI 醫(yī)生綜合得分為 7.2分。AI醫(yī)生與三甲主治醫(yī)生在比分結(jié)果上的一致性達(dá)到了96%。這就意味著,當(dāng)下最火熱的AI:GPT醫(yī)生在我們常規(guī)的一些科室的疾病方面的診斷準(zhǔn)確率,跟真人的主治醫(yī)生及以上專(zhuān)家的診斷水平齊平。并且在患者提供的檢查治療與病情描述清晰的情況下,GPT醫(yī)生出現(xiàn)的誤診、漏診的概率就非常小。專(zhuān)家評(píng)審團(tuán)認(rèn)為,GPT醫(yī)生的知識(shí)覆蓋面是超過(guò)一些經(jīng)驗(yàn)并不是很充足的真人醫(yī)生的。AI對(duì)決頂尖醫(yī)生的結(jié)果讓人驚訝,那他又會(huì)對(duì)康復(fù)帶來(lái)怎樣的作用?AI的優(yōu)點(diǎn):評(píng)估和預(yù)警AI可以幫助醫(yī)生提供更好的臨床決策,取代醫(yī)療保健的某些功能區(qū)域(例如放射影像學(xué))中的人類(lèi)判斷。AI系統(tǒng)從大量患者群體中提取有用信息,可以對(duì)健康風(fēng)險(xiǎn)進(jìn)行評(píng)估和預(yù)警,對(duì)健康趨勢(shì)進(jìn)行預(yù)測(cè)和推斷,而且AI具有學(xué)習(xí)和自我糾正能力,可以根據(jù)反饋提高其準(zhǔn)確性。在康復(fù)醫(yī)學(xué)領(lǐng)域,人工智能機(jī)器人已經(jīng)可以進(jìn)入康復(fù)治療一線,包括一些可以讓下肢癱瘓的患者進(jìn)行步行運(yùn)動(dòng)的減重步行機(jī)器人等。但是,對(duì)于康復(fù)評(píng)估過(guò)程,目前人工智能技術(shù)還沒(méi)有為臨床工作提供幫助的案例,但通過(guò)此次對(duì)決不難預(yù)料,AI進(jìn)入康復(fù)評(píng)估將在短時(shí)間內(nèi)成為可能。人工智能算法在康復(fù)評(píng)定中的應(yīng)用
不論是中樞神經(jīng)損傷還是下肢骨骼肌肉系統(tǒng)疾患都會(huì)對(duì)患者的步態(tài)產(chǎn)生影響,而正常步態(tài)的建立是患者重返日?;顒?dòng)的基礎(chǔ)。實(shí)際臨床工作中的步態(tài)分析往往依賴(lài)于醫(yī)生和治療師的經(jīng)驗(yàn);少數(shù)機(jī)構(gòu)運(yùn)用可穿戴設(shè)備進(jìn)行步態(tài)分析,但是實(shí)際操作費(fèi)事費(fèi)力且對(duì)場(chǎng)地要求較高,不利于大面積推廣應(yīng)用。早在2012年,南非的科學(xué)家使用一種無(wú)線的慣性捕捉系統(tǒng)(Inertial Motion Capture, IMC)收集了30名健康受試者和28名中風(fēng)后偏癱患者的下肢步態(tài)參數(shù),并對(duì)一個(gè)反向傳播人工神經(jīng)網(wǎng)絡(luò)(Back-propagation artificial neural network)進(jìn)行測(cè)試和訓(xùn)練;結(jié)果顯示,這個(gè)ANN對(duì)166個(gè)測(cè)試參數(shù)的分類(lèi)正確率為100%,而且重復(fù)精確度達(dá)到了99.4%!說(shuō)明這個(gè)ANN模型可以精確穩(wěn)定的區(qū)分健康人和偏癱患者的步態(tài)特征,這有助于判斷偏癱患者步態(tài)恢復(fù)情況。這還是十多年前的模型,而相較于目前在算法和應(yīng)用上更為先進(jìn)的AI,應(yīng)用到康復(fù)評(píng)估上的精確度將會(huì)更高!預(yù)測(cè)康復(fù)決策和康復(fù)結(jié)局一種康復(fù)醫(yī)療決策支持系統(tǒng)(Medical Decision Support System, MDSS),即僅根據(jù)患者的人口學(xué)特征和臨床特征,就能準(zhǔn)確預(yù)測(cè)康復(fù)醫(yī)生為膝關(guān)節(jié)骨性關(guān)節(jié)炎(Osteoarthritis,OA)患者開(kāi)出的康復(fù)方案。試驗(yàn)將170例分別接受過(guò)三種不同治療方案的膝關(guān)節(jié)OA患者的人口學(xué)數(shù)據(jù)和臨床變量納入MDSS。模型中的人口統(tǒng)計(jì)學(xué)變量是年齡和性別。進(jìn)入模型的臨床變量包括身高、體重、BMI、患側(cè)、膝關(guān)節(jié)OA嚴(yán)重程度、疼痛程度。研究中的所有患者都接受了膝關(guān)節(jié)OA患者的三種治療方案中的某一種:(1)熱敷聯(lián)合電療和運(yùn)動(dòng)療法;(2)冰敷聯(lián)合超聲波和運(yùn)動(dòng)療法;(3)單獨(dú)運(yùn)動(dòng)療法。采用彈性反向傳播人工神經(jīng)網(wǎng)絡(luò)算法(Resilient back propagation artificial neural network algorithm),進(jìn)行了十次交叉驗(yàn)證。輸出結(jié)果顯示,MDSS能夠準(zhǔn)確預(yù)測(cè)87%的患者的治療方案,可以有效地輔助臨床康復(fù)工作者快速制定OA康復(fù)方案。人工智能距離康復(fù)醫(yī)療有多遠(yuǎn)?現(xiàn)代人工神經(jīng)網(wǎng)絡(luò)在康復(fù)評(píng)定領(lǐng)域有巨大發(fā)展和應(yīng)用前景,可以簡(jiǎn)化一些繁瑣的人工評(píng)定方法,還可以對(duì)一些難以在臨床進(jìn)行量化評(píng)定的參數(shù)進(jìn)行精確化預(yù)測(cè),節(jié)約了臨床診療時(shí)間,減輕了康復(fù)醫(yī)師和治療師的工作量。但是,我們不得不面對(duì)一些亟待解決的問(wèn)題。首先,人工智能的深度學(xué)習(xí)需要大量臨床參數(shù)、圖像、影像等的數(shù)據(jù)支持,而這些數(shù)據(jù)取得因?qū)颊唠[私權(quán)的保護(hù)而難以合法地成立課題或大規(guī)模使用。此外,人工智能可很大程度輔助臨床醫(yī)生進(jìn)行診療,必將造成相關(guān)科室醫(yī)務(wù)人員需求的降低,這也使臨床一線人員對(duì)于人工智能的研發(fā)有所抵觸。其次,部分人工智能在醫(yī)療及生物醫(yī)學(xué)領(lǐng)域的應(yīng)用涉及倫理問(wèn)題,某些領(lǐng)域(比如傳染病科、精神科)所涉及的敏感問(wèn)題還未有完備的的倫理體系提供理論支持,若大規(guī)模應(yīng)用恐造成有違醫(yī)療公正和社會(huì)道德的行為。因此,雖然我們對(duì)于AI進(jìn)入康復(fù)醫(yī)療滿(mǎn)懷期待,但是鑒于目前還存在諸多亟待解決的問(wèn)題,切不可操之過(guò)急,不成熟的AI濫用,不僅是對(duì)患者的不負(fù)責(zé),也是對(duì)醫(yī)療資源的浪費(fèi)。