公共衛(wèi)生學院張巖波教授課題組關(guān)于冠心病心力衰竭患者3年全因死亡率的可解釋性預測研究最新成果
2021年9月,在國際學術(shù)期刊Computers in Biology and Medicine上以“Interpretable prediction of 3-year all-cause mortality in patients with heart failure caused by coronary heart disease based on machine learning and SHAP”為題在線發(fā)表了山西醫(yī)科大學公共衛(wèi)生學院張巖波教授團隊的研究論文。
在本研究中,,作者開發(fā)并測試了一種可解釋的基于機器學習(machine learning,,ML)的風險分層工具,以預測冠心病引起的心衰患者在3年隨訪期間的全因死亡率,。在6種ML分類器中,XGBoost的性能最好,因此,,作者使用該模型來創(chuàng)建ML風險評分。研究發(fā)現(xiàn)該風險評分模型明顯優(yōu)于目前可用的其他風險評分,。最終結(jié)果表明,,ML具有臨床應用的潛力,以改善風險評估,。同時,,作者利用SHAP值和SHAP圖證明了ML方法可以說明冠心病心衰患者的關(guān)鍵特征,建立高精度的死亡率預測模型,。特征重要性的說明和特征重要性的可視化解釋可以讓醫(yī)生直觀地理解XGBoost中的關(guān)鍵特征,,幫助醫(yī)生更好地理解模型的決策過程,結(jié)果中描述的詳細信息和對于風險因素的解釋讓醫(yī)生更有洞察力,,可以幫助他們做出更明智的決定,,而不是一味盲目地相信算法的結(jié)果。
山西醫(yī)科大學公共衛(wèi)生學院2018級博士研究生王可為文章第一作者,,山西醫(yī)科大學公共衛(wèi)生學院張巖波教授和山大一院韓清華教授為共同通訊作者,。該工作得到國家自然科學基金、重大疾病風險評估山西省重點實驗室等多方資助,。
A
 |
B
 |
Figure1Categorization threshold of Prediction score(A)andKaplan–Meier estimator for populationwith low and high machine learning risk (B).

Figure2Multivariable Cox regression for3-yearall-cause death prediction.
Figure3Variable importance in ML classification for men (A,N= 1023) and women (B,N= 539). Kaplan–Meier curves for subjects with highand low ML risk in mam (C) and woman (D).
No-survivor
 |
Survivor
 |
Figure4The interpretation of model prediction results with the two samples. (The values of each variable are normalized values.)