急性肾损伤(AKI)会影响多达 60% 入住 ICU 的患者。预防、早期诊断和适当治疗对于减轻AKI相关短期和长期死亡率和发病率至关重要。AKI会增加慢性危重病的风险,长期生存率和生活质量较差,尤其是当肾功能恢复不完全或延迟时。
AKI 具有复杂的病理生理学,难以用简单的决策算法来表示。精明的、训练有素的重症监护医生可能完全有能力进行高效、全面的诊断检查,但结果通常会在数小时后出来,并花费大量的医疗费用。然而,使用常规收集的临床数据,人工智能模型可以准确地表示危重疾病中 AKI 的复杂病理生理学。
本文的目的是汇总和批判性评估最近发表的有关人工智能应用的文献,用于对危重AKI 患者进行预测、诊断和亚表型分析。对过去 18 个月内发表的重要同行评审文章的主要公开数据库进行了系统审查。
在 PubMed 中系统搜索了截至 2021 年 6 月的 18 个月期间发表的与 AKI 预测或模型开发或验证相关的文章。搜索利用了医学主题词(MESH)术语并被分成三组:ICU、AKI 和预测/建模。227 篇文章通过搜索标准确定,并由两名审稿人独立筛选,分歧由第三名审稿人解决 。通过标题/摘要筛选的 46 篇文章的全文进行了审查。
我们确定了 2020年 1 月至 2021 年 7 月期间发表的 30 项符合纳入标准的研究,其中 27 项研究描述了 AKI 预测模型的开发或验证(表 1 和 2),两项关于 AKI 亚表型的研究(表 3)和一项包括两者的研究。
有22项研究是来自同一个中心的患者; 8项研究报告了来自两个或更多中心的结果。最常见的患者来源是重症监护医疗信息(MIMIC)III,包括了15 项研究。尽管大多数研究 (n =16) 包括综合ICU 人群,但有 7 项研究侧重于脓毒症患者,其中四项针对手术患者,一项针对糖尿病酮症酸中毒,一项针对失血性休克,一项针对急性脑损伤。
在回顾的30项研究中,26项研究使用了KDIGO标准定义AKI;13项研究单独使用血清肌酐标准,13项研究同时使用尿量和血清肌酐标准(表1和3)。3项研究使用AKIN标准,一项使用国际疾病分类代码。结局包括至少 1 期或2 期持续性 AKI(定义为任何阶段的 AKI 持续超过 48 小时)、2 期或 3 期 AKI 持续至少 3 天以及其余 25 项研究中存在任何 AKI 阶段。用于结局标记的窗口时间为住院24小时至 7 天。
基线血肌酐
确定血清肌酐 (sCr) 基线的方法因研究而异,有些使用在入住 ICU 后 3 天内测量的第一个sCr,而其他使用在ICU期间的最低值。 有些研究的基线水平从入院前的最低 sCr(范围从入院前 365 天到 1周前或前 7 天之内),入院前 180 到 7 天平均 sCr,如果测量的 sCr 不可用,则使用术前 sCr 或改良饮食和肾脏疾病(MDRD)方程。11 项研究未定义基线 sCr。
最常见的建模技术是逻辑回归。20项研究评估了至少一种逻辑回归模型;14个专门评估逻辑回归模型。9篇文章使用了深度学习模型,5篇使用了其他机器学习模型:梯度提升树(GBT)、随机森林、支持向量机(SVM)、朴素贝叶斯、k-最近邻(kNN)和决策树。模型性能最常通过接收器操作下的面积来评估特征曲线(AUROC),范围从 0.52 到 0.98(表 2)。
其他常用的性能指标包括灵敏度、特异性、正预测值(PPV)、负预测值(NPV)、准确性和精确率和曲线下的面积(AUPRC)。性能最高的模型使用具有动态、时间组件的集成模型,可分析随时间变化的趋势。
深度学习模型
深度学习技术越来越多地应用于大规模、高维、多模态 ICU 数据,例如临床记录和生理时间序列数据。 这种方法显示出提供连续、准确、早期 AKI 风险预测的巨大潜力。循环神经网络(RNN) 和一维(1D) 卷积神经网络(CNN) 对解析时间数据特别有效,因为随着时间的推移,随着越来越多的数据变得可用,允许对患者风险进行连续预测。Vagliano等人开发了双向长短期记忆(LSTM) 网络,它是 RNN 子类型,以使用时间生理学、实验室和治疗干预变量生成每 6 小时更新一次的预测;这种方法优于随机森林、GBT 和逻辑回归模型。通过积分梯度测量可解释性,表明过去 6 小时内的肌酐和尿量是最重要的危险因素。Alfier等人开发了一个 1D CNN 模型来连续预测发生 AKI 2 或 3 阶段的概率,实现比逻辑回归更高的性能。同样,Similarly和Sato等人生成 1D-CNN 以在入住 ICU 后24-48 小时内每 15 分钟预测一次 AKI。生命体征和血清肌酐值的多个时间序列以及人口统计信息被用作模型特征,实现了比 RNN、XGB 和 LSTM 更好的性能。系统为每个患者的预测确定了重要的时间点和变量。
Roy等人提出了一个多任务模型,使用实验室数值和生命体征的每小时平均值和标准差预测每小时六项结局指标:AKI、连续肾脏替代治疗、机械通气、血管活性药物、住院时间和死亡率。该模型与单任务和多任务模型进行了比较,六项任务中有四项在统计上取得了显著提升。
相比之下,Qian等人和Morid等人分别开发了 CNN 和神经网络(NN) 来预测 AKI 风险,其中生理时间序列数据的特征被转换为汇总统计或其他时间模式,而不是直接将原始时间序列数据输入网络。施瓦格等人比较了 GBT、逻辑回归和神经网络预测AKI分类,通过按 sCr、尿量和 sCr 或尿量。有趣的是,仅按尿量分类的 AKI 主要与患者人口统计学相关,而仅由 Cr 确定的 AKI 主要与患者合并症相关。
将自然语言处理应用于临床并提取有意义的特征可以早期预测AKI。Xu等人开发了一个记忆网络模型,从多模态数据中学习患者的表征,以预测未来的 AKI 风险。该模型整合了来自非结构化临床记录的有用信息(从分层 LSTM 模型中提取)和与时间相关的结构化 EHR 数据(例如实验室测量值和生命体征),与机器学习和其他不使用多模态数据的深度学习模型相比,其性能最佳。Le等人开发了一个多通道模型以及用于时间序列数据的 CNN 和一个单独的 Doc2Vec 网络,用于处理临床笔记的文档向量,以提取 AKI 风险预测的有用信息。该模型的表现明显优于 XGBoost 模型和序贯器官衰竭评估(SOFA)。
机器学习模型
除了logistic回归和深度学习外,我们还使用了几种机器学习方法来预测ICU相关AKI。基于Tree的分类器GBT和XGBoost是AKI预测中最常用的分类器,具有较强的临床应用性能、较高的效率和可扩展性。Gong等人利用logistic回归、决策树、SVM、随机森林、神经网络、XGBoost和一个基于logistic回归和随机森林相结合的投票方案,开发了ICU入院24小时内AKI的预测模型。XGBoost和基于logistic回归和随机森林的投票方案获得了最佳的预测性能。为了满足对灵活、稳固的可解释性工具的需求,他们的框架配备了Shapley附加解释。Wang等人开发了一个基于XGBoost的集成时间序列模型(ETSM),处理生命体征和实验室测量以生成“显性指标”,并从药物信息中生成“隐性指标”。 ETSM比Naive Bayes、k-NN、AdaBoost和随机森林模型表现出更高的性能。
由于AKI是一种隐匿性疾病,延迟识别和治疗与较差的临床结果相关,因此有必要对EHR数据集应用一致的AKI定义和基线sCr的标准化定义,以准确、快速地识别AKI。尽管有研究阐述了ICU患者中AKI的可计算表型或AKI预警的实施,但我们在过去18个月的文献检索中没有发现任何相关研究。
ICU相关AKI的病因、严重程度、发展轨迹和结果存在很大的异质性,受内在疾病机制、患者生理反应和治疗过程的影响,从而掩盖了特定AKI人群特有的独特病理生理过程。我们需要对AKI亚型进行鉴别,以确定具有共同的、可改变的生物学机制的AKI患者亚组,这些亚组在治疗反应方面存在差异,或存在较高的死亡率风险,从而允许进行早期针对性干预。最近的进展使数据驱动的AKI子表型使用机器学习技术。Bhatraju等人开发了一个潜在类别分析(LCA)模型,使用了包括人口统计学、共病、实验室、ICU事件和生物标志物等29个变量,他们发现了两种分子上不同的亚表型,它们在潜在的病理生理学、对血管加压素治疗的反应和不良临床结果的风险方面表现出了差异。在Wiersema等人的一项类似研究中,使用类似变量开发了一个LCA模型,并确定了两种脓毒症相关AKI患者的亚表型,其中一种与较低的短期肾脏恢复概率和增加的90天死亡率相关。Chaudhary等人利用深度学习算法从EHR数据中提取信息,包括实验室测量和生命体征,并应用k均值聚类法识别三种与脓毒症相关的AKI亚型。这些亚型有不同的透析风险和死亡率。Xu等人首先开发了一个记忆网络模型来学习患者表征,该模型可以从结构化和非结构化数据中最好地预测未来AKI风险,然后将k均值聚类应用于AKI患者的表征,确定具有独特实验室值的三种不同AKI亚型(如葡萄糖、白蛋白和肌酐),并与AKI的不同阶段显著相关。
AKI是危重病患者中死亡率和资源利用率较高的常见疾病。及时识别有发生AKI风险的患者至关重要。虽然人工智能应用在危重患者AKI的预测、诊断和治疗方面具有巨大潜力,但首先必须克服几个挑战。尽管在临床研究中成功地使用了人工智能/机器学习,但有限的数据集和模型的解释性、公平性和再现性不足阻碍了其进展,这些数据集和模型难以在各机构之间共享和实施。首先,对于要在不同机构的多个EHR之间集成的模型,数据必须标准化;我们建议遵守FastHealthcare Interoperability Resources framework,该框架描述了跨EHR和基于云的通信的健康信息共享标准,以及观察医疗结果合作伙伴关系通用数据模型,以将各个机构的数据映射到标准概念。其次,模型特征和预测性能的质量必须随着时间的推移进行系统分析、优化和仔细监测,最初在“静默”分析阶段,随后在临床实施阶段,使用与标准临床试验第1、2和3阶段类似的过程。SPIRIT-AI(标准方案项目:人工智能介入试验建议)扩展和CONSORT-AI(人工智能报告试验综合标准)指南中描述了这些过程的详细信息。个体预后或诊断报告建议的多变量预测模型的透明报告总结了报告预测模型的建议。作为特征优化的一部分,有必要确保训练数据集能够代表应用模型预测和分类的患者。例如,在估算肾小球滤过率和参考肌酐时采用种族调整的标准方法可能会低估非裔美国人CKD和AKI的发病率。人工智能算法从数据中学习;当对种族不平衡的数据集进行训练时,算法可能会产生种族偏见的结果。在我们的综述中,很少有研究进行外部验证,这是建立普遍性所必需的。现有的AKI预测模型性能一般,缺乏可解释性。最后,与算法相关的错误的责任和责任分配仍然具有挑战性,需要医疗司法专家进一步关注。
在最近发布的用于预测、诊断和亚表型分型危重患者AKI的人工智能中,有许多有前途的模型,但很少有外部验证、临床可解释性和高预测性能。利用多模式临床数据的深度学习技术显示出了巨大的潜力,其可以提供持续、准确、早期的AKI风险预测,可以在临床上实施,以优化预防和早期治疗管理策略。使用协商一致的标准、标准定义和通用数据模型有助于获取可供外部验证的机器学习数据集。人工智能模型缺乏可解释性、公平性和透明度,阻碍了其委托和临床实施;遵守标准化报告准则可以缓解这些挑战。
本文荟萃自网络及文献,只做学术交流学习使用,不做为临床指导,本文观点不代表数字日志立场。