文献1:
DOI: 10.1016/S2213-2600(19)30369-8,PMID: 31948926
文献2:
DOI: 10.1164/rccm.202002-0347OC,PMID: 32551817
这两篇文章是关于识别急性呼吸窘迫综合征表型的研究。
数据来源:两个研究数据均来自随机对照实验,部分作为训练部分作为验证。
研究方法:
文献1:Machine-learning algorithms (random forest, bootstrapped aggregating, and least absolute shrinkage and selection operator) were used to select a maximum of six important classifier variables, which were then used to develop nested logistic regression models.
文献2:A gradient-boosted machine algorithm was used to develop classifier models using 24 variables (demographics, vital signs, laboratory, and respiratory variables) at enrollment.
文献1是利用不同方法筛选出最重要的变量然后预测ARDS表型,文献2是纳入收集的所有变量使用 XGBoost模型进行预测。
研究结果:
文献1:可以使用三个或四个变量,通过简约分类器模型准确识别ARDS表型。在开发关键生物标志物的实时测试和前瞻性验证之前,这些模型可以促进ARDS表型的鉴定,使其能够应用于临床试验和实践。
文献2:基于易得的临床数据,可以使用机器学习模型准确识别ARDS表型,并且可以在床头快速识别表型。
训练数据集中最重要的十个变量。
验证队列(validation cohor)中四组分类器模型的ROC曲线。
本文荟萃自公众号: yamaton,只做学术交流学习使用,不做为临床指导,本文观点不代表数字日志立场。