文献精读|基于随机森林的房颤预测模型6分文章
作者:白介素2
今天是周末,终于腾出一点时间来看看文献,分享给大家。文章题为:A novel atrial fibrillation prediction model for Chinese subjects: a nationwide cohort investigation of 682 237 study participants with randomforest model,文章发表在 Oxford旗下的 EP Europace杂志,影响因子为6.1分.
image.png摘要
image.png文章主要研究内容是开发了一个针对华人的房颤预测模型,使用的数据量达到682237例,按9:1分为训练集,测试集。使用了 F1 值,recall values, ROC , K-fold交叉验证等方法来评估模型的性能。
结果展示
研究的人口学特征展示
image.png第一张结果,展示研究人群的基线数据。
效果评估
image.png计算了评估指标在各个数据集中的值。
与其它模型比较
image.png比较了现开发的基于 Random Forest模型与其它模型的 ROC比较,显然 RF表现出了明显的优越性。
讨论
我个人比较喜欢看着一部分的内容。
主要创新点
[图片上传失败...(image-eff977-1571562023964)]
作者说:其实在这个模型之前已经有其它针对房颤的模型了,然而其它模型都是基于西方人口队列的。而本研究是基于中国人群的模型构建,这样的模型才会更适用于中国人。
文章不足
image.png这一部分很多文章可能就是一句套话,说这个研究是一个回顾性的分析就完了,看看人家作者怎么写的。
-
不可避免的混杂因素,叫做 cofounding factors
-
缺少生活方式等数据作为预测因子
-
本文是基于回顾性分析 retrospective nature of this study
-
本文是用于预测临床诊断的房颤,而实际上会低估房颤的发生率,因为有些仅仅有症状,或通过心电图才能发现
-
由于数据的保密性,没能比较对勾预测模型的性能,看哪个是最好的。
-
创新点同样也是缺陷,因为数据是对华人的,那应用也只能针对华人
参考文献
A novel atrial fibrillation prediction model for Chinese subjects: a nationwide cohort investigation of 682 237 study participants with random forest model , 2019 下载地址
今天的文献解读就到这里,我是白介素2,下期再见。