相信不少急重症领域的医生朋友在读文献时,都看到过MIMIC数据库的身影。
MIMIC数据库开放问世至今,至少已经发表了两千多篇SCI,其中更不乏顶刊的身影,甚至去年还有一篇发表在了JAMA上!
图源:部分文献检索结果展示
既不用收数据,又不用回访或者做实验,但就能发表高质量的SCI,MIMIC数据库有何神通广大之处?
MIMIC好发SCI的个理由
数据量大、数据源质量好:MIMIC数据库包含了麻省理工贝斯以色列迪康医学中心重症监护室十几年来的真实医疗数据,共含成年患者「年龄=16岁」人。
在国内想要完整的收集到五万多例重症病人的数据,对于99%的临床医生来说比中彩票还难!
数据量详细:包括人口统计学、生命体征数据、实验室测试、影像数据和药物等、社保数据库,记录了患者的随访时间和预后结局。
如果自己随访过病人的医生朋友会知道,哪怕只是几个月短期几十个病例,也十分耗时耗力!
病例丰富:只要你所在的科室,有需要进重症的病例,几乎都能在MIMIC数据库中找到数据!
医院可能一年也攒不够三位数病人的疾病,在MIMIC数据库中成千上万!以下是该数据库常见病种:
现在用MIMIC发文章还来得及吗?
不少学友心里可能在犯嘀咕「MIMIC数据库都发了两千多篇文章了,我现在挖还来得及吗?」
答案是「绝对来得及,机会还很多!」
简简单单计算一下,MIMIC数据库收录了以下数据:
?X-暴露因素:上百个「按算」,包括常用药物、手术操作、常用指标等。
?Y-结局指标:5大类,包括死亡率、肾损伤、各种时间结局、手术结局以及远期随访结局等。
?P-人群:各大科室的相关疾病中,收录病例数在例以上的疾病有80种之多。
我们计算下这几种指标排列组合能产生多少种结果吧:
(X)*5(Y)*80(P)=00
再搭配不同的协变量的分析、不同模型的构建、分层分析等套路的应用;甚至可以补充自身数据集的验证,能发的文章绝不止四万多篇!
MIMIC数据库挖掘难点
可MIMIC数据库挖起来也不是那么简单的,以下三点往往是让很多新手从入门到放弃的大难点!
数据库使用权限的获取
该数据库注册完成后数据的使用和分析不受限制,但是注册流程和数据下载比较复杂不仅要考试还需要推荐人和机构邮箱等操作;且数据库经常更新改版,所以新手往往连注册这一关也很难通过。
因此在《MIMIC数据私教班》的课程计划中,沈老师会在直播间一步步教大家注册;大家在实际注册遇到问题时,也可以第一时间跟沈老师沟通交流;对于没用机构邮箱的用户,也会给大家准备好注册用的机构邮箱,确保所有人都能顺利完成注册哦!
数据的下载、筛选与合并
MIMIC数据库中的数据量十分巨大,且原始数据一般需要通过PostgreSQL提取,对于没有计算机和编程基础的零基础用户来说,拿到这样的数据完全不知道该从何下手,连如何成功安装都做不到。
数据分析和文章撰写
其实用MIMIC数据库进行的临床研究和跟我们用普通的临床数据进行的研究没什么不同。可以进行回顾性队列研究、相关性研究、临床预测模型构建等各种临床研究设计,发表不同档次的SCI。
但是很多科研新手对于大样本临床数据的统计分析和预测模型构建并不熟悉,因此也没法更好的发挥数据价值。
本文选自《丁香园》