自2014年起,麻省理工学院团队已经在全球举办了20余届Datathon活动。越来越多的人通过Datathon实践认识了医疗大数据,通过医疗大数据手段解决了临床问题。这一模式为医疗领域的跨学科合作提供了模版,并有很多竞赛小组实现了后续的团队合作。
每场Datathon不仅因其精彩过程而备受瞩目,对于很多人来说,Datathon会前培训也是关注的重点。10月20日,2019医疗大数据Datathon在解放军总医院成果举办,国内顶级学者聚在一起,探讨数据科学为临床科研带来的诸多福利。和鲸科技的K-Lab在线数据分析平台对此次培训提供了全程在线支撑,每个人都可以直接在线使用数据库并进行分析。
在培训中,解放军总医院急诊科主治医师、讲师,北京市科技新星,解放军总医院“新秀人才”冯聪博士分享一个议题——如何将临床问题转化为科研问题,并开展相关的研究。
这个话题很有意义,医疗领域一直流传着一句话:“在每一份临床标本的后面,都是一个渴望健康的生命”,所以医务人员在临床医疗决策时都会非常重视每一个治疗措施对患者的影响。
医务人员实长期临床实践和细致的观察中,往往能发现一些尚未证实的规律或现象,那么该如何通过科学的方法从临床问题中筛选出科研问题,并对这些课题加以研究和证实,从而解决提高临床诊疗效率?只有解答这个问题,我们才能够明白,为什么说提出了一个很好的临床问题是好的科研问题的源泉。
在冯聪博士的分享中,他以“有创动脉血压监测对患者真的有帮助吗?”这个问题做举例,将临床问题与科研问题之间的转化分成了以下几个步骤。
一、发现临床问题
临床问题的发现首先来自于实践,与从事基础研究的学者相比,临床医师要集中精力在科研工作有很多的限制性。但是,临床医师因工作上的优势,掌握了丰富的临床资源,每天面对大量的临床问题,而临床问题正是创新的源头。因此,临床医师要将焦点聚集在临床研究上,从临床中发现问题、提出问题、解决问题。
临床问题的提出需要考虑以下几个要素,以创动脉血压监测为例:
- 源于临床实践
在过往学习和观察的操作中,医师都了解到,有创动脉血压监测是 ICU 中重要的血液动力学监测手段之一,该课题是来源于临床实践中的。
- 长期细致的观察
可是,我们也能了解在经历过多次相应临床案例实践后,虽然有创动脉血压监测从表面上看是有益的,但是动脉置管可能导致严重的不良事件,包括手部供血不足和感染等,这无疑会带来一系列副作用,甚至引起血栓。
- 发现尚未证实的一种规律或现象
那么接下来需要考虑的就是使用有创动脉置管检测利弊这一课题是否已经有定论,当我们发现并没有实质性研究证实这一点的时候,便可以将这个问题制定为研究课题。
二、制定研究课题
由此,我们便可对有创动脉置管监测的利弊展开研究,首先我们需要考察临床上使用动脉置管决策时涉及的相关因素,并比较使用有创的动脉置管的患者与仅使用无创监测设备的患者之间的临床结局,这些可以为临床医生在决定是否放置动脉置管时提供有用的决策支持信息。
在制定研究课题时,需要着重考虑几点:
- 研究样本
在制定研究课题时,首先要考虑研究者定义的受试者群体,即这个研究问题与哪些患者相关:
- 所有 ICU 患者、所有进行机械通气的患者、所有静脉注射了会强烈影响血压的药物的患者、所有成人、所有儿童等等
- 我们还可以选择患有特定疾病或症状的人群作为研究样本,例如休克(动脉置管可用于密切监测血压)或严重哮喘(动脉置管可以监测氧及二氧化碳分压水平)的人群
- 暴露变量
第二步是需要控制暴露变量与非暴露变量是否进行了动脉置管,需要注意的几个问题,例如暴露变量时间的定义,还有如何定义暴露组和非暴露组。
- 暴露变量时间窗口的定义,例如入院 48 小时内、机械通气前等等
- 非暴露组 (对照组)同等重要, “样本与暴露组需相一致
- 定义暴露组 : 机械通气前进行动脉置管的 ICU 患者
- 定义非暴露组:机械通气前未进行动脉置管的 ICU 患者,不能定义为未进行动脉置管的所有 ICU 患者
- 结局变量
第三步,我们需要关注在变量影响下,我们关注的事件是否会发生,以下是几种可以考虑的结局。
- 中间结局:知晓致病路径,但可能不会立即影响患者。例如:动脉抽血次数、呼吸机设置变化或血管活性药物变更
- 以患者为中心 的结局:知晓对患者而言的重要结局,舒适度、生存质量或死亡率。例如: 28 天或 90 天死亡率,不良事件率
- 以医院为中心的结局 : 资源利用或成本。例如:住院费用,增加的临床医生工作量
- 临床问题转化为实验问题
在理清这些需要进行的研究课题后,我们需要思考如何将临床问题的哪些部分转化为能够定性的试验问题,例如:
“在所关注的研究样本中,与对照组相比,暴露于我们所研究的变量是否会产生不同的临床结局?
在有创动脉置管监测中,可以将问题设置为:
进行机械通气且未使用血管活性药物的成年 ICU 患者中(即研究样本),在机械通
气开始后进行动脉置管(与没有动脉置管的患者相比)(即暴露组和对照组)是否会
降低患者的 28 天死亡率(以患者为中心的主要结局)和每天的血气测量次数(次要结局,中间结局)?
三、进行试验设计
将临床问题转化为研究课题后,我们就要开始试验的设计,以此证明我们提出的假设和发现,分为以下步骤。我们可以采用随机对照实验和观察性研究结合的方式对课题展开研究。
- 随机对照实验
近年来,循证临床实践对真实世界证据的需求不断增加。由于各种原因,既往的认识常常把真实世界研究与观察性研究对等起来。而随着认识的深入,实效性随机对照试验(pragmatic randomized controlled trial,pRCT)逐渐被视为真实世界研究的重要构成,并日益成为医疗卫生领域关注的热点证据之一。所以随机对照实验成为了生物医学研究中的金标准。理想条件下,随机化过程可消除所有混杂因素,并做出因果推断,而如果不随机化则不能做出正确的因果推断。
所以在 RCT 中,限定条件的患者(例如所有进行机械通气的成年人)会随机地接受特定的药物或干预(例如动脉置管)或随机地接受对照组处理(例如不进行动脉置管),然后仔细测量记录预先选定的结局(例如 28 天死亡率)
- 观察性研究
观察性研究:非试验性的,研究者记录日常的医疗实践活动,在无主动外加干预的情况下,根据相关性和关联性得出结论。
- 反事实假设:当我们想要在某一个特定的结局和暴露变量间建立因果关系时,我们需要借助一种叫“反事实假设”的哲学概念。“反事实假设”是指这样一种情形: 反“ ” “ ” 事实假设 的哲学概念。 反事实假设 是指这样一种情形:所有外在条件都相同,相同的研究对象在相同的时间,既接受暴露处理又不接受暴露处理(反事实),并且在这两种情况下测量的结局变量也相同。
真实世界中医疗过程的产生有其原因,这些原因可能会导致研究样本偏离反事实假设的理想状态(即暴露组和非暴露组的患者存在重要的差异)。简言之,观察性研究很难获得反事实对照组,可能比 RCT 更容易受偏倚的影响(有效性问题)
四、选择数据库
定性研究作为科研的基石,在将数据科学加入科研时,首要的便是选择数据源,在观察性研究的关键是合适数据库的选择,在培训过程中,冯聪博士列举了以下几类相应的数据库。数据库的选择很重要,数据分析工具的便捷也能让科研过程更加顺畅,在Datathon的整个过程中便采用了K-Lab在线数据分析工具,无需下载即可直接连到数据库让,使用云计算资源进行计算分析,大大提高了项目完成效率。
- 管理 / 索赔数据库
这类数据库往往包含有关病人的基本信息,医院人口统计学信息以及计费和操作代码的信息,能够在宏观上对医疗做出研究。比如由 Healthcare Cost and Utilization Project 建立的 National InpatientSample 和 State Inpatient Databases 数据库,还有 Medicare database 保险数据库。
优势:样本量非常大,采集方便
缺点:但是粒度较粗,缺少更细粒度的患者水平的信息,比如生命体征、实验室检查数据、微生物学数据等,这些可能对于处理混杂因素非常重要
- 电子健康档案( EHR )
这类数字化的医疗记录克服了医疗管理数据的一些缺陷,在电子健康档案中记录了更细粒度的数据,涵盖实验室检查数据,用药信息和临床事件的时间等,例如MIMIC Ⅲ重症医学数据库。
优势:
多个独立的 HER 数据源整合形成大数据库 ,利于临床医生使用
信息去标识化可供研究人员使用,数据库包含详细信息,可通过自然语言处理工具检索
细粒度性减少混杂因素,扩大观察性研究范围
结语
伴随着数据科学技术的迅速普及渗透,以及医疗数据量的迅速成长,各医院积累了大量电子病历临床数据,通过这些数据的研究来辅助临床诊疗、科研,并节约医疗资源和提升医疗质量,成为各医疗科研机构普遍关注的重点。
大多数研究问题来自临床场景,是当我们不清楚或不确定最佳的治疗方案时,将临床中提出的问题转化为科研课题,并通过利用数据科学,用先进的在线数据分析平台连接高质量数据库进行研究,才能让临床问题转化为科研问题,并反哺临床医学,产生更大的价值。
冯聪博士的完整分享PPT已上传至和鲸社区(Kesci)
可移步以下链接下载:
2019医疗大数据Datathon活动会前培训资料集合https://www.kesci.com/home/project/5db29f4b75df5c002b23d655