【Datathon专题】从临床医生的角度看医疗大数据

在刚刚结束的2019医疗大数据Datathon会前培训上,北京市生理科学会危重症医学专业委员会主任委员,原北京大学第三医院 ICU 主任王谊冰医师站在临床医生的角度分享了如何看待医疗大数据,阐述了数据科学对医学进步的推动作用。

王谊冰医师认为,数学能够真正打入医学研究之时,才是医学高度发展的新时代。目前临床实验研究的基本原则主要为这4项——随机、对照、双盲、重复,实验中的研究方法则主要以队列研究、随机对照试验以及荟萃分析为主,详细介绍这些研究方法的同时,王谊冰医师还毫不吝啬地展示了其中存在的优缺点:

  • 就队列研究而言

其优点在于:一般不会存在回忆偏倚;可以得到发病 / 死亡率,计算 RR;病因和疾病的时间顺序合理,检验假说能力较强,一般可以正式病因联系;有助于了解人群疾病自然;可研究一种暴露于多种结局的关系。

其缺点在于:不适于发病率很低的疾病的病因研究;失访;研究耗费人力、物力、财力和时间较多;以及研究设计要求严密,资料收集、分析有一定难度。

  • 就随机对照试验而言

其优点在于:组间可比性好;防止选择性偏倚好;研究对象的诊断确切;盲法衡量和分析结果,结果更真实、可靠;高质量的单个RCT,可成为系统评价的可靠资源。

其缺点在于:RCT花费时间、人力、财力较大;RCT严格的纳入、排除标准,导致研究结果的代表性和外在的真实性受到一定的局限;安慰剂不恰当的应用、对照组措施选择不当,或让受试对象暴露于某种有害致病危险因素,则会违背医德的原则。

  • 就荟萃分析而言

其优点在于:能综合某个特定时期所有相关的有效数据,利用许多小的研究结果,获得高的统计效能;能使文献回顾过程中某个重要部分更加透明;一个表达充分的荟萃分析中读者可以复制论点的定量部分;分析结果客观性强,具有科学性;现代 Meta 分析考虑了独立研究的质量问题

其缺点在于:资料的完整性和发表偏倚;发表物中缺少综述者所需数据;分析对象最初的数据质量不等;各研究的方法和指标不一,同质性和可比性难以验证;分析者对综合的结果的解释有偏见;不可避免的非随机性选择独立研究

由此可见,目前临床医学所使用的研究方法依然存在很多的不足,要想解决大部分的临床问题任然需要耗费大量的人力与时间。

那么如何用较小的代价解决部分临床问题?

他认为医疗大数据分析能够为解决部分临床问题提供新的研究方法。以血压的动脉有创测量和袖带测量的差异性为例,通过医疗大数分析的方法可以快速得出结论:在各个年龄段,正常血压范围,无创和有创测量方法差异不大,但当血压异常时(无论是高血压还是低血压),二者差异较大,且呈增大趋势;示波法无创血压与有创血压测量结果之间存在比例性偏差;以及无论测量血压在疾病诊断和慢病管理领域的应用都应持谨慎态度。

到底临床医生对医疗大数据研究能做些什么?他给出了这样的答案:临床问题的质量是决定大数据研究价值的基础,临床医生应当保证问题的高质量性。其次,优质的临床信息系统( CIS )是保证医疗大数据质量的前提,数据的完整性与质量,与临床信息系统的品质密切相关。只有临床医生与信息系统工程师以及数据分析工程师之间达成密切合作才能更好地促进医疗大数据的研究。

最后,王谊冰医师建议,临床医生们在学习医疗大数据研究方法的过程中,可以与数据工程师们共同建立一个持续的交流和工作平台,这样不仅能够互相学习与交流,还能培养出众多跨学科知识结构的人才,更能够有效解决一部分长大临床问题。

王谊冰医师的完整分享PPT已上传至和鲸社区(Kesci)
可移步以下链接下载:
2019医疗大数据Datathon活动会前培训资料集合https://www.kesci.com/home/project/5db29f4b75df5c002b23d655