随着医学不断发展进步,源于个体的数据越来越丰富 ,医学数据挖掘在临床诊疗、疾病预测、医药研发等领域的应用也越来越受重视。

为提高人类的健康水平,探索疾病的发生、发展规律,人们需要不断探究,通过对医学大数据的充分挖掘和利用,从海量的数据中发现隐藏其中的规律。数据和信息几乎支撑着医疗组织内的所有活动,面对庞大多样且持续增长的医疗大数据的现状,更加依赖数据的完整性、依据数据挖掘进行分析。

现如今,医院已积累了很多医疗相关数据。医学大数据与数据发掘的结合,可以协助人们从存储的大体量、高杂乱的医学数据中提取有价值信息,加快医学效果转化,为医疗开辟一个新的时代。

源于医疗大数据目前的发展背景与科研需求,医学信息研究所与和鲸科技达成了深度合作,基于和鲸科技旗下核心产品 ModelWhale 打造的教学和科学研究一体化的医学数据挖掘平台,有效提升了内部教学和科研工作开展效率,同时也构造了良好的人才培养和科研转化生态圈。

云端沉淀课程内容,突破在线教学壁垒

和鲸与协和医学院的合作契机还应追溯到一门叫“医学数据挖掘实用技术”的课程,该课程的教学目的是为了让学生了解医学数据挖掘的内涵,全面掌握医学数据处理、数据分析和数据解读的技能。

由于突然袭来的疫情,教师们只能在线上开展远程教学,而ModelWhale的在线编程环境以及远程协作的优势,完全突破了远程在线教学的壁垒。不仅如此,原定50人的课堂因为 ModelWhale 平台的加入,最终变成了200+人的大课堂,使得除此专业之外对医学数据挖掘感兴趣的同学也有机会感受此课程的魅力。

此外,基于 ModelWhale 的 Notebook 在线编程与存储功能,所有的课程内容都沉淀在了云端环境中,成功解决了课程内容分发困难、在线教学效率较低等问题。

ModelWhale 内置的医学数据挖掘专用镜像,无需本地安装,老师和学生就能够在教学过程中使用统一的计算环境,摆脱了环境安装繁琐、编程版本不一致等困扰

复现研究案例,让实践真正落地

为了创造更好的实践环境,基于 ModelWhale 的 Notebook 云端存储功能,复现了麻省理工学院 Collaborative Data Science in Medicine 教材《电子病历的二次分析利用》中的经典案例,便于学生进行fork与练习,从而快速上手分析经典案例。

以「ICU死亡预测问题」为例,项目通过机器学习方法对病患信息、实验室化验检查、生命体征等数据预测ICU中30天死亡率,以一个 Notebook 承载了整个案例的研究背景、数据集调取与预处理、模型的建立、结果分析与可视化、以及最后的结论。

(左)原书模型图,(右)复现后的模型图

X研究所拥有着丰富的文献资源、医学特色资源和医药卫生科学数据,希望能充分发挥医学数据的价值,建成能够对海量医学数据进行分析和建模的医学大数据平台,助力行业培养更多专业的医学数据挖掘人才。

同时,让研究所的科研人员快速进行数据建模、数据挖掘、模型训练等工作,最大化释放医学数据的研究价值,助力研究所的数据化转型,最终推动我国医学事业的发展。

和鲸认为,在大数据时代来袭的当下,数据、算力协同的云端化都促成了科研基础设施的改变,垂直领域数据科学的研究人员都是拓荒者,希望 ModelWhale 这款数据科学协同平台可以成为数据时代的信息化装备,并且利用开放科研的方式让拓荒的路途不再孤单。