和鲸101领航北中医:助力健康医疗AI实验室建设,培养交叉数据人才
2024 年 3 月开学季,北京中医药大学(简称“北中医”)的健康医疗人工智能实验室迎来了正式投入使用后的第一堂课。除了配备全新的桌椅和尖端的硬件服务器外,实验室还引入了先进的人工智能实训平台,为大数据管理与应用专业的师生提供了一个现代化的教学与科研环境。
事实上,早在 2019 年北中医成为全国首个获批“大数据管理与应用”本科专业的医学院校时,学校便开始了实验室的规划与建设。
2022 年,“大数据管理与应用”专业获批北京市一流专业;
2023 年,软科中国大学专业排名 42(B+级);
在专业的建设与发展上,北中医步伐稳健,但实验室却历经四年才终于落地。
北中医管理学院医疗大数据与信息管理教研室副教授韩爱庆老师告诉我们,实验室从无到有的四年,也是“AI+医学”实现跨越式发展的四年。这一过程中,实验室的建设需求不断迭代与细化,从方案确定、实施到深入调研了 22 家企业,再经过多轮试用和反馈,专业的教师团队投入了大量心血和努力才最终造就了这个“集大成”的实验室。
2019 年,现代人工智能与医疗大数据广泛的应用前景刚开始初现端倪;
2023 年,人工智能大模型技术的爆发开启了数智医疗的奇点时代。
北中医实验室的建设之路,一定是具备着极大的学习和借鉴价值的。
01
三大核心需求:
聚焦交叉应用型数据科学人才培养
北中医的大数据管理与应用专业依托公共管理学科的深厚底蕴,借助“双一流”学科优势,致力于大数据分析的理论和方法在中医药领域应用的科学研究与人才培养。
解决师生在教科研过程中遇到的种种实际问题,是实验室建设的首要目标。
1.1 教学需求
“AI+医学”持续升温,从精确诊治、预后判断到新药发现、医院管理,数字技术在医学领域的各个环节都展现出了深远的应用潜力;但与此同时,交叉创新的人才也成为了行业共性的“卡脖子”问题。对此,韩教授展示了北中医的人才培养路径。
“我们想要培养的是交叉应用型数据科学人才,信息技术、经典数据分析、以及现代数据分析都是学生必须要掌握的核心专业知识。”
在此路径下,70% 的专业课程都需要依托实验室环境进行,但现有的实验室排课却已经达到了饱和;同时,随着人工智能、深度学习课程的引入以及大四学生毕业设计课程的需要,师生对于 GPU 算力和人工智能实训平台的依赖也日益增加。
1.2 科研需求
实验室的使用场景并不仅限于教学,在推动科研创新方面,学院也期待它能发挥核心作用。
医学科研领域正经历着由人工智能和深度学习技术引领的转型,无论是大数据挖掘还是医学影像诊断的应用,这些前沿技术都已成为研究的热点,并预示着未来趋势。
科研工作的深化,尤其是大数据分析和复杂模型训练,对计算资源提出了更高的要求。以师生们经常进行的舌象分割、穴位检测等相关研究为例,其计算密集型的特性就使得个人电脑或小型服务器难以完全满足使用。
1.3 竞赛需求
“学生竞赛月”作为北中医的标志性校级活动,每年都会吸引众多校内以及 8 个附属医院的学生共同参与。
其中,由管理学院主导的医学数据分析大赛已步入第五届,该赛事为学生提供了一个宝贵的机会,让他们能够运用计算机技术、机器学习、人工智能和统计学等多学科知识与技能,解决医学领域的实际问题。
与其他类型的竞赛相比,数据分析竞赛不仅考验参赛者对数据的理解和分析能力,还涉及到代码、环境、算力等多种要素,因此,一个功能完备、稳定可靠的竞赛平台对于竞赛的筹备和顺利进行至关重要,这也成为了实验室建设规划中的一个重要考量点。
02
结缘和鲸:
人工智能实训平台赋能课、研、赛
历经四年筹备,深入调研了 22 家企业,软件方面,北中医最终选择了和鲸 ModelWhale 平台,韩教授告诉我们,和鲸平台的综合能力受到了师生们的一致认可。
“ ModelWhale 确实满足了我们对实践教学、课程实训、学生竞赛、科研和团队管理等不同场景的需求。”
2.1 基础设施:人工智能实践环境
数据、算力和算法是构成人工智能应用的三大基石,建成的人工智能实践教学与综合实训平台首先便是要实现这三大要素的集中管理和优化配置。
2.1.1 数据:多源接入,安全流通
实验室的数据涉及到内部数据和外部数据的整合使用。内部数据主要来源于教师的科研项目和学生自主采集的数据,而外部数据则涵盖了与学校附属医院合作获得的医疗数据以及公开可访问的开放数据。
医学数据易涉及伦理问题,尤其是包含患者病历、诊断结果等隐私信息的医院数据,确保数据安全是首要任务。因此,老师们对于数据管理特别强调——要能安全流通。
使用时,师生可以安全地访问数据库、对象存储、NAS 中的数据,也可以上传本地数据。每组数据都设有独立的分享、使用、下载权限管理,既确保数据安全,又便于合理流通与共享。这也有助于不同课题组间的协同工作,能有效避免数据冲突和重复劳动。
2.1.2 算力:动态分配,弹性调度
平台将实验室配备的私有云算力资源进行了有效整合,算力可以根据核数与内存大小进行拆分,再按照使用需求精准分配给不同群体,比如 2C8G 的基础算力就分配给低年级学生上课使用,4C16G 的给到高年级学生实训使用,更高规格的算力分配给研究团队科研使用。针对大规模计算任务,老师还可以将多机多卡的 GPU 组成集群算力,达到成倍计算效率。
平台上线一个月的时候,韩教授高兴地向我们展示了目前的使用情况。
“ CPU 基础版已经用了将近 1200 个小时,实训版也用了 230 个小时,后面还有科研版,这些如果去外面租的话一年下来估计要十几万,现在就方便多了。”
2.1.3 算法:在线运行,轻松管理
算法可能是老师的课件、学生的作业,也可能是科研的阶段性成果。实验室环境下,算法的“分享”属性被放大。
平台提供了云端运行环境,以项目为单位实现了算法、算力、数据、环境的集成,使得算法在课、研、赛场景下不仅能在线运行,共享给他人也更简便(后文将分场景展示)。
2.2 赋能教学、科研、竞赛三大场景
基础设施是支撑平台功能发挥的基石。在不同应用场景中,北中医管院的师生也能够利用平台的特性,实现多样化的目标和需求。
2.2.1 教学:课件可运行,作业云收发
很多学校都拥有校内教学平台,尽管能便捷地管理教学资源、作业、成绩,但往往缺乏集成编程环境——即便老师上传了包含代码的教学材料,学生也无法直接运行。北中医之前便是这样的情况。
新平台部署后,学生可以在课程系统内获取各类课件,并一键拉取数据、环境、算力运行代码,完成教学的实时互动;老师也能在线完成作业的收发和批阅。
作为一名喜欢布置实战类作业的老师,韩教授表示,“能方便地运行学生提交的作业,并帮助他们修改、创新代码,很大程度上提升了教学效果”。
值得一提的是,去年 9 月尽管私有化尚未部署完成,北中医管理学院就已率先在公有云上成功执行了一场《医学人工智能分析应用实践》课程的现场考核。
考核前期,老师将考卷配置入平台的课程系统内;
考核时,通过项目形式,考卷一键分发给每位考生,考生在各自的独立实践环境中在线作答;
考核结束后,老师结合人工评审和平台的自动评测功能,对考生的答卷进行了双重审核,更公平且高效。
创新的考核形式在当时也受到了好评。
2.2.2 科研:自动标注省时省力,项目团队轻松管理
人工智能实践环境已能全面支持科研场景的各个环节,包括数据接入、数据处理、分析建模、模型评估以及部署应用,形成完整工作流。但北中医的老师们还特别关注了平台在数据标注上的能力——训练好的 AI 模型可以自动识别并标注出图像中的病灶区域,是人工智能在医学领域的重要应用之一。
此外,考虑到科研工作往往需要团队协作,围绕科研项目的团队管理也受到了老师们的重视。在平台上,一个复杂项目可以被拆分为多个子任务后分配给不同学生,任务的状态和成果将实时同步。
韩教授分享了他的使用体验:“以我们正在进行的舌象分类项目为例,我安排了两名学生负责数据采集,另外两名学生进行数据标注,在任务规划里我可以清晰地看到他们的完成进度。”
2.2.3 竞赛:发挥“以赛促教”的核心作用
5月9日,北京中医药大学第五届“和鲸杯”医学数据分析大赛正式开启报名,这标志着实验室建成后的首个重要赛事活动正式拉开帷幕。相较往年,今年的赛事不仅允许跨校组队,还鼓励跨年级的学生组队参与,进一步拓宽了竞赛的参与范围和学术视野。
“以赛促教”的核心其实还是在于通过竞赛的形式检验学生对知识的掌握程度和实际操作能力,通过平台,老师可以直接查看和运行学生提交的代码,深入了解学生的算法思路,验证能否真正跑通,并进行评分和提供反馈。这种直观的评审方式使得竞赛与日常教学有了更紧密的结合。
北中医管理学院的老师们以及和鲸团队都对本届赛事寄予厚望。
“新实验室给咱们学生创造了更好的比赛条件,相信今年能看到更多高质量的参赛作品!”
03
面向未来:
促进人工智能与中医药深度融合
2024 年国务院政府工作报告同时提出,要促进中医药传承创新,加强中医优势专科建设,以及深化大数据、人工智能等研发应用,开展“人工智能+”行动。
北中医健康医疗人工智能实验室的建设,或在未来成为展示中国传统医学与现代科技融合成果的重要窗口,向世界传递中医药的独特魅力和科学价值,和鲸期待能共同见证这一天的到来。
和鲸 ModelWhale 数据科学协同平台基于 ModelOps 理念,助力北京中医药大学打造健康医疗人工智能实验室,聚焦交叉应用型数据科学人才培养,您可点此链接免费注册使用。
此外,本次合作也是和鲸社区“101 数智领航计划”的重要成果。结合和鲸社区近十年在数据科学人工智能的开源资源积累和专业共建经验积累,和鲸发起和鲸社区“101 数智领航计划”,配合高校重点聚焦在一流核心课程、一流核心教材、一流核心教师团队和一流核心实践项目四个“基础核心要素”建设,助力高校在本科教育教学模式的持续转型,推动人才培养从“知识为主”转向“能力为先”。
任何相关需求,都欢迎您点此链接联系我们,或进入 ModelWhale 官网注册体验。