随着科技革命与产业变革的不断深入,人工智能技术正持续升级并向科研领域广泛渗透,“人工智能驱动的科学研究(AI for Science)”已成为全球人工智能新前沿。8 月 10 日 - 11 日,2023 全球科学智能峰会期间,中国科学院院士、国家自然科学基金委交叉科学部主任汤超受访表示,AI for Science 不只是一个新的科学浪潮,更将开启全新的科学时代。
临床研究以疾病的诊断、治疗、预后、病因及预防为主要内容,是医疗生信领域非常重要的组成部分。如何以 AI 赋能临床——既关注新技术带来的标准化、流程化,又不忽视“人”作为一生命体的作用与交互——是许多研究人员所面临的新课题。
针对 AI for Science 驱动临床研究,和鲸科技特邀上海交通大学医学院临床研究中心副研究员张维拓老师,张老师作为拥有数理背景的临床研究者,将从自身经历、研究方向谈起,为有意踏入相关领域的青年人提供宝贵建议。
01 选择临床研究这个领域
我之前主要是学数学和物理,其实也做过挺多方向的 data scientist 该干的活,包括天文类的比如天体物理的预测、行星上的天气预报,也有金融的预测,还做过社交网络。但我后来仔细考虑了一下自己的职业发展方向,觉得还是往 data scientist 和医学的角度去切入比较合适。
有几个原因。一个是我们做数据科学的,很多时候会问自己,做的分析到底产生了什么影响。我觉得医学研究可以很放心的一件事是,你知道自己在做一件对的事,它可能在这个行业领域里面的贡献不一定会很大,但至少不是坏事。
第二个就是临床研究给人的反馈是比较及时的。首先在任何一个研究项目刚开始的时候,就能有一个明确的意识——这件事别人想知道、别人非常需要这个结果,而且别人也有用,那就可以很放心地切入,而不用担心一个东西做完以后会被丢在墙角。另外基本上研究做完后的一两年,就能得到相关反馈了,比如说根据结果,患者的生存率确实提高了等等,它会很好地验证目前做的方向到底是不是正确的。
还有另外一个想法是,从长期来看,人的职业发展是要面对很多竞争的。数据科学本身,相信大家都可以感觉到,很多东西会变得越来越标准化、流程化,它渐渐地可能会变成不需要太专业的训练,每个人都能去做的事情。
那什么样的职业相对来说在时间尺度上有更强的生命力呢,我认为是那些需要更贴近人的。在临床研究中,就有很多关于人的价值判断。它不能完全量化,或者说仅仅一个数值指标不能代表对错,需要从人的视角去代入体会,如果你是个患者,遇到这种情况会是什么选择。很典型的比如有些治疗方法,它可以提高生存率,但是会让人极端痛苦,就是有30%的概率让你多活半年,但在剩下的生命中一直是非常疼痛的状态,这究竟是个好的还是不好的治疗方法?
数据科学是不会回答你的,你必须站在人的角度去代入体会。
02 我目前的研究方向
我自己现在主要的研究方向可以分成两大块,一部分是日常研究工作,一部分是我自己更加 focus 的部分。
我们日常的研究工作其实就是帮助临床医生去解决他们的临床研究问题,涉及到新的药物、新的医疗器械、新的治疗方法,它们的临床试验、观察性研究,然后从这些中获得一些临床证据。
另外我自己比较 focus 的是一些创新性的方法学问题,主要就是医学人工智能方向。最典型的有两个方面,一个我叫做偏移问题。医学人工智能的生产过程是依赖于现实世界数据的,而现实世界的数据和真实发生的事情之间又有距离。现实世界中的很多数据实际上包含了我们人类的错误,当再用这个数据去训练 AI 的时候,AI 就是再重复一遍我们人类已经犯过的错误。如果我们想让 AI 去做正确的事,那就一定要 fix 数据和真实世界之间的 gap。
另外一个方面是模型的可解释性,就是当 AI 和医生判断不一致的时候究竟听谁的。理想的情况是,让模型去 say something,然后让医生去逐条 check。在这个过程中,就需要让 AI 更多地向人类的思维去靠近,让 AI 的判断嵌入我们现在的诊疗流程中,比如在什么节点,AI 提供的 information 是对患者有帮助的,那这个时候就可以真正地去做一个临床上大家都愿意用的产品。
03 有关 Data Scientist 切入临床研究
想要很好地切入这个领域,需要学习的内容包括了我们前面说的伦理法规,包括了医学、临床中的一些基本概念,包括需要建立临床思维,深入地去参与至少一个临床项目。但这个过程一定不是只单纯地坐在计算机后面,看着数据反复折腾,一定要去到现场,去到数据真实发生的地方,看数据产生和收集的过程,然后去了解你要做的东西是如何在这个场景中发挥作用的。
我觉得这是一件非常重要的事情,也是我切入这个领域来给我最大影响的一件事情。我从一个单纯坐在计算机背后的 data scientist,到现在做临床研究,最大的改变就是在现场感受到了这些东西,然后开始意识到,要把过去学习的所有知识 apply 到一个具体的场景,是真的需要考虑很多真实世界中发生的现象。当有了这个感受,就正式从一个单纯的数据科学家变成一个临床研究方法学者了。
04 结束语
临床医学是以人为研究对象、提升疾病治愈率的重要学科,从医学数据中挖掘作用于人的价值、让 AI 的判断嵌入到临床诊疗流程中,数据科学、人工智能技术可作为方法学的一环推动领域发展。但事实上,不管是临床知识,还是数据、AI 知识都存在一定门槛,无论哪方的人参与进来,都会存在一个 gap——以 AI for Science 驱动临床研究,在技术应用与人才培养方面都还面临着许多问题。
既然从零建立人才培养体系在短期内不太现实,我们目前需要的是一座桥梁能让大家相互都往前走一步——临床医生如何更主动地学习、应用人工智能技术;有数理背景的研究者如何像张老师提供的建议一样踏出第一步、参与到实际的临床研究项目中并激发自己的兴趣;可能在两者不断磨合的过程中,就能够积累起那最宝贵的一批临床研究的方法学人才。
和鲸 ModelWhale 在与上海交通大学医学院临床研究中心的合作过程中,就是希望能以平台降低知识门槛,协助搭建两种知识间交流的桥梁。
作为以推动 AI for Science 科研范式改革、加强有组织科研为己任的数字化基础设施,ModelWhale 科研版关注从数据、算法到模型等研究对象的一站式全流程管理,从基础设施层面提升科学研究的可复现性,帮助营造协作协同的良好科研生态;基于 FAIR 原则与开放科研理念为数据等研究生产资料提供安全、完善的公开共享门户与在线交互工作台;异构融合、集约管控、按需分配、敏捷响应,强大的算力调度管理使个人电脑调用 LLM 大语言模型成为可能,也使算力资源在组织团队内发挥最大可用性;引入 ModelOps 理念,助力大模型全生命周期管理。
ModelWhale 科研版覆盖地球科学、生物医学、人文社科等专业领域,且已将最佳实践落实于国家气象信息中心、中国自然资源航空物探遥感中心等国家级科研机构,希望能为每一位从事数据创新研究的开拓者及其团队提供支持。任何相关需求,都欢迎您进入 ModelWhale 官网 注册体验,或点击【联系产品顾问(移动端跳转)】与我们展开交流。
再次感谢张维拓老师有关 AI for Science 驱动临床医学研究中相关问题的分享,点击《临床研究方法学,到现场,到数据真实发生的地方 | 对话数智 x 张维拓》阅读访谈完整版。