和鲸洞察丨基于 AI for Science 的医疗领域:模型的应用、迭代及可解释性

随着新科技革命与产业变革的深入发展,人工智能技术正不断突破并向科研领域广泛渗透,“人工智能驱动的科学研究(AI for Science)”已成为全球人工智能新前沿:提升科研效率、推动范式变革——必将为未来科技发展开启全新局面。

针对人工智能赋能医疗高质量发展,2023 世界人工智能大会(WAIC)期间,国家卫健委统计信息中心副主任胡建平表示,应积极探索人工智能领域中大数据、算法、超级计算技术等三大核心驱动力在医疗健康领域更加场景化、专业化、垂直化的应用,推动健康中国、数字中国两大国家战略的落地。

和鲸科技特邀上海交通大学医学院临床研究中心副研究员张维拓老师,从临床研究的成果转化谈起,以第一人称的视角与大家分享基于 AI for Science 医疗领域中模型的应用、迭代及可解释性

01 临床研究的成果转化

临床研究成果的转化方式,一般情况下可以分成这么几类。

首先是论文,临床研究结果的报告可能会以论文的形式发表。

接着我们希望论文能产生的效果是改变指南,因为指南相当于是医学界的一个公认文件,里面任何一句话都是有很多临床研究去支持的,只有更好的治疗才会被放到指南里。所以任何一个新的药物、一种新的医疗器械、或是一种新的手术方式,背后一定是有人做过了临床研究并证明这个方式确实比其他方式好,才会把这句话写进指南里。这也回到了之前我们说的,评价一个临床研究价值最好的方法就是,看做完这个研究之后,它的结论会不会改变医生的行为,最好的标准就是看指南里有没有写上这一句话。

另外附带的一些其他产品,包括相关专利、新上市的医疗器械、上市的新药,是可以拿去卖然后转化成一定经济受益、社会效益的,这也是我们国家生物医药产业发展的一个重要来源。

还有第三类,也是一种比较新的表现形式,叫做数字医疗,是大数据发展后产生的新的医疗产品形态。它是在一个模型、一种软件,或者一个智能硬件上产生的为医疗提供服务的形态,背后很多都是基于大数据分析产生的模型

02 医疗领域模型的应用现状

目前,临床研究成果转化的过程中存在瓶颈,很多临床研究产生的模型在经过论文发表后就停在我们自己的计算机里了,要拿去用很困难。和上市产品相比,我们的模型每回使用,都要先自己把计算机打开,再把图片从医疗设备里导出来,可能还要打开代码界面,input image 跑完,才能出结果。没有人会真的在临床的工作中干这件事。

所以从研究过程中获得的模型,要变成一个真正在临床上可以用的工具,其实有一个产品化的过程,其中可能包括了要把模型放在云上,相当于在任何地方都能 access ;其次需要对模型做个封装,因为要防止模型本身或者数据本身的泄露;接着还有用户的管理,哪些人可以 access ,哪些人不可以 access ,那就需要有个用户界面;甚至还要打通一些数据链路,比如说怎么让数据从医疗设备上到模型的服务器上等等。只有把这一连串的步骤全部完成以后,才可以把电脑里的模型变成临床上可以使用的工具,这肯定是医生自己干不了的。

临床中其实有挺多这样的模型,绝大多数仅仅是在医院的特定科室里面使用,上千个中可能只有一两个需要打包让药监局认认真真地评审。所以有个现象是你可能在论文中看到了一个不错的模型,但找不到去哪使用。现在网上可及的,可以被用的模型,数量非常少。

如果有平台能把从模型到应用的这个过程做得比较自动化,让临床医生不需要花太多时间精力就能把手里的模型变成一个网上可及的产品,当然不一定所有人都可及,他自己或者他所在的医院可以先在网页上 access 的话,我觉得这会是大家都非常需要的一件事情。

03 模型的优化迭代

我们知道机器学习、人工智能方法生产的模型有一个很大的特点,就是需要大量的数据投入训练,并且数据越多,理论上来说模型的 performance 会逐步提高。所以如果不允许模型迭代,很大程度上可以说是浪费了这类方法最大的优势;但是如果进行迭代,在监管方面就会涉及到很多问题

临床研究是重证据的,生产模型是一回事,证明模型有效又是另外一回事。模型肯定是在一个有限的环境、有限的医院,采集到了数据以后开发出来的,要上市那就要证明这个模型可以适用于各个地方,需要经过一个非常复杂的评估流程。假使评估完后上市了,需要进行模型迭代,那如何去判定迭代后它依旧是 work 的呢?从理论上来说它已经变成了一个全新的东西。重复一遍评估流程,这个成本代价是很高的。

所以在临床研究中,数据量更大的模型,训练效果会更好,这是一定的吗?其实很多时候不是的。因为最开始进行模型训练的时候,拿到的一定是最高质量的数据,而后来迭代的时候,数据很有可能是从各个地方收集到的,质量肯定不如原来的。所以当数据量变大的时候,模型其实不一定会变好,或者说我们不能不经过验证就去假设它一定会变好。

04 AI 的可解释性

新技术引入的时候,不能只看技术本身,要看这个技术对人的影响。

人和 AI 是要共同做决策的,这就会产生很多不确定性,究竟是以人最终主导,还是以 AI 最终主导,还是以某种方式去综合呢?那就需要 AI 提供更多信息,我们叫做 AI 的可解释性。除了提供最终判断以外,如果 AI 还能提供它是怎么做出这个判断的,那这时候医生就可以逐项地去核查到底是哪里产生了不一致。

其实医生实际做判断的时候,能获得很多 AI 不具备的信息。AI 只能看见图,但医生可能会知道另外一些事情,比如说患者的家族史、患者的生活习惯、之前的病史等等。如果 AI 给出判定肿瘤的解释是因为某块地方有个什么病灶,而医生查了病史以后知道这个不是肿瘤,是另外的东西,就可以排除掉 AI 可能犯的一些错误。

所以从这个角度来说,当 AI 真的要和人类医生相结合的时候,两边都需要做很多努力。AI 需要去适应人类的思维,解释一些人类想知道的东西;人类也需要去理解 AI ,但一定不能把 AI 当作是一个神,产生了不一致就觉得 AI 一定是对的,不能这个样子,要理解 AI 大概的能力范围在哪里,最后还是靠人类医生去做判断。

05 结束语

感谢张维拓老师有关 AI for Science 医疗领域中相关问题的分享,搜索《临床研究方法学,到现场,到数据真实发生的地方 | 对话数智 x 张维拓》阅读访谈完整版。

在技术革命与顶层政策的引领下,科研界正给予人工智能越来越多的关注。和鲸科技旗下的 ModelWhale 科研版聚焦数据驱动研究的协同创新,是以推动 AI for Science 科研范式改革、加强有组织科研为己任的数字化基础设施:关注从数据、算法到模型等研究对象的一站式全流程管理,从基础设施层面提升科学研究的可复现性,帮助营造协作协同的良好科研生态;基于 FAIR 原则与开放科研理念为数据等研究生产资料提供安全、完善的公开共享门户在线交互工作台;异构融合、集约管控、按需分配、敏捷响应,强大的算力调度管理使个人电脑调用 LLM 大语言模型成为可能,也使算力资源在组织团队内发挥最大可用性;引入 ModelOps 理念,助力大模型全生命周期管理。

ModelWhale 科研版覆盖地球科学、生物医学、人文社科等专业领域,且已将最佳实践落实于国家气象信息中心、中国自然资源航空物探遥感中心等国家级科研机构,希望能为每一位从事数据创新研究的开拓者及其团队提供支持。任何相关需求,都欢迎您进入 ModelWhale 官网 注册体验,或扫描下方二维码、联系产品顾问与我们展开交流。