AI促进新药研发,“默克”逆合成反应预测大赛为开放式创新带来新思考
新药研发投入费用大、时间周期长、创新成功率低
近几十年一直困扰医药行业

近年来,随着计算能力的发展和海量数据的产生和积累,人工智能技术在生物医药领域,从科研到应用都取得了巨大的进展。特别是随着深度学习技术的高速发展,更是重塑了生物医学领域的现状和未来,在医疗影像、辅助诊断领域都有着广泛的应用。但在新药研发这一领域,人工智能却鲜见落地应用。

据L.E.K.相关调研数据显示,未来五年,仅中国就将贡献370亿美元的处方药增量,占全球总增长的13%。但随之而来的新药研发成本更是水涨船高。另据相关研究报告显示,一个原研新处方药开发至获批上市的总费用已经从2010年的11亿美元增至如今的26亿美元。

新药研发不仅费用高昂,还存在着周期长和研发成功率低等问题。根据报告显示,一款专利药从早期研发到获批上市,一般需要11年左右,甚至更长时间。而近几十年来, 新药研发难度加大, 新药研发成功率不断降低, 中国整体临床通过率约为 34%, 其中生物药约为 42.9%, 化学药约为 27.6%。新药研发的周期长、投入大、成功率低,不仅是医药行业从业者的桎梏,也给数据科学与人工智能技术的应用方面带来了思考与挑战。

“默克”杯逆合成反应预测大赛落幕,成果高于预期
或将引发医药创新领域的AI应用热潮

4月19日,数据商业家应默克生命科学的邀请,来到上海张江科技园,参与“默克”杯逆合成反应预测大赛的决赛和颁奖仪式。“默克”杯逆合成反应预测大赛,是由默克集团(Merck KGaA)旗下默克生命科学主办,和鲸科技(前身为kesci科赛)协办的医药领域人工智能赛事,主题是通过人工智能进行逆合成反应物预测,以此助力新药研发。

近年来,AI技术不断参与化学、制药领域,但主要是被用来预测反应物。然而逆合成分析作为有机化学的基石,在新药研发中也占有十分重要的地位。传统化学研究中,化学家们完成逆合成反应预测耗时耗力:需先从目标产物的分子式开始分析,再利用Scifinder搜索相似的结构和文献报道过的合成路径,确认需要哪些试剂、怎样的反应序列,甚至要依据直觉制定几十个化学反应,通过这些反应逐步生成目标产物,才能开始实验。这个过程往往会浪费化学家几天甚至更长时间。

在本次大赛中,选手们通过将将海量的化学反应方程式交给计算机去学习,让计算机进行逆合成反应预测,不仅提高了预测的复杂程度和挑战性,也强调了它在新药研发中的意义。而在未来,AI将成为科学家的定制工具,对于提高药物研发的速度和效率、降低成本等,都有着巨大的益处。默克生命科学作为一家医疗领域的领军企业,率先以人工智能数据竞赛的方式,与众多数据人才一起进行一场新药研发领域有价值的尝试,或将引发医药创新领域的AI应用热潮。

据了解,自今年1月开启赛事报名后,到 3 月 1 日初赛提交结束,共吸引了 582 支队伍、1150 位专业选手参加。其中不乏来自北京大学、中国科学院上海药物研究所、复旦大学、中山大学、中南大学的高材生,也有各类AI公司的工程师们带着丰富的实战经验而来。在决赛现场,选手们通过各种方式展示了自己的作品,经过激烈的线上和线下角逐,为期3个月的大赛成功落下帷幕,来自北京大学的MDL团队最终获得了此次大赛的一等奖。

积极布局人工智能在新药领域的应用
百年默克正逐渐转型成为一个创新科技公司

“生命科学领域总是充满着各种不确定性,作为一家该领域的公司,默克相信数据化技术的应用是生物学发展的未来,人工智能能够帮助我们更快更好地解决生物领域的问题,所以我们举办了这次比赛,为中国的数据人才提供分享创意和交流技术的平台,希望促成医药领域和数据科学领域的合作。”在本次比赛颁奖典礼上,默克生命科学中国区董事总经理卫政熹表示,默克生命科学正在布局人工智能在新药研发领域的应用。

在接受数据商业家记者采访时,卫政熹说道:“其实默克在生命科学技术领域十分的活跃,我们认为通过对人工智能技术的应用,能够帮助生命科学研究者大幅提升研究效率,我们已经有了一定的技术和数据基础,希望能够得到更多创新实现和理念,逐步将生命科学与人工智能进行结合。”

而作为全球前五大市场之一的中国,在默克的发展战略中更是十分重要。采访过程中,卫政熹说:“我们看到,中国是人工智能发展非常迅速的国家,在中国人工智能科研论文被引用的数量已经在世界上占据了很高的比例。我们默克公司也一直对人工智能和数据科学秉承开放的态度和好奇的精神,我们已经和中国一些数据技术企业建立了紧密的联系,未来也会继续发掘中国优秀的数据人才和新一代数据企业。”

据悉,在2018年11月,默克集团便宣布将在上海设立技术研发中心,并进行扩张,达到1000平方米,共设20多名科学家和工程师。此外,其还将和默克南通生命科学中心结合,建立完整的数据流通和技术研发体系。在中国,默克已经投资了2.5亿欧元以推进中国市场的本土化布局,不仅与腾讯、阿里健康等领先技术企业达成合作,还与同济大学等国内顶尖高校建立了核心技术合作伙伴关系。可以看出,默克生命科学正在对人工智能技术不断加码,逐渐转型成为一个创新科技公司。

“我们对这次大赛得到的结果非常惊喜,看到很多来自各个领域的选手能够来参加我们的比赛,通过这一次比赛,我们看到了人工智能的应用范围远比想象的要广,我们希望在这次比赛之后将优秀成果与内部团队对接,让研究成果进一步应用到真正的生产研发中去。”作为一家有着350年历史的集团,默克在人工智能方面的布局彰显了其持续创新的意识,“Always Curious”这一理念也贯彻了默克悠久的历史,一直在寻找新的创新点,不断地进行自我跳帧,也许就是这家企业百年长青的基石。

数据智能的时代,企业需要开放式创新

但我们还需要看到,AI+医疗仍然有很长的路要走。同样是在这一周的4月13日,人工智能医疗巨头IBM沃森健康(IBM Watson Health)正式宣布,本周将裁掉本部门约50%-70%的员工,这无疑是一个酝酿已久的决定,也是人工智能医疗领域的一次重大洗牌。这让我们开始思考,企业常用的那种选择一个领域,搭起一个团队,投入一批资源、形成技术成果、进行商业化应用的封闭式路径是否真的已经不太合适全新的数据智能时代了。

在数据技术快速发展的时代,为了让人工智能充分发挥其潜力并改变生命科学,人工智能系统必须要用到需要考虑到比临床试验更多的因素。相对于闭门造车方式的研究方式来说,像默克生命科学一样,集合各领域的数据人才进行开放式创新,集合众多的新思想和不同方法,无论是在前期研究还是后期开发阶段,都能更好地拓展思路,提高效率,才能在人工智能与各行业结合的尝试中不断突破边界。

据数据商业家记者了解,默克生命科学正在与数据科学平台和鲸科技策划更加深入的合作,共同推动人工智能在生命科学的科研进步与产业应用,我们也会进行后续的跟踪报道。

无论如何,人工智能医疗这个行业有着非常广阔的前景,必将诞生一些伟大的公司,谁都不是第一个象牙塔的守望者,也不会是最后一个丛林中的引路人。