「深度」当AI遇到制药,成为颠覆者还是只能“打辅助”?_FIN:TRU

界面新闻记者|李科文

界面新闻编辑|谢欣

1

就如《猎药师:发现新药的人》一书中直言,新药研发就像阿根廷作家博尔赫斯的《巴别塔图书馆》中寻找真理的过程一样困难。被寻找、挑选或设计的,能与人体异常复杂的分子系统配对的某个化合物,就如真理一样,潜藏在这座像宇宙一般浩瀚无垠的巴别塔图书馆之中。

某种化合物可能消灭卵巢癌细胞,另一种可能会抑制老年痴呆症的恶化,还有一种或许可以清除艾滋病,但也有可能根本没有这些能适配的化合物,也就是说真理或许根本就不存在。

现代药物研发流程却有着基础轮廓,是科学家们基于基因学、蛋白组学等生物学研究找到新靶点,然后建立筛选方法,从类药化合物库中找到有活性有潜力的苗头化合物,进一步筛选、优化出为先导化合物,然后再以先导物为基础通过一系列安全性、活性、成药性的研究和验证,发展出药效、选择性、其他成药性质都符合标准的临床前候选化合物,最后再在几个候选化合物中持续验证和探索,直到锁定一个各方面表现最优、可以进入临床试验的候选药物分子。

目前,人类仍没有办法获取关于人体和化合物全面且确切的信息,就好似未是知的未知。而当代药物研发人员寻找新药的困难程度便与在巴别塔图书馆中的图书管理员相似——大部分图书管理员在图书馆中穷尽一生也一无所获,看到的只是杂乱无章的字母,而非真理。

时间的齿轮径直地转到2020年。在这一年,Google旗下DeepMind的AlphaFold发布取得重大突破,解决了困扰科学家50年的生物学难题——蛋白折叠。虽然早在1966年,赛勒斯·利文索尔已将计算机模拟与分子图像相结合实现蛋白质和核酸结构可视化,正式标志着计算机辅助药物设计的开始,但AlphaFold的惊艳表现让资本市场对AI在制药领域对作为用着火热的期许——这一技术可以帮助科学家看清靶点的结构,新药研发的第一步从雾里看花转为按图索骥,让很多已知靶点具备了开发成药的条件,显著打开创新药研发源头的阀门。寻找真理是否能一步到位,有捷径可循?

特别是,到2022年11月ChatGPT的横空出现,在社交媒体的渲染下,让普通公众也对AI技术有着超越理性的崇拜或恐惧。

现在可以明确的是,AI作为一种工具,可以在多个药物研发的效率、瓶颈难题上带来帮助,它仍无法跳脱与颠覆现代药物研发流程的基础轮廓。研发药物的过程依旧异乎寻常地困难,因为在某些关键节点,总需要进行反复试错。

不过,还有一点可以明确的是,若把新药研发当作是颗抬头看不见天的硕大苹果树,那些已被验证的经典的药物靶点就是已被摘完的低垂的果实,现在借助AI技术这把梯子,我们可以尝试摘取此前已抬头可见但更高处的果实。但还有一点,仍可能有数量无限的果实隐藏在未能被看见的叶丛之中,即便借助AI也仍需我们拨开遮挡,摸索。

大海捞药的帮手

现代药物研发技术的发展历史大致可分为三个阶段:第一个阶段可以追溯到19世纪开始,人们能从自然产物中分离出单一的有效成分,依靠药物化学家的灵感、偶然甚至运气驱动药物发现;随后,由抗生素的发现所引领的20世纪药物大发现,科学家们开始发现和合成具有药物效果的新分子结构。20世纪后半叶,基于“靶点”的药物研发兴起,科学家可以选出一个生物机理相对明确的“靶点”,筛选得到可以调节该靶点的化合物,并借助分子模拟、组合化学和自动化高通量筛选、重组DNA技术等新技术进行“理性设计”,药物发现在20世纪末取得了快速进展。

再到第三个时期,也就是21世纪,随着基因组学、蛋白质组学的发展,越来越多经过理性设计和优化的生物药获批上市,登上历史舞台。

想弄清楚AI技术具体在制药领域能做什么,得先知道现代药物研发到上市的基础流程有哪些。一般而言,一款新药的研发流程包括以下几个阶段:探索阶段、药学研究阶段、临床前生物研究阶段、临床研究阶段、以及临床后的审批上市。

“从早期的靶点发现,到化合物发现,到临床前至临床间,甚至审批上市至商业推广都可以用到AI技术的赋能和加速。”晶泰科技首席科学家张佩宇向界面新闻记者表示,目前而言AI最主要集中应用于化药及生物药的发现和临床前开发阶段。

图片来源:互联网公开信息

研发一种有效药物需要两个条件:一是合适的目标,第二个是合适的化合物。“若把病比作一把锁,那么靶点就是锁芯,找到锁芯,研究出锁芯的立体结构,那么就可以根据它的立体结构为其设计、打磨一把专有的钥匙——能够用药物治疗的药物即为这把专有的钥匙。”前宾夕法尼亚大学医学院研究副教授、杭州赛得康生物科技有限公司创始人张洪涛这样表示。

而所谓靶点,即人体内能够与可能成药的化合物结合,并产生药理效应的生物大分子的结合部位,现通称为药物作用的生物靶点。药物作用靶点可以是受体、酶、离子通道、转运体、免疫系统、基因等,其发现和验证是一个非常复杂的过程。其中,寻找疾病作用机制,发现靶点,是寻找真理的第一步,也是新药后续能否继续推进的基石。

以因电影《我不是药神》而闻名的抗癌药格列卫为例,它的研发至上市便是依照寻找疾病作用机制,发现靶点这一现代药物研发流程的基础轮廓。它也是首款能被称为是理性设计的药物——再到基于蛋白质结构筛选和设计能够抑制靶点蛋白表达的小分子,从生物学原理出发,一步一步都以理性为依据。

在此之前的药物靶点的发现与应用可以说都是以实验和经验观察主导,有些误打误撞的成分。像默沙东90年代研发的治疗良性前列腺增生的保列治、和治疗男性秃发的保发止。虽然这两款药物都是基于5-α还原酶研发的,但默沙东最初的药物猜测与设计是将其用于抑制青少年粉刺生长。

格列卫是针对慢性粒细胞白血病的靶向治疗药物。罹患慢性粒细胞白血病的患者的血管中的血液里有中性粒细胞。随着血液里的中性粒细胞越来越多,就会挤占原本血液里红细胞的资源和空间。红细胞越来越少后,患者的急症期便有可能会出现因窒息而死亡的现象。造成这种现象的最底层病理机制便是患者造血干细胞中的基因中的BCR-Abl蛋白出现“故障”——产生中性粒细胞的基因因在中间部分发生交换而无法被正常关闭。这也便是前述所讲的患者致病的原因所在,也就是锁心。

化合物筛选库包含大量有潜力成为药物的化合物,通常由以百万到亿计数的小分子组成,既有可购买的商业库,也有大药企自己独有的分子库,每个化合物都有不同的结构和物理、化学、药学性质,是药物发现、筛选和设计的起点。格列卫,其最基础的、编号为STI571的化合物便是科学家基于成千上万中小分子中被筛选出的能适配且能打开BCR-Abl蛋白这个锁心的钥匙。这在业内也被称为苗头化合物,即这些化合物很可能有效。

与此前不同的是,如今,苗头化合物的发现通过高通量筛选完成。人类合成过的分子是百万级,一般用于筛选的虚拟化合物库大到几十亿分子的规模,药物研发科学家依照计算机辅助技术和个人经验,选定大概的方向,分批将这些分子按需合成后进行实验验证,如果观察到小分子和靶点的蛋白质有一定的结合能力,再去进一步研究和优化。

在苗头化合物基础上,再经过一系列优化和确认后,像进行体内外的活性测试、理评价和药代动力学研究等,就形成了具有良好的生物活性和较好的药物性质和安全性的化合物——先导化合物。这一部分也被成为临床前研究的药物发现与探索。之后,再经过漫长且风险的临床试验、监管审批,某款被验证的药物或有最终上市的可能。

实际上,据推算,可能成药的化合物,也就是钥匙的个数是10的60次方。这意味着,这比太阳系里的原子数量还要高好几个数量级。而人类目前所能筛选到的分子数量仅在10的11次方。这中间还存在着巨大的差异。也可以说,前面编号为STI571的化合物能被挑选出来且最终成为知名药物格列卫也是一个幸运的结果。

目前AI在药物发现领域的作用,就是在前述的经验积累中学习为遇到这个幸运再增加一些概率。“如果我们能通过AI打开更大的分子宇宙,或许就有更多格列卫级别的分子能够横空出世,攻克新的疾病。”张佩宇表示。

在业内药物研发的过程被总结为三高一长:高投入、高风险、高回报,但时间长。一款新药从研发到上市面临3个“10”的考验——10年时间、10亿美金、10%成功率。像格列卫这样理性兼顾幸运的产品于2001年5月才终于通过了美国食品药品管理局审批正式上市,这距离格列卫的所有者诺华向FDA提交药品上市申请已过去两年半,而距离找到能打开BCR-Abl蛋白这个锁心的钥匙的那一刻已过去十三年。

“在引入AI之前,寻找可能成药的化合物的筛查过程是人工筛选试验的,效率低下,进展缓慢,且筛选的先后顺序往往是基于研发者个人的经验,带有一定的运气成分,不确定性很高,困难重重。”张佩宇表示,可能能成药的化合物也要满足多种属性。在筛查化合物的过程中,AI能做的如同老顽童的“左右互搏”,AI一边推测设计出百万量级的可能成药的化合物,其中一些可能从未存在于任何药物数据库中;一边就是建立模型,成为这些分子的筛选器,就像巨大的漏斗。在漏斗精挑细下选出最有可能与适配锁心的化合物,各方面物理化学性质也要满足可能成药的标准。“综合评估被筛选的化合物的成药性、活性、选择性,成功概率可能会更大。”

圆壹智慧创始人兼CEO潘麓蓉博士在接受行业媒体同写意采访时曾表示,药物设计有时候需要研究化合物与生物酶的多级作用机制,涉及多口袋竞争、诱导契合、酶催化反应等动态过程。传统方法或许可以计算单个口袋与化合物结合的物理近似,但处理真实酶催化反应历程的计算结果与实验存在很大偏差。而深度学习模型通过“学习”活性实验数据,将所有“口袋”和“过程”作整体考虑,在训练充分的情况下,可以产生比传统物理模拟方法更接近实验的计算结果。

除了发现可能成药的化合物的外,AI在小分子药物自动合成路线的设计、新药物效果模拟和预测,甚至新型药物分子的预测上面都有实际应用的实践。像辉瑞新冠口服药Paxlovid便是AI在药物探索阶段深度参与和加速的结果。在此之前,行业内的临床前研究平均需要4-7年时间。

张佩宇介绍,晶泰科技曾帮助辉瑞将研发Paxlovid所需要化合物、及其所有可能的固体形态,通过AI算法全部预测且准确匹配实验结果。这项工作关乎药品安全、大规模生产以及专利的申报,原本需要耗时要半年以上,当时通过AI耗费六个星期就已全部预测完成。这为后续的继续研发大大提前了进程。

“AI既可以有效学习现有分子结构特点,随机产生大量新的分子结构,也可以按照药物化学家的需求,定向产生符合某种药物设计需求的新分子结构,从而大大扩展药物筛选过程中可用的高质量药物分子候选者。这种基于海量‘经验值’的设计能力远超任何人类科学家。”张佩宇说。

张佩宇表示,药物研发是多目标优化试错的过程,也正是如此才需要有借助AI来筛选。传统试验人工要合成几千、上万个分子,也仍可能失败。AI就是来提高试错的成功率。试错是不可避免的,只不过是借助AI的“比特”而非人手来协助试错,试错效率显著提高,可以将筛选范围从几千拓展到百万,同时显著降低排除错误选项的成本,还能挑战传统实验方法无法胜任的“难成药靶点”,有望让药物走上临床的成功概率从“万中无一”变成几千甚至几百分之一。

“在药物研发领域不是单纯非黑即白,中间还有非常多的灰度。”张洪涛表示,比如某个制药企业根据这个有可能成功的靶点做某个蛋白药物,假设有1千种可能性,就需要雇1千个科研人员去测试它的可能性,但普通的制药企业根本没有这么大的资金来实现它,现在通过AI技术将可能的分子提前筛选,原来的1千种可能性缩小集中到最有可能10个,即使不能保证这10个分子最终都能成功,但这聚焦目标的过程就是AI在药物发现领域目前作出的贡献。

并非无所不能?

仍需要提醒一句,AI制药没法一步到位地实现目标——即脱离前期海量的生物学研究,凭空创造出药物。像能创造格列卫的STI571这样有效的化合物,如果没有真实有效的靶点,若没有机缘,即便借助AI也有可能不会被找到,就像真理也许并不存在于图书馆之中。

AI的学习资料是基于人类已经创造的实验数据,对于那些是冷门乃至未知的靶点信息,AI无法准确的无中生有。

如作家纳西姆·塔力布在他的畅销书《黑天鹅》中将未知的未知比喻作“黑天鹅”。在资本市场黑天鹅的出现是令人惶恐不安的,但在新药研发领域,能够发现且识别黑天鹅则是令人欣喜若狂——当一个疾病靶点被发现,就可能颠覆一种原本不可能治愈的疾病,催生一系列相关药物的研发和上市。

图片来源:浙商证劵

在新药研发领域,可以将新药的探索分为两种:一种是已知的未知,就像默沙东模仿日本第一三共,去寻找几乎与美伐他汀化学式一摸一样的洛伐他汀。

对于已知的未知,科学家给AI确定的靶点探索方向通过深度学习模型的介入,可以更快地数以千万计的科学文献的非结构数据、以及这些生物的基因分子中找到可能合适的靶点,再通过选择不同的靶点并进行验证,以了解靶点的生物学特性,实时交互得到有证据的结果,实现相应药物靶点的发现。

当然,这种准确性仍不能保证。张佩宇表示,核心竞争力其实是,通过AI推理提出的假设和验证的时间与人提出的推理假设精确度相比,准确性与效率是否提升。这才是决定人是否在此处使用AI的关键。

还有一种是未知的未知,但未知的未知有多少,这连AI也不清楚。

就像前述最初提及的,基于5-α还原酶研发的治疗良性前列腺增生的保列治和治疗男性秃发的保发止。该理论最初基于早在1948年美国药理学家雷蒙德·P·安奎斯特就提出的可能——存在两种不同的肾上腺素受体的假设。

在整整十年后,科学家回溯后才相信,这只黑天鹅早已掠过人类认知的天际,只不过没有一个人能辨认出它。到了七十五年后的今天,即便有了AI协助,现在的科学家也仍出现与当时相似的情况——可能无法辨认出刚刚划过天空的就是一只黑天鹅。

“但是通过人对AI的有效利用与两者的协作,我们或许就具备更好地抓住黑天鹅的机会。”张佩宇说,比如利用AI挖掘潜在的靶点,再基于靶点去筛选潜在的药物。因为AI制药的成本更低,甚至可以折叠新靶点验证和新药早期发现这两个顺序步骤的时间,通过找到有效的苗头化合物,反向验证靶点的真实有效。如同在可能有黑天鹅的位置撒下大网,通过抓住它来验证它的存在。

此外,即使发现与辨认出了黑天鹅,AI也如前所所言协助着科学家缩小了选择钥匙的范围,但还需对这枚钥匙进行打磨,之后科学家也还需要再去试验,再看看是否有效,将数据反馈给AI算法,下一轮生成更加接近需求的钥匙,从而形成一个循环。这个对钥匙结合打磨验证的过程,必须在真实世界完成,需要AI无和实验技术配合完成。

其中,通过AI虚拟筛选苗头化合物是药物开发的一个起点,只是药物发现过程中的一个步骤,还需要经过多个步骤的筛选和优化。它只能提供初步的筛选结果,需要进一步进行实验室筛选和结构优化等步骤,才能最终确定苗头化合物。AI预测良好的活性、稳定性和安全性等方面可能存在一定的不确定性,实验数据反馈给算法后,可能仍然需要经过若干轮的迭代,和科学家的参与意见,AI才能设计出真正符合要求的分子。

这就像在拼乐高积木,但与标准化的、能完全拼合的乐高积木不同,试验被挑选的可能能适配打开新靶点这把锁的化合物过程中,它们间有时候可能会出现只有部分结合的情况,而部分结合又分为大部分结合,或是小部分结合。小到结合位点,大到靶点的微环境,都有其独特性,很难有“万金油”算法能够放之四海而皆准。这样的结果是,在药物研发试验中会有各种千奇百怪的结果。

张佩宇表示,每个项目都需要定制化的策略。更重要的是后续的数据反馈闭环,AI在每个靶点体系中经过针对性的数据积累和模型优化。

以前述提及的DeepMind的AlphaFold为例,此前结构生物科学家颜宁回国后,舆论曾热议其科研成果是否可以被AlphaFold的AI技术直接取代。一位生物医药人士曾向界面新闻表示,以AlphaFold2为代表的的AI蛋白结构预测算法,还没法取代结构生物学的湿实验。AI技术的确预测来几乎所有Uniprot中的序列的结构,但这些预测模型的质量仍良莠不齐。

湿实验指的是在实验室里采用分子、细胞、生理学试验方法进行研究,也就是传统的药物研发实验室;而干实验则是通过计算机模拟及生物信息学方法来进行研究,既有传统的“计算机辅助药物设计”,也包括AI药物研发平台做的事情。。

另一位生物医药人士也曾向界面新闻表示,目前来说AI只能是补充手段,可以减少确定结构过程中的很多麻烦,但最终仍脱离不开科研人员的实验验证。“即使你基于当前模型,预测的准确率达100%,也不能在不进行湿实验的情况下确定该结构的准确性。”

在确认靶点后从苗头化合物到先导化合物这个试验阶段,先导化合物在体外和体内实验中已经表现出一定的药效和选择性,但在实际应用中,也可能存在潜在的性和不良反应,药效、生物利用度和代谢等也需要进一步评估和优化。

张洪涛表示,依据AI的学习程度,理论上可以根据已有的数据库,避免性、不良反应的风险的概率,也仍需要真实的实验来验证AI预测的结果是否准确。

不过,就像第一个获批上市的他汀类药物,被称为胆固醇杀手的默沙东历史上的头号大药洛伐他汀。若仅带着AI技术穿越回去,在没有数据支持的情况下,即便借助AI也会在当时面临的抉择前摇摆不定。

与第一三共于1980年因性而终止研发的美伐他汀相比,默沙东的洛伐他汀在化学结构上“几乎完全一样”——唯一的区别就是一个甲基。若用现有的任何一种人工智能算法来做预判,都会认为洛伐他汀也应该会像美伐他汀一样引起癌症比例升高的严重问题,但默沙东为期两年的动物性实验数据却显示洛伐他汀没有出现相同的问题。

张佩宇表示,这的确是目前AI还无法解决的问题。像发现美伐他汀与洛伐他汀的细微差异,这种细微变化相似,但却导致在人体内的作用效果有巨大差异,面对人体这样庞大且复杂的体系,目前AI也无法帮助人类走捷径。这种细微的变化发现就是试错试出来的,所以临床试验仍然是对药物安全性有效性最权威的考验。AI协助人类试错是将错误成功率从万分之一,降到千分之一,再可能降到百分之一,而不是一试一个准。即便只是将临床试验成功率从10%提高到20%、30%,也是对创新成功率2、3倍的提升。

而且人体还是一个异常复杂的分子系统,复杂度与尺度远超现在计算技术的模拟能力,而身体各个组成部分之间的关系极其复杂,牵一发而动全身,且每个个体又有其不同的特性。换句话说,人体的生理活动不像机器人并没有固定的套路。对于人体内的生理活动,截至目前科学家们只了解其中很小的一部分,仍无法描绘身体中绝大部分分子究竟是如何工作的。这让药物的效果在人体试验的结果依旧无法预测。

张佩宇表示,人类的探索和尝试从未停止。目前的药物研发在细胞、酶等试管环境探究其初步的有效性,再在由小到大的动物模型中进一步探索药物在生物体内的药效,直至走上临床。而类器官等技术与AI的结合,可以在试管中更好地复原和模拟人体内的三维环境,让药物研发早期获得与真实临床相关性更高的活性数据,这样训练出来的AI模型,有望设计和筛选出临床成功率更高的药物分子。

未来的野望

在1950年发表的作品《我,机器人》中,历史上最伟大的科幻小说作者阿西莫夫深入探讨了“机器人学三定律”:

第一法则:机器人不得伤害人类,或袖手旁观坐视人类受到伤害;第二法则:除非违背第一法则,机器人必须服从人类的命令;第三法则:在不违背第一及第二法则下,机器人必须保护自己。

以人类现在的局限性,无法透支未来的图景,但有一点可以明确:现在的在AI被用于新药研发的环节仍需人类制定或给予方向。

“人类很容易把想法收敛到某个方向再去推理阐释,这是人的优势。”张佩宇表示,现阶段AI的确可以根据人设定的目标去自发探索,但人给予明确的方向AI探索的效率会更高。

若明确AI作为工具,至少在新药研发领域,现在很多关于AI的崇拜或恐惧或可以烟消云散。

“人和AI结合起来做药物探索与发现是未来新药研发行业的事实趋势。不会使用AI的科学家会被会使用AI的科学家取代,并不是说AI会完全取代科学家。”张佩宇说。

生物医药将是AI产业化最重要的部分之一。传统的制药模式中,药物从头设计依赖于专家经验指导下的实验试错,且新药筛选失败率高、药企的创新投资回报率不断下降。如何通过大数据、人工智能等科学技术,更加高效地以“比特“而非实验去试错,从而加速新药研发进程、平衡研发投入与成果产出之间的关系,成为了医药公司在数字化改革道路上的重点之一。

据浙商证劵数据,2022年医药行业的投融资热度下降,但AI制药赛道反而更加火热。根据公开数据统计,2022年全年AI制药赛道相关的融资总事件达144起,YOY97%,总金额为62.02亿美元,YOY47.67%。且美国AI初创公司吸纳了市场上的绝大部分资金,占总融资额的77%。

界面新闻了解,前AI制药市场的主要参与者有三类:生物医药企业、CRO、互联网公司。在商业模式上主要分为:AI-biotech、AI-CRO和AI-SaaS,即利用AI自己建立新药研发管线成为药企、提供药物发现服务和售卖AI药研平台与软件的使用服务。

像互联网公司借助对外投资、打造自有相关平台、提供算力及计算框架服务,但像腾讯、百度、字节跳动等互联网公司的缺点在于,他们虽然算法和算力优势,但对制药专业领域的知识及经验较为匮乏,而现阶段的AI制药在模型与数据之外,仍需要大量物理、化学、生物学、药学等领域算法与方法的跨界融合,是需要到多目标优化的系统工程。因此互联网公司主要集中发力在新药研发对数据及算力要求较高的环节,有同质化竞争趋向,到了CMC之后的阶段算法和算力提供的帮助就变得有限,也很难拿到显著优越于同行的结果,说服药企为平台的落地付费买单。

除去售卖软件外,AI+CRO和AI+Biotech是目前被资本市场认可的最主流的商业模式。实际上,资本市场对是做AI+CRO还是AI+Biotech之间仍有分歧。不过,在分歧中也走出了各种的头部。其中,晶泰科技更偏AI+CRO,而英矽智能则更偏AI+Biotech。

当然,这两种不同的商业模式也会带来不同的风险与回报。AI+Biotech则可能采取构建伙伴关系或内部药物发现为商业模式。这两种的AI制药商业模式的底层逻辑与Biotech无异。

选择AI+Biotech模式的公司最主要原因是依照生物医药行业惯性:一个成功的药物一旦进入市场,每年很大概率能给公司带来数亿乃至数十亿美元的回报,直到专利过期。他们在内部开发候选药物,通过临床试验的考核,最终将产品推向市场。在药物正式批准上市之前,按照市场惯例,公司估值与管线的表现高度关联,随着药物管线进入I、II、III期临床,公司估值也会水涨船高;而某次临床失利的消息也可能直接让企业估值受创。但仍要提醒的是,药物发展路径仍漫长且充满风险,临床研究需要数年时间且花费昂贵,即便借助AI也不例外。

诸如英矽智能、未知君、药物牧场等早期的AI制药公司在定位上便是明显的Biotech特征。这些公司均有多个在研管线,并且拥有已进入临床阶段的管线,目标是打造First-in-class或best-in-class药物,推动这些药物管线上市或被大药企接盘。

选择AI+CRO模式的公司,会将其AI研发技术与服务作为产品出售给制药和生物技术公司。他们与合作伙伴合作,完成特定的研发环节,或包圆整个靶点发现后到临床前验证的环节,然后将临床候选移交给合作伙伴继续进行新药申报的准备和临床开发与研究。这种商业模式使选择AI+CRO模式的公司能够专注在AI最有优势的、轻资产投入而重计算的临床前环节,最大限度地优化、提高其平台的效率,甚至实现新药研发的规模化效应,最主要的是能避免新药研发更下游开发的风险,同时可以收到新药一步步走向上市的里程碑付款甚至分享销售分成。

像晶泰科技与礼来签署一项AI小分子新药发现合作,预付款及里程碑总收益可达2.5亿美元,也是目前国内最大的单个管线AI新药发现合作订单。

“现在AI制药企业技术布局趋向同质化,AI制药企业应该打造自己独特的技术优势,根据不同的新药研发需求提供相适配的服务”,张佩宇表示,晶泰科技不会做Biotech模式,因为Biotech实际上能做的项目很少。晶泰科技也不会是纯粹的CRO模式,传统的CRO模式是按劳动力付费的,多一倍的项目就需要招多一倍的人。而AI+CRO是可以实现药物研发规模化,研发的管线越多,数据的积累与算法的优化优势越明显,平台的交付能力越强,且边际效应明显——因为预测可以减少高达90%的传统实验需求,所以在大量云计算资源的支持下,服务的管线数量翻倍,也不需要等比翻倍地招募更多的人来为项目服务。

关于AI制药的未来构想无论多么宏大,对于所有的AI制药企业来说,有个必须探讨的阿喀琉斯之踵——数据如何得来?张佩宇也直言,AI的核心三要素,算力、算法、数据,如果大家都相差不多,也很难有企业杀出重围,在同质化竞争中异军突起。在算法模型快速发展、云端算力极大丰富的今天,数据成了发展AI制药最关键的瓶颈。

但医药行业目前所拥有的数据规模和质量,在一些研发环节的数据是不足或者数据构成单一、一致性差,直接影响模型表现。与ChatGPT直接搜罗学习全互联网的公开信息不同,AI在制药方面的数据积累就困难的多,比如一个分子是否对给定的靶点有活性,需要在将这个分子真正合成出来,再经过一系列的实验测试。这期间的耗费的时间周期与数据获取和标注成本要高很多。

特别是,制药领域涉及专利,对数据开源和分享的意愿很低,且非常注重数据安全与隐私保护。拥有独特、丰富的化合物数据集是成功制药公司的法宝,有些更是通过多年专注于某一个疾病靶点或生物学领域,积累了大量独家的实验数据,这对药企来说是关键的数字化资产和研发优势。而对数据极度依赖的、需要高度开放的AI要想在药物研发领域落地,并促成质的提升。

张佩宇表示,现在的核心是需要解决什么问题就搜集什么数据。与药企合作也会在药企的要求下使用相关的数据库,包括通过隐私计算,针对药企数据去训练模型,但这些数据的所有权依旧归于药企所有。但AI可以通过不断的学习完善自己的模型。

“目前行业普遍认为,AI需要与湿实验相辅相成,“干湿结合”才是对AI技术最好的使用。”张佩宇表示,自动化与AI的结合使用也是行业未来的趋势。自动化实验能够收集大量的数据,还有望解决AI药物研发的数据短板问题,有助于提升整体研发流程的效率和成功率。大量重复性劳动交给机器人,科学家将有更多时间和精力投入到药物研发的关键环节中,不仅实验产出效率成倍提升,还能减少人为操作引起的实验误差。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

金智博客

[0:31ms0-3:126ms