医药研发行业是一场时间和金钱高投入的冒险,长期以来面临着“双十定律”,即需要耗时超过10年、10亿美金才有可能上市一款新药。制药巨头强生的首席科学官Paul Stoffels曾形容,一款新药的成功上市比造飞机更难。
近日,加拿大多伦多大学研究人员开发了一种人工智能系统,可以使用生成扩散来创建自然界中不存在的蛋白质; 华盛顿大学研究团队利用人工智能技术平台精准地设计出能够穿过细胞膜的大环多肽分子,开辟了设计全新口服药物的新途径......
图源:pixabay
【资料图】
测定蛋白质,AI效率>超级计算机
人体和其他生物体内的蛋白质,都由多种氨基酸折叠而成。氨基酸排成一条长链,被放入水里,会在1秒内折叠成稳定的三维结构。
理论上讲,计算机是能够推算出来的。不过实际上,蛋白质折叠问题的难度非常大。假设每个氨基酸都有2种状态——展开态和折叠态,如果一个蛋白质由100个氨基酸组成,那么它可能的三维结构数量就是2的100次方,这是个“超超超超超超级大”的天文数字,而其中只有一个结构是稳定的三维结构。所以光靠超级计算机的“暴力计算”,是无法根据氨基酸序列预测出蛋白质结构的。
图源:pixabay
长期以来,计算机预测蛋白质结构的准确率不高,明显低于实验测定的蛋白质结构,所以计算生物学方法在蛋白质折叠问题上只是配角。
为什么还要测定蛋白质结构?大家服用的药物大多是小分子化学药,它们的作用靶点大部分在蛋白质上。研发这类药物的一个重要前提,是解析蛋白质结构。只有绘制出人体内某些蛋白质的“三维地图”,才能找到药物靶点,完成“精准制导”。
2022年,DeepMind公司与欧洲生物信息研究所的合作团队公布了生物学领域的一项重大飞跃。他们利用人工智能系统AlphaFold,预测出超过100万个物种的2.14亿个蛋白质结构,几乎涵盖了地球上所有已知蛋白质。而在前一年,这一研究还入选了《自然》年度十大科学事件。
AI正在融入药物研发各个环节
一款药物从无到有,要历经漫长且坎坷的过程。其中主要包括4个研发阶段,即靶标选择和验证、化合物筛选和先导优化、临床前研究以及临床试验。而每一个阶段又涉及到许多具体环节。
1964年,定量构效关系建模领域的建立成为AI开始用于药物研发的标志。从初期计算机辅助药物设计(CADD),发展到如今的人工智能药物研发(AIDD),人工智能目前几乎参与了从药物靶点发现到临床试验的全流程。
图源:pixabay
比如在靶标选择和验证阶段,需要确定疾病相关的靶标。根据传统实验去确定靶标,既费时成本又高,而使用AI技术并结合已有的组学大数据,根据已知的以及新产生的实验数据,就可以快速分析出潜在候选靶标,节约时间和成本。
在最重要的临床试验阶段,AI的应用也起到了事半功倍的效果。AI可以参与到患者的招募、临床试验设计以及试验结果数据分析等。
一个新药的诞生,通常需投入10亿甚至数10亿美元,研发周期一般超过10年,成功率却低于10%。而由于AI的加入,如今的药物研发成本减少了上亿美元,同时也大大缩短了研发时间,一般来说可以缩短一半以上。根据英伟达公开资料,使用AI技术可使药物早期发现所需时间缩短至1/3,成本节省至1/200。
一款新药是否成功最终还是需要通过上市销售来验证,而AI制药虽然想象空间巨大,但到目前为止尚未有AI技术辅助研发的药物实现上市。
从行业来看,临床AI公司Sensyne Health的濒临倒闭和IBM超级计算机“沃森”引入医疗行业的失败,让人们觉得在开发新药方面,AI还是“太年轻”。
图源:pixabay
从技术层面,AI技术仍在发展中,数据、算法、算力上的突破也需要一定的时间。如数据量不足、数据质量参差不齐,算法精度不高、算法无法满足需求等,都为AI在药物研发和应用上带来了困难。此外,AI制药还面临许多其他挑战。比如生命领域的基础理论研究还有很多没有解决的问题,再比如复合型人才的缺少。
赛迪顾问预计,到2023-2025年,将会有一批AI研发的药物进入素有“死亡之谷”之称临床二期,到2026-2027年才会出现首个上市的AI制药产品。
审核:张宁 策划:李政葳 撰文:李飞 编辑:穆子叶
参考:科技日报、新华网、经济观察报、中国经营报、第一财经、上观新闻、澎湃新闻
更多信息欢迎关注光明网数字化频道