“伟哥之父”穆拉德在一次座谈会上讲述其药物开发过程时,这样讲道。这番话让在场的观众惊讶得合不拢嘴,但这确实是药物发现的一个主要方式:偶然发现。

药物发现、生物标志物筛选等环节均是一种苦苦寻觅的过程,要在自然界无数种物质中找到一种能治疗某种特定疾病的物质。大多数情况下,科学家是无限扩大筛选对象以期邂逅目标分子,人们通常利用高通量筛选(HTS)进行筛选,HTS成本十分昂贵,它由机器人自动完成,通过在同一时间进行数以百万计的试验,找出最有潜力达到目标的化合物,提高药物发现的“命中”几率。目前,业界尝试利用人工智能开发虚拟筛选技术,以取代或增强传统的高通量筛选(HTS)过程,并提高筛选的速度和成功率。

那么,AI可用在哪里?具体怎么用呢?

用在哪里?

AI可应用于药物开发的不同环节,包括新药开发、药物有效性/安全性预测、构建新型药物分子、筛选生物标志物、研究新型组合疗法等。

新药有效性、安全性预测

一种物质变成药物,必须要具备安全性、有效性的特征,而在新药研发过程中提前预测,则可以极大程度地提高研发成功率。

Atomwise是药物挖掘与人工智能结合领域比较有代表性的初创公司,其通过IBM超级计算机分析数据库,并用深度学习神经网络分析化合物的构效关系,于药物研发早期评估新药风险。

不仅如此,Atomwise还自己研发了深度学习网络AtomNet,以识别了医药化学中的基础模块,并且声称自己在新药发现、结合亲和力预测和毒性检测上得到了世界上最好的结果。

2015年,公司宣布在寻找埃博拉病毒治疗方案方面有一些进展,在已有药物中,有两种或许能用来抗击埃博拉病毒,找到这两种药物用时仅一周,而用传统药物研发方法寻找则可能要耗费好几年的时间。

目前,Atomwise的商业模式是:为制药公司、创业公司和研究机构提供候选药物预测服务。除此之外,公司与Merck公司和Autodesk也合作进行一些保密项目。

药物挖掘

据了解,药物挖掘是AI应用最早且进展最快的领域。通过计算机模拟,可以对药物活性、安全性和副作用进行预测。

BenevolentAI是英国的一家人工智能公司,公司旨在将人工智能应用于医学研究的庞大数据库以快速筛选和组织数据,并且有一个“小目标”:用AI颠覆整个药物研发过程。

BenevolentAI公司颠覆的具体过程是这样的:

数据分析:通过深度学习和自然语言处理理解和分析大量的生物科学信——专利、基因组数据和所有生物医学期刊和数据库每天上传的10,000多份出版物。

深度学习软件摄取、分析信息,找出关联并提出相应的候选药物,进一步筛选具有对某些特定疾病有效的分子结构,比如可用于神经退行性疾病但没有心脏或肝脏副作用的分子。

2016年11月,强生旗下杨森公司与BenevolentAI达成协议,用后者的人工智能技术评估小分子化合物的临床潜力。据了解,目前BenevolentAI已经获得了一定数量的临床阶段的新药物,以及相关专利的独家许可证。

设计新型药物分子

药物作用于体内特殊部位,有如钥匙与锁的关系,科学家们通常通过研究构效关系或研究靶标生物大分子的结构,进行药物分子设计。

一家位于Baltimore的生物信息公司—— Insilico Medicine,显得与众不同,公司使用了一种较新的深度学习技术:生成式对抗网络(GAN)来构建药物分子。

对此,Insilico公司CEO说道,“不同于通过不断试验试错来寻找先导化合物,你可以告诉这个网络产生这样的化合物分子。”

GANs 通过使用两个竞争神经网络模型,创建不同于真实数据的新数据,生成模型产生“看起来像”真实数据的数据,鉴别模型输入生成数据和真实数据,并且区分他们。生成模型通常用于创建图像、语音或文本,也有公司将其应用于癌症药物开发。

GAN,概率生成模型的目的,就是找出给定观测数据内部的统计规律,并且能够基于所得到的概率分布模型,产生全新的,与观测数据类似的数据。GAN的或者一般概率生成模型的训练目的,就是要使得生成的概率分布和真实数据的分布尽量接近,从而能够解释真实的数据。

据了解,这种用生成对抗网络(Generative Adversarial Networks ,GANs)发展、训练新的分子结构的方法,能大幅度减少寻找有潜在药物特性物质的时间和其他成本。

据了解, Insilico与美国保健品供应商Life Extension合作,帮助后者开发具有新型营养作用的分子结构,并且Insilico公司也与Novartis、Champions Oncology和其他多家合作伙伴密切合作。

筛选生物标志物

生物标志物(Biomarker)是指可以标志系统、器官、组织、细胞及亚细胞结构或功能的改变或可能发生的改变的生化指标。在医学领域,生物标志物可用于疾病诊断(例如前列腺特异性抗原PSA可用于前列腺癌诊断)、判断疾病分期(例如恶性肿瘤的分期)或者用来评价新药或新疗法在目标人群中的安全性及有效性。

2016年10月,美国国防部宣布与生物制药公司“博格健康”合作,利用人工智能技术开展新药研发,以寻找应对现有药物不起反应的侵入性乳腺癌治疗方案,将筛选多达25万个样本来寻找早期癌症的新生物学指标和生物标记。

博格健康有一个人工智能平台,该平台筛选过程是这样的:

研究人员首先将对来自健康供体的样品和各种乳腺癌亚型的样品进行基因测序,从而对存在于癌细胞和正常细胞中的突变、蛋白及细胞过程建立基因组信息。

这些数据将与患者的已知病史结合起来送入人工智能平台,并利用数万个数据点建立起健康及患病组织的不同模型。

该平台的算法最终将找出横跨这些模型的分子签名中的热点。这些热点或可代表生物标记或药物靶点。

新型药物靶点、组合疗法

药物与机体生物大分子的结合部位即药物靶点,而选择确定新颖的有效药靶是新药开发的首要任务。

2016年12月,医药巨头辉瑞与IBM Watson Health签署一个协议:将Watson的超级计算能力用于其研发新型抗癌药中。

辉瑞用到的是其基于云端的人工智能平台:Watson for Drug Discovery,辉瑞的研究人员通过这个工具分析大量孤立的数据来源,包括许可的和公开的可用数据以及公司自己的数据,并且可以验证假设,实时交互得到有证据的结果,用于免疫肿瘤领域新药物靶点的发现、组合疗法的研究和患者治疗策略的选择中。

怎么用?

算法是一系列包含能够帮助人解决问题、完成目标任务的规则的步骤,用正确的方式把这些步骤和规则组织起来,能够自动化算法建立人工智能(AI)。AI能够帮助我们做大量的分析性工作,让我们把时间集中于更有价值的事情。而在药物开发环节,AI(深度学习)能做到的主要有这些:

数据处理:

处理巨大的数据库,利用不同的实验数据,提高多种疾病的预测精度。

寻找生物标志物或药物靶点。

研究特定疾病的疗法等。

生成模型

分析药物构效关系,取代或增强传统的高通量筛选(HTS)过程,并提高筛选的速度和成功率。

“在许多靶点上,它都实现了接近完美的预测质量,使其尤其适合被用作虚拟筛选装置。总之,深度学习提供了建立虚拟筛选并将其作为药物设计管道中标准步骤的机会。”

评估药物副作用:当存在成千上万个化合物都可能对某个疾病显示出某种疗效,评估药物的副作用。

按需构造分子或设计新型药物分子。

传统的药物开发是一个不断试验、不断试错的过程,在这种思路下,药物从最初的实验室研究到最终摆放到药柜销售平均要花费12年时间,需要投入66.145亿元人民币、7000874个小时、6587个实验、423个研究者,最后得到1个药物。

AI助力的药物研发从数据开始,并通过数据生成假定药物,并且显示出更快、更有效率开发新药的潜力。以Atomwise为例,其超级计算机可以在几天之内评估820万种化合物,找到多发性硬化症可能的治疗方法。

2016年底,美国高盛集团发布的人工智能报告:《人工智能、机器学习和数据将推动未来生产力的发展》(AI, Machine Learning and Data Fuel the Future of Productivity)中提到:“随着人工智能和机器学习的不断整合,人们将有望在新药研发的过程中显著地实现“去风险”,不但将节约每年约260亿美元的研发成本,同时还将提高全球医疗信息领域的效率,节约的成本价值超过每年280亿美元。”