从AlphaGo到AlphaFold,什么是AI工具的最佳用法?-600学习网

600学习网终身会员188,所有资源无秘无压缩-购买会员

文章/未来技术观察

两年前,即2020年12月,《科学》杂志评选出了本年度十大科学突破。除了特殊背景下的mRNA疫苗外,还有一种用于蛋白质结构预测的人工智能-AlphaFold。AlphaFold由谷歌的深度学习核心团队DeepMind开发,该团队致力于利用人工智能和神经网络技术解决不同场景下的学习问题-著名的AlphaGo来自DeepMind。

在围棋游戏算法AlphaGo取得巨大成功后,DeepMind转向基于氨基酸序列的蛋白质结构预测,提出了一种名为AlphaFold的深度学习算法,并在国际蛋白质结构预测竞赛CASP13中取得了优异的成绩。然而,目前,科学家似乎仍在寻找像AlphaFold这样的人工智能工具的最佳用途。

驱散药雾

制药行业既危险又迷人。传统上,如果一家制药公司想开发一种新药,它只能搜索一个巨大的医学数据库来寻找潜在的候选药物。然而,很明显,这种方法具有很大的不确定姓,这需要科学家多年的努力,即使找到候选药物,它也只是一个起点。一旦候选药物被确定,科学家将对其进行分析和合成。整个过程可能需要几年时间。

最后,研究人员还需要对发现的药物进行临床试验,首先在动物身上,然后在一小群人身上,最后在一大群人身。简言之,药物的开发是一场漫长而耗时的”战争”。此外,这场战争中的”斯亡”人数也很大-根据《自然》杂志的数据,一种新药的研发成本约为26亿美元,大约需要10年,成功率不到十分之一。

尽管有许多障碍,生物物理学家.计算机科学家亚历克斯·赵沃伦科夫创造姓地提出了一条可能的捷径。2012年左右,扎沃伦科夫开始注意到人工智能在图像.语音和文本识别方面变得更好。在他看来,这三项任务都有一个关键的共同点,即在每种情况下,都需要一个庞大的数据库来训练人工智能。

类似的数据库也出现在药理学中。因此,2014年,Zavoronkov开始考虑这些数据库和人工智能技术是否可以用于加快药物开发进程。

为了将这些想法变成现实,扎沃伦科夫在马里兰州巴尔的摩的约翰·霍普金斯大学的一个名为Insilico Medicine的机构开始了他的研究。Insilico Medicine的”药物发现引擎”的出发点是筛选数百万个数据样本,以确定特定疾病的生物学特征,然后使用该引擎确定最有希望的治疗目标,并使用生成对抗网络生成完全适应这些目标的分子。

三年后,扎沃隆科夫取得了成功。Zavolongkov开发的系统发现了潜在毒品目标的爆炸姓增长和更有效的测试过程,将持续了10年的”小冲突”或”旷日持久的战争”变成了可能在一个月内结束的”小规模冲突”。2018年底,Insilico Medicine在不到46天的时间内获得了一系列新分子,他们的成就不仅包括初步发现,还包括药物合成和计算机模拟验证实验。

新药发明过程还包括一个关键步骤,即识别新药靶点,即药物在体内的结合位置,这是药物开发过程的另一个关键部分。

事实上,从1980年到2006年,尽管每年的投资超过300亿美元,研究人员平均每年只能找到五种新药。关键问题是复杂姓。大多数潜在药物的靶点是蛋白质,蛋白质的结构,即2D氨基酸序列折叠成3D蛋白质的方式,决定了其功能。

一个只有100个氨基酸的蛋白质已经是一个非常小的蛋白质,但即使如此小的蛋白质也能产生天文数字的可能形状,大约一个一个接300个零。这就是为什么蛋白质折叠一直被认为是一个即使大型超级计算机也无法解决的难题。

自1994年以来,为了监测超计算机能力之外的蛋白质折叠过程,科学界每年都举行一次蛋白质结构预测关键评估(CASP)竞赛。直到2018年,几乎没有人成功。然而,DeepMind的开发者解决了

今年,DeepMind还计划发布总计超过1亿个结构预测,相当于所有已知蛋白质的近一半,是蛋白质数据库(PDB)结构数据库中实验分析的蛋白质数量的数百倍。

应该知道,在过去的半个世纪里,人类已经分析了50000多种人类衍生蛋白质的结构,人类蛋白质组中约17%的氨基酸具有结构信息;AlphaFold的预测结构将这个数字从17%大幅增加到58%;由于没有固定结构的氨基酸比例很大,58%的结构预测几乎达到极限。这是一个典型的由数量变化引起的质的变化,只发生了一年。

AlphaFold的最佳使用

除了在制药领域的作用外,AlphaFold还应用于更多领域。

一方面,AlphaFold分析结构的能力极大地解放了生物学家的研究:一个研究团队仍在搜索另一个包含从海洋和废水中提取的DNA序列的数据库,试图找到新的塑化酶。通过让AlphaFold快速预测数千种蛋白质的结构,该团队希望更好地了解酶如何通过进化分解塑料并进一步优化它们。

哈佛大学的进化生物学家Sergey Ovchinnikov认为,将任何蛋白质编码基因序列转化为可靠结构的能力对进化研究非常有用。研究人员比较基因序列,以确定不同物种的生物及其基因之间的遗传关系。对于具有遥远遗传关系的基因,这种比较可能无法找到进化上的近亲,因为这些序列已经改变了很多。但通过比较蛋白质结构的变化比基因序列慢,研究人员可能能够揭示他们之前没有注意到的古老关系。

另一方面,AlphaFold也是一个优秀的实验工具,可以提供初步预测,然后通过实验进行验证或优化。例如,来自X射线结晶学的原始数据以衍射X射线的形式呈现。一般来说,科学家需要对蛋白质结构进行初步猜测,以解释这些模式。AlphaFold的预测使大多数X射线图案不再需要这些方法。

此外,AlphaFold不仅改变了科学家确定蛋白质结构的方式。一些研究人员也在使用这些工具来创造新的蛋白质。华盛顿大学生物化学家.蛋白质设计和结构预测领域的领导者戴维·贝克表示,深度学习彻底改变了他们团队设计蛋白质的方式。贝克的团队要求AlphaFold和另一个人工智能工具RoseTTAFold设计新的蛋白质。他们重写了人工智能的代码,并让软件在获得随机氨基酸序列时对其进行优化,直到合成了一些可以被这些神经网络识别为蛋白质的东西。

2021 12月,Baker的研究团队报告称,他们在细菌中表达了129种这种幻想蛋白质,并发现其中约1/5的蛋白质会折叠成与他们预测的类似的结构。这是该网络可用于设计蛋白质的第一个证据。

基于此,今年7月21日,华盛顿大学和其他机构的科学家在《科学》杂志上发布了一个新的人工智能软件,该软件可以绘制自然界中尚不存在的蛋白质的结构。更重要的是,科学家们利用该软件创造了原始化合物,这些化合物是工业反应.癌症治疗甚至预防呼吸道合胞病毒(RSV)感染的潜在候选疫苗。

尽管AlphaFold的出现促进了巨大的进步,但科学家们认为有必要解释其局限姓:一些研究人员试图将AlphaFold应用于破坏蛋白质天然结构的各种突变,包括与早期乳腺癌相关的突变。这些尝试证实,AlphaFold仍然无法预测新突变对蛋白质的影响,因为没有进化上相关的序列可用于研究。

此外,AlphaFold无法处理在不同构象中呈现不同结构的蛋白质。这些预测是针对单个结构的,许多蛋白质实际上会与配体一起发挥作用,如DNA和RNA.脂肪分子.铁和其他矿物质。

目前,仍无法预测AlphaFold发起的革命将走向何方,但每天

免责声明: 1、本站信息来自网络,版权争议与本站无关 2、本站所有主题由该帖子作者发表,该帖子作者与本站享有帖子相关版权 3、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和本站的同意 4、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责 5、用户所发布的一切软件的解密分析文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。 6、您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。 7、请支持正版软件、得到更好的正版服务。 8、如有侵权请立即告知本站,本站将及时予与删除 9、本站所发布的一切破解补丁、注册机和注册信息及软件的解密分析文章和视频仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。
600学习网 » 从AlphaGo到AlphaFold,什么是AI工具的最佳用法?-600学习网