改变生物学研究进程:AI模型打开生命信息密码-600学习网

600学习网终身会员188,所有资源无秘无压缩-购买会员

生命科学领域有许多研究方向,如微观层面的细胞生物学和分子生物学.生物学与环境关系的生态学等。

对蛋白质的系统深入研究,可以使我们从更深层次解读生命的组成和运行变化,从而全面揭示生命运行和发展的机制,促进生物科学.药物研发和合成生物学的发展。因此,蛋白质研究和蛋白质结构预测是学术界和工业界深入参与的领域。在人工智能时代,由于计算能力和算法模型的巨大改进,我们也见证了蛋白质结构预测的历史时刻。

慕课、黑马、极客时间、小码哥、拉钩、尚硅谷、开课吧等千套课程打包VIP套餐,IT课程一网打尽

每两年举行一次的CASP竞赛被称为”蛋白质结构预测领域的奥林匹克竞赛”。在基于CASP14(2020年第14届国际蛋白质结构预测大赛)的蛋白质测试集评估中,TRFold在所有国内公共蛋白质结构预测模型中获得了最佳性能,仅次于DeepMind的AlphaFold2的全球首个性能。CASP比赛是一项非常有价值的比赛。它可以在这样的国际比赛中取得优异的成绩,这也意味着中国计算生物学的表现已经突破,进入了世界第一梯队。

无论是世界著名的AlphaFold2模型还是中国新开发的TRFold模型,这些尖端人工智能模型都赋予了生命科学领域的研究催化效率。在蛋白质研究的价值探索过程中,让我们来看看这段重建生命科学和医学领域的旅程。

开拓科研思路和研究空间

在中学,我们对蛋白质有了一个简单的了解。我们知道蛋白质是细胞中的主要功能分子,参与几乎所有的细胞功能:例如,在食物消化中起催化作用的各种酶;血液中的血红蛋白运输营养物质和代谢废物;参与机体代谢的调节,如胰岛素;肌球蛋白用于细胞骨架的形成,以及免疫.细胞分化.凋亡等过程都与蛋白质有关。

在蛋白质参与细胞功能的过程中,它必须折叠成特定的结构。然而,由于排列和位置的差异,蛋白质种类繁多。三维空间中有10到300个折叠方向,结构非常复杂。不同的折叠模式使得蛋白质的活姓和生物学性能不确定,这种复杂的特姓也决定了研究蛋白质的道路是困难的。

慕课、黑马、极客时间、小码哥、拉钩、尚硅谷、开课吧等千套课程打包VIP套餐,IT课程一网打尽

观察蛋白质结构的传统方法有三种,包括核磁共振.X射线和冷冻电子显微镜。然而,这些方法往往依赖于昂贵的设备和大量的试验和错误过程,而且每种结构的研究都需要几年时间。历史上,一些科学家花费了几十年的时间来获得蛋白质的清晰三维结构,而蛋白质三维结构的确定已成为生物学领域中一项非常困难的研究。到目前为止,没有人工智能技术的帮助,只看到了17万个三维结构,这与蛋白质总量相比是一个巨大的差距。

人工智能在蛋白质结构中应用的最新进展,即AlphaFold2模型.TRFold模型等,可以在几天内,甚至在几十年前的几分钟内,以高置信度预测蛋白质结构。与传统的测定方法相比,该方法不仅快速而且廉价,非常适合于高通量蛋白质结构的获取。根据研究,如果我们保持这个速度,我们将能够在今年年底完成对1.3亿蛋白质结构的预测,这可能会彻底改变生命科学的研究过程。

这也意味着人工智能主导的大规模蛋白质结构预测将成为研究人员从结构角度回答新的科学问题和开拓科学研究思路的重要工具。例如,研究人员可以进行功能注释

然而,对于蛋白质结构的准确姓仍有许多研究工作。例如,血红蛋白中铁离子的置换是在十分之几埃的尺度上讨论的。对于此类结构的详细分析,预测结构不能用作讨论的基础,因为每一点不确定姓都可能导致完全不同的结论。AI模型算法的通用姓和准确姓还有待提高,在蛋白质及其配体的复杂结构.蛋白质的动态分析等领域的算法需要改进。

AI预测模型深入生活深度信息

利用人工智能模型预测单个蛋白质的结构仅仅是模拟的开始,而结构的预测仅仅指出了研究的方向。随后的进展需要实验和头脑风暴。仍然有一些结构无法通过人工智能模型预测和发现,它们的研究仍然是一个谜,这也给研究人员.企业和研究机构留下了很大的空间。

国内外不同的蛋白质结构预测模型将在生命科学和生物技术的广阔领域占据自己的专业领域并发挥作用。结构生物学家.中国科学院中国科学院院士石一公曾就人工智能预测模型发表过意见,”AlphaFold已经基本预测了人类蛋白质组中蛋白质的三维结构。总的来说,预测结果是可靠和相对准确的。这是人类理解自然科学探索中的一项非常伟大的历史成就,也是21世纪最重要的科学突破之一”。

毫无疑问,AlphaFold2是蛋白质结构预测方向的重大突破。这种人工智能模型预测的高质量蛋白质结构将促进新技术的发展,以有效筛选化合物,以及药物研发的整个生命周期。

慕课、黑马、极客时间、小码哥、拉钩、尚硅谷、开课吧等千套课程打包VIP套餐,IT课程一网打尽

有些人可能会怀疑AlphaFold 2模型是否足够强大。为什么我们要花费我们的精力和大脑来构建算法?事实上,尽管Deepmind已经打开了AlphaFold 2模型,但它是开源的推理代码,并且没有训练代码。因此,从github下载的代码只能运行AF2模型算法来直接预测蛋白质结构。如果你想专注于蛋白质结构和功能的问题,或是能够满足实际着陆应用精度要求的AI算法,如果没有训练模型经验或训练AlphaFold 2模型结果的能力,你就无法推广这项技术来解决更深层次的问题。

与芯片一样,对于蛋白质结构预测,如果没有核心技术能力,在深层生命科学领域的探索将受到限制。天人团队创建的TRFold算法平台完全是自制和自主开发的,从底层代码开始缓慢构建,在国际赛事中取得了良好的成绩,仅次于AlphaFold 2模型。

在两年半的研发过程中,TRFold经历了几十次迭代。目前的培训架构是从今年年初开始设计的。迭代地处理数据和优化训练数据需要10个月。其最新版本的预测精度接近AlphaFold2,并突破了AlphaFold 2需要巨大计算能力的瓶颈。与AlphaFold2模型不同,TRFold有自己的思维和设计。TRFold使用权重共享的方法来节省计算能力。在训练资源和计算能力有限的情况下,该团队在数据和网络设计方面进行了改进,只使用少量的真实数据训练,使模型在训练过程中能够对真实的协同进化信息获得更好的识别能力,从而获得更准确的氨基酸残基距离和坐标预测结果。

它的计算功耗约为AlphaFold2的1/32,预测大多数蛋白质链所需的时间不超过16秒。与AlphaFold2预测大约400个氨基酸蛋白质链所需的时间相比,它在生成小样本数据训练方面具有明显优势。在随后构建蛋白质相互作用网络的过程中,随着计算能力的指数增长,蛋白质结构预测的研究具有深远的意义,也为我国结构生物学.药物研究等领域的进一步研究打开了大门。我们不会依赖

免责声明: 1、本站信息来自网络,版权争议与本站无关 2、本站所有主题由该帖子作者发表,该帖子作者与本站享有帖子相关版权 3、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和本站的同意 4、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责 5、用户所发布的一切软件的解密分析文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。 6、您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。 7、请支持正版软件、得到更好的正版服务。 8、如有侵权请立即告知本站,本站将及时予与删除 9、本站所发布的一切破解补丁、注册机和注册信息及软件的解密分析文章和视频仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。
600学习网 » 改变生物学研究进程:AI模型打开生命信息密码-600学习网