David Baker团队又一突破:首次利用生成式AI设计出全新抗体

DavidBaker团队又一突破:首次利用生成式AI设计出全新抗体据Nature报道,这一工作提出了将人工智能驱动的蛋白质设计带入价值数千亿美元的治疗性抗体市场的可能性。抗体与流感病毒蛋白结合(来源:JuanGaertner/SciencePhotoLibrary)相关研究论文以“Atomicallyaccuratedenovodesignofsingle-domainantibodies”为题,已发表在预印本网站bioRxiv上。英国牛津大学免疫信息学家CharlotteDeane评价道:“这是一项非常有前景的研究,它代表了将人工智能蛋白质设计工具应用于制造新抗体的重要一步。”让抗体设计更快、更容易抗体是一种免疫分子,能强力附着在与疾病相关的蛋白质上,传统的制造方法包括对动物进行免疫实验或对大量分子进行筛选,昂贵且费时。该论文的共同第一作者、华盛顿大学计算生物化学家NathanielBennett认为,能够缩短这些昂贵的人工智能工具有可能“使设计抗体的能力民主化”。在这项工作中,研究团队利用RFdiffusion和RoseTTAFold2网络,通过计算机模拟和实验验证,成功设计出了全新的抗体VHH(单域抗体;VariableHeavy-chainofHeavy-chainantibodies)。在整个设计过程中,研究团队充分考虑了抗体与靶标之间的相互作用,力求达到最优的结合效果。据论文描述,RFdiffusion和RoseTTAFold2网络在抗体设计中扮演了至关重要的角色,实现了抗体结构的设计和预测,为全新抗体的生成提供了基础。其中,RFdiffusion网络主要用于设计全新的抗体结构,特别是针对特定的抗原表位。它可以根据用户指定的抗原表位,设计出具有结合能力的抗体结构。基于AlphaFold2/RF2的蛋白质骨架,RFdiffusion网络使用一系列训练过程来进行蛋白质结构的预测和优化。在训练过程中,该网络通过一系列步骤对蛋白质结构进行噪声处理,并预测去噪后的结构。这些步骤使网络能够学习并优化抗体结构,从而适应特定的抗原表位。通过训练和优化过程,该网络能够生成具有高结合亲和力的抗体结构,从而实现对特定抗原的识别和结合。用于抗体设计的RFdiffusion概述(来源:该论文)RoseTTAFold2网络则主要用于预测抗体结构,特别是在抗体-抗原复合物中的抗体结构。它能够帮助验证设计的抗体结构与抗原的结合模式是否符合预期。基于Transformer神经网络架构,RoseTTAFold2网络使用大量的蛋白质结构数据进行训练。它通过对蛋白质序列进行序列到序列的预测,从而得到全新的蛋白质3D结构。经过微调的RoseTTAFold2能够区分真正的复合物和诱饵复合物(来源:该论文)微调后的RoseTTAFold2与IgFold在抗体单体预测方面的比较(来源:该论文)通过对设计的抗体结构进行预测,研究团队可以更好地了解抗体与抗原之间的相互作用,并验证设计的合理性和有效性。整体上,通过设计和预测抗体结构,RFdiffusion和RoseTTAFold2网络为全新抗体的创新和验证提供了重要支持。人工智能设计的抗体,能用吗?利用这种方法,研究团队设计出了数千种抗体,这些抗体能识别几种细菌和病毒蛋白质(比如流感病毒用来入侵细胞的蛋白质)的特定区域以及一种抗癌药物靶标。然后,他们在实验室中制作了这些设计的一个子集,并测试了这些分子是否能与正确的靶点结合,进而验证了抗体卓越的有效性。例如,表面等离子共振(SPR)等技术,可以验证VHH与目标抗原的结合能力。实验结果显示,设计的VHH能够与目标抗原特异性结合,并表现出一定的结合亲和力。另外,X射线晶体学或/和冷冻电镜技术,可以解析VHH与目标抗原的复合物结构。结构解析结果显示,设计的VHH与目标抗原形成特定的结合模式,VHH的关键残基与抗原表位发生特异性相互作用,进一步证明了设计的抗体具有与目标抗原结合的能力。最后,通过SPR等技术,研究团队对VHH与目标抗原的结合亲和力进行了验证。结果显示,设计的VHH与目标抗原之间存在一定的结合亲和力,其亲和力值反映了两者之间的结合强度和稳定性。以上这些结果,为设计的抗体的进一步应用和开发提供了重要的实验基础和支持。然而,该研究也存在一些局限性。首先,设计的VHH在结合亲和力和特异性方面仍有待进一步优化和提高;其次,设计的VHH主要针对单一抗原进行了验证,对于多种抗原或复杂疾病的治疗效果尚待验证;另外,抗体的免疫原性、稳定性和生产成本等方面也需要进一步研究和解决。蛋白质设计,充满无限可能近年来,DavidBaker团队一直致力于蛋白质设计研究,且成果显著。图DavidBaker2021年8月,团队研发出了一款完全免费的、新的深度学习工具RoseTTAFold,不仅拥有媲美AlphaFold2的蛋白质结构预测超高准确度,而且更快、所需计算机处理能力更低。2021年11月,团队进一步将AlphaFold2与RoseTTAFold相结合,成功用于蛋白质-蛋白质复合物结构的预测。去年4月,他们在一篇发表在Science上的论文中,介绍了如何利用强化学习设计新型蛋白质设计软件,由该方法合成的蛋白质能更有效地在小鼠体内产生有用抗体。他们称,这一突破将会在疫苗领域有所贡献。去年7月,他们开发了一个人工智能蛋白质结构预测系统RoseTTAFold,称可与AlphaFold媲美,不仅可以预测蛋白质结构,还能预测蛋白复合物结构。随后,他们也公开了RFdiffusion的云版本,将定制蛋白质带入了主流科研界。去年12月,团队在Nature上发表论文,展示了人工智能技术能够从头设计高亲和力的蛋白,这让科学家们更有可能创造出更便宜的抗体替代品,用于疾病检测和治疗。一项好的科学研究,不仅需要过硬的技术,也同样需要丰富的想象力。未来,抗体及蛋白质设计领域或将充满着无限可能,为人类健康和医学治疗带来新的希望。参考链接:https://www.biorxiv.org/content/10.1101/2024.03.14.585103v1https://www.nature.com/articles/d41586-024-00846-7...PC版:https://www.cnbeta.com.tw/articles/soft/1424679.htm手机版:https://m.cnbeta.com.tw/view/1424679.htm

相关推荐

封面图片

MIT的 "FrameDiff" 生成式AI想象出可能改变医学的新蛋白质结构

MIT的"FrameDiff"生成式AI想象出可能改变医学的新蛋白质结构FrameDiff系统在构建单个蛋白质的任务中进行了测试,研究人员发现它可以构建多达500个部分的大蛋白质。与以前的方法不同,它不需要依赖预先存在的蛋白质结构图。图片来源:AlexShipps/MITCSAILviaMidjourney试想一下,如果我们能够加快针对新出现的病原体制造疫苗或药物的进程,那将会怎样?如果我们的基因编辑技术能够自动生成蛋白质,纠正导致癌症的DNA错误,那将会怎样?寻找能够与靶标强结合或加速化学反应的蛋白质对于药物开发、诊断和众多工业应用至关重要,但这往往是一项旷日持久且成本高昂的工作。为了提高我们在蛋白质工程方面的能力,麻省理工学院CSAIL的研究人员发明了"FrameDiff",这是一种用于创建超越自然界的新蛋白质结构的计算工具。这种机器学习方法生成的"框架"符合蛋白质结构的固有特性,使其能够独立于已有的设计构建新型蛋白质,从而实现前所未有的蛋白质结构。在自然界中,蛋白质设计是一个缓慢的过程,需要数百万年的时间。麻省理工学院CSAIL博士生JasonYim说:"我们的技术旨在为解决比自然界发展速度更快的人类问题提供答案。我们的目标是利用这种新的能力生成合成蛋白质结构,从而提高各种能力,例如更好的粘合剂。这意味着工程蛋白质可以更有效、更有选择性地附着在其他分子上,对靶向给药和生物技术有着广泛的影响,它可能发展出更好的生物传感器的开发。它还可能对生物医学领域及其他领域产生影响,如开发更高效的光合作用蛋白、创造更有效的抗体以及用于基因治疗的纳米粒子工程等。"框架结构蛋白质结构复杂,由许多原子通过化学键连接而成。决定蛋白质三维形状的最重要原子被称为"骨架",有点像蛋白质的脊柱。骨架上的每个原子三元组都具有相同的化学键模式和原子类型。研究人员注意到,这种模式可以利用微分几何和概率的思想来构建机器学习算法。这就是框架的作用所在:从数学上讲,这些三元组可以被建模为刚体,称为"框架"(物理学中常见的),在三维空间中具有位置和旋转。这些框架为每个三元组提供了足够的信息,使其能够了解周围的空间环境。机器学习算法的任务是学习如何移动每个框架来构建蛋白质骨架。通过学习构建现有的蛋白质,该算法有望推广并能够创造出自然界中从未见过的新蛋白质。通过"扩散"训练构建蛋白质的模型需要注入噪音,随机移动所有帧,模糊原始蛋白质的样子。算法的工作就是移动和旋转每一帧,直到它看起来像原始蛋白质。虽然简单,但帧上扩散的开发需要黎曼流形上随机微积分的技术。在理论方面,研究人员开发了用于学习概率分布的"SE(3)扩散",它将每个帧的平移和旋转部分非难连接起来。微妙的扩散艺术2021年,DeepMind推出了AlphaFold2,这是一种深度学习算法,用于从序列预测三维蛋白质结构。在创建合成蛋白质时,有两个基本步骤:生成和预测。生成"是指创建新的蛋白质结构和序列,而"预测"是指找出序列的三维结构。AlphaFold2也使用框架来建立蛋白质模型,这并非巧合。SE(3)扩散和FrameDiff的灵感来自于将框架纳入扩散模型,从而进一步发展了框架的概念,这种生成式人工智能技术已经在图像生成领域大受欢迎,例如Midjourney。蛋白质结构生成和预测之间共享的框架和原理意味着两端的最佳模型是兼容的。在与华盛顿大学蛋白质设计研究所的合作中,SE(3)扩散已被用于创建和实验验证新型蛋白质。具体来说,他们将SE(3)扩散与RosettaFold2结合起来,RosettaFold2是一种蛋白质结构预测工具,与AlphaFold2很相似,从而产生了"RFdiffusion"。这一新工具使蛋白质设计人员更接近于解决生物技术中的关键问题,包括开发用于加速疫苗设计的高特异性蛋白质结合剂、用于基因传递的对称蛋白质工程以及用于精确酶设计的稳健主题支架。FrameDiff未来的工作包括提高通用性,以解决药物等生物制剂的多种需求相结合的问题。另一个扩展是将模型推广到包括DNA和小分子在内的所有生物模式。研究小组认为,通过在更多的数据上扩大FrameDiff的训练并加强其优化过程,它可以生成与RFdiffusion具有同等设计能力的基础结构,同时保持FrameDiff固有的简单性。哈佛大学计算生物学家谢尔盖-奥夫钦尼科夫(SergeyOvchinnikov)说:"摒弃[FrameDiff]中的预训练结构预测模型为快速生成大长度结构提供了可能性。研究人员的创新方法为克服当前结构预测模型的局限性迈出了可喜的一步。尽管这仍是一项初步工作,但它在正确的方向上迈出了令人鼓舞的一步。因此,得益于麻省理工学院研究团队的开拓性工作,蛋白质设计在解决人类最紧迫挑战中发挥关键作用的愿景似乎越来越触手可及。"Yim与哥伦比亚大学博士后BrianTrippe、法国巴黎国家科学研究中心数据科学中心研究员ValentinDeBortoli、剑桥大学博士后EmileMathieu、牛津大学统计学教授兼DeepMind高级研究科学家ArnaudDoucet共同撰写了这篇论文。麻省理工学院教授ReginaBarzilay和TommiJaakkola为这项研究提供了建议。该团队的工作部分得到了麻省理工学院AbdulLatifJameelClinicforMachineLearninginHealth、EPSRC基金和微软研究院与剑桥大学之间的繁荣合作项目、美国国家科学基金会研究生研究奖学金项目、美国国家科学基金会Expeditions基金、机器学习促进药物发现和合成联盟、DTRA发现应对新威胁和新兴威胁的医疗对策项目、DARPA加速分子发现项目和赛诺菲计算抗体设计基金的支持。这项研究将在7月举行的国际机器学习大会上发表。...PC版:https://www.cnbeta.com.tw/articles/soft/1370909.htm手机版:https://m.cnbeta.com.tw/view/1370909.htm

封面图片

DNA诱饵在突破性疫苗方法中战胜病毒

DNA诱饵在突破性疫苗方法中战胜病毒这种疫苗已在小鼠身上进行了试验,它由一个DNA支架组成,支架上有许多病毒抗原的拷贝。这种疫苗被称为微粒疫苗,模仿病毒的结构。以前大多数微粒疫苗的研究工作都依赖于蛋白质支架,但这些疫苗中使用的蛋白质往往会产生不必要的免疫反应,从而分散免疫系统对目标的注意力。在小鼠研究中,研究人员发现DNA支架不会诱发免疫反应,从而使免疫系统能够将抗体反应集中在目标抗原上。麻省理工学院生物工程学教授马克-巴特(MarkBathe)说:"我们在这项工作中发现,DNA不会诱发抗体,以免分散对相关蛋白质的注意力。可以想象的是,B细胞和免疫系统正在接受目标抗原的全面训练,而这正是你想要的--让免疫系统激光聚焦于感兴趣的抗原。"研究人员说,这种能强烈刺激B细胞(产生抗体的细胞)的方法能让人们更容易开发出针对艾滋病、流感以及SARS-CoV-2等难以针对的病毒的疫苗。与受到其它类型疫苗刺激的T细胞不同,这些B细胞可以持续数十年,提供长期保护。哈佛大学医学院副教授、拉贡研究所首席研究员丹尼尔-凌伍德说:"我们有兴趣探索是否能让免疫系统产生更高水平的免疫力,以抵御流感、艾滋病毒和SARS-CoV-2等传统疫苗方法所抵御的病原体。这种将针对目标抗原的反应与平台本身脱钩的想法是一种潜在的强大免疫学技巧,现在我们可以利用它来帮助这些免疫学靶向决策朝着更有针对性的方向发展"。Bathe、Lingwood和哈佛大学医学院副教授、拉贡研究所首席研究员亚伦-施密特(AaronSchmidt)是这篇论文的资深作者,论文今天(1月30日)发表在《自然-通讯》(NatureCommunications)杂志上。论文的主要作者包括麻省理工学院前博士后艾克-克里斯蒂安-瓦姆霍夫、拉贡研究所博士后拉兰斯-隆萨、哈佛大学前研究生贾里德-费尔德曼、麻省理工学院研究生格兰特-克纳普和哈佛大学前研究生布莱克-豪瑟。微粒疫苗通常由一种蛋白质纳米粒子组成,其结构与病毒相似,可携带许多病毒抗原拷贝。这种高密度的抗原能产生比传统疫苗更强的免疫反应,因为人体认为它与真正的病毒相似。目前已开发出针对乙型肝炎和人类乳头瘤病毒等少数病原体的微粒疫苗,而针对SARS-CoV-2的微粒疫苗也已获准在韩国使用。这些疫苗尤其擅长激活B细胞,使其产生针对疫苗抗原的特异性抗体。Bathe说:"免疫学领域的许多人都对微粒疫苗非常感兴趣,因为它们能产生强大的体液免疫,也就是基于抗体的免疫,它有别于基于T细胞的免疫,而mRNA疫苗似乎能更强烈地激发T细胞免疫。"不过,这种疫苗的一个潜在缺点是,用于支架的蛋白质通常会刺激人体产生针对支架的抗体。巴特说,这会分散免疫系统的注意力,使其无法如愿启动强有力的反应。他说:"中和SARS-CoV-2病毒需要一种疫苗以产生针对病毒尖峰蛋白受体结合域部分的抗体。当在基于蛋白质的微粒上显示这种抗体时,免疫系统不仅能识别受体结合域蛋白质,还能识别与试图引起的免疫反应无关的所有其他蛋白质。"另一个潜在的缺点是,如果同一个人接种了不止一种由相同蛋白支架携带的疫苗,例如接种了SARS-CoV-2疫苗,然后又接种了流感疫苗,那么他们的免疫系统很可能会立即对蛋白支架产生反应,因为他们已经做好了对蛋白支架产生反应的准备。这可能会削弱对第二种疫苗所含抗原的免疫反应。Bathe说:"如果想应用这种基于蛋白质的微粒来免疫不同的病毒(如流感),那么免疫系统就会沉迷于它已经看到并产生免疫反应的底层蛋白质支架。这可能会降低机体对实际抗原的抗体反应质量。"作为一种替代方法,Bathe的实验室一直在开发使用DNA折纸制作的支架,这种方法可以精确控制合成DNA的结构,并允许研究人员在特定位置附着各种分子,如病毒抗原。在2020年的一项研究中,巴特和麻省理工学院生物工程及材料科学与工程教授达雷尔-欧文(DarrellIrvine)发现,携带30个艾滋病毒抗原拷贝的DNA支架可以在实验室培育的B细胞中产生强烈的抗体反应。这种结构是激活B细胞的最佳选择,因为它与纳米级病毒的结构非常相似,而纳米级病毒的表面会显示许多病毒蛋白的拷贝。Lingwood说:"这种方法建立在B细胞抗原识别的基本原理基础之上,即如果对抗原进行阵列显示,就能促进B细胞的反应,提高抗体输出的数量和质量。"在新的研究中,研究人员换用了由SARS-CoV-2原始菌株中尖峰蛋白的受体结合蛋白组成的抗原。在给小鼠注射疫苗时,他们发现小鼠对尖峰蛋白产生了高水平的抗体,但对DNA支架却没有产生任何抗体。与此相反,以一种名为铁蛋白的支架蛋白为基础、涂有SARS-CoV-2抗原的疫苗产生了许多针对铁蛋白和SARS-CoV-2的抗体。"DNA纳米粒子本身没有免疫原性,"Lingwood说。"使用基于蛋白质的平台会对平台和感兴趣的抗原产生同样高滴度的抗体反应,这会使重复使用该平台变得复杂,因为身体会对它产生高亲和力的免疫记忆"。减少这些脱靶效应还有助于科学家们实现开发一种疫苗的目标,这种疫苗可以诱导针对任何变异的SARS-CoV-2甚至所有冠状病毒的广泛中和抗体,而冠状病毒是包括SARS-CoV-2以及导致SARS和MERS的病毒在内的病毒亚属。为此,研究人员正在探索一种附有多种不同病毒抗原的DNA支架能否诱导出针对SARS-CoV-2和相关病毒的广泛中和抗体。编译来源:ScitechDaily...PC版:https://www.cnbeta.com.tw/articles/soft/1415109.htm手机版:https://m.cnbeta.com.tw/view/1415109.htm

封面图片

DeepMind最新AlphaFold模型有助于新药研发

DeepMind最新AlphaFold模型有助于新药研发实验室的工作仍在继续。今天,DeepMind透露,最新版本的AlphaFold(AlphaFold2的后继者)可以对蛋白质数据库(世界上最大的生物分子开放获取数据库)中的几乎所有分子生成预测。据DeepMind博客上的一篇文章称,专注于药物发现的DeepMind衍生公司IsomorphicLabs已经将新的AlphaFold模型应用于治疗药物设计,帮助表征对治疗疾病很重要的不同类型的分子结构。新的AlphaFold的功能超出了蛋白质预测的范围。DeepMind声称,该模型还可以准确预测配体的结构-与“受体”蛋白结合并导致细胞通讯方式发生变化的分子)以及核酸(包含关键遗传信息的分子)和翻译后修饰(化学修饰)的结构。蛋白质产生后发生的变化。DeepMind指出,预测蛋白质配体结构可以成为药物发现的有用工具,因为它可以帮助科学家识别和设计可能成为药物的新分子。目前,药物研究人员使用称为“对接方法”的计算机模拟来确定蛋白质和配体如何相互作用。对接方法需要指定参考蛋白质结构以及该结构上配体结合的建议位置。然而,使用最新的AlphaFold,无需使用参考蛋白质结构或建议位置。该模型可以预测以前尚未“结构表征”的蛋白质,同时模拟蛋白质和核酸如何与其他分子相互作用——DeepMind表示,目前的对接方法无法实现这种建模水平。DeepMind在博文中写道:“早期分析还表明,我们的模型在一些与药物发现相关的蛋白质结构预测问题(例如抗体结合)上远远优于(上一代)AlphaFold。我们的模型在性能上的巨大飞跃表明人工智能具有极大增强对构成人体的分子机器的科学理解的潜力。”不过,最新的AlphaFold并不完美。DeepMind和IsomorphicLabs的研究人员在一份详细介绍该系统优势和局限性的白皮书中透露,该系统无法达到预测RNA分子(人体内携带制造蛋白质指令的分子)结构的一流方法。毫无疑问,DeepMind和IsomorphicLabs都在努力解决这个问题。...PC版:https://www.cnbeta.com.tw/articles/soft/1393483.htm手机版:https://m.cnbeta.com.tw/view/1393483.htm

封面图片

百度抗原抗体结构预测模型效果远超 AlphaFold3

百度抗原抗体结构预测模型效果远超AlphaFold3据百度AI,在抗体药物和多肽药物研发领域,抗原抗体和多肽蛋白复合体结构预测都发挥着至关重要的指引性作用,其准确性对后续的研究至关重要。但从目前的计算方法看,无论是基于物理方法的能量函数工具,还是基于深度神经网络的方法,包括最近DeepMind更新的AlphaFold3等,在抗原抗体和蛋白多肽复合体的结构预测精度上,仍有较大的提升空间。针对这一挑战,百度飞桨螺旋桨PaddleHelix团队研发出HelixFold-Multimer模型,通过在数据,网络结构及训练手段等多方面的优化,在抗原抗体/多肽蛋白复合体结构预测任务上,均达到业界领先。与现有方法比较,HelixFold-Multimer在DockQ和成功率两个核心关键指标上,远超同类方法,也包括最新发布的AlphaFold3。

封面图片

模拟病毒的DNA粒子可提供无免疫副作用的疫苗

模拟病毒的DNA粒子可提供无免疫副作用的疫苗DNA粒子制成的疫苗递送平台避免了使用蛋白质粒子时出现的脱靶效应巴特实验室/麻省理工学院微粒疫苗通常是由携带许多病毒抗原拷贝的蛋白型病毒微粒支架制成。由于它们模拟天然病毒,因此与传统疫苗相比,这些疫苗能产生更强的免疫反应。它们能激活B细胞,使其产生针对所传递抗原的特异性抗体。不过,微粒疫苗的一个潜在缺点是,蛋白质支架会刺激产生针对它和它所携带的抗原(也是一种蛋白质)的抗体,从而降低免疫系统对抗原的反应强度。此外,由于机体会产生针对蛋白质平台的抗体,这就限制了它今后作为疫苗载体的使用,即使是用于不同的病毒。现在,麻省理工学院的研究人员开发出了一种基于DNA的支架,可以避免这一问题,确保免疫系统只对抗原而不是平台做出反应。该研究的通讯作者之一丹尼尔-凌伍德说:"DNA纳米粒子本身没有免疫原性。如果使用基于蛋白质的平台,你会对平台和感兴趣的抗原产生同样高级别的抗体反应,这会使重复使用该平台变得复杂,因为机体会对它产生高亲和力的免疫记忆"。为了制作支架,研究人员采用了他们以前使用过的"DNA折纸"技术,即折叠DNA,使其模仿病毒的结构。这种技术可以在特定位置附着各种分子,如病毒抗原。将SARS-CoV-2穗状病毒蛋白的受体结合部分附着在DNA支架上后,他们在小鼠身上进行了测试。他们发现,小鼠并没有像使用蛋白质支架时那样对支架产生抗体,只是对SARS-CoV-2产生了抗体。另一位通讯作者马克-巴特(MarkBathe)说:"我们在这项研究中发现,DNA不会诱发抗体,从而分散对相关蛋白质的注意力。你可以想象,你的B细胞和免疫系统正在接受目标抗原的全面训练,而这正是你想要的--让你的免疫系统激光聚焦于感兴趣的抗原。"与其他类型疫苗刺激的T细胞不同,B细胞可以持续数十年,提供长期保护。Bathe说:"免疫学领域的许多人都对微粒疫苗非常感兴趣,因为它们能产生强大的体液免疫,也就是基于抗体的免疫,它有别于基于T细胞的免疫,而mRNA疫苗似乎能更强烈地激发T细胞免疫。"研究结果表明,DNA支架是基于蛋白质的平台的有效替代品,但不会产生脱靶效应,研究人员目前正在探索是否可以利用它同时传递不同的病毒抗原,以提供对一系列病毒的保护。Lingwood说:"我们有兴趣探索是否能让免疫系统产生更高水平的免疫力,以抵御流感、艾滋病毒和SARS-CoV-2等传统疫苗方法所抵御的病原体。这项研究发表在《自然通讯》杂志上。...PC版:https://www.cnbeta.com.tw/articles/soft/1415563.htm手机版:https://m.cnbeta.com.tw/view/1415563.htm

封面图片

微软开源新型蛋白质生成人工智能 EvoDiff

微软开源新型蛋白质生成人工智能EvoDiff但是,从计算和人力资源的角度来看,目前在实验室设计蛋白质的过程成本高昂。它需要提出一种能在体内执行特定任务的蛋白质结构,然后找到一种可能"折叠"到该结构中的蛋白质序列(组成蛋白质的氨基酸序列)。(蛋白质必须正确折叠成三维形状,才能实现其预期功能)。其实不一定非要这么复杂。本周,微软公司推出了一个通用框架EvoDiff,该公司声称可以根据蛋白质序列生成"高保真"、"多样化"的蛋白质。与其他蛋白质生成框架不同的是,EvoDiff不需要目标蛋白质的任何结构信息,省去了通常最费力的步骤。微软高级研究员凯文-杨(KevinYang)说,EvoDiff开源后,可用于创建新疗法和给药方法的酶,以及用于工业化学反应的新酶。"我们的设想是,EvoDiff将扩展蛋白质工程的能力,使其超越结构-功能范式,走向可编程、序列优先的设计,"EvoDiff的共同创建者之一杨在接受TechCrunch电子邮件采访时说。"通过EvoDiff,我们证明了我们可能实际上并不需要结构,而是'蛋白质序列就是你所需要的一切',从而可控地设计出新的蛋白质"。EvoDiff框架的核心是一个640参数模型,该模型是根据所有不同物种和功能类别蛋白质的数据训练而成的。(参数"是人工智能模型从训练数据中学到的部分,基本上定义了模型处理问题的技能--在本例中就是生成蛋白质)。训练模型的数据来自序列比对的OpenFold数据集和UniRef50,后者是UniProt数据集的一个子集,UniProt是由UniProt联盟维护的蛋白质序列和功能信息数据库。EvoDiff是一种扩散模型,其结构类似于稳定扩散和DALL-E2等许多现代图像生成模型。EvoDiff可以学习如何从几乎完全由噪声组成的起始蛋白质中逐渐减去噪声,从而使其缓慢地、一步一步地接近蛋白质序列。EvoDiff生成蛋白质的过程。扩散模型已越来越多地应用于图像生成以外的领域,从设计新颖的蛋白质(如EvoDiff),到创作音乐,甚至合成语音。"如果说[从EvoDiff]中能得到什么启发的话,我认为那就是我们可以--也应该--通过序列来生成蛋白质,因为我们能够实现通用性、规模和模块化,"EvoDiff的另一位共同贡献者、微软高级研究员阿瓦-阿米尼(AvaAmini)通过电子邮件说。"我们的扩散框架让我们有能力做到这一点,也让我们能够控制如何设计这些蛋白质,以实现特定的功能目标。"对于阿米尼的观点,EvoDiff不仅能创造新蛋白质,还能填补现有蛋白质设计中的"空白"。例如,如果蛋白质的某一部分与另一种蛋白质结合,该模型就能围绕这一部分生成符合一系列标准的蛋白质氨基酸序列。由于EvoDiff是在"序列空间"而非蛋白质结构中设计蛋白质,因此它还能合成最终无法折叠成最终三维结构的"无序蛋白质"。与正常功能的蛋白质一样,无序蛋白质在生物学和疾病中发挥着重要作用,比如增强或降低其他蛋白质的活性。需要指出的是,EvoDiff背后的研究还没有经过同行评审--至少目前还没有。参与该项目的微软数据科学家萨拉-阿拉姆达里(SarahAlAMDari)承认,在该框架投入商业应用之前,"还有很多扩展工作要做"。阿拉姆达里通过电子邮件说:"这只是一个6.4亿参数的模型,如果我们将其扩展到数十亿参数,我们可能会看到生成质量的提高。虽然我们展示了一些粗粒度策略,但要实现更精细的控制,我们希望EvoDiff以文本、化学信息或其他方式为条件,指定所需的功能。"下一步,EvoDiff团队计划测试该模型在实验室中生成的蛋白质,以确定它们是否可行。如果可行,他们将开始下一代框架的工作。...PC版:https://www.cnbeta.com.tw/articles/soft/1384011.htm手机版:https://m.cnbeta.com.tw/view/1384011.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人