古代蛋白质研究揭示了自然选择是如何在生命本身之前进行的

古代蛋白质研究揭示了自然选择是如何在生命本身之前进行的尽管自然界有数百种不同的氨基酸,但从大肠杆菌到大象,每一种生物体中都能找到20种核心氨基酸。这是因为一切都可以通过复杂的生命树追溯到数十亿年前存在的一个共同祖先。但是这20种特定的氨基酸有什么特别之处呢?找出这一点是由约翰霍普金斯大学和查尔斯大学的科学家共同领导的一项新研究的目标。该团队在实验室中重现了早期地球的条件,包括在生命出现之前非常常见的氨基酸组合。其中一些被认为是在来自太阳的紫外线与当时大气层中的气体相互作用时产生的,而另一些则是搭乘陨石到达的,这些陨石撞击地球的频率比现在更高。在他们的实验中,研究小组观察到一种自然选择过程的发生,即使在没有生命的情况下。古代有机化合物倾向于将最适合将蛋白质折叠成关键功能形状的氨基酸整合到它们的生物化学中,这使这些化合物有更好的机会存活。给它足够的时间,就会有更多的有机化合物具有对生命有利的特性。这项研究的共同负责人斯蒂芬-弗里德说:"蛋白质折叠基本上允许我们在我们星球上出现生命之前就进行进化。可以在有生物学之前就进行进化,也可以在有DNA之前就对那些对生命有用的化学物质进行自然选择。"该研究小组说,这一过程可以帮助解释非生命物质和生物体之间的神秘过渡。一旦第一个极其简单的生命体被激发出来,它们就可以继续进化成数十亿年来曾经生活过的所有其他东西,保存那些"特殊"的氨基酸。弗里德说:"为了实现达尔文意义上的进化,你需要有这种将DNA和RNA等遗传分子变成蛋白质的复杂方式。但是复制DNA也需要蛋白质,所以我们有一个鸡和蛋的问题。我们的研究表明,在达尔文进化论之前,大自然可能已经选择了具有有用特性的构件"。这项研究不只是对地球上的生命有影响--类似的规则也可能适用于其他世界。毕竟,在彗星和小行星中已经检测到了氨基酸,而且似乎在那里相当普遍。"宇宙似乎喜欢氨基酸,"弗里德说。"也许如果我们在一个不同的星球上发现了生命,也不会有什么不同。"这项研究发表在《美国化学学会杂志》上。...PC版:https://www.cnbeta.com.tw/articles/soft/1347121.htm手机版:https://m.cnbeta.com.tw/view/1347121.htm

相关推荐

封面图片

研究人员发现前生物地球上的原始蛋白质是如何形成的

研究人员发现前生物地球上的原始蛋白质是如何形成的以前的研究表明,高碱性蒸发环境是古代蛋白质合成的场所,可产生多达20个单体长的甘氨酸多肽。中性条件被认为是肽合成的最坏情况。富含硼的古代沿海地区可以催化氨基酸的聚合。图片来源:YoshihiroFurukawa在地球上发现的一些最古老的沉积岩中发现了大量的含硼矿物质,其历史可以追溯到38亿年前。这些发现表明,富含硼酸的古代小大陆和岛屿的沿海地区自发地组装了氨基酸,形成了多肽和原蛋白质。东北大学副教授古川义弘说:"多肽在中性环境中的形成对生命起源的化学进化具有重要意义。"RNA在中性条件下相当稳定,但在碱性条件下却极不稳定。众所周知,硼有助于非生物核糖核苷酸合成的许多步骤。"富含硼的中性蒸发环境是前生物地球上两种基本聚合物形成和相互作用的理想场所,"古川说。该研究小组目前正在研究在这种环境中哪些氨基酸被加入到原肽中。...PC版:https://www.cnbeta.com.tw/articles/soft/1371499.htm手机版:https://m.cnbeta.com.tw/view/1371499.htm

封面图片

人工智能技术可从零开始生成原始蛋白质

人工智能技术可从零开始生成原始蛋白质该实验表明,最初为阅读和写作语言文本而创建的自然语言处理人工智能可以掌握生物学的某些基本概念。这个被称为ProGen的AI程序是由SalesforceResearch开发的,它采用了下标预测法,从氨基酸序列中构建人工蛋白质。科学家们说,这项新技术可能会变得比定向进化(诺贝尔奖得主的蛋白质设计技术)更强大,它将通过加快开发新的蛋白质来为有50年历史的蛋白质工程领域注入活力,这些蛋白质几乎可以用于从治疗药物到降解塑料的任何用途。加州大学旧金山分校药学院生物工程和治疗科学教授詹姆斯-弗雷泽博士说:"人工设计的性能比受进化过程启发的设计好得多,"他是这项工作的作者之一,该论文最近发表在《自然-生物技术》上。该论文的前一个版本自2021年7月以来一直在预印本服务器BiorXiv上提供,在那里获得了几十次引用,然后才发表在同行评议的期刊上。"语言模型正在学习进化的各个方面,但它与正常的进化过程不同,"弗雷泽说。"我们现在有能力调整这些属性的生成,以达到特定的效果。例如,一种热稳定性极强的酶或喜欢酸性环境或不会与其他蛋白质相互作用的酶。"为了创建这个模型,科学家们只是将2.8亿种不同的蛋白质的氨基酸序列输入机器学习模型,并让它消化了几周的信息。然后,他们用五个溶菌酶家族的56000个序列以及关于这些蛋白质的一些背景信息对该模型进行了微调。该模型迅速生成了一百万个序列,研究小组根据它们与天然蛋白质序列的相似程度,以及人工智能蛋白质的基础氨基酸"语法"和"语义"的自然程度,选择了100个进行测试。在这第一批由TierraBiosciences公司进行体外筛选的100种蛋白质中,研究小组制作了五种人工蛋白质在细胞中进行测试,并将其活性与鸡蛋白中发现的一种酶进行比较,这种酶被称为鸡蛋白溶菌酶(HEWL)。在人类的眼泪、唾液和牛奶中也有类似的溶菌酶,它们在那里抵御细菌和真菌。其中两种人工酶能够分解细菌的细胞壁,其活性与HEWL相当,但它们的序列彼此之间只有大约18%的相同。这两个序列与任何已知的蛋白质都有大约90%和70%的相同。一个天然蛋白质只要有一个突变就能使其停止工作,但在另一轮筛选中,研究小组发现人工智能生成的酶显示出活性,即使其序列中只有31.4%与任何已知的天然蛋白质相似。人工智能甚至能够学习酶的形状,仅仅通过研究原始序列数据。通过X射线晶体学测量,人造蛋白质的原子结构看起来和它们应该的一样,尽管其序列是以前从未见过的。SalesforceResearch在2020年开发了ProGen,基于他们的研究人员最初开发的一种用于生成英语文本的自然语言编程。他们从以前的工作中知道,人工智能系统可以教自己语法和单词的含义,以及其他使写作有条理的基本规则。"当你用大量数据训练基于序列的模型时,它们在学习结构和规则方面真的很强大,"SalesforceResearch的人工智能研究主任、该论文的资深作者NikhilNaik博士说。"它们可以学习哪些词可以共同出现,也可以学习构成性。"对于蛋白质,设计的选择几乎是无限的。就蛋白质而言,溶酶很小,最多有大约300个氨基酸。但是有20个可能的氨基酸,就有大量的(20300)可能的组合。这比古往今来的所有人类,乘以地球上的沙粒数量,再乘以宇宙中的原子数量还要多。考虑到无限的可能性,该模型能够如此容易地产生工作的酶,这一点非常了不起。ProfluentBio公司的创始人、前SalesforceResearch公司的研究科学家、该论文的第一作者AliMadani博士说:"从零开始生成功能性蛋白质的能力表明,我们正在进入一个蛋白质设计的新时代。"这是一个可供蛋白质工程师使用的多功能新工具,我们期待着看到治疗性应用"。完整的作者和资助名单请见该论文。论文中描述的方法的综合代码库可在https://github.com/salesforce/progen上公开获取。...PC版:https://www.cnbeta.com.tw/articles/soft/1346413.htm手机版:https://m.cnbeta.com.tw/view/1346413.htm

封面图片

合成蛋白质简化了自然界 超越了真实世界的存在

合成蛋白质简化了自然界超越了真实世界的存在尽管存在数百种氨基酸,但自然选择已经挑选了20种在地球上每个生物体中都能找到的氨基酸。这套核心物质组合成数十万种不同的变化,创造出你体内的每一种蛋白质。近年来,科学家们一直在尝试创造人工蛋白质,在治疗阿尔茨海默氏症和疟疾等疾病方面取得了进展。这些通常是通过试图复制自然界在数十亿年中所形成的复杂结构和配方来制造的--但这真的是最有效的方法吗?在加州大学伯克利分校的研究中,科学家们研究了更简单的合成替代品。首先,他们在一个约有6万种天然蛋白质的数据库中训练人工智能系统。然后,人工智能的任务是找出如何从仅有的几个"构件"--目前在塑料中使用的单体--重新创造蛋白质的特定属性和功能。该团队发现,人工智能可以选择正确的单体数量、类型和排列方式,而不是使用天然蛋白质中的所有20个氨基酸,只用两块、四块或六块构件就能重新创造出功能正常的蛋白质。他们把他们的蛋白质替代品称为随机异构聚合物(RHPs)。在一项实验中,研究人员利用RHPs创造了一种人工血浆,这种RHPs被特别设计用来溶解和稳定血液中的天然蛋白质生物标志物。这种液体不仅可以在不冷藏的情况下保存它们,而且还能通过帮助蛋白质在更高的温度下存活,设法改进天然的东西。虽然这听起来像是走捷径会导致劣质产品,但该团队表示,这项技术是为了去除非活性的"垃圾",这些垃圾在经过数十亿年的试验和错误之后在蛋白质中积累起来。该研究的主要作者TingXu说:"大自然并不像我们在实验室里那样做很多自下而上的、分子的、精确驱动的设计。大自然需要灵活性,以达到它的目的。大自然不会说,让我们研究这种病毒的结构并制造一种抗原来攻击它。它要表达一个抗原库,并从那里挑选出一个有效的抗原。"重要的是,人工塑料RHPs与生物系统一起工作,不会造成麻烦。在另一项测试中,研究人员创造了人工细胞液,即细胞内的液体,并发现天然蛋白质生产的核糖体继续照常工作,甚至在人工液体中也是如此。Xu说:"基本上,所有的数据表明,我们可以使用这种设计框架来产生聚合物,以至于生物系统将无法识别它是一种聚合物还是一种蛋白质。我们基本上愚弄了生物学。整个想法是,如果你真的设计它并将你的塑料作为生态系统的一部分注入,它们应该表现得像蛋白质。如果其他蛋白质喜欢,'好吧,你是我们的一部分',那么这就没问题。"虽然还有很多工作要做,但该团队表示,RHPs最终可以帮助制造出更多的生物相容性材料,如植入物,或更好的药物输送系统。该研究发表在《自然》杂志上。...PC版:https://www.cnbeta.com.tw/articles/soft/1350503.htm手机版:https://m.cnbeta.com.tw/view/1350503.htm

封面图片

麻省理工学院的生物学家对重复的蛋白质序列有了新的认识

麻省理工学院的生物学家对重复的蛋白质序列有了新的认识计算分析显示,许多重复序列在不同的蛋白质中是共享的,并且在从细菌到人类的物种中是相似的。大约70%的人类蛋白质包括至少一个由单一氨基酸重复多次组成的序列,其中还夹杂着一些其他氨基酸。这些"低复杂性区域"(LCRs)也存在于大多数其他生物体的蛋白质中。PC版:https://www.cnbeta.com/articles/soft/1325147.htm手机版:https://m.cnbeta.com/view/1325147.htm

封面图片

新研究发现一些植物牛排和冷盘产品营养状况堪忧 糖多蛋白质少

新研究发现一些植物牛排和冷盘产品营养状况堪忧糖多蛋白质少人们首先想到的可能是无肉汉堡或仿牛肉粉,但植物替代品的选择范围已扩大到包括类似牛排和鸡胸肉的整块肉,以及萨拉米香肠或布雷索拉(一种腌牛肉)等冷切片。虽然对这些新产品的研究还没有汉堡类产品那么广泛,但它们正变得越来越普遍,越来越受消费者欢迎。因此,了解它们在营养方面与它们所要复制和替代的肉类有什么不同非常重要。换句话说,我们的身体从这些食物中消化和获取营养的情况如何?图利亚-特德斯基及其同事希望通过比较植物性牛排和冷盘与肉类的蛋白质质量、完整性和可消化性来回答这个问题。肉制品(左上,小牛肉;左下,香肠)往往比植物替代品(右)含有更多的蛋白质和氨基酸。来源:改编自《农业与食品化学杂志》2024期,DOI:10.1021/acs.jafc.3c08956方法和初步结论位于意大利的研究小组收集了三种不同的植物牛排和三种不同的植物冷盘。小牛排作为与植物牛排的比较,而火腿和牛肉冷盘则与各自的植物替代品进行比较。测量了每种食物的脂肪、盐和蛋白质含量,然后在实验室对样品进行模拟消化,以了解蛋白质在人体消化道中的分解情况。与肉类产品相比,植物产品含有更多的碳水化合物、更少的蛋白质和更少的氨基酸。就必需氨基酸含量和消化率而言,植物牛排和小牛肉样品具有可比性。植物冷盘的盐分通常比肉类少,所含的必需氨基酸也较少。不同产品的消化率也因所含成分的不同而有所差异。总体而言,植物性产品的营养价值在很大程度上取决于用于制造这些产品的植物,导致其氨基酸含量和蛋白质消化率差异很大。相比之下,特定肉类中的所有样本都显示出相似的营养成分。研究人员说,这项工作有助于证明,在用植物替代品取代肉类产品时应慎重考虑,并应将这些营养成分的差异告知消费者,以便他们做出明智的决定。编译来源:ScitechDaily...PC版:https://www.cnbeta.com.tw/articles/soft/1428199.htm手机版:https://m.cnbeta.com.tw/view/1428199.htm

封面图片

微软开源新型蛋白质生成人工智能 EvoDiff

微软开源新型蛋白质生成人工智能EvoDiff但是,从计算和人力资源的角度来看,目前在实验室设计蛋白质的过程成本高昂。它需要提出一种能在体内执行特定任务的蛋白质结构,然后找到一种可能"折叠"到该结构中的蛋白质序列(组成蛋白质的氨基酸序列)。(蛋白质必须正确折叠成三维形状,才能实现其预期功能)。其实不一定非要这么复杂。本周,微软公司推出了一个通用框架EvoDiff,该公司声称可以根据蛋白质序列生成"高保真"、"多样化"的蛋白质。与其他蛋白质生成框架不同的是,EvoDiff不需要目标蛋白质的任何结构信息,省去了通常最费力的步骤。微软高级研究员凯文-杨(KevinYang)说,EvoDiff开源后,可用于创建新疗法和给药方法的酶,以及用于工业化学反应的新酶。"我们的设想是,EvoDiff将扩展蛋白质工程的能力,使其超越结构-功能范式,走向可编程、序列优先的设计,"EvoDiff的共同创建者之一杨在接受TechCrunch电子邮件采访时说。"通过EvoDiff,我们证明了我们可能实际上并不需要结构,而是'蛋白质序列就是你所需要的一切',从而可控地设计出新的蛋白质"。EvoDiff框架的核心是一个640参数模型,该模型是根据所有不同物种和功能类别蛋白质的数据训练而成的。(参数"是人工智能模型从训练数据中学到的部分,基本上定义了模型处理问题的技能--在本例中就是生成蛋白质)。训练模型的数据来自序列比对的OpenFold数据集和UniRef50,后者是UniProt数据集的一个子集,UniProt是由UniProt联盟维护的蛋白质序列和功能信息数据库。EvoDiff是一种扩散模型,其结构类似于稳定扩散和DALL-E2等许多现代图像生成模型。EvoDiff可以学习如何从几乎完全由噪声组成的起始蛋白质中逐渐减去噪声,从而使其缓慢地、一步一步地接近蛋白质序列。EvoDiff生成蛋白质的过程。扩散模型已越来越多地应用于图像生成以外的领域,从设计新颖的蛋白质(如EvoDiff),到创作音乐,甚至合成语音。"如果说[从EvoDiff]中能得到什么启发的话,我认为那就是我们可以--也应该--通过序列来生成蛋白质,因为我们能够实现通用性、规模和模块化,"EvoDiff的另一位共同贡献者、微软高级研究员阿瓦-阿米尼(AvaAmini)通过电子邮件说。"我们的扩散框架让我们有能力做到这一点,也让我们能够控制如何设计这些蛋白质,以实现特定的功能目标。"对于阿米尼的观点,EvoDiff不仅能创造新蛋白质,还能填补现有蛋白质设计中的"空白"。例如,如果蛋白质的某一部分与另一种蛋白质结合,该模型就能围绕这一部分生成符合一系列标准的蛋白质氨基酸序列。由于EvoDiff是在"序列空间"而非蛋白质结构中设计蛋白质,因此它还能合成最终无法折叠成最终三维结构的"无序蛋白质"。与正常功能的蛋白质一样,无序蛋白质在生物学和疾病中发挥着重要作用,比如增强或降低其他蛋白质的活性。需要指出的是,EvoDiff背后的研究还没有经过同行评审--至少目前还没有。参与该项目的微软数据科学家萨拉-阿拉姆达里(SarahAlAMDari)承认,在该框架投入商业应用之前,"还有很多扩展工作要做"。阿拉姆达里通过电子邮件说:"这只是一个6.4亿参数的模型,如果我们将其扩展到数十亿参数,我们可能会看到生成质量的提高。虽然我们展示了一些粗粒度策略,但要实现更精细的控制,我们希望EvoDiff以文本、化学信息或其他方式为条件,指定所需的功能。"下一步,EvoDiff团队计划测试该模型在实验室中生成的蛋白质,以确定它们是否可行。如果可行,他们将开始下一代框架的工作。...PC版:https://www.cnbeta.com.tw/articles/soft/1384011.htm手机版:https://m.cnbeta.com.tw/view/1384011.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人