麻省理工学院的生物学家对重复的蛋白质序列有了新的认识

麻省理工学院的生物学家对重复的蛋白质序列有了新的认识计算分析显示,许多重复序列在不同的蛋白质中是共享的,并且在从细菌到人类的物种中是相似的。大约70%的人类蛋白质包括至少一个由单一氨基酸重复多次组成的序列,其中还夹杂着一些其他氨基酸。这些"低复杂性区域"(LCRs)也存在于大多数其他生物体的蛋白质中。PC版:https://www.cnbeta.com/articles/soft/1325147.htm手机版:https://m.cnbeta.com/view/1325147.htm

相关推荐

封面图片

麻省理工学院的化学家们发现光合作用的光线采集为何如此高效

麻省理工学院的化学家们发现光合作用的光线采集为何如此高效麻省理工学院的研究人员发现,光收集复合体中的蛋白质的无序排列增强了其能量转移效率,推翻了有序结构更有效率的假设。这一发现表明,这种混乱的排列可能不是偶然的,而是一种有目的的进化,以实现效率的最大化。麻省理工学院的化学家们首次测量了光合作用采光蛋白之间的能量传递,使他们发现采光蛋白的无序排列提高了能量传递的效率。资料来源:研究人员提供麻省理工学院化学家的一项新研究为光收集复合体(也称为"天线")的蛋白质如何实现这种高效率提供了一个潜在的解释。研究人员首次能够测量光收集蛋白之间的能量转移,使他们发现这些蛋白的无序排列提高了能量传导的效率。"为了使该'天线'工作,你需要长距离的能量转导。我们的关键发现是,光收集蛋白的无序组织提高了这种长距离能量传导的效率,"麻省理工学院化学副教授、这项新研究的资深作者GabrielaSchlau-Cohen说。麻省理工学院的博士后DihaoWang和DvirHarris以及麻省理工学院前研究生OliviaFiebig博士'22是这篇论文的主要作者,该论文本周发表在《美国国家科学院院刊》上。麻省理工学院的化学教授曹建树也是该论文的作者。在这项研究中,麻省理工学院的团队专注于紫色细菌,这些细菌通常在缺氧的水生环境中被发现,并且通常被用作研究光合作用光收集的模型。在这些细胞内,捕获的光子通过由蛋白质和吸收光的色素(如叶绿素)组成的光收获复合体。使用超快光谱,一种使用极短的激光脉冲来研究发生在飞秒到纳秒时间尺度上的事件的技术,科学家们已经能够研究能量如何在这些蛋白质中的一个单独的蛋白质中移动。然而,研究能量如何在这些蛋白质之间移动已被证明更具挑战性,因为它需要以一种可控的方式定位多个蛋白质。为了创建一个实验装置,使他们能够测量能量如何在两个蛋白质之间移动,麻省理工学院的团队设计了合成的纳米级膜,其成分与自然发生的细胞膜相似。通过控制这些被称为纳米盘的膜的大小,他们能够控制嵌入盘中的两个蛋白质之间的距离。在这项研究中,研究人员将在紫色细菌中发现的主要采光蛋白的两个版本,即LH2和LH3,嵌入他们的纳米盘中。LH2是在正常光照条件下存在的蛋白质,而LH3是通常只在弱光条件下表达的变体。利用麻省理工学院纳米设施的低温电子显微镜,研究人员可以对他们的膜包埋蛋白进行成像,并显示它们的位置与原生膜中的距离相似。他们还能够测量光收集蛋白之间的距离,其规模为2.5至3纳米。由于LH2和LH3吸收的光的波长略有不同,因此有可能使用超高速光谱来观察它们之间的能量转移。对于间隔紧密的蛋白质,研究人员发现,一个光子的能量在它们之间传播需要大约6皮秒的时间。对于相距较远的蛋白质,能量转移需要15皮秒的时间。更快的旅行意味着更有效的能量转移,因为旅行的时间越长,转移过程中损失的能量就越多。Schlau-Cohen说:"当一个光子被吸收时,在能量通过非辐射衰变等不需要的过程失去之前,你只有这么长的时间,所以它能越快得到转换,它的效率就越高。"研究人员还发现,排列在晶格结构中的蛋白质比排列在随机组织结构中的蛋白质显示出更低的能量转移效率,就像它们通常在活细胞中那样。"有序的组织实际上比生物学的无序组织效率低,我们认为这非常有趣,因为生物学往往是无序的。"Schlau-Cohen说:"这一发现告诉我们,这可能不仅仅是生物学的一个不可避免的缺点,而且生物体可能已经进化到利用它。"目前研究人员已经建立了测量蛋白质间能量转移的能力,接下来的计划是探索其他蛋白质之间的能量转移,例如'天线'蛋白质到反应中心的蛋白质之间的转移。他们还计划研究在紫色细菌以外的生物体(如绿色植物)中发现的'天线'蛋白之间的能量转移。...PC版:https://www.cnbeta.com.tw/articles/soft/1369211.htm手机版:https://m.cnbeta.com.tw/view/1369211.htm

封面图片

Salesforce公司的科学家用AI开发出能分解垃圾的蛋白质

Salesforce公司的科学家用AI开发出能分解垃圾的蛋白质ProGen是由SalesforceResearch(是的,就是那个Salesforce)制造的,使用语言处理来学习生物学。简而言之,ProGen采用氨基酸序列并将其转化为蛋白质。1999年,生物学家GünterBlobel因其在蛋白质合成方面的工作而获得诺贝尔奖,但这项由人工智能驱动的新技术可能已经超过了它。ProGen加速了新蛋白质的创造,这些蛋白质可用于许多方面,如药物或分解垃圾填埋场中的塑料,估计可以帮助我们避免迫在眉睫的2505年大垃圾雪崩。参与该项目的科学家詹姆斯-弗雷泽(JamesFraser)说:"人工设计比正常过程中的设计要好。我们现在可以制造特定类型的酶,比如那些在高温或酸中工作良好的酶。"为了制造ProGen,Salesforce公司的科学家向该系统提供了2.8亿种不同蛋白质的氨基酸序列。人工智能系统很快就做出了惊人的100万条蛋白质序列,其中100条被挑选出来进行测试。在这些序列中,有五个被制成了实际的蛋白质,并在细胞中进行了测试,要知道这仅仅是生成结果的0.0005%!似乎下一个前沿领域是开发一个人工智能来测试所有的可能性。其中两种人工酶在分解细菌方面与蛋清中的天然酶一样好。即使如此,两者也只有18%的相似性。ProGen是在2020年使用最初为编写文本而制作的LLM,与ChatGPT类似。该人工智能系统通过查看大量数据了解了蛋白质的规则和结构。对于蛋白质,有巨大的可能性,但ProGen仍然可以制造出工作的酶,即使在结果之间有很大的差异。参与该项目的科学家AliMadani说:"这是蛋白质工程师的一个新工具,我们很高兴看到它能被用来做什么。这个项目看起来非常有价值,而且肯定花费了Salesforce的一大笔钱,所以我们很惊讶地看到ProGen的代码在Github上可供任何想尝试它(或添加它)的人使用。"...PC版:https://www.cnbeta.com.tw/articles/soft/1341599.htm手机版:https://m.cnbeta.com.tw/view/1341599.htm

封面图片

微软开源新型蛋白质生成人工智能 EvoDiff

微软开源新型蛋白质生成人工智能EvoDiff但是,从计算和人力资源的角度来看,目前在实验室设计蛋白质的过程成本高昂。它需要提出一种能在体内执行特定任务的蛋白质结构,然后找到一种可能"折叠"到该结构中的蛋白质序列(组成蛋白质的氨基酸序列)。(蛋白质必须正确折叠成三维形状,才能实现其预期功能)。其实不一定非要这么复杂。本周,微软公司推出了一个通用框架EvoDiff,该公司声称可以根据蛋白质序列生成"高保真"、"多样化"的蛋白质。与其他蛋白质生成框架不同的是,EvoDiff不需要目标蛋白质的任何结构信息,省去了通常最费力的步骤。微软高级研究员凯文-杨(KevinYang)说,EvoDiff开源后,可用于创建新疗法和给药方法的酶,以及用于工业化学反应的新酶。"我们的设想是,EvoDiff将扩展蛋白质工程的能力,使其超越结构-功能范式,走向可编程、序列优先的设计,"EvoDiff的共同创建者之一杨在接受TechCrunch电子邮件采访时说。"通过EvoDiff,我们证明了我们可能实际上并不需要结构,而是'蛋白质序列就是你所需要的一切',从而可控地设计出新的蛋白质"。EvoDiff框架的核心是一个640参数模型,该模型是根据所有不同物种和功能类别蛋白质的数据训练而成的。(参数"是人工智能模型从训练数据中学到的部分,基本上定义了模型处理问题的技能--在本例中就是生成蛋白质)。训练模型的数据来自序列比对的OpenFold数据集和UniRef50,后者是UniProt数据集的一个子集,UniProt是由UniProt联盟维护的蛋白质序列和功能信息数据库。EvoDiff是一种扩散模型,其结构类似于稳定扩散和DALL-E2等许多现代图像生成模型。EvoDiff可以学习如何从几乎完全由噪声组成的起始蛋白质中逐渐减去噪声,从而使其缓慢地、一步一步地接近蛋白质序列。EvoDiff生成蛋白质的过程。扩散模型已越来越多地应用于图像生成以外的领域,从设计新颖的蛋白质(如EvoDiff),到创作音乐,甚至合成语音。"如果说[从EvoDiff]中能得到什么启发的话,我认为那就是我们可以--也应该--通过序列来生成蛋白质,因为我们能够实现通用性、规模和模块化,"EvoDiff的另一位共同贡献者、微软高级研究员阿瓦-阿米尼(AvaAmini)通过电子邮件说。"我们的扩散框架让我们有能力做到这一点,也让我们能够控制如何设计这些蛋白质,以实现特定的功能目标。"对于阿米尼的观点,EvoDiff不仅能创造新蛋白质,还能填补现有蛋白质设计中的"空白"。例如,如果蛋白质的某一部分与另一种蛋白质结合,该模型就能围绕这一部分生成符合一系列标准的蛋白质氨基酸序列。由于EvoDiff是在"序列空间"而非蛋白质结构中设计蛋白质,因此它还能合成最终无法折叠成最终三维结构的"无序蛋白质"。与正常功能的蛋白质一样,无序蛋白质在生物学和疾病中发挥着重要作用,比如增强或降低其他蛋白质的活性。需要指出的是,EvoDiff背后的研究还没有经过同行评审--至少目前还没有。参与该项目的微软数据科学家萨拉-阿拉姆达里(SarahAlAMDari)承认,在该框架投入商业应用之前,"还有很多扩展工作要做"。阿拉姆达里通过电子邮件说:"这只是一个6.4亿参数的模型,如果我们将其扩展到数十亿参数,我们可能会看到生成质量的提高。虽然我们展示了一些粗粒度策略,但要实现更精细的控制,我们希望EvoDiff以文本、化学信息或其他方式为条件,指定所需的功能。"下一步,EvoDiff团队计划测试该模型在实验室中生成的蛋白质,以确定它们是否可行。如果可行,他们将开始下一代框架的工作。...PC版:https://www.cnbeta.com.tw/articles/soft/1384011.htm手机版:https://m.cnbeta.com.tw/view/1384011.htm

封面图片

麻省理工学院的科学家们为合成基因开发了一个新的控制系统

麻省理工学院的科学家们为合成基因开发了一个新的控制系统利用基于CRISPR基因编辑系统的方法,麻省理工学院的研究人员开发了一种新方法,可以精确控制哺乳动物细胞中产生的特定蛋白质的数量。资料来源:MatthewDaniels,由麻省理工学院新闻网在他们的新研究中,研究人员显示,这个系统可以在各种哺乳动物细胞中工作,且结果非常一致。描述这些结果的论文最近发表在《自然通讯》杂志上。"这是一个高度可预测的系统,我们可以预先设计,然后得到预期的结果,"前麻省理工学院研究科学家WilliamC.W.Chen说。"这是一个非常可调整的系统,适用于不同类型细胞的许多不同的生物医学应用"。现在是南达科他大学生物医学科学助理教授的Chen是这项新研究的主要作者之一,同时还有前麻省理工学院研究科学家LeonidGaidukov和博士后YongLai。高级作者TimothyLu作为麻省理工学院生物工程和电气工程及计算机科学副教授领导了这项研究。基因控制许多治疗性蛋白质,包括单克隆抗体都是在含有哺乳动物细胞的大型生物反应器中生产的,这些细胞被设计用来产生所需的蛋白质。几年前,麻省理工学院合成生物学中心的研究人员,包括Lu的实验室,开始与辉瑞公司合作开展一个项目,开发可用于促进这些有用蛋白质生产的合成生物学工具。为了做到这一点,研究人员瞄准了他们想要调高的基因的启动子。在所有的哺乳动物细胞中,基因有一个与转录因子结合的启动子区域--启动基因转录为信使RNA的蛋白质。在以前的工作中,科学家们设计了合成的转录因子,包括称为锌指的蛋白质结构模体,以帮助激活目标基因。然而,锌指和大多数其他类型的合成转录因子必须为它们所针对的每个基因重新设计,这使得它们的开发具有挑战性和耗费时间。2013年,Lu实验室的研究人员开发了一种基于CRISPR的转录因子,使他们能够更容易地控制哺乳动物和酵母细胞中自然发生的基因的转录。在新的研究中,研究人员着手在这项工作的基础上创建一个合成生物部件库,使他们能够传递转基因--一种细胞通常不表达的基因--并精确控制其表达。Chen说:"我们的想法是拥有一个全谱系的合成启动子系统,可以从非常低的水平到非常高的水平,以适应不同的细胞应用。"研究人员设计的系统包括几个部分。一个是要转录的基因,以及一个"操作者"序列,它由一系列人工转录因子结合点组成。另一个组成部分是引导RNA,它与这些操作者序列结合。最后,该系统还包括一个连接到停用的Cas9蛋白的转录激活域。当这种失活的Cas9蛋白与合成启动子位点的引导RNA结合时,基于CRISPR的转录因子可以开启基因表达。用于该合成系统的启动子位点被设计成与自然发生的启动子位点不同,因此该系统不会影响细胞自身基因组中的基因。每个操作者包括2到16个拷贝的引导RNA结合位点,研究人员发现他们的系统可以以与结合位点数量线性对应的速率启动基因转录,使他们能够精确控制产生的蛋白质数量。高度一致性研究人员在几种类型的哺乳动物细胞中测试了他们的系统,包括中国仓鼠卵巢(CHO)细胞,这些细胞通常用于在工业生物反应器中生产治疗性蛋白质。他们发现在CHO细胞和他们测试的其他细胞中的结果非常相似,包括小鼠和大鼠的肌细胞(肌肉细胞的前体)、人类胚胎肾细胞和人类诱导多能干细胞。Chen说:"该系统在不同的细胞类型和不同的目标基因上具有非常高的一致性。这是一个很好的起点,可以考虑用一个高度可调整、可预测的人工系统来调控基因表达和细胞行为。"在首先证明他们可以使用新系统诱导细胞产生预期数量的荧光蛋白之后,研究人员表明他们还可以用它来编程生产一种被称为JUG444的单克隆抗体的两个主要部分。研究人员还对CHO细胞进行编程,使其产生不同数量的称为抗PD1的人类抗体。当人类T细胞接触到这些细胞时,如果产生的抗体数量较多,它们会成为更有力的肿瘤细胞杀手。他们说,尽管研究人员能够获得所需抗体的高产量,但要将这一系统纳入工业流程,还需要进一步努力。与工业生物反应器中使用的细胞不同,这项研究中使用的细胞是生长在一个平面上,而不是在液体悬浮液中。"这是一个有希望用于工业应用的系统,但首先我们必须将其改造成悬浮细胞,看看它们是否能制造出同样的蛋白质。"...PC版:https://www.cnbeta.com.tw/articles/soft/1333007.htm手机版:https://m.cnbeta.com.tw/view/1333007.htm

封面图片

研究人员发现前生物地球上的原始蛋白质是如何形成的

研究人员发现前生物地球上的原始蛋白质是如何形成的以前的研究表明,高碱性蒸发环境是古代蛋白质合成的场所,可产生多达20个单体长的甘氨酸多肽。中性条件被认为是肽合成的最坏情况。富含硼的古代沿海地区可以催化氨基酸的聚合。图片来源:YoshihiroFurukawa在地球上发现的一些最古老的沉积岩中发现了大量的含硼矿物质,其历史可以追溯到38亿年前。这些发现表明,富含硼酸的古代小大陆和岛屿的沿海地区自发地组装了氨基酸,形成了多肽和原蛋白质。东北大学副教授古川义弘说:"多肽在中性环境中的形成对生命起源的化学进化具有重要意义。"RNA在中性条件下相当稳定,但在碱性条件下却极不稳定。众所周知,硼有助于非生物核糖核苷酸合成的许多步骤。"富含硼的中性蒸发环境是前生物地球上两种基本聚合物形成和相互作用的理想场所,"古川说。该研究小组目前正在研究在这种环境中哪些氨基酸被加入到原肽中。...PC版:https://www.cnbeta.com.tw/articles/soft/1371499.htm手机版:https://m.cnbeta.com.tw/view/1371499.htm

封面图片

古代蛋白质研究揭示了自然选择是如何在生命本身之前进行的

古代蛋白质研究揭示了自然选择是如何在生命本身之前进行的尽管自然界有数百种不同的氨基酸,但从大肠杆菌到大象,每一种生物体中都能找到20种核心氨基酸。这是因为一切都可以通过复杂的生命树追溯到数十亿年前存在的一个共同祖先。但是这20种特定的氨基酸有什么特别之处呢?找出这一点是由约翰霍普金斯大学和查尔斯大学的科学家共同领导的一项新研究的目标。该团队在实验室中重现了早期地球的条件,包括在生命出现之前非常常见的氨基酸组合。其中一些被认为是在来自太阳的紫外线与当时大气层中的气体相互作用时产生的,而另一些则是搭乘陨石到达的,这些陨石撞击地球的频率比现在更高。在他们的实验中,研究小组观察到一种自然选择过程的发生,即使在没有生命的情况下。古代有机化合物倾向于将最适合将蛋白质折叠成关键功能形状的氨基酸整合到它们的生物化学中,这使这些化合物有更好的机会存活。给它足够的时间,就会有更多的有机化合物具有对生命有利的特性。这项研究的共同负责人斯蒂芬-弗里德说:"蛋白质折叠基本上允许我们在我们星球上出现生命之前就进行进化。可以在有生物学之前就进行进化,也可以在有DNA之前就对那些对生命有用的化学物质进行自然选择。"该研究小组说,这一过程可以帮助解释非生命物质和生物体之间的神秘过渡。一旦第一个极其简单的生命体被激发出来,它们就可以继续进化成数十亿年来曾经生活过的所有其他东西,保存那些"特殊"的氨基酸。弗里德说:"为了实现达尔文意义上的进化,你需要有这种将DNA和RNA等遗传分子变成蛋白质的复杂方式。但是复制DNA也需要蛋白质,所以我们有一个鸡和蛋的问题。我们的研究表明,在达尔文进化论之前,大自然可能已经选择了具有有用特性的构件"。这项研究不只是对地球上的生命有影响--类似的规则也可能适用于其他世界。毕竟,在彗星和小行星中已经检测到了氨基酸,而且似乎在那里相当普遍。"宇宙似乎喜欢氨基酸,"弗里德说。"也许如果我们在一个不同的星球上发现了生命,也不会有什么不同。"这项研究发表在《美国化学学会杂志》上。...PC版:https://www.cnbeta.com.tw/articles/soft/1347121.htm手机版:https://m.cnbeta.com.tw/view/1347121.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人