中国科学家提出DNA数字存储纠错新算法

中国科学家提出DNA数字存储纠错新算法DNA数字存储是一种使用生命密码DNA存储信息的新方法,以其存储密度高、存储寿命长且维护成本低的优势,被视为高潜力的新兴存储技术。然而,DNA数字存储过程中的合成错误、保存错误以及测序错误,给数据的准确恢复带来了挑战。纠错算法的示意概览。中国农业科学院深圳农业基因组研究所供图为解决这一问题,研究人员基于DNA数字存储的错误偏好性,构建出了错误预测模型,在此基础上首次融入纠错码解码技术,开发出可将纠错数量提高至硬判决(物理学名词,译码器的输入只能是0或者1)2倍的软判决(物理学名词,不直接判决输出是1还是0,只给出“推测”)译码软件Derrick,预计可达到千亿亿亿字节规模的无损存储容量。...PC版:https://www.cnbeta.com.tw/articles/soft/1384773.htm手机版:https://m.cnbeta.com.tw/view/1384773.htm

相关推荐

封面图片

科学家们找到读写与检索存储在DNA中的数字数据的方法

科学家们找到读写与检索存储在DNA中的数字数据的方法DNA早已经成了在研发生物计算机的过程当中实现大规模数据存储的最佳方法。D方法是将二进制(0或1)值转化为四个不同的DNA"字母"(A、T、C或G)之一。但是,人们如何在DNA编码的数据数据库中搜索,以发现某个数据?又如何能够使用DNA编码的数据执行计算,而不首先将其转化为电子形式?这些都是来自LIMMS(CNRS/东京大学)和Gulliver(CNRS/ESPI)实验室的研究小组试图回答的问题。他们正在试验一种新的方法,使用酶和人工神经元和神经网络对DNA数据进行直接操作。具体来说,研究人员利用三种酶的反应来设计化学"神经元",重现真正的神经元所表现出的网络结构和复杂计算能力。他们的化学神经元可以用DNA链上的数据执行计算,并将结果表达为荧光信号。LIMMS和Gulliver团队还通过组装两层人工神经元进行创新,以细化计算。通过反应的微流控小型化进一步提高了精度,允许数以万计的反应快速发生。作为法国生物化学家和日本微流控工程师之间十年合作的成果,这些突破最终可能允许对某些疾病进行更好的筛选,以及对巨大的DNA编码数据库进行操作。当远离水、空气和光线时,DNA可以保存几十万年,且不需要任何能量输入。一个直径几厘米的胶囊存储的DNA可以容纳多达500TB的数字数据。到2025年,人类产生的数字数据总量预计将达到175ZB。由于目前的存储介质相对笨重、脆弱和能源密集,DNA可能提供一个可行的替代方案,也就是能够在一个鞋盒的空间内容纳所有现有数据。促进DNA存储技术的发展将是PEPRMoleculArxiv的目标,这是法国国家科学研究中心去年5月提供的一项优先研究计划。...PC版:https://www.cnbeta.com.tw/articles/soft/1333691.htm手机版:https://m.cnbeta.com.tw/view/1333691.htm

封面图片

康奈尔大学的科学家们发现了一种隐藏的量子态

康奈尔大学的科学家们发现了一种隐藏的量子态在微观层面上,窗玻璃呈现出一种奇妙的混合特性。它的原子像液体一样无序,但又具有固体的刚性;当一个原子受力时,会影响到其他所有原子。物理学家用这种比喻来描述一种被称为"量子自旋玻璃"的量子态,量子计算机中的量子力学比特(量子比特)既表现出无序性(具有看似随机的值),又表现出刚性(当一个量子比特翻转时,其他所有量子比特也会翻转)。康奈尔大学的一组研究人员在开展一个研究项目时意外地发现了这种量子态的存在,该项目旨在进一步了解量子算法以及相关的量子计算纠错新策略。"测量量子粒子的位置会改变其动量,反之亦然。同样,对于量子比特来说,有些量在测量时会相互改变。我们发现,这些不相容测量的某些随机序列会导致量子自旋玻璃的形成,"康奈尔大学文理学院(A&S)物理学教授ErichMueller说。"我们工作的一个意义是,某些类型的信息在量子算法中会自动受到保护,而这些算法与我们的模型具有相同的特征。"这项研究最近发表在《物理评论B》上。第一作者是物理学博士生VaibhavSharma。物理学助理教授简超明与穆勒是共同作者。三人都在康奈尔大学原子和固体物理实验室(LASSP)从事研究工作。这项研究得到了文理学院新前沿基金的资助。夏尔马说:"我们正试图理解量子算法的通用特征--超越任何特定算法的特征。我们揭示这些普遍特征的策略是研究随机算法。我们发现,某些算法类别会导致隐藏的'自旋玻璃'秩序。我们现在正在寻找其他形式的隐藏秩序,并认为这将为我们带来量子态的新分类法。"随机算法是指将一定程度的随机性作为算法一部分的算法--例如,用随机数来决定下一步该做什么。量子纠错的进步穆勒的2021年新前沿资助提案"自主量子子系统纠错"旨在简化量子计算机体系结构,方法是开发一种新策略来纠正由环境噪声(即宇宙射线或磁场等任何会干扰量子计算机量子比特、破坏信息的因素)引起的量子处理器错误。穆勒说,经典计算机系统的比特受到纠错码的保护;信息被复制,因此如果某个比特"翻转",你可以检测到它并修复错误。"要想让量子计算在现在和未来都行得通,我们需要想出以同样方式保护量子比特的方法。纠错的关键在于冗余。如果我发送一个比特的三个副本,你可以通过比特之间的比较来判断是否有错误。我们借用密码学的语言来谈论这种策略,并把重复的比特集合称为'密码'。"穆勒和他的团队在发现自旋玻璃顺序时,正在研究一种通用方法,即使用多个编码词来表示相同的信息。例如,在一个子系统代码中,位"1"可能有4种不同的存储方式:111、100、101和001。量子子系统代码中的额外自由度简化了检测和纠正错误的过程。研究人员强调,他们在开始这项研究时,并不是简单地试图生成一种更好的错误保护方案。相反,他们是在研究随机算法,以了解所有此类算法的一般特性。穆勒说:"有趣的是,我们发现了非同寻常的结构。最引人注目的是这种自旋玻璃阶的存在,这表明有一些额外的隐藏信息漂浮在周围,这些信息应该可以以某种方式用于计算,尽管我们还不知道如何使用。"参考文献VaibhavSharma、Chao-MingJian和ErichJ.Mueller,2023年7月31日,《物理评论B》,"二维贝肯-肖电路中的子系统对称性、自旋玻璃阶和随机测量的临界性"。DOI:10.1103/PhysRevB.108.024205编译来源:ScitechDaily...PC版:https://www.cnbeta.com.tw/articles/soft/1403391.htm手机版:https://m.cnbeta.com.tw/view/1403391.htm

封面图片

海量数据如何存储?中国科学家实现光存储Pb量级首次突破

海量数据如何存储?中国科学家实现光存储Pb量级首次突破近日,中国科学院上海光学精密机械研究所(下称“上海光机所”)与上海理工大学等科研单位合作,在超大容量超分辨三维光存储研究中取得突破性进展。这对我国在信息存储领域突破关键核心技术、实现数字经济的可持续发展具有重大意义。相关研究成果于2月22日发表在《自然》(Nature)杂志。这是国际上首次实现Pb量级的超大容量光存储。仅仅20克透明轻薄的光盘,来源:《自然》小空间存更多数据所谓存力,是以数据存储为核心,包含性能表现、安全可靠、绿色低碳在内的综合数据存储服务能力,是激活数据要素的核心动能。本次成果中,研究团队利用国际首创的双光束调控聚集诱导发光超分辨光存储技术,实验上首次在信息写入和读出均突破了衍射极限的限制,实现了点尺寸为54nm、道间距为70nm的超分辨数据存储,并完成了100层的多层记录,单盘等效容量达Pb量级,对于我国在信息存储领域突破关键核心技术、实现数字经济的可持续发展具有重大意义。该论文第一作者单位为上海光机所,通讯作者为上海光机所阮昊研究员和上海理工大学光子芯片研究院院长顾敏院士,上海理工大学文静教授。上海光机所博士后赵苗和上海理工大学文静教授为并列第一作者。项目得到了上海市科委和国家重点研发计划等支持。阮昊对第一财经解释道,光存储技术具有绿色节能、安全可靠、寿命长达50~100年的独特优势,非常适合长期低成本存储海量数据,然而受到衍射极限的限制,传统商用光盘的最大容量仅在百GB量级。在信息量日益增长的大数据时代,突破衍射极限、缩小信息点尺寸、提高单盘存储容量长久以来一直都是光存储领域的追求。1994年德国科学家StefanW.Hell教授提出受激辐射损耗显微技术,首次证明了光学衍射极限能够被打破,并在2014年获得诺贝尔化学奖,经过20多年的发展,在显微成像、激光纳米直写等多个领域实现了光学超分辨成果,信息的超分辨写入已经得到了解决。从光学显微技术到光存储技术,都被光学衍射极限所限制。在2021年Science发布的全世界最前沿的125个科学问题中,突破衍射极限限制更是在物理领域高居首位。该超分辨光盘的成功研制在信息写入和读出都突破了这一物理学难题,有助于我国在存储领域突破关键核心技术,将在大数据数字经济中发挥重大作用,以满足信息产业领域的重大需求。“所以这一次我们解决了光存储领域信息写入和读出均受衍射极限限制的问题,实现了超分辨的记录,极大地提高了光存储的密度和容量。因为单盘的容量是1.6个Pb,相当于1万张蓝光光盘,这是一个突破性的进展,为大数据存储提供了绿色节能长寿命的方案。”研究人员告诉记者,他们也和目前的硬盘、光盘技术进行了一些对比,在技术性能上提高了最高的光存储面密度,可以在数据中心档案存储上实现突破性应用,解决大容量和节能的存储技术难题。《自然》审稿人的评价该成果道:“这是一种具有突破性创新的Pb级光存储技术…”“与现有其它技术相比,该技术在性能方面提供了最高的光存储面密度…”“研究成果可能会带来数据中心档案数据存储的突破,解决大容量和节能的存储技术难题…”。(来源:上海光机所)帮数据中心处理“冷数据”随着算力作为数字经济时代新的生产力迅速发展,各地也在加码布局数据中心。近年来,我国算力相关政策密集出台。2020年4月,国家发改委首次将智算中心等算力基础设施纳入“新基建”的范畴;2021年5月,国家发改委等四部门联合发布了《全国一体化大数据中心协同创新体系算力枢纽实施方案》,首次提出全国算力网络枢纽节点布局;2022年2月,国家发改委等三部门同意了京津冀、长三角、粤港澳大湾区等8地启动国家算力枢纽节点建设,并规划了10个国家数据中心集群,标志着“东数西算”工程正式启动。就在近日,国家发改委、国家数据局、中央网信办、工信部、国家能源局五部门日前联合印发《深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》(下称《实施意见》),提出到2025年底,普惠易用、绿色安全的综合算力基础设施体系初步成型。而在数据的分类中,有热数据、冷数据、温数据等。“冷数据”一般指的是那些时效性需求不太高的,“热数据”是对处理时间要求高、需要立刻做决策并运算的,例如自动驾驶、远程医疗等,“温数据”则是介于“冷数据”和“热数据”之间的。阮昊对记者解释,他们的成果主要存储的就是冷数据。“在所有数据中,80%以上都是冷数据,这些数据使用频率很少,但是需要永久保存,比如大科学装置做出来的实验数据。这类实验做一次非常不容易,这些访问速率没那么快但是又很重要的数据都要安全性地保存,我们的成果主要用在这类数据上面,因此特别适合数据中心的使用。”他补充举例,像处理热数据的固态硬盘、手机存储卡、存储条都很贵,处理百分之十几的温数据可以用磁存储、磁硬盘,另外80%冷数据就可以用光盘。Pb级光盘制备及读写方式示意图,来源:《自然》研究团队介绍,未来他们将加快原始创新和关键技术攻关,推动超大容量光存储的集成化和产业化进程,并拓展其在光显微成像、光显示、光信息处理领域的交叉应用,产出更多更优秀的创新成果。“关于产业化我们计划是5年左右应该有一个可以用的光盘和机器给消费者看。这当然也需要企业界和科研界一起努力。”阮昊说。...PC版:https://www.cnbeta.com.tw/articles/soft/1419981.htm手机版:https://m.cnbeta.com.tw/view/1419981.htm

封面图片

2023年诺贝尔物理学奖揭晓,三位科学家获奖

2023年诺贝尔物理学奖揭晓,三位科学家获奖北京时间10月3日,在瑞典首都斯德哥尔摩,瑞典皇家科学院宣布,将2023年诺贝尔物理学奖授予美国俄亥俄州立大学名誉教授皮埃尔·阿戈斯蒂尼(PierreAgostini)、匈牙利-奥地利物理学家费伦茨·克劳斯(FerencKrausz)和瑞典隆德大学教授安妮·吕利耶(AnneL’Huillier),以表彰他们在阿秒脉冲光方面所做出的贡献。频道:@kejiqu群组:@kejiquchat

封面图片

科学家通过融化DNA快速识别血源性病原体

科学家通过融化DNA快速识别血源性病原体在斯蒂芬妮-弗拉利教授的带领下,加州大学圣迭戈分校的科学家们一直在探索这种更快、更准确的替代方法。他们开发了一种微流体芯片,将少量血液样本沉积在芯片上,然后加热到50至90ºC(122至194ºF)的温度。如果液体中存在细菌,热量会导致它们的DNA分子融化。当这些分子解体时,它们的双螺旋链就会以其核苷酸序列特有的方式展开。为了确定这种模式,需要在样品中加入一种特殊的染料。它能使开卷过程产生荧光。通过分析荧光的特性,就能获得一种称为熔化曲线的特征。然后将该熔化曲线与其他已知的特定细菌的熔化曲线进行比较。一旦找到匹配,就能确定血液样本中的细菌。整个过程不超过六个小时。如果不是使用了定制的机器学习算法,这种速度是不可能实现的。这种算法可以识别并剔除患者自身DNA的熔解曲线以及其他"背景噪音"。近距离观察微流控芯片DavidBaillot/圣地亚哥大学雅各布斯工程学院在对该技术进行的一项测试中,分析了从17名怀疑感染了可能致命的败血症的儿童身上提取的血液样本。新技术不仅与传统方法得出的结果完全吻合,而且没有产生任何假阳性结果。核酸扩增等其他方法并非总是如此,这些方法只是简单地增强所有DNA的特征。弗拉利说:"这是首次在疑似败血症患者的全血中测试这种方法。"因此,这项研究是对该技术在真实临床场景中表现的更真实的预演。"有关这项研究的论文最近发表在《分子诊断学杂志》上。编译来源:ScitechDaily...PC版:https://www.cnbeta.com.tw/articles/soft/1420133.htm手机版:https://m.cnbeta.com.tw/view/1420133.htm

封面图片

合成DNA初创公司Catalog与希捷合作推出基于DNA的数据存储平台

合成DNA初创公司Catalog与希捷合作推出基于DNA的数据存储平台数据需要被储存在某个地方。然而,数据存储成本不断增长,而人们不断生产和消费的数据却无法跟上可用的存储。根据互联网数据中心(IDC)的数据,全球数据预计在2025年将从2018年的33ZB增加到175ZB。总部位于波士顿的创业公司Catalog提出了一个解决这个问题的新方法。这家初创公司正在建立一个使用合成DNA存储数字数据的平台,并与存储厂商希捷科技开展研究合作,推进其自动DNA存储和计算平台。合作的重点是利用希捷公司专门设计的电子芯片实现基于DNA的存储平台的自动化。传统的微处理器处理二进制代码,而希捷的芯片有微小的储存器,可以处理液体形式的少量合成DNA;芯片上一个储存器的液体可以与另一个储存器的液体一起处理,产生化学反应。目录说,其目前名为Shannon的DNA计算和存储平台的写入装置原型已经证明了DNA计算和存储的潜力,作为一个概念验证,但它是一个大型机器,需要大量的化学反应。据Catalog说,Shannon的大小就像一个普通家庭的厨房。为了开发一个商业上可行的DNA存储平台,Catalog正在减少化学成分的数量,增加DNA存储和计算所需的自动化数量。这两家公司的目标是制造下一代基于DNA的存储和计算平台,这将需要更少的能源,成本更低,并且体积小到1000倍。目录说,他们的第一次化学和电子学的联合测试预计将在9月中旬开始。此外,希捷的下一代"芯片上的实验室"技术可以装在桌面上,也可以作为物联网设备使用。"与希捷这样的行业领导者合作,将有助于加快我们推进DNA存储的能力,"创始人兼首席执行官HyunjunPark说。"除了DNA存储之外,Catalog已经发现了将DNA纳入算法和应用的手段,其潜在的广泛案例包括人工智能、机器学习、数据分析和安全计算。与希捷的这项工作对于最终降低存储系统的成本和减少其复杂性至关重要。"Catalog之前从HanwhaImpact和HorizonsVentures获得了3500万美元的B轮融资,使其融资总额达到6000万美元。目录公司技术的潜在应用包括金融欺诈检测、缺陷发现的图像处理和能源领域的灾难时应对。希捷研究部副总裁EdGage说:"他们在基于DNA的存储和计算方面的领导地位,加上希捷在将创新存储解决方案推向市场方面的悠久历史,有可能加速基于DNA的解决方案的开发和部署,以应对迅速扩大的数据领域的挑战。"...PC版:https://www.cnbeta.com/articles/soft/1314075.htm手机版:https://m.cnbeta.com/view/1314075.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人