研究人员在高精度计算中释放忆阻器的威力

研究人员在高精度计算中释放忆阻器的威力 麻省理工大学阿默斯特分校制作的集成芯片示例照片,其中包含不同尺寸的忆阻器横条阵列。图片来源:Can Li马萨诸塞大学阿默斯特分校电气与计算机工程系教授、《科学》(Science)杂志上发表的这项研究的通讯作者之一夏强飞解释说,在当前的计算方法下,每次要存储信息或给计算机布置任务时,都需要在内存和计算单元之间移动数据。当复杂的任务需要移动大量数据时,处理过程中就会出现"交通堵塞"。传统计算解决这一问题的方法之一是增加带宽。相反,Xia 和他在阿默斯特大学、南加州大学以及计算技术制造商 TetraMem 公司的同事们利用模拟忆阻器技术实现了内存计算,通过减少数据传输次数来避免这些瓶颈。该团队的内存计算依赖于一种名为"忆阻器"的电子元件它是内存和电阻器(控制电路中的电流)的结合体。忆阻器可以控制电路中的电流流向,同时还能"记忆"先前的状态,即使在电源关闭的情况下也是如此,这与当今基于晶体管的计算机芯片不同,后者只能在有电的情况下保存信息。忆阻器装置可编程为多个电阻等级,从而提高了一个单元的信息密度。当这种忆阻器电路被组织成一个交叉棒阵列时,就能以大规模并行的方式利用物理定律进行模拟计算,从而大大加快矩阵运算的速度,而矩阵运算是神经网络中最常用但却非常耗电的计算。计算在设备现场进行,而不是在内存和处理之间移动数据。夏用交通作类比,把内存计算比作大流行病高峰期几乎空无一人的道路:"你消除了交通,因为(几乎)每个人都在家工作,"他说。"我们同时工作,但只将重要数据/结果发送出去"。此前,这些研究人员已经证明,他们的忆阻器可以完成低精度计算任务,如机器学习。其他应用还包括模拟信号处理、射频传感和硬件安全。夏说:"在这项工作中,我们提出并演示了一种新的电路架构和编程协议,它可以使用多个相对低精度的模拟器件(如忆阻器)的加权和来有效地表示高精度数,与现有的量化方法相比,大大降低了电路开销、能耗和延迟。这篇论文的突破在于,我们进一步推动了这一领域的发展。这项技术不仅适用于低精度的神经网络计算,也适用于高精度的科学计算"。在原理验证演示中,忆阻器解决了静态和时变偏微分方程、纳维-斯托克斯方程和磁流体力学问题。他说:"我们突破了自己的舒适区,从边缘计算神经网络的低精度要求扩展到高精度科学计算。"马萨诸塞大学阿默斯特分校的团队和合作者花了十多年时间才设计出合适的忆阻器设备,并为模拟内存计算构建了相当规模的电路和计算机芯片。"我们过去十年的研究使模拟忆阻器成为一项可行的技术。现在是时候把这样一项伟大的技术推向半导体行业,使广大的人工智能硬件社区受益了。"编译自:ScitechDaily ... PC版: 手机版:

相关推荐

封面图片

可调谐忆阻器的研发进展有助于人工神经网络更高效处理随时间变化的数据

可调谐忆阻器的研发进展有助于人工神经网络更高效处理随时间变化的数据 人工神经网络也许很快就能更高效地处理随时间变化的信息,如音频和视频数据。密歇根大学领导的一项研究在今天的《自然-电子学》(Nature Electronics)杂志上报告了首个具有可调节"弛豫时间"的忆阻器。忆阻器是一种将信息存储在电阻中的电子元件,与当今的图形处理单元相比,它可以将人工智能的能源需求降低约 90 倍。预计到 2027 年,人工智能的耗电量将占全球总耗电量的一半左右,而且随着越来越多的公司销售和使用人工智能工具,这一比例还有可能进一步上升。"现在,人们对人工智能很感兴趣,但要处理更大、更有趣的数据,方法就是扩大网络规模。这效率并不高,"麻省理工大学詹姆斯-R-梅勒工程学教授 Wei Lu 说,他与麻省理工大学材料科学与工程学副教授 John Heron 是这项研究的共同通讯作者。图形处理器的问题问题在于,GPU 的运行方式与运行人工智能算法的人工神经网络截然不同整个网络及其所有互动都必须从外部存储器中顺序加载,这既耗时又耗能。相比之下,忆阻器可以节省能源,因为它们模仿了人工神经网络和生物神经网络在没有外部存储器的情况下运行的主要方式。在某种程度上,忆阻器网络可以体现人工神经网络。麻省理工学院材料科学与工程系应届博士毕业生 Sieun Chae 与麻省理工学院电气与计算机工程系应届博士毕业生 Sangmin Yoo 是这项研究的共同第一作者。在生物神经网络中,计时是通过放松来实现的。每个神经元都会接收电信号并将其发送出去,但这并不能保证信号会向前推进。在神经元发送自己的信号之前,必须先达到接收信号的某个阈值,而且必须在一定时间内达到该阈值。如果时间过长,神经元就会随着电能的渗出而松弛。神经网络中具有不同松弛时间的神经元有助于我们理解事件的顺序。忆阻器如何工作忆阻器的工作原理略有不同。改变的不是信号的存在与否,而是有多少电信号可以通过。接触到一个信号,忆阻器的电阻就会降低,从而允许更多的下一个信号通过。在忆阻器中,弛豫意味着随着时间的推移,电阻会再次上升。Lu 的研究小组过去曾探索过在忆阻器中加入弛豫时间,但这并不是可以系统控制的。但现在,Lu 和 Heron 的团队已经证明,基础材料的变化可以提供不同的弛豫时间,从而使忆阻器网络能够模仿这种计时机制。材料成分和测试研究小组在超导体 YBCO(由钇、钡、碳和氧制成)的基础上构建了这些材料。YBCO在零下292华氏度的温度下没有电阻,但他们想要它的晶体结构。它引导着镁氧化物、钴氧化物、镍氧化物、铜氧化物和锌氧化物在忆阻器材料中的组织。赫伦称这种熵稳定氧化物为"原子世界的厨房水槽"添加的元素越多,它就越稳定。通过改变这些氧化物的比例,研究小组获得了 159 到 278 纳秒(即万亿分之一秒)的时间常数。他们构建的简单忆阻器网络学会了识别 0 到 9 数字的发音。一旦经过训练,它就能在音频输入完成之前识别出每个数字。未来展望这些忆阻器是通过能源密集型工艺制造的,因为研究小组需要完美的晶体来精确测量它们的特性,但他们预计,更简单的工艺也适用于大规模制造。赫伦说:"到目前为止,这只是一个愿景,但我认为有一些途径可以使这些材料具有可扩展性,而且价格合理。这些材料是地球上丰富的资源,无毒、廉价,你几乎可以把它们喷洒在上面。"编译来源:ScitechDailyDOI: 10.1038/s41928-024-01169-1 ... PC版: 手机版:

封面图片

《微软飞行模拟》加入拉斯维加斯高精度地景 俯瞰世界最大网红球

《微软飞行模拟》加入拉斯维加斯高精度地景 俯瞰世界最大网红球 通过集成高分辨率的航空影像、先进的数字高程模型数据以及TIN(三角不规则网络)表面纹理技术,微软精心再现了拉斯维加斯的地标性酒店和全球最大的“网红球”MSG Sphere等地标。自1982年首次面世以来,《微软飞行模拟》一直是PC游戏史上的经典之作,对游戏界产生了深远的影响。在该游戏中,玩家不仅能选择不同的飞机和机场,还能自定义航线,享受逼真的飞行体验并自由探索世界各地的风光。 ... PC版: 手机版:

封面图片

互联网档案馆上线旧计算器模拟器

互联网档案馆上线旧计算器模拟器 上线了一组旧式计算器的模拟器“”,如德州仪器的图形计算器系列,包括 TI 73 Explorer、81、82、83 Plus、85、86 和 89,以及惠普的一系列计算器 HP 38G、48G+、48GX 和 49G,Vtech Number Muncher 等等。部分模拟器还支持声音。模拟器利用了 ,让创造出原始图形计算器的数字克隆成为可能。 来源 , 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

封面图片

【#嫦娥六号完成轨返解锁分离#】今日13时22分许,北京航天飞行控制中心通过地面测控站,向嫦娥六号轨道器和返回器组合体注入高精度

【#嫦娥六号完成轨返解锁分离#】今日13时22分许,北京航天飞行控制中心通过地面测控站,向嫦娥六号轨道器和返回器组合体注入高精度导航参数。此后,轨道器与返回器在距南大西洋海平面高约5000公里处正常解锁分离,轨道器按计划完成轨道规避机动。#欢迎嫦娥六号回家#网页链接 via 央视新闻的微博

封面图片

加州大学河滨分校研究人员通过软件调整消除瓶颈 将计算机处理速度提升一倍

加州大学河滨分校研究人员通过软件调整消除瓶颈 将计算机处理速度提升一倍 从智能手机和个人电脑到数据中心服务器,大多数现代计算机都包含用于人工智能和机器学习的图形处理器(GPU)和硬件加速器。著名的商业案例包括NVIDIA GPU 上的张量核心(Tensor Cores)、Google云服务器上的张量处理单元(TPU)、苹果 iPhone 上的神经引擎(Neural Engines)以及Google Pixel 手机上的边缘 TPU。这些组件各自处理信息,将信息从一个处理单元转移到下一个处理单元时往往会造成数据流的瓶颈。在一项新的研究中,加州大学河滨分校(UCR)的研究人员展示了一种方法,让现有的不同组件同时运行,从而大大提高处理速度并降低能耗。加州大学洛杉矶分校电气与计算机工程系副教授、该研究的共同第一作者曾宏伟说:"不必增加新的处理器,因为你已经拥有了它们。"研究人员的框架被称为同步异构多线程(SHMT),它摒弃了传统的编程模式,即只能将代码区域专门委托给一种处理器,而让其他资源闲置,不为当前功能做贡献。相反,SHMT 利用了多个组件的多样性或异质性,将计算功能拆分开来,让它们共享。换句话说,这是一种并行处理。比较 (a) 传统异构计算机、(b) 带有软件流水线的传统异构计算机和 (c) SHMT 执行功能的方式 图/Hsu 和 Tseng工作原理您可以跳过这部分内容,但对于计算机科学爱好者来说,下面是有关 SHMT 工作原理的概述(仍然非常基础)。一组虚拟操作(VOPs)允许 CPU 程序将功能"卸载"到虚拟硬件设备上。在程序执行过程中,运行时系统会驱动 SHMT 的虚拟硬件,衡量硬件资源的能力以做出调度决策。SHMT 采用质量感知工作抢占(QAWS)调度策略,不会占用资源,但有助于保持质量控制和工作负载平衡。运行时系统将 VOP 分成一个或多个高级操作 (HLOP),以便同时使用多个硬件资源。然后,SHMT 的运行时系统将这些 HLOP 分配到目标硬件的任务队列中。由于 HLOP 与硬件无关,运行时系统可以根据需要调整任务分配。原型测试和结果为了测试这一概念,研究人员构建了一个系统,该系统采用的芯片和处理能力可以在任何像样的后期型号智能手机中找到,并做了一些调整,这样他们还可以测试该系统在数据中心中的功能。SHMT 原型平台具体来说,他们使用NVIDIA的Jetson Nano模块定制了一个嵌入式系统平台,该模块包含一个四核 ARM Cortex-A57 处理器(CPU)和 128 个 Maxwell 架构 GPU 内核。Google Edge TPU 通过其 M.2 Key E 插槽与系统相连。中央处理器、图形处理器和 TPU 通过板载 PCIe 接口交换数据,PCIe 接口是主板组件(如图形卡、内存和存储设备)的标准化接口。系统的主内存(4 GB 64 位 LPDDR4,1,600 MHz,25.6 GB/s)托管共享数据。Edge TPU 还包含一个 8 MB 的设备内存,并使用 Ubuntu Linux 18.04 作为操作系统。使用基准应用程序对 SHMT 概念进行了测试后发现,采用性能最佳的 QAWS 策略的框架将其发挥得淋漓尽致,与基准方法相比,速度提高了 1.95 倍,能耗显著降低了 51%。采用不同调度策略的 SHMT 速度提升(相对于基准 GPU)这一切意味着什么?研究人员说,这对 SHMT 的影响是巨大的。现有手机、平板电脑、台式机和笔记本电脑上的软件应用程序可以利用这个新的软件库实现一些相当惊人的性能提升。但它也能减少对昂贵的高性能组件的需求,从而带来更便宜、更高效的设备。由于这种方法可以减少能源消耗,进而降低制冷需求,因此可以优化数据中心的两个关键项目,同时还能减少碳排放和用水量。能源消耗和能源延迟产品 图/加州大学河滨分校与往常一样,我们还需要对系统的实施、硬件支持以及哪类应用最受益等方面进行进一步的研究,但有了这些成果,我们相信该团队在吸引资源将其推广开来方面不会遇到什么困难。这项研究在第 56 届 IEEE/ACM 微体系结构国际研讨会MICRO 2023 上发表。 ... PC版: 手机版:

封面图片

清华大学研究人员利用仿生学技术开发出FlexRAM液态金属内存

清华大学研究人员利用仿生学技术开发出FlexRAM液态金属内存 即使关闭电源,数据也能在惰性液体中保存 43200 秒(或 12 小时)。目前的 FlexRAM 原型由 8 个独立的 1 位存储单元组成,总共存储 1 个字节。它的写入循环次数已超过 3500 次,但还需要进一步提高耐用性才能投入实际使用。商用 RAM 的额定读写周期可达数百万次。毫米级金属液滴最终可达到纳米级尺寸,从而显著提高内存密度。FlexRAM 代表着可自由弯曲和挠曲的电路和电子元件领域的一个突破。研究人员设想的应用领域包括软机器人、医疗植入物和柔性可穿戴设备。与可拉伸基板的兼容性为新兴技术释放了巨大潜力。虽然 FlexRAM 仍处于早期概念阶段,但它证明了曾经被认为不可能或不切实际的计算和内存创新,可以通过不懈的科学创造力变为现实。它加入了柔性电子研究的先锋浪潮,实现了比刚性硅更高的灵活性。在 FlexRAM 和液态电子技术改变计算领域之前,仍有许多挑战需要解决。但是,通过证明液态存储器件是可能的,这项技术将为电子和计算带来截然不同的未来。下图是作为 FlexRAM 突破性技术的液态金属液滴。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人