加州大学河滨分校研究人员通过软件调整消除瓶颈 将计算机处理速度提升一倍

加州大学河滨分校研究人员通过软件调整消除瓶颈 将计算机处理速度提升一倍 从智能手机和个人电脑到数据中心服务器,大多数现代计算机都包含用于人工智能和机器学习的图形处理器(GPU)和硬件加速器。著名的商业案例包括NVIDIA GPU 上的张量核心(Tensor Cores)、Google云服务器上的张量处理单元(TPU)、苹果 iPhone 上的神经引擎(Neural Engines)以及Google Pixel 手机上的边缘 TPU。这些组件各自处理信息,将信息从一个处理单元转移到下一个处理单元时往往会造成数据流的瓶颈。在一项新的研究中,加州大学河滨分校(UCR)的研究人员展示了一种方法,让现有的不同组件同时运行,从而大大提高处理速度并降低能耗。加州大学洛杉矶分校电气与计算机工程系副教授、该研究的共同第一作者曾宏伟说:"不必增加新的处理器,因为你已经拥有了它们。"研究人员的框架被称为同步异构多线程(SHMT),它摒弃了传统的编程模式,即只能将代码区域专门委托给一种处理器,而让其他资源闲置,不为当前功能做贡献。相反,SHMT 利用了多个组件的多样性或异质性,将计算功能拆分开来,让它们共享。换句话说,这是一种并行处理。比较 (a) 传统异构计算机、(b) 带有软件流水线的传统异构计算机和 (c) SHMT 执行功能的方式 图/Hsu 和 Tseng工作原理您可以跳过这部分内容,但对于计算机科学爱好者来说,下面是有关 SHMT 工作原理的概述(仍然非常基础)。一组虚拟操作(VOPs)允许 CPU 程序将功能"卸载"到虚拟硬件设备上。在程序执行过程中,运行时系统会驱动 SHMT 的虚拟硬件,衡量硬件资源的能力以做出调度决策。SHMT 采用质量感知工作抢占(QAWS)调度策略,不会占用资源,但有助于保持质量控制和工作负载平衡。运行时系统将 VOP 分成一个或多个高级操作 (HLOP),以便同时使用多个硬件资源。然后,SHMT 的运行时系统将这些 HLOP 分配到目标硬件的任务队列中。由于 HLOP 与硬件无关,运行时系统可以根据需要调整任务分配。原型测试和结果为了测试这一概念,研究人员构建了一个系统,该系统采用的芯片和处理能力可以在任何像样的后期型号智能手机中找到,并做了一些调整,这样他们还可以测试该系统在数据中心中的功能。SHMT 原型平台具体来说,他们使用NVIDIA的Jetson Nano模块定制了一个嵌入式系统平台,该模块包含一个四核 ARM Cortex-A57 处理器(CPU)和 128 个 Maxwell 架构 GPU 内核。Google Edge TPU 通过其 M.2 Key E 插槽与系统相连。中央处理器、图形处理器和 TPU 通过板载 PCIe 接口交换数据,PCIe 接口是主板组件(如图形卡、内存和存储设备)的标准化接口。系统的主内存(4 GB 64 位 LPDDR4,1,600 MHz,25.6 GB/s)托管共享数据。Edge TPU 还包含一个 8 MB 的设备内存,并使用 Ubuntu Linux 18.04 作为操作系统。使用基准应用程序对 SHMT 概念进行了测试后发现,采用性能最佳的 QAWS 策略的框架将其发挥得淋漓尽致,与基准方法相比,速度提高了 1.95 倍,能耗显著降低了 51%。采用不同调度策略的 SHMT 速度提升(相对于基准 GPU)这一切意味着什么?研究人员说,这对 SHMT 的影响是巨大的。现有手机、平板电脑、台式机和笔记本电脑上的软件应用程序可以利用这个新的软件库实现一些相当惊人的性能提升。但它也能减少对昂贵的高性能组件的需求,从而带来更便宜、更高效的设备。由于这种方法可以减少能源消耗,进而降低制冷需求,因此可以优化数据中心的两个关键项目,同时还能减少碳排放和用水量。能源消耗和能源延迟产品 图/加州大学河滨分校与往常一样,我们还需要对系统的实施、硬件支持以及哪类应用最受益等方面进行进一步的研究,但有了这些成果,我们相信该团队在吸引资源将其推广开来方面不会遇到什么困难。这项研究在第 56 届 IEEE/ACM 微体系结构国际研讨会MICRO 2023 上发表。 ... PC版: 手机版:

相关推荐

封面图片

《计算机一级考试资料》|简介:《计算机一级考试资料》是备考计算机一级考试的得力助手。它包含了详细的计算机基础知识讲解,如计算机的

《计算机一级考试资料》|简介:《计算机一级考试资料》是备考计算机一级考试的得力助手。它包含了详细的计算机基础知识讲解,如计算机的硬件组成、操作系统的基本功能和操作方法、办公软件的初步应用等内容。在硬件部分,对 CPU、内存、硬盘等核心部件的原理和性能指标进行了深入浅出的介绍;操作系统章节则涵盖了 Windows 系统的安装、设置、文件管理和用户管理等实用操作;办公软件方面,重点讲解了 Word 的文档编辑、格式设置,Excel 的表格制作、数据处理和函数应用,PowerPoint 的演示文稿创建和动画效果设置等。资料中还配有大量的实例演示和练习题,通过实际操作和练习,帮助考生熟悉考试题型和操作流程,提高应试能力,顺利通过计算机一级考试。|标签:#计算机一级考试资料#计算机考试#备考资料|文件大小:NG|链接:

封面图片

中国研究人员报告能用现有量子计算机破解 2048 位 RSA

中国研究人员报告能用现有量子计算机破解 2048 位 RSA 清华和浙大等中国研究人员在预印本平台上发表,报告破解 2048 位 RSA 密钥所需的量子比特数可以大幅减少,现有的量子计算机就能做到。研究人员称,Peter Shor 早在 1990 年代就发现用量子计算机进行大数的因式分解是很容易的,但所需的量子比特数需要多达数百万,现有技术还制造不出此类规模的量子计算机。今天最先进的量子计算机只有数百个量子比特如 IBM 的 Osprey 有 433 个量子比特。中国研究人员提出了一种优化方法,将所需的量子比特数减少到 372 个量子比特这是现有技术能做到的,虽然中国还没有如此先进的量子计算机。知名加密学专家 Bruce Schneier 在其博客上指出,中国研究人员提出的优化方法是基于 Peter Schnorr 最近发表的一篇受争议论文,Schnorr 的算法在较大的系统上崩溃了,所以中国的方法是否成功还是未知,但至少 IBM 的研究人员可以测试下了。 来源 , 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

封面图片

谷歌科学家发布:量子计算机取得重大突破

谷歌科学家发布:量子计算机取得重大突破 谷歌科学家最近在ArXiv平台上发布了一篇预印本论文,声称在量子计算机领域取得了重大突破。他们表示,通过对Sycamore处理器的升级,谷歌成功提升了量子位的数量,从之前的53个增加到了70个。 这次实验中,谷歌科学家们执行了一项名为随机电路采样的任务,这个任务在量子计算中用于评估计算机的性能和效率。通过运行随机电路并分析结果输出,科学家们测试了量子计算机在解决复杂问题方面的能力。 谷歌的研究结果显示,升级后的70个量子位的Sycamore处理器在执行随机电路采样任务上比业内最先进的超级计算机快了几十亿倍。例如,需要业内最先进超级计算机Frontier计算47.2年才能完成的任务,53个量子位的Sycamore处理器只需要6.18秒就能完成,而新版的70个量子位的Sycamore处理器速度更快。来源 ,, 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

封面图片

研究人员利用具有光反馈功能的VCSEL阵列开发出一台计算机

研究人员利用具有光反馈功能的VCSEL阵列开发出一台计算机 我们先来了解伊辛问题。它的原理如下:想象一下,把一个问题表示成一个图,图中的节点由边连接。每个节点都有两个状态,要么+1,要么-1,代表潜在的解决方案。我们的目标是根据"哈密顿"的概念,找到使系统总能量最小的配置。在伊辛计算机中(此处以 4 位为例),所有变量都在并行地朝着一个解决方案演进。来源:作者 doi: 10.1117/1.JOM.4.1.014501为了高效求解伊辛哈密顿方程,研究人员正在探索能够超越传统计算机的物理系统。一种很有前景的方法是使用基于光的技术,将信息编码成偏振状态、相位或振幅等属性。通过利用干涉和光反馈等效应,这些系统可以快速找到正确的解决方案。在发表于《光学微系统杂志》(Journal of Optical Microsystems)上的一项研究中,新加坡国立大学和新加坡科学技术研究局的研究人员探讨了利用垂直腔面发射激光器(VCSEL)系统来解决伊辛问题。在这个装置中,信息被编码在 VCSEL 的线性偏振态中,每个态对应一个潜在的解决方案。激光器相互连接,它们之间的相互作用编码了问题的结构。研究人员在 2 位、3 位和 4 位 Ising 问题上测试了他们的系统,发现结果很有希望。不过也发现了一些挑战,例如需要最小的 VCSEL 激光各向异性,这在实践中可能很难实现。尽管如此,克服这些挑战可能会产生一种基于 VCSEL 的全光学计算机架构,能够解决目前传统计算机无法解决的问题。参考文献:Brandon Loke、Zifeng Yuan、Soon Thor Lim、Aaron Danner 于 2023 年 12 月 28 日发表的《使用光注入锁定 VCSEL 的 Ising 计算线性偏振态编码》,《光微系统杂志》。doi: 10.1117/1.jom.4.1.014501编译来源:ScitechDaily ... PC版: 手机版:

封面图片

《[王道计算机教育]2021考研计算机操作系统》|简介:[王道计算机教育]2021考研计算机操作系统这门课程为学习者提供了全面的

《[王道计算机教育]2021考研计算机操作系统》|简介:[王道计算机教育]2021考研计算机操作系统这门课程为学习者提供了全面的知识和技巧,涵盖了从基础到进阶的多项内容。无论你是想提升专业能力,还是在职业生涯中寻求突破,课程都能为你提供切实可行的方法和思路,帮助你在未来的工作中游刃有余。|标签:#课程 #[王 #系统|文件大小:NG|链接:

封面图片

Inflection AI宣布打造2.2万块H100计算卡的AI超级计算机

Inflection AI宣布打造2.2万块H100计算卡的AI超级计算机 一家名为"Inflection AI"的人工智能创业公司近日宣布,他们计划利用2.2万块NVIDIA H100计算卡打造一台规模宏大的AI超级计算机。这台超级计算机将由近700个机柜组成,每个机柜还将配备四块Intel至强处理器,旨在提供卓越的计算能力。据悉,该系统的功耗预计将达到31兆瓦,相当于每小时消耗3.1万度电。 Inflection AI此次计划打造的AI超级计算机被视为世界顶级之一,而能够轻松获取大量NVIDIA H100计算卡的原因在于,NVIDIA正准备对该公司进行投资。来源 , 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人