实验室中的内存解决方案可在高达600°C的温度下运行 有望在服务器中广泛应用

实验室中的内存解决方案可在高达600°C的温度下运行 有望在服务器中广泛应用 根据《自然电子学》(Nature Electronics)上发表的研究,基于铁电氮化铝钪(AlScN)的闪存盘可能会成为市场的下一代标准,这不仅是因为它的名字听起来很特别,还因为这种材料在温度下的可持续性。宾夕法尼亚大学的研究人员 Deep Jariwala 和 Roy Olsson 展示了一种存储器原型,即使在 600 摄氏度的高温下仍能正常工作,据说是目前市场上替代品的两倍。现在,更大的问题是,为什么首先需要这种内存解决方案。答案很简单。巨型计算系统集成了大量组件,会产生巨大的热能,这些热能会通过板载冷却解决方案、液体或空气散失。然而,由于内存设备的不稳定性,超出范围的温度会导致数据丢失和性能下降,这对于大型系统来说是难以承受的。因此,即使在高温条件下,板载内存也必须持续运行。Jariwala 说,他们的解决方案针对的是大规模人工智能系统,因为这些系统甚至可以在更恶劣的条件下运行。据报道,除了温度优势外,基于 AlScN 的内存设备在弥补中央处理器和内存之间数据传输效率低下的问题上也比传统产品更具优势。虽然碳化硅技术很有希望,但它的处理能力远不及硅处理器,因此无法在高温或任何恶劣的环境中进行高级处理和重数据计算,如人工智能。我们内存设备的稳定性可以让内存和处理更紧密地结合在一起,从而提高计算的速度、复杂性和效率。我们称之为"内存增强计算",并正与其他团队合作,为新环境下的人工智能奠定基础。- 宾夕法尼亚大学 Deep Jariwala这项研究确实表明,未来的内存标准可能会迅速发展,所使用的核心材料层也会发生根本性的变化,在这种情况下,AlScN 似乎是个不二之选,但现在下结论还为时尚早。 ... PC版: 手机版:

相关推荐

封面图片

AMD:处理器温度只会越来越高,与台积电商讨解决方案

AMD:处理器温度只会越来越高,与台积电商讨解决方案 2019 年 Ryzen 3000 系列的推出,不仅让 AMD CPU 的性能大幅提升,工作温度也随之提升。而从那以后,情况就再也没有好转。AMD 最新的 Ryzen 7000 系列,甚至将正常工作温度提升 95C゚,让旗舰 Ryzen 9 7900X 和 7950X 可以全速执行。不过,AMD 副总裁 David Mcafee 在接受外媒采访时明确表示,这种温度状况未来只会越来越高。

封面图片

Panmnesia发布CXL协议 允许AI GPU以最小的延迟利用各类内存

Panmnesia发布CXL协议 允许AI GPU以最小的延迟利用各类内存 目前的人工智能加速器仅限于板载内存,而制造商只能提供非常有限的 HBM。随着数据集的不断增长和对功耗的需求,业界正专注于增加更多的人工智能 GPU,而考虑到其所占用的财务和制造资源,这种方法从长远来看是不可持续的。有鉴于此,由韩国 KAIST 研究所支持的公司 Panmnesia 推出了一个 CXL IP,可以让 GPU 利用 DRAM 甚至 SSD 的内存,扩展内置的 HBM。为了实现连接,CXL 采用了 PCIe 链接,确保在消费者中得到广泛采用。不过,这也有一个问题。传统的人工智能加速器缺乏必要的子系统,无法直接连接并利用 CXL 进行内存扩展,而且 UVM(统一虚拟内存)等解决方案的速度相当慢,这就失去了初衷。不过,作为一种解决方案,Panmnesia 开发出了自己的符合 CXL 3.1 标准的 Root Complex 芯片,它有多个端口,通过 PCIe 总线连接 GPU 和外部内存,HDM(主机管理设备内存)解码器则充当连接的桥梁,管理内存分配和转换。有趣的是,Panmnesia 决定将他们的解决方案(CXL-Opt)与三星和 Meta 开发的原型产品(他们称之为"CXL-Proto")进行基准测试。令我们惊讶的是,CXL-Opt 的往返延迟(即数据从 GPU 传输到内存再返回所需的时间)大大降低。 CXL-Opt 的延迟时间为两位数纳秒,而 CXL-Proto 的延迟时间为 250ns。除此之外,CXL-Opt 的执行时间远远少于 UVM 解决方案,因为它的 IPC 性能速度是 UVM 的 3.22 倍。Panmnesia 的解决方案可以在市场上取得巨大进步,因为它是堆叠 HBM 芯片和实现更高效解决方案之间的中介。鉴于该公司是首批拥有创新 CXL IP 的公司之一,如果这一技术获得认可,Panmnesia 将受益匪浅。 ... PC版: 手机版:

封面图片

Rambus推出GDDR7内存控制器IP:提供48 Gbps速率和192GB/s带宽

Rambus推出GDDR7内存控制器IP:提供48 Gbps速率和192GB/s带宽 人工智能 2.0 训练过程的输出是一个推理模型,可用于根据用户的提示创建新的多模态内容。由于准确性和保真度会随着模型规模的扩大而提高,因此推理模型的规模也在不断扩大。随着人工智能推理变得越来越普遍,并从数据中心转移到边缘和终端,这促使整个计算环境需要更强大的处理引擎和定制的高性能内存解决方案。GPU 一直是推理引擎的首选,在服务器和台式机等边缘和终端应用中,GPU 一直使用 GDDR6 内存。然而,GDDR6 已经达到了标准 NRZ 信号每秒 24 千兆比特(Gbps)数据传输速率的实际极限。为了满足未来 GPU 的带宽需求,需要使用新信号方案的新一代 GDDR。使用 PAM3 信号的 GDDR7 内存可将数据传输速率提高到 40 Gbps 或更高。Rambus介绍说:GDDR 目前已达到 GDDR7 规格水平,是当今最先进的图形内存解决方案,其性能发展蓝图达 48Gbps,每个 GDDR7 内存设备的内存吞吐量达 192 GB/s。在带宽这一关键参数上,GDDR7 内存确实大放异彩。在 32 Gbps 的数据传输速率和 32 位宽接口条件下,GDDR7 设备可提供 128 GB/s 的内存带宽,是任何其他解决方案的两倍多。GDDR7 内存为人工智能推理提供了最佳的速度、带宽和延迟性能。Rambus 已经在提供 HBM、PCIe 和 CXL 控制器 IP,现在又推出了业界首个GDDR7存储器控制器 IP。Rambus GDDR7 控制器支持 40 Gbps 运行,为 GDDR7 存储器设备提供160GB/s的吞吐量,比业界吞吐量最高的 GDDR6 控制器(同样来自 Rambus)提高了 67%。Rambus GDDR7 控制器实现了新一代 GDDR 内存部署,适用于人工智能加速器、图形和高性能计算 (HPC) 应用。Rambus GDDR7 控制器主要功能支持包括 PAM3 和 NRZ 信号在内的所有 GDDR7 链路功能支持多种 GDDR7 设备尺寸和速度经过优化,可在各种流量情况下实现高效率和低延迟灵活的 AXI 接口支持低功耗支持(自刷新、休眠自刷新、动态频率缩放等)可靠性、可用性和可维护性(RAS)功能如端到端数据路径奇偶校验、存储寄存器奇偶校验保护等。全面的记忆测试支持可为第三方 PHY 提供集成支持利用最新的 GDDR7 VIP 和内存供应商内存模型进行验证 ... PC版: 手机版:

封面图片

都说板载内存好 却没几个人愿意买单?

都说板载内存好 却没几个人愿意买单? 而为了追求纤薄时尚、长续航,笔记本厂商可谓是绞尽脑汁,将电脑内部每一寸空间都压榨到极致。其中,采用板载内存设计成为了一种常见做法。而随着这种“焊死内存”的做法逐渐延伸到追求性能和扩展性的游戏本上时,便引来了更多消费者的疑议。↑传统插槽式内存(可替换升级)↑板载内存(不可替换升级)板载内存 既不省心又不省钱?板载内存的起源可以追溯到苹果MacBook系列笔记本电脑,起初是为了节省空间、提高能源效率、优化生产流程等目的。板载内存的争议点主要集中在其缺乏升级性、消费者权益问题,以及维修难度增加等方面。板载便意味着用户将失去内存升级的灵活性和便利性,以往很方便替换、升级的硬件变成了“一锤子买卖”。于是,当我们购买电脑时,便要英明地预估未来对于内存和硬盘容量的需求度。如果对此不确定,只能多花些预算去选择原厂高内存、硬盘的机型配置以确保电脑整机拥有更久的使用寿命。以苹果MacBook电脑为例,内存和硬盘容量是关键的购买选配项,但它们的价格却贵如“黄金”每增加16GB内存或256G硬盘容量就要增加1000元以上的支出,价格远超出行业标准定价。我们往往不得不为了解决未来的焦虑而多花很多钱。↑升级芯片规格只要750元而当我们未来要进行更大计算量的工作时,即便当初已经花重金选购了大内存版本,但内存和硬盘容量仍有不足的风险。电脑除了内存容量不足以外,哪儿都没有毛病,但就是因为无法扩充内存容量而导致软件经常闪退,让电脑不得不在计划外进行报废!另外,一旦内存和硬盘出现故障,维修成本和难度也会大幅上升。对用户来说,板载内存似乎是一个弊远大于利的事情,多花钱不说,还可能不好用。那么为什么它却变成了笔记本设计趋势了呢?抛开内存成为某些厂商的生意经以外,板载内存确实有助于制造出更薄、更轻的笔记本电脑。另外,板载内存的成本较低,生产过程更加简单和高效,这有助于降低生产成本。此前惠普的体验工程高级总监 Haval Othman给出回应表示,板载内存可以:1.节省笔记本内部空间。2.生产成本更低、且生产难度降低。3.内存速度更快、更高效。4.电池更加耐用。随着内存迭代,频率不断攀升,SO-DIMM 接口对于这种高带宽的内存显然是力不从心了,在板载内存上面现如今已经突破到 8000MT/s 的大关。普通 SO-DIMM 只能限制在主流的4800MT/s-64000 MT/s 左右,频率对比板载内存确实少了一大截。大容量内存更易让消费者产生正向感知大幅降低发热和耗电的 LPDDR内存对电气信号抗干扰要求就更高,显然板载内存的形式要优于传统插槽形式。不过,如果你以为板载内存能让所有人都对系统性能有感知性的提升,那可就有些天真了。实际上,除非你是做一些超级专业的工作或追求极致性能的玩家,否则你很难感受到内存频率带来的这种微小的性能差异。反倒是内存容量的大小对于用户应用效率的影响更大。此前,PConline也做过相关测试,在分别使用单条内存、双条内存与双条大内存的前提下,对不同负载的执行效率进行测试,大内存带来的应用效率收益十分明显,尤其对于做影视剪辑或3D建模的同学来说,往往升级一条内存条就能解决燃眉之急,对于游戏发烧友来说,情况也是如此。当年就有一批“8G妥妥够用”的同学,在玩《巫师3》等3A大作的时候就被内存容量拖了后腿,好在当时的游戏本还都可以升级内存,只花了几百块钱就解决了烦恼。如今随着本地AIGC的爆火,内存需求更是雪上加霜,当用户选择了小容量板载内存的产品时,恐怕只能怀着沉甸甸的银子去寻找新的伙伴了。另外,我们不可否认板载内存提升了电脑结构稳定性和耐久度。毕竟少了可拆卸部件,整体的结构坚固度自然就高了一些。尤其对于笔记本电脑这种需要随身携带的设备来说,耐用性可是一个重要的考量因素。可反过来看,以前如果我们电脑的内存条出了问题,只需再买一条新的就搞定了。可如今板载内存一旦损坏就必须把整个主板卸下来换新,这可不是普通消费者能玩得转的活儿。加上主板的费用,保修期一过,修理的支出往往高得吓人。更完美的选择?对于这场板载内存的争议,我的态度其实是既不能全盘否定,也不能过于偏激。我们要看到目前板载内存确实给消费者带来一些不便,但追求轻薄机身和优化生产效率也是笔记本厂商必须权衡的现实考量。更重要的是,科技发展没有止境,未来新技术的出现,或许能让所有纠葛迎刃而解。比如最近获批的 CAMM2 内存标准,它不仅集成了内存和插槽两种设计,而且容量和频率都有了大幅提升。目前,CAMM2内存基于DDR5、LPDDR5和LPDDR5X标准,容量高达256GB。CAMM2内存与多数人传统观念中的“内存条”有着很大的区别,更像是一块焊接了内存颗粒及主控的纤薄PCB。在安装时,只需要将PCB版放入指定的区域中并拧上固定螺丝即可iFixit 曾拆解了联想 ThinkPad P1 Gen 7 移动工作站,可以看到其配备了 LPCAMM2 内存模组,可以不降低 LPDDR 的能效情况下实现可插拔。从图片上看,有三个限位孔和三个螺丝固定,底座则是类似于 CPU 的 LGA 针脚。另外,每个LPCAMM2 内存默认都是真·双通道设计。相对比于传统的 SO-DIMM,LPCAMM2 内存节约了 64% 的空间,降低了 57% 的功耗。实现了 8533MT/s 的传输速度。目前CAMM2已经获得了镁光、三星、海力士及龙芯中科等厂商的支持,基本上囊括了目前主要的内存制造商。镁光也已经推出了零售的产品,64GB LPDDR5X-7500 售价在 2300 元左右。总的来说,板载内存的兴起反映了笔记本电脑行业的发展趋势,即追求更轻薄、更高效的设备。然而,这一趋势也带来了不少挑战,尤其是对于那些希望升级硬件的用户。我们也期待未来的CAMM2内存能够解决当前的限制,为用户提供更多的选择和灵活性。 ... PC版: 手机版:

封面图片

国产量子计算用温度计刷新纪录:可测宇宙最低温度

国产量子计算用温度计刷新纪录:可测宇宙最低温度 该产品测温极限接近6毫开尔文(mK),刷新了国内纪录,标志着我国超导量子计算极低温测量技术达到世界先进水平。氧化钌温度计是量子计算机的核心器件之一,可用于对量子芯片的工作环境进行测温。据介绍,“宇宙最低温度”通常指的是0开尔文,也被称为“绝对零度”(约零下273.15℃),是理论上能达到的热力学最低温度极限,而量子芯片正需要在接近“绝对零度”条件下运行。国盾量子表示,目前,国内氧化钌温度计主要依赖进口,没有能在10mK以下温区进行测量的国产替代产品。国盾量子此次推出的氧化钌温度计ezQ-RX56,主要应用于6mK-200mK温区的测量,测温极限6mK(接近-273.144℃),刷新了国内最低起测温度的纪录,并具有较高的测量精度和灵敏度,能实现连续测量和快速响应。与普通的氧化钌温度计相比,国盾量子氧化钌温度计的标定基准在20mK以下温区采用顺磁盐温度计,显著降低了标定过程的环境干扰和测量误差,大幅提高温度标定的准确性和可靠性。以上图源均来自“国盾量子”公众号 ... PC版: 手机版:

封面图片

AMD为日本新干线运营商JR九州提供人工智能轨道检测解决方案

AMD为日本新干线运营商JR九州提供人工智能轨道检测解决方案 JR 九州子弹头列车在超过 1455 英里长的铁轨上运行,列车时速高达 161 英里/小时。安全是公司的头等大事,要求每隔一定时间对轨道进行严格检查。为了提高评估的效率和准确性,JR九州选择了东京工匠智能公司(TAI)的AMD驱动解决方案,该解决方案使用高速图像处理和先进的人工智能功能来检测和检查松动的螺栓和其他轨道问题。JR九州公司新干线部工程分部副经理坂口和弘说:"有了TAI和AMD的新解决方案,我们能够提高传统轨道检测的效率,我们预计通过未来的功能增强,检测效率将进一步提高。"轨道检测解决方案的核心是一个安装在小车上的视觉计算盒,它能以每小时 12 英里的速度检测轨道。该盒子配有一个高速摄像头,使用基于 FPGA 的 Kria K26 SOM 进行人工智能增强型前后数据和图像处理。Kria K26 SOM 是一个紧凑的一体化嵌入式平台,集成了定制的 AMD Zynq UltraScale+ MPSoC、DDR 内存、非易失性存储设备、安全模块和铝制散热器。TAI联合创始人兼首席执行官Hiroki Nakahara说:"在这种情况下,人工智能最重要的好处是降低成本。"用小车取代传统的徒步检查轨道的方法,极大地提高了运营效率。"AMD Kria SOM解决方案的可编程性、耐用性和嵌入式智能也使其能够适应JR九州独特而多变的条件、地理位置和乘客需求。由于铁路安装在自然环境中,因此能够更新 Kria SOM 以适应每天不断变化的自然条件至关重要,并有助于未来的投资。AMD 工业、视觉、医疗和科学市场高级总监 Chetan Khona 表示:"AMD Kria SOM 正在加速边缘创新,通过部署简化解决方案的开发。JR九州是一个完美的例子,说明了Kria SOM无穷无尽的可编程性如何与边缘人工智能计算相结合,在从机器视觉到工业机器人和人工智能/ML计算等各种应用中实现流程自动化并显著提高运营效率。"点击此处阅读 AMD 和 JR Kyushu 客户案例研究。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人