SK hynix GDDR7内存将GPU带宽提升至160GB/秒 容量达24Gb

SK hynix GDDR7内存将GPU带宽提升至160GB/秒 容量达24Gb 虽然有报道称第一代 GDDR7 内存产品将使用 28 Gbps 的芯片,容量为 16 GB(2 GB VRAM),但 DRAM 制造商并没有停止展示他们的下一代产品。在GTC 2024上,SK hynix展示了其GDDR7内存模块,它将提供40 Gbps的针脚速度,每个模块的带宽高达160 GB/s。GDDR7 标准的基准速度为 32 Gbps,每个模块的带宽为 128 GB/s,因此未来的 GDDR7 变体在带宽方面将提升 25%。三星也在加速 GDDR7 DRAM 的生产,该公司还在 GTC 上展示了其内存模块,不过是 16 Gb 和 32 Gbps 两种规格。该公司还展示了引脚速度 37 Gbps 的模块。此外,该公司还将推出不同容量的x显存,目前已上市的最高容量为 24 Gb,基准容量为 16 Gb。使用 16 Gb 模块可获得 2 GB 的 VRAM 容量,使用 24 Gb 模块可获得 3 GB 的 VRAM 容量。但我们已经报道过 JEDEC 公布的规格,这些规格证实 GDDR7 将达到 48 Gbps 的速度和 64 Gb 的密度(8 GB VRAM 容量)。这将标志着显存容量的大幅提升,256 位标准接口可提供 64 GB 容量。相比之下,目前 256 位总线接口使用 16 Gb DRAM 模块可达到的最大容量为 16 GB。24GB DRAM 模块可将容量提升至 24GB。但同样,这些速度和容量也不是我们一开始就能期待的。这样的规格可能要到 2026-2027 年之后才能实现,而现在距离 2026-2027 年还有很多年。以下是我们可以期待的第一代 GDDR7 内存产品:512 位/28 Gbps/32GB(最大内存)/1792 GB/s(最大带宽)384 位 / 28 Gbps / 24 GB(最大内存)/ 1344 GB/秒(最大带宽)256 位 / 28 Gbps / 16 GB(最大内存)/ 896.0 GB/秒(最大带宽)192 位 / 28 Gbps / 12 GB(最大内存)/ 672.0 GB/秒(最大带宽)128 位/28 Gbps/8GB(最大内存)/448.0 GB/s(最大带宽)以下是 SK hynix 40 Gbps 和 24 Gb GDDR7 DRAM 产品上市后的预期:512 位 / 40 Gbps / 48 GB(最大内存)/ 2560 GB/秒(最大带宽)384 位/40 Gbps/36 GB(最大内存)/1920 GB/秒(最大带宽)256 位/40 Gbps/24 GB(最大内存)/1280 GB/秒(最大带宽)192 位/40 Gbps/18 GB(最大内存)/960.0 GB/秒(最大带宽)128 位 / 40 Gbps / 12 GB(最大内存)/ 640.0 GB/秒(最大带宽)除了GDDR7内存模块,SK hynix还展示了DDR5 MCR DIMM,每个模块的容量达64 GB,速度达8800 MT/s,电压为1.1V。 ... PC版: 手机版:

相关推荐

封面图片

三星展示GDDR7内存模块:为下一代游戏GPU设计 16Gb密度32Gbps速率

三星展示GDDR7内存模块:为下一代游戏GPU设计 16Gb密度32Gbps速率 三星将成为下一代 GDDR7 内存标准的主要供应商之一,该标准将成为下一代游戏 GPU 的主要标准。该公司早在 2023 年就宣布了开发计划,并将很快推出速度更快的变体,不过新标准的起点仍将是 32 Gbps 的速度。三星最初推出的 GDDR7 内存模块密度为 16GB,每个模块提供 2GB 容量。速度将设定为 32 Gbps(PAM3),并可降低至 28 Gbps,以提高产量和起步阶段的整体性能/成本。三星还表示,GDDR7 内存的能效将提高 20%,同时工作电压仅为 1.1V(低于 1.2V 标准)。其他特点还包括,由于采用了更新的封装材料和优化的电路设计,高速运行时的发热量降低,热阻比 GDDR6 降低了 70%。JEDEC 最近发布了 GDDR7内存规格,主要亮点包括:核心独立的 LFSR(线性反馈移位寄存器)训练模式,带有遮罩和错误计数器,可提高训练精度,同时缩短训练时间。独立通道数量增加一倍,从 GDDR6 的 2 个增加到 GDDR7 的 4 个。支持 16 Gbit 至 32 Gbit 密度,包括支持双通道模式,使系统容量翻倍。通过集成最新的数据完整性功能,包括带实时报告功能的片上 ECC (ODECC)、数据毒性、错误检查和擦除功能,以及带命令屏蔽功能的命令地址奇偶校验 (CAPARBLK),满足市场对 RAS(可靠性、可用性和可维护性)的需求。虽然 GDDR7 的规格更快,但这些都要等到 2025-2026 年才能实现。这又让我们回到了 28 Gbps GDDR7 显存颗粒上,英伟达下一代GeForce RTX 50"黑武士"游戏 GPU 已将其作为首选产品。到目前为止,传言中提到前三个芯片将使用 GDDR7 显存,这意味着入门级 SKU 目前可能会坚持使用 GDDR6(X),稍后在 GDDR7 成为可行的替代品时再转用 GDDR7。512 位/28 Gbps/32GB(最大内存)/1792 GB/s(最大带宽)384 位 / 28 Gbps / 24 GB(最大内存)/ 1344 GB/秒(最大带宽)256 位/28 Gbps/16GB(最大内存)/896.0 GB/s(最大带宽)192 位 / 28 Gbps / 12 GB(最大内存)/ 672.0 GB/秒(最大带宽)128 位/28 Gbps/8GB(最大内存)/448.0 GB/s(最大带宽)我们注意到,GDDR6 和 GDDR6X 内存模块的一个特点是超频变得非常容易。您可以轻松地手动将这些芯片设置为更高的频率,而且它们工作起来非常顺手。随着新显存产量的增加,首批 GDDR7 显卡可能会在今年晚些时候面世。这将是整个消费级显存市场的新起点,我们期待着它的发展。 ... PC版: 手机版:

封面图片

Rambus推出GDDR7内存控制器IP:提供48 Gbps速率和192GB/s带宽

Rambus推出GDDR7内存控制器IP:提供48 Gbps速率和192GB/s带宽 人工智能 2.0 训练过程的输出是一个推理模型,可用于根据用户的提示创建新的多模态内容。由于准确性和保真度会随着模型规模的扩大而提高,因此推理模型的规模也在不断扩大。随着人工智能推理变得越来越普遍,并从数据中心转移到边缘和终端,这促使整个计算环境需要更强大的处理引擎和定制的高性能内存解决方案。GPU 一直是推理引擎的首选,在服务器和台式机等边缘和终端应用中,GPU 一直使用 GDDR6 内存。然而,GDDR6 已经达到了标准 NRZ 信号每秒 24 千兆比特(Gbps)数据传输速率的实际极限。为了满足未来 GPU 的带宽需求,需要使用新信号方案的新一代 GDDR。使用 PAM3 信号的 GDDR7 内存可将数据传输速率提高到 40 Gbps 或更高。Rambus介绍说:GDDR 目前已达到 GDDR7 规格水平,是当今最先进的图形内存解决方案,其性能发展蓝图达 48Gbps,每个 GDDR7 内存设备的内存吞吐量达 192 GB/s。在带宽这一关键参数上,GDDR7 内存确实大放异彩。在 32 Gbps 的数据传输速率和 32 位宽接口条件下,GDDR7 设备可提供 128 GB/s 的内存带宽,是任何其他解决方案的两倍多。GDDR7 内存为人工智能推理提供了最佳的速度、带宽和延迟性能。Rambus 已经在提供 HBM、PCIe 和 CXL 控制器 IP,现在又推出了业界首个GDDR7存储器控制器 IP。Rambus GDDR7 控制器支持 40 Gbps 运行,为 GDDR7 存储器设备提供160GB/s的吞吐量,比业界吞吐量最高的 GDDR6 控制器(同样来自 Rambus)提高了 67%。Rambus GDDR7 控制器实现了新一代 GDDR 内存部署,适用于人工智能加速器、图形和高性能计算 (HPC) 应用。Rambus GDDR7 控制器主要功能支持包括 PAM3 和 NRZ 信号在内的所有 GDDR7 链路功能支持多种 GDDR7 设备尺寸和速度经过优化,可在各种流量情况下实现高效率和低延迟灵活的 AXI 接口支持低功耗支持(自刷新、休眠自刷新、动态频率缩放等)可靠性、可用性和可维护性(RAS)功能如端到端数据路径奇偶校验、存储寄存器奇偶校验保护等。全面的记忆测试支持可为第三方 PHY 提供集成支持利用最新的 GDDR7 VIP 和内存供应商内存模型进行验证 ... PC版: 手机版:

封面图片

首批采用GDDR7内存的GPU可能采用16Gbit芯片 也有可能采用24Gbit

首批采用GDDR7内存的GPU可能采用16Gbit芯片 也有可能采用24Gbit 旗舰产品 RTX 4090 在其 384 位内存总线上使用了 12 个这样的芯片,可组成 24 GB 显存。Kopite7kimi 泄露的信息可能有不同的含义,就像 RTX 30 系列的"Ampere"和 RTX 40 系列的"Ada"一样,英伟达可能不会在所有细分产品上都使用 JEDEC 标准的 GDDR7,而可能会与一家拥有最适合其图形架构的内存总线信号和电源管理技术的 DRAM 公司共同设计一种独家标准。它与美光科技公司共同开发的 GDDR6X 正是这样做的。GDDR7 的数据传输速率高达 32 Gbps,这将是 2024 年年底到 2025 年推出的第一轮 GDDR7 芯片的最高速度。第二轮 GDDR7 芯片将于 2025 年底至 2026 年推出,速度可达 36 Gbps。这类似于第一批 GDDR6 芯片的速度为 14-16 Gbps,而下一轮的速度为 18-20 Gbps。另一个非常有趣的发展是的一篇文章,文章称 GDDR7 将出现非对称密度,如 24 Gbit 和 48 Gbit。24 Gbit 密度的 GDDR7 芯片容量为 3 GB,在 192 位内存总线上的容量为 18 GB;在 256 位内存总线上的容量为 24 GB;在 128 位内存总线上的容量为 12 GB。假设 GPU 制造商希望降低电路板成本,并缩小内存总线宽度以利用 32 Gbps 的速度,那么他们现在就可以选择使用这些 24 Gbit 芯片来弥补显存容量的不足。当然,GDDR7 标准有更高的密度,如 32 Gbit 或甚至 64 Gbit,但这些芯片将是奇特的、昂贵的,而且仅限于专业图形市场,我们可以想想 RTX Blackwell Generation 或 Radeon Pro RDNA 4,再看一下自己的钱包。 ... PC版: 手机版:

封面图片

SK海力士计划2025Q1量产GDDR7 传输速度达40Gbps

SK海力士计划2025Q1量产GDDR7 传输速度达40Gbps 据悉,三星和美光都计划在2024年内实现GDDR7的量产。三星的GDDR7产品页面已在今年3月上线,而美光最近也公告已向合作伙伴提供了样品,并预计在2024年下半年开始供货。尽管如此,SK海力士的量产计划虽然稍晚,但并不意味着失去了市场先机。目前,各方都在与合作伙伴进行紧密验证,确保产品的稳定性和性能。值得一提的是,GDDR7在信号编码机制上有了显著的进步。它采用了PAM3信号编码机制,与GDDR6使用的NRZ/PAM2和英伟达、美光共同开发的GDDT6X使用的PAM4有所不同。PAM3每两个周期能传输3位数据,而NRZ/PAM2每周期传输1位,PAM4每周期传输2位。这一改变进一步提升了数据传输效率和带宽。从SK海力士展出的样品来看,他们计划提供16Gb(2GB)和24Gb(3GB)的模块,速率高达40Gbps,对应的带宽达到惊人的160GB/s。这一数据比三星和美光首批GDDR7芯片的32Gbps速率和16Gb(2GB)模块容量更为出色。SK海力士显然在性能上下了不少功夫,为其未来的市场竞争增添了信心。 ... PC版: 手机版:

封面图片

RTX 50"Blackwell"GB200 GPU将保留与Ada相同的内存总线 最高达384位

RTX 50"Blackwell"GB200 GPU将保留与Ada相同的内存总线 最高达384位 NVIDIA GeForce RTX 40"Ada"图形处理器阵容目前包括以下五个 SKU:AD102(384 位)AD103(256 位)AD104(192 位)AD106(128 位)AD107(128 位)我们看到NVIDIA的入门级 AD107 GPU SKU 低至 96 位,但这只是少数几种移动配置。GeForce RTX 4090 和 RTX 6000 Ada 是该阵容的领头羊,它们都配备了 384 位总线接口和 24/48 GB 的显存容量。联系起第一代GDDR7 芯片上看到的情况,NVIDIA 有可能会为其下一代 GB200"Blackwell"游戏 GPU(GeForce RTX 50 系列)保留相同的显存配置。我们可以期待以下情况:GB202(384 位)GB203(256 位)GB204(192 位)GB206(128 位)GB107(128 位)如果NVIDIA继续使用时钟频率为 32 Gbps 的标准 16 Gb(2 GB)内存模块,那么产品阵容将如下所示:GB202- 384 位 / 32 Gbps / 24 GB(最大内存)/ 1536 GB/秒(最大带宽)GB203- 256 位 / 32 Gbps / 16 GB(最大内存)/ 1024 GB/秒(最大带宽)GB204- 192 位 / 32 Gbps / 12 GB(最大内存)/ 768.0 GB/秒(最大带宽)GB206- 128 位 / 32 Gbps / 8 GB(最大内存)/ 512.0 GB/秒(最大带宽)GB207- 128 位 / 32 Gbps / 8 GB(最大内存)/ 512.0 GB/秒(最大带宽)上述配置只是初步配置,众所周知,英伟达在其入门级 SKU 上会使用较低的内存时钟。此外,上述最大内存仅基于单面配置。NVIDIA GeForce RTX 4060 Ti 16 GB 采用了双面 DRAM 芯片,因此,如果情况确实如此,NVIDIA可以将每款 GPU 的双倍内存版本并排提供,或者从一开始就作为标准配置提供。如果英伟达坚持将 24 GB 作为最大 VRAM,那么这将是第三款具有如此容量的旗舰型号,之前的是 GeForce RTX 3090 和现有的 GeForce RTX 4090。根据之前的传言,NVIDIA GeForce RTX 50 "Blackwell "游戏 GPU 将采用台积电 3nm 工艺节点制造,支持 DisplayPort 2.1 以及与现有产品系列类似的 FE Founders Edition 冷却系统,但会有一些新的升级。下一代系列预计将于 2024 年底推出,届时距离 RTX 40 "SUPER "系列的发布将近一年,距离 RTX 40 "Ada "系列的发布也将近两年。 ... PC版: 手机版:

封面图片

三星、美光和SK海力士均提供GDDR7内存样品 GDDR 7大战即将拉开序幕

三星、美光和SK海力士均提供GDDR7内存样品 GDDR 7大战即将拉开序幕 起初,显卡内存兼容CPU内存,主要使用DDR内存,然而鉴于图像处理需求逐年攀升,显卡逐渐转向采用专门为图形处理器(GPU)设计GDDR。由于GDDR具有更高的数据传输速率和带宽,在推动GPU的发展过程中起到了很关键的作用。GDDR技术发展历程历经二十余年发展,GDDR家族已经迭代至第七代,GDDR家族主要有GDDR、GDDR2、GDDR3、GDDR4、GDDR5 和 GDDR6,以及最新推出的GDDR 7。在此,我们先看下前六代的技术和性能上的情况。来源:imec虽然GDDR专为GPU设计,但是最开始的一二代GDDR和GDDR 2并没有比DDR提升很多,因此也没得到GPU厂商的大规模采用。所以GDDR的正式被认可和迭代可以说是从GDDR3开始。自GDDR3开始,Nvidia和AMD等主要GPU厂商的参与使得GDDR标准得到了大幅提升,得益于制程工艺的不断进步,GDDR3内存的数据传输速率从最初的1GHz一路攀升至2.5GHz,实现了大幅提升,并保持了长达五年的生命周期,为现代图形处理和计算提供了强大的支持。GDDR4在GDDR3的基础上,进一步提升了数据传输速率和能效。虽然GDDR4在技术上取得了进步,但由于当时NVIDIA和ATI之间对于GDDR 4标准意见相左,且存在激烈的竞争关系,NVIDIA没有采用GDDR 4,这导致其市场占有率相对有限,成本很高,GDDR4很快就被历史所遗忘。GDDR5大幅提升了带宽和速度,成为2008年后高性能显卡的标配。GDDR5具有更高的时钟频率和数据传输速率,广泛应用于各类图形处理和计算任务中。GDDR5之后,NVIDIA还与美光推出了GDDR5X半代产品,用于NVIDIA高端显卡。而GDDR6则在数据传输速率和能效方面进一步提升,成为现代高端GPU的主流选择。GDDR6X引入了PAM4(Pulse Amplitude Modulation 4)信号技术,显著提高了数据传输速率。Nvidia在其Ampere架构,如GeForce RTX 3080和RTX 3090,率先采用了GDDR6X内存。可以看出,从最初的GDDR到最新的GDDR6,GDDR内存经历了多次技术迭代和性能提升。每一代GDDR内存都在数据传输速率、带宽和能效方面不断优化,满足了GPU和图形处理日益增长的需求。如今,它已成为人工智能和大数据应用领域中最受欢迎的内存芯片之一。GDDR7大战打响 三星和SK海力士打头阵目前,三星、美光和SK海力士均已开始提供GDDR7内存样品,GDDR 7大战即将拉开序幕。三星和SK海力士在今年3月份NVIDIA的GTC大会上均宣布了各家GDDR7的相关指标。两家公司都展示了16Gb(2GB)密度的产品,24Gb(3GB)更高版本没有在这一波浪潮中展现。按照三星的披露,三星GDDR7芯片能够在仅1.1 V的DRAM电压下实现32 Gbps的速度,这超过了JEDEC的GDDR7规范中的1.2 V,这一性能是通过首次应用PAM3信号实现的。再加上三星特有的其他电源管理创新,能源效率提高了20%,将待机功耗降低 50%,从而减少整体功耗。三星还在封装基板方面进行了一些创新,它使用了一种导热性高、热阻低的环氧模塑料 (EMC) 进行 GDDR7 封装,以确保有源元件(IC本身)不会过热,与 GDDR6 芯片相比,热阻降低了70%。这些芯片采用512M x32组合,采用266针FBGA 封装。而SK海力士表示它将提供速度高达40 Gbps的GDDR7芯片。与其前身GDDR6相比,最新的GDDR7产品提供的最大带宽达到160GB/s,是其上一代产品(GDDR6位80GB/s)的两倍,功耗效率提升了40%,同时,内存密度提升了1.5倍,使得视觉效果也进一步得到增强。独立的四通道的模式,提高了内存并行处理能力,每个通道支持32字节的数据访问。除了四通道模式,GDDR7还支持双通道模式,提供了灵活的配置选项,以适应不同的应用需求和系统架构。SK海力士GDDR7技术指标(来源:SK海力士)SK海力士GDDR7采用与GDDR6相同的板尺寸,大小为12mm x 14mm,这意味着在设计和制造过程中,GDDR7可以直接替换现有的GDDR6模块,而无需对电路板进行重新设计。此外,GDDR7内存还配备了专用的内存实现方案和PCB(印刷电路板)设计,以最大化其性能和效率。(来源:SK海力士)SK海力士的16Gb GDDR7 芯片基本已经准备就绪,将在今年晚些时候批量出货。三星的也在出样品的过程中。虽然尚不清楚谁将成为三星和SK海力士GDDR7内存的首批客户,但是考虑到两家均在NVIDIA GTC2024上进行展示,这也很清楚地表明NVIDIA是其中之一。姗姗来迟的美光2024年6月4日,美光宣布开始为下一代GPU提供GDDR7内存样品,它有28GB/s和32Gb/s两种速度。新一代GDDR7采用美光科技的1β (1-beta) DRAM 技术制造,在能效和性能上实现了大幅提升。美光在宣布这一消息时公布了一些诱人的数字。该公司表示,32Gb/s GDDR7提供的内存带宽比GDDR6高出60%,在384位总线上可达到1.5TB/s的内存带宽。这比其前代产品有了显著的飞跃,前代产品在RTX 4090等 GPU上的384位内存总线上最高可达1TB/s。同时,工作电压降低至1.2V,上一代为1.35V,美光表示,其GDDR7的效率比GDDR6 提高了50%,实现节能的方式主要包括分割电压平面、部分设备运行和休眠模式。采用FBGA更薄的封装高度(1.1mm对比1.2mm)和高热导EMC封装,提供65%更好的热阻,这为台式机和笔记本电脑提供了更好的热管理。美光GDDR6与GDDR7特点比较美光GDDR7的这些特性提升使其在游戏、生成式AI、高性能计算(HPC)领域前景广阔。也就意味着GDDR7可能与HBM相竞争。如美光所述,在游戏领域,GDDR7预计在每秒帧数(FPS)方面可提升超过30%,特别是在光线追踪和光栅化工作负载下;在生成式AI应用中,GDDR7提供超过1.5 TB/s的高系统带宽,预计可将生成式AI文本到图像生成的响应时间减少多达20%;对于HPC,GDDR7预计能够减少处理时间,实现复杂工作负载(如动画、3D设计、科学仿真和金融建模)的无缝多任务处理。据美光的公告,其GDDR7内存将于2024年下半年直接从美光以及通过精选的全球渠道分销商和经销商发售。NVIDIA使用美光的内存是板上钉钉了,因为此前美光专门为 Nvidia 制造了GDDR6x,不过在美光GDDR7的公告中也提到了AMD,因此AMD也可能会加入这一行列。GDDR 7最大的技术变化2024年3月,JEDEC发布了GDDR7 内存标准规范。JEDEC 是微电子行业标准制定领域的全球领导者。如下图所示,GDDR7的每引脚带宽最高可达48 Gbps,远高于GDDR6和GDDR6X的24 Gbps。在256位总线宽度下,GDDR7的总带宽达到1024 GB/sec,显著高于GDDR6和GDDR6X的768 GB/sec。GDDR7的工作电压为1.2 V,比GDDR6和GDDR6X的1.35 V更低。在信号技术上, GDDR7采用PAM-3信号技术,而GDDR6X采用PAM-4,GDDR6则使用传统的NRZ信号技术。GDDR7的最大密度达到64 Gb,是GDDR6和GDDR6X的两倍。GDDR7采用266 FBGA封装,高于GDDR6和GDDR6X的180 FBGA。图表展示了GDDR7相对于前几代在带宽、功耗和封装上的显著改进。来源:anandtechGDDR7最大的技术变化在于内存总线从2位不归零 (NRZ) 编码转换为3位脉冲(-1、0、+1)幅度调制 (PAM3) 编码。PAM3使GDDR7能够在两个周期内传输3位数据,仅这一变化就让数据传输效率提高了50%。随着向PAM3信号的转变,内存行业有了一条新途径来扩展 GDDR 设备的性能并推动图形和各种高性能应用的持续发展。之前的GDDR标准使用非归零(NRZ)技术,通过两种信号电平来传输编码为1或0的数据。这种方法在多个GDDR世代中都足够使用,但随着时钟速度和系统复杂性的增加,成为了一大瓶颈。为了解决这一挑战,美光与英伟达推出了采用多级信号技术的创新GDDR6X技术。美光是唯一提供GDDR6X的公司,GDDR6X利用PAM4信号技术,提供了业界领先的>1.1 TB/s带宽。美光在GDDR6X方面的成功和经验为下一代使用类似信号方法的GDDR奠定了基础。虽然PAM3每周期传输的比特数量低于GDDR6X上的PAM4,但PAM3提供了50%的更高电压裕度,并且编码复杂度更低,这减... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人