由于美国禁止向中国出口AI芯片,国内工厂开始拆解RTX 4090游戏显卡并将其改装成AI加速卡,工厂只保留芯片和内存,丢弃原始P

由于美国禁止向中国出口AI芯片,国内工厂开始拆解RTX 4090游戏显卡并将其改装成AI加速卡,工厂只保留芯片和内存,丢弃原始PCB和散热器,安装新的PCB和风扇,使卡片更紧凑。让多个RTX 4090卡可以并排放入服务器机架,用于AI计算。 工厂获得了禁令前运到中国的大批RTX 4090卡进行改造,改造后的价格上涨,原RTX 4090卡价格超过了2700美元。 当现有存货改造完毕后,这些工厂可能会关闭或转型,消费者最好等待RTX 4090价格稳定后再购买。()

相关推荐

封面图片

亚马逊售出假冒RTX 4090显卡 安装的是RTX 4080 GPU和烧毁的组件

亚马逊售出假冒RTX 4090显卡 安装的是RTX 4080 GPU和烧毁的组件 最近这起事件的受害者很不幸地从亚马逊收到了假冒的 RTX 4090。不幸的是,买家在收到货时发现"运输损坏",于是将它送到了 North West Repair(NWR),并在其 YouTube 频道上分享了这个故事。对显卡的初步目测发现,PCB 板上有一条巨大的裂缝。此外,似乎还有一个熔化的电源连接器我们以前在 RTX 4090 显卡上见过这种情况。但与深入检查后发现的情况相比,这就不算什么了。有问题的第一个迹象是其中一个螺丝上贴着假的防篡改保修贴纸,所有螺丝都拧得有点过紧有两个无法拧出,不得不用酒精浸泡。取下后盖和散热片后,NWR 注意到的第一件事是散热垫片只覆盖了一半的内存芯片。GPU 本身似乎已经完全烧毁,PCB 上的一些其他元件也是如此。事情从这里开始变得更糟了,虽然显卡贴纸上的序列号声称它是配备 24GB VRAM 的 RTX 4090,但 AD103-300-A1 代码却显示它是 RTX 4080。NWR 在视频中称这是 RTX 4090 笔记本 GPU,但该公司在 YouTube 评论区确认这是自己的失误。最后的结论是,这张卡"无法修复",因为没什么可修复的了。这已经不是我们第一次听说有人从亚马逊订购显卡却收到了其他东西。2022 年 12 月,亚马逊向一位加拿大买家发送了一张 RTX 3060 Ti 显卡,结果发现这是一张塞满了油灰状物质的假显卡。该公司表示,在"正确"的商品被送回仓库之前不会退款。不过,最近这起事件也有值得注意的地方。这位顾客是从亚马逊退货的打折交易中买的卡。我们经常看到这样的情况:一些不法分子为了拿回钱,会保留还能用的卡,并退回看起来与原产品相似的假卡。这些假货会被卖给其他顾客,而他们并不知道自己买到的是假货。本月早些时候,有报道称一位玩家在中国花 1600 美元购买了一台二手 RTX 4090,却发现它没有 GPU,而且缺少 VRAM 芯片。 ... PC版: 手机版:

封面图片

手工打造全球唯一RTX 4090 SUPER 3090Ti的身子、性能飙升40%

手工打造全球唯一RTX 4090 SUPER 3090Ti的身子、性能飙升40% 影驰RTX 3090 Ti HOF OC Lab专为极限玩家打造,配备了白色PCB、28相供电电路、两个16针供电接口,搭载的是GA102 GPU核心、21GB GDDR6X(ZC)显存。改造前改造后改造后水冷、液氮轮番安排Techlab团队将GPU核心换成了AD102-300-A1,将显存换成了24GHz GDDR6X(ZF),同时改造电路、BIOS,甚至调整了供电电压,成功点亮。Unigine Superposition 8K超高分辨率测试中,默认性能和RTX 4090非常相似。首先将显存超到等效25.8GHz,跑分提升了13%。再超核心频率,稳定在2871MHz,不时可以突破3GHz,跑分提升幅度达到16%。再配合液氮超到极限,跑分比默认高了多达恐怖的40%! ... PC版: 手机版:

封面图片

RTX 4090焊点频频脱落 完全没法修 暴力包装运输惹的祸

RTX 4090焊点频频脱落 完全没法修 暴力包装运输惹的祸 有些卡甚至不需要拆掉散热器、卸下GPU芯片,就能感觉不对头。询问得知,这些卡在包装运输时的安全措施都不到位,要么没有固定牢靠,要么泡沫填充不够,导致显卡遇到明显震动和撞击。要知道,RTX 4090显卡加上包装,动不动就会五六斤,很容易受伤。不过奇怪的是,这些脱落焊点基本都位于左上角和左下角,具体原因暂时不详。 ... PC版: 手机版:

封面图片

英伟达对华“特供”的H20、RTX4090D将受限

英伟达对华“特供”的H20、RTX4090D将受限 (1)芯片的I/O带宽传输速率大于或等于600 Gbyte/s;(2)数字处理单元/原始计算单元每次操作的比特长度乘以TOPS 计算出的算力之和大于或等于4800TOPS。”此举,直接导致了英伟达的A100、H100等高性能AI芯片无法对华出口。随后,英伟达为了挽回中国市场,针对中国市场推出了符合美国限制政策的AI芯片:A100和A800,主要是降低了互联速率。但是,在2023年10月17日,美国政府又推出了新的限制规则,进一步收紧了限制范围:(1)ECCN 3A090a针对最高性能芯片,集成电路中包含一个或多个处理单元达到以下任一标准:a) 综合运算性能(Total Processing Performance,TPP)达到4800,或b) 综合运算性能达到1600,同时“性能密度”(Performance Density,PD)达到5.92。(2)ECCN 3A090b针对次高性能芯片,集成电路中包含一个或多个处理单元达到以下任一标准:a) 综合运算性能达到2400但低于4800,性能密度达到1.6但低于5.92;b) 综合运算性能达到1600,性能密度达到3.2但低于5.92。但凡只要在上述两项性能标准范围内的美国芯片都将会受到限制。这也直接导致了英伟达针对中国市场推出的A100和A800芯片的对华出口受限,英伟达在A100和A800这两款芯片上的投资也是损失不小。此外,英伟达L40S、高端显卡RTX 4090等产品也受到了限制。不过,英伟达依旧不甘心放弃中国这个庞大的AI芯片市场。于是在去年四季度,英伟达又针对中国市场开发出了符合美国最新限制政策的四款AI芯片,包括 HGX H20、L20 PCle 和 L2 PCle。同时还开发了符合新规的高端显卡RTX 4090 D。从公布的参数来看,其中最强的H20的FP16、INT8等主要算力参数仅为A100的不足1/2,更是仅为H100的约1/7;L20的主要算力参数则相较于之前的L40、L40S分别下降约1/3、2/3。此前NVIDIA内部人士在访谈中也承认,H20单卡算力仅有H100的20%,相比某国产芯片,其性能也只有其60%多。此外,RTX 4090 D的核心数量相较RTX 4090也减少约11%,整体性能或降低了10%!显然,英伟达这些最新针对中国市场定制的产品性能被大幅阉割,使得市场大多对其性能表现、性价比持悲观或怀疑态度。不过,即便如此,美国方面似乎还是不放心。近日,美国又公布了将于今年4月4日生效的新的限制规则,4A003类目下 “数字计算机”、“电子组件”及其相关设备和“组件”,对于所有目的地(除EAR第740部分第1号补充文件国家组E:1或E:2中的国家外),“调整后峰值性能”(“APP”)超过70 Weighted TeraFLOPS(WT,每秒计算万亿次浮点运算,主要针对GPU性能,CPU和NPU主要提供定点/整数算力)的计算机和4A003.c中所述的“电子组件”都需要许可证(NLR)。这里需要补充说明的是,在AI训练方面,通常使用浮点格式FP16和FP32,因为它们具有足够高的精度。而在AI推理方面则通常使用整数数据格式INT8和INT4。也就是说,现有的美国厂商的计算机产品或组件,如果其综合浮点算力超过70 TFLOPS,则需要申请许可证才能出口。而这似乎是针对的是英伟达此前针对中国市场新推出的RTX 4090-D以及H20。数据显示,RTX 4090-D的FP16/FP32算力为74TFLOPS,H20的TF32算力为74 TFLOPS(L20的FP32/16算力为60TFLOPS不到)。这也意味着,英伟达RTX 4090-D以及H20对华出口可能需要申请许可,至于是否能够获批,则可能需要“逐案审查”(case-by-case review)。虽然也有国内媒体报道称,该政策可能将会限制到高性能的AI PC产品。但是,芯智讯认为,目前AMD、英特尔、高通、苹果等厂商所推出的集成了AI内核的面向AI PC的处理器,其浮点运算能力目前仍比较有限,更多还是提升整数运算能力,并不会受到新规限制。比如英特尔在去年底推出的Meteor Lake芯片(Core Ultra) 基于其AI引擎、NPU、CPU和GPU,可提供34TOPS(注意不是FLOPS)的算力。不过,以上只是笔者对于该规则的解读。目前英伟达官方面尚未有相关信息公布。芯智讯也有咨询英伟达中国区相关负责人,但对方并未对此进行回应。值得注意的是,美国商务部长雷蒙多在12月2日举办的“里根国防论坛”(Reagan National Defense Forum)上曾表示,即便会让企业难做,美国政府仍将持续修改(change constantly)先进芯片的出口管制,因为“科技会变、对手也会变,我们必须跟上”。雷蒙多指出,就算业者重新设计出一款能规避现有法令的芯片,只要被关注国家将之用来发展AI,“我第二天就会立刻出手控管”(I’m going to control it the very next day)。针对雷蒙多发言,英伟达CEO黄仁勋(Jensen Huang)曾于12月6日在新加坡召开的记者会上表示,英伟达一直都在积极配合美国政府,打造符合法规的产品。“我们打算继续配合美国政府,开发符合新规定的全新系列产品”。黄仁勋之前还曾表示,美国对华半导体出口的限制,也进一步刺激了中国努力发展半导体产业的决心,中国大陆目前已有数十家公司正在开发可与英伟达产品竞争的技术,这对英伟达在中国市场的发展也很不利。过去多年来,中国市场约占英伟达营收的20%。 ... PC版: 手机版:

封面图片

GeForce RTX 5090 GPU将采用大面积单片式GB202"Blackwell"芯片

GeForce RTX 5090 GPU将采用大面积单片式GB202"Blackwell"芯片 现在,根据内部人士 Kopite7kimi 发布的一条新推文,GPU 将采用单片式设计。虽然英伟达已经为其 HPC/AI 芯片(如 B100 和 B200)转向了芯片组设计,但该公司似乎仍希望为其面向消费者的 GPU 芯片保留单片封装。据说,GB202"Blackwell"GPU 将采用物理单片设计,而且从早先的报道中,我们知道它的 SM 和内核数量预计将是 GB203 的两倍,而 GB203 则是用于 GeForce RTX 5080 等产品的更为精简的芯片。这将使两款显卡的性能相差悬殊,但 RTX 5090 将是一款不折不扣的猛兽。让我们先来谈谈 GB202"黑井"图形处理器本身,目前可以确认的是它会是单片设计,英伟达可能会将两个 GB203 芯片封装在一个单片封装上,而不会使其看起来像Chiplet结构。这样可以更好地实现芯片间的通信,而不会出现芯片外通信瓶颈。虽然NVIDIA拥有克服瓶颈的解决方案,如 NVLINK 和其他互连技术,但它们可能会有点昂贵,因为它们会增加 GPU 的复杂性。英伟达已经有了一种解决方案,这种解决方案已经以 GA100 和 GH100 的形式在市场上推出,GA100 和 GH100 本质上是一个较小芯片的两半,通过互连连接,并通过一个分离的二级缓存进行通信。英伟达的Bryan Catanzaro解释说,这种实现方式提高了可扩展性,他们最初向这种设计的过渡非常顺利。预计该芯片还将采用台积电 4NP 工艺节点(5 纳米),密度将提高 30%(晶体管),因此除了架构升级外,也会带来不错的改进。现在,NVIDIA 可能也会在游戏方面采取同样的做法,这意味着如果整个项目取得成功,那么我们就能在未来看到 B100/B200 型芯片组产品。现在回到 NVIDIA GeForce RTX 5090,有多份报告称,我们可能会在这款下一代旗舰显卡上采用512 bit接口,而且已经有消息称,新一代怪兽级别显卡将采用全新的冷却和 PCB 解决方案。考虑到有传言称AMD 将凭借其 RDNA 4 阵容退出超高端图形性能领域,看起来英伟达一旦推出 Blackwell GPU,可能会进一步推动其在游戏领域的领先地位。GeForce RTX 5090 预计将在 RTX 5080 上市几周后推出,而 RTX 5080据传将是首款上架的 Blackwell 游戏 GPU。 ... PC版: 手机版:

封面图片

“阉割版”AI芯片,也能让英伟达赚疯?

“阉割版”AI芯片,也能让英伟达赚疯? 不过,H20在中国市场的实际情况,可能并没有如咨询机构预估的那般乐观。一位服务器经销商向虎嗅表示,目前一台H20八卡服务器,定价大约在120万元,而性能大幅领先的满配H100 NVLink版本的八卡服务器价格为270万元上下,而且是现货。尽管后者早早被列入禁止对华出售的名单中,但在非官方渠道中,这款芯片的货源基本没有断过,甚至在今年二季度H200开售后,这款芯片的价格还下跌了约10%。“无论怎么看,H20的性价比都还是太低。”这位服务器经销商提到,即便是同国内的解决方案相比,H20都难言有多大的竞争优势。“阉割版”,但还挺良心的?与同系列芯片不同,H20是一枚“赶工”性质非常明显的产品。在去年10月美国升级芯片禁令后,原本就被视为阉割版芯片的A800/H800,甚至是消费级产品RTX4090都被纳入禁令的管制范围。但仅在一个月后,就有台湾地区媒体报道称,英伟达向代工厂下了H20芯片的订单。在如此短的时间内,英伟达不可能重新设计一款芯片,最大的可能是基于既有型号进行有针对性的调整。比如新规中取消了将“互联带宽”作为限制芯片的识别参数,英伟达就将H20的HBM3显存容量拉高到96Gb,使显存带宽提高到4.0Tb/s;又比如新规新增了“性能密度”的限制,英伟达就向算力规格大砍一刀,使其理论性能仅为296TFLOP,相当于H100芯片的15%。至于那些新规没有提到的,比如PCIe Gen5扩展卡、八路HGX,英伟达全部保留了下来。值得一提的是,H20还有非常高的卡间互联速度,其NV Link带宽达到900Gb/s,很适合组建大规模集群。但这些特征组合在一起,却形成了一个很尴尬的事实:在算力大幅削减的情况下,H20的BOM很可能跟H100齐平,甚至高于后者。原因在于,存储颗粒一直是高性能计算卡成本的“大头”,比如H100芯片中,HBM3颗粒的采购就要占到60%左右,而在H20芯片上,英伟达又不得不为其配备更高规格的显存容量,以弥补算力不足的缺陷。基本可以断定,H20在英伟达高性能计算卡中,属于利润率最低的存在。相较于1.2-1.3万美元的售价,与它同成本的H100目前定价为2.5-3万美元。从这个角度来看,H20算是英伟达的一款良心产品了。英伟达自然不甘心于让一款单品拉低公司整体的毛利表现,但自去年芯片禁令升级后,英伟达四季度在中国大陆的营收,从上一季度的40.3亿降低至19.46亿,其中国区数据中心营收占比也从22%滑落至8%,英伟达急需用一款产品去稳住在中国的市场份额。H20就是英伟达拿出的诚意之作,但还是那个问题,H20的算力实在羸弱,这个硬伤无法被忽视。华为或与之一战?实际上,英伟达曾在今年2月进行过一次官方调价,在调价之前H20芯片的价格为2.3万美元,尽管英伟达表示降价的原因是“供货充足”,但如此大幅的价格调整,主要原因大概率还是销量没有达到预期。“国内大厂基本不会考虑H20服务器,都是闭眼买H100,而那些体量相对小的厂商也认为有点划不来。”有服务器经销商向笔者算了一笔账,现在H100的服务器单机租赁费用大概是8-9万元/月,而算力仅有前者六分之一的H20服务器价格为120万元上下,即便不考虑算力损耗的问题,厂商也需要购买6台H20服务器,才能与H100服务器相齐平。这样一对比,H20虽然是英伟达利润率最低的产品,但对于客户来说,实在称不上有性价比。而对于英伟达来说,还有一个不可忽视的因素是国内同类型竞品,比如华为升腾910B。与H20相比,910B在单卡算力(FP16)上几乎相当于前者的一倍。相应地,910B价格也要高于H20,服务器经销商向笔者表示,目前910B的服务器价格已经超过170万元。抛开价格,从实际表现来看,二者的竞争互有胜负手。910B强在算力和能效比上,H20则胜在软件生态与互联上。最直接的例子就是,H20兼容所有的英伟达H系列卡,而且具备极高的访存能力,在搭建算力集群时,能够更好地避免算力损耗。当然,这个集群规模是有上限的,比如各地筹划的“万P计算集群”,如果用H20搭建,那么0.15P单卡运算能力就意味着十万颗级别的GPU,组网难度极大。另外一个值得关注的问题是,英伟达与华为谁能更加稳定地供应产品?此前,就有业内人士向笔者提到过,对于那些急于购买搭建算力中心的厂商来说,H20可能是更现实的选择。一方面,英伟达的软件生态更加成熟,厂商的适配工作量要小得多;另一方面,目前无论是政策还是资本方,都对于算力中心的芯片国产化率有一定要求,910B的需求量非常大,相应地交付周期也比较长。这一说法笔者也在服务器经销商处得到了验证,对方向笔者表示,“在英伟达调价前,行业内客户对于910B的咨询要远大于H20,但现在也有客户对H20展现出了兴趣,因为有充足的现货。”有趣的是,二者可能并不是完全意义上的竞争关系,因为有业内人士向笔者表示,在他所在的公司,910B和H20被归为不同分级,在采购上并不冲突。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人