售价超25万 NVIDIA顶级显卡抢购到明年：台积电加急生产

售价超25万NVIDIA顶级显卡抢购到明年：台积电加急生产订单在手，NVIDIA也紧急向台积电下单增产A100、H100等高性能AI显卡，导致后者的5nm产能利用率几近满载，现在台积电采用的是超级急件的方式给NVIDIA生产。即便如此，订单到今年底都是满载的，实在是太火了。H100基于GH100GPU核心，定制版台积电4nm工艺制造，800晶体管，集成18432个CUDA核心、576个张量核心、60MB二级缓存，支持6144-bitHBM高带宽内存，支持PCIe5.0。H100计算卡有SXM、PCIe5.0两种样式，其中SXM版本15872个CUDA核心、528个Tensor核心，PCIe5.0版本14952个CUDA核心、456个Tensor核心，功耗最高达700W。性能方面，FP64/FP3260TFlops(每秒60万亿次)，FP162000TFlops(每秒2000万亿次)，TF321000TFlops(每秒1000万亿次)，都三倍于A100，FP84000TFlops(每秒4000万亿次)，六倍于A100。...PC版：https://www.cnbeta.com.tw/articles/soft/1367365.htm手机版：https://m.cnbeta.com.tw/view/1367365.htm

在Telegram中查看

相关推荐

NVIDIA最强显卡H100找到外援产能大增30%

NVIDIA最强显卡H100找到外援产能大增30%NVIDIA的高端GPU采用了台积电的7nm、5nm工艺代工，但是产能瓶颈不在先进工艺上，而是所用的Cowos先进封装上，此前也是依赖台积电，但后者的产能提升有限，还有AMD等公司的订单抢产能。最新消息称，联电也开始给NVIDIA提供外援了，7月份起每个月增加3000片晶圆的Cowos中介层产能，然后再有另一家封测大厂Amkor安靠封装，三方的合作使得A100、H100的整体产能提升了30%。供应量上来了，A100、H100等显卡的供应情况应该会有所缓解，下半年有望解决加价抢购的麻烦。H100基于GH100GPU核心，定制版台积电4nm工艺制造，800晶体管，集成18432个CUDA核心、576个张量核心、60MB二级缓存，支持6144-bitHBM高带宽内存，支持PCIe5.0。性能方面，FP64/FP3260TFlops(每秒60万亿次)，FP162000TFlops(每秒2000万亿次)，TF321000TFlops(每秒1000万亿次)，都三倍于A100，FP84000TFlops(每秒4000万亿次)，六倍于A100。...PC版：https://www.cnbeta.com.tw/articles/soft/1369081.htm手机版：https://m.cnbeta.com.tw/view/1369081.htm

追赶NVIDIA！国产顶级AI GPU亮相：算力达160万亿次

追赶NVIDIA！国产顶级AIGPU亮相：算力达160万亿次曦思N100是一款面向云端数据中心应用的AI推理GPU加速卡，内置异构GPGPU通用计算核心“MXN100”，并集成HBM2E高带宽内存，单卡的INT8整数算力达160TOPS(160万亿次每秒)，FP16浮点算力则达80TFLOPS(80万亿次每秒)，兼备高带宽、低延时。曦思N100已实现规模量产，可广泛应用于智慧城市、智慧安防、智慧交通、云计算、智能视频处理等场景。沐曦产品均采用完全自主研发的GPUIP，拥有完全自主的指令集和架构，配以兼容主流GPU生态的完整软件栈(MXMACA)，具备高能效和高通用性的优势。投稿：@ZaiHuaBot频道：@TestFlightCN

英伟达第二次为中国特供加速卡H800

英伟达第二次为中国特供加速卡H800昨晚的GTC2023春季图形大会上，NVIDIA又确认为中国市场开发了第二个特供版H800，基于已有的H100调整而来，符合美政府的规定。NVIDIA没有透露H800的具体变化，外媒称和A800类似，将芯片间互连带宽缩减了一半，如果用于AI训练会消耗更长的时间。阿里巴巴、百度、腾讯BAT三巨头都已经用上了H800加速卡。H100加速卡采用全新的Hopper架构，GH100GPU核心，台积电4nm制造工艺、CoWoS2.5D封装技术，集成800亿个晶体管，核心面积814平方毫米。它拥有18432个CUDA核心、576个Tensor核心、60MB二级缓存，可搭配6144-bit位宽的六颗HBM3/HBM2e，总容量80GB，支持PCIe5.0、第四代NVLink总线。两种样式，其中SXM版本15872个CUDA核心、528个Tensor核心，显存带宽3.35TB/s，NVLink带宽900GB/s，PCIe5.0带宽128GB/s，热设计功耗最高700W。PCIe5.0版本14952个CUDA核心、456个Tensor核心，显存带宽2TB/s，NVLink带宽600GB/s，PCIe5.0带宽128GB/s，热设计功耗300-350W。目前尚不清楚中国特供的H800是哪种样式，猜测很可能是PCIe，那么NVLink互连带宽就只有300GB/s，PCIe5.0则应该不会缩水。A800规格表H100规格表：精简一下带宽就是H800H100加速卡...PC版：https://www.cnbeta.com.tw/articles/soft/1350665.htm手机版：https://m.cnbeta.com.tw/view/1350665.htm

ChatGPT需要1万张NVIDIA A100显卡国内仅有6家公司做到

ChatGPT需要1万张NVIDIAA100显卡国内仅有6家公司做到他们是商汤、百度、腾讯、字节、阿里和幻方，其中百度、腾讯、字节、阿里这样的互联网巨头能买到且买得起1万张A100显卡不让人意外。百度3月底已经发布了自己对标ChatGPT的产品文心一言，接下来其他公司也会陆续发布自己的AI产品。NVIDIAA100核心及计算卡是2020年5月份发布的，也是安培架构的第一款产品，7nm工艺制造，542亿个晶体管，826平方毫米面积，8196个流处理器，实际开启6912个，搭配5120-bit40GBHBM2显存，PCIe版本功耗250W。A100的单精度浮点性能高达19.5TFlops，FP64性能9.7TFLOPS，INT8性能624TOPS，TDP400W，显存的带宽也是恐怖的1.6TB/s，后期还发布过80GBHBM2e的版本，频率从2.4Gbps提升到3.2Gbps，使得带宽从1.6TB/s提升到2TB/s。...PC版：https://www.cnbeta.com.tw/articles/soft/1353167.htm手机版：https://m.cnbeta.com.tw/view/1353167.htm

NVIDIA发布三款全新RTX ADA工作站显卡 32GB显存卖2.9万元

NVIDIA发布三款全新RTXADA工作站显卡32GB显存卖2.9万元RTX6000ADA旗舰卡为双插槽、单涡轮风扇设计，满血的AD102GPU核心，配备18176个CUDA核心、568个Tensor核心，核心加速频率可达2.5GHz。显存搭档384-bit48GBGDDR6ECC，等效频率20GHz，带宽为960GB/s，整卡功耗300W，四个DP1.4a接口。FP32浮点性能91.1TFlops(每秒91.1万亿次)，价格高达6800美元，约合人民币4.90万元。RTX5000ADA延续了老大哥的造型、AD102核心，精简到12800个CUDA核心、400个Tensor核心。显存也砍到256-bit32GB，频率18GHz，带宽降至578GB/s，功耗也来到250W。浮点性能65.3TFlops，相当于旗舰卡的约72％，价格4000美元，约合人民币2.88元。RTX4500ADA外观依然不变，但内部改成了AD104核心(跳过AD103)，7680个CUDA核心、240个Tensor核心的规模与RTX4070Ti完全一致。核心频率是全系列最高的2.6GHz，显存是192-bit24GBGDDR6ECC，频率18GHz，带宽432GB/s。浮点性能39.6TFlops，价格2250美元，约合人民币1.62万元。RTX4000ADA改成了单插槽设计，还是单个涡轮风扇，AD104核心，6144个CUDA核心、192个Tensor核心、160-bit20GBGDDR6显存，接口四个miniDP1.4a，这些都和SFF半完全一致。不过核心频率从1.56GHz大幅提高到2.2GHz，显存频率也从16GHz提高到18GHz，浮点性能来到了26.7TFlops，功耗也从70W大幅增至130W。价格倒是没变，还是1250美元，约合人民币9000元。Boxx、戴尔、LAMDda、联想、惠普等将从今年秋天开始陆续推出搭载新卡的工作站，甚至有的会配备四块RTX6000ADA，总显存多达192GB。...PC版：https://www.cnbeta.com.tw/articles/soft/1375929.htm手机版：https://m.cnbeta.com.tw/view/1375929.htm

1.8万核心GPU、144核心CPU NVIDIA大杀器将揭开面纱

1.8万核心GPU、144核心CPUNVIDIA大杀器将揭开面纱HotChips年度芯片行业盛会将在本月底举行，Intel、AMD、NVIDIA和众多业内芯片巨头都将拿出各家的拳头产品，秀秀肌肉。NVIDIA这次会有多场分享，重点覆盖HopperGPU计算加速器、GraceCPU服务器处理器、NVLink高速总线，届时会有多位高级工程师分享内部架构设计、性能数据。HopperGPU采用定制版台积电4nm工艺、全新架构，集成多达800亿个晶体管、18432个CUDA核心、576个Tensor核心，支持6144-bit位宽的80GBHBM3/HBM2e高带宽内存，并支持PCIe5.0、第四代NVLIink，性能号称四倍于上代A100，功耗最高700W。GraceCPU采用双芯合体设计，攻击144个Arm架构核心，集成396MB缓存，支持LPDDR5XECC内存，带宽达1TB/s，同样支持PCIe5.0，功耗500W。NVIDIA还打造了一颗超级芯片，HopperGPU、GraceCPU二合一，通过NVLink-C2C高速总线互连，带宽达900GB/s。PC版：https://www.cnbeta.com/articles/soft/1306753.htm手机版：https://m.cnbeta.com/view/1306753.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人