#中共出新招下半年或爆发大规模雪崩https://www.bannedbook.org/bnews/bait/2024050

中共出新招中小企业救专家存疑

又出新招了via

加速CPU设计，Arm再出新招

加速CPU设计，Arm再出新招在本周的HotChips2023上，ArmLtd在宣布（再次）上市后展示了其“Demeter”V2内核，该公司还推出了“Genesis”N2计算子系统，简称CSS智能包。（我们将单独深入探讨V2核心。）Genesis的这一努力有可能比过去更快地让ArmCPU进入该领域。多年来，Arm一直在朝着将成熟的CPU组装在一起以供客户修改并直接推向市场的目标迈进。早在2000年代末，当Arm接管智能手机时，服务器制造商正在考虑Arm架构如何改进基本上处于垄断地位的X86架构，服务器芯片设计人员从Arm架构许可开始，并开始使用它。这是一种非常昂贵且耗时的创建服务器芯片的方法，尽管比从定制ISA开始要好，但由于大量的软件移植工作，世界无法容忍定制ISA。在Broadcom、高通、AMD和三星等老牌半导体巨头以及Calxeda和AppliedMicro等初创公司多次尝试Arm服务器芯片失败后，以及Cavium凭借其ThunderX和ThunderX2CPU取得了一些有限的成功后，Arm决定将其推出。Neoverse的工作于2018年10月推出，它不仅提供了服务器芯片核心的路线图，还提供了参考架构，用于将这些核心转变为适当的CPU，并混合了其他Arm知识产权（例如片上芯片）网状互连和第三方内存、PCI-Express控制器和以太网控制器。这些Neoverse设计是针对台积电的特定工艺节点量身定制的，这使得服务器芯片制造商更容易更快地采取行动。我们从来不确定Neoverse是否比架构许可证更便宜或更贵。你可以用多种不同的方式来论证它。Neoverse完成了更多的工作，但与Arm架构许可证相比，自由度有限。也许更重要的是，正如我们所说，如果Arm不能比开源的RISC-VISA和设计更便宜，那么它可以更快。由于客户不耐烦，Arm无论如何都必须更快。以下是2022年9月公布的最新Neoverse路线图：最初，只有一个内核系列-N系列-但Arm将其分为三个内核系列和三个相应的平台，每个平台都针对系统市场的不同部分。N系列核心和平台针对主流服务器工作负载，其中每瓦性能驱动设计，而V系列具有更重的矢量处理，针对计算密集型工作负载，例如AI训练和推理以及HPC模拟和建模。E系列旨在实现吞吐量计算，并且不仅针对更高的每瓦性能进行了优化，而且还以比N系列更低的热封装实现了最大吞吐量。现在不仅有三个系列的内核和平台，还有两种方法：DIY和CSS。所以现在新的Neoverse路线图看起来像是硬塞进去了CSS选项：我们已经为我们所知的每个核心和平台添加了代号。Neoverse的努力让芯片公司在设计上取得了优势，而且许多公司已经做到了。富士通的A64FX芯片比当前任何供应商都早得多（比Neoverse的努力早了很多年），并且在许多方面都可以被视为“Kronos”V0实现，因为它发明了可扩展矢量扩展并将其带入了-IntelAVX-512的位向量极限。亚马逊在其Graviton1芯片中使用了原始Neoverse堆栈中的“Maya”CortexA72，在其Graviton2芯片中使用了“Ares”N1，在其Graviton3芯片中使用了“Zeus”V1。十多年前，NVIDIA最初使用其Arm架构许可来创建“Denver”服务器处理器，但已改用“Grace”CPU芯片的V2内核现在即将上市。AmpereComputing的Altra和AltraMaxArmCPU中使用N1内核，但现在正在开发定制内核。显然，阿里巴巴已经为其倚天710处理器定制了Armv9核心，如果这是真的，那么NVIDIA的Grace并没有市场上第一个Armv9核心。印度政府正在其“Aum”A48Z处理器中使用V1内核。还有其他的，但这些是最重要的。他们都花费了大量资金来创建Arm服务器芯片。但这既关乎时间，也关乎金钱。众所周知，爱因斯坦证明了时间就是疯狂的金钱，也证明了能量就是疯狂的物质。正如Arm产品管理高级总监JeffDefilippi在HotChips上的Arm演讲之前解释的那样，随着摩尔定律的耗尽，对专用芯片的需求不断增长，芯片设计人员面临的压力也在不断增加。正如上图所示，随着晶体管尺寸的缩小，设计芯片的成本也在上升，而在7纳米节点之后，每个晶体管的制造成本也在上升，但该图没有显示这一点。Arm的CSS知识产权包旨在加快设计速度，从时间就是金钱的意义上来说，至少可以将金钱转化为节省的时间，正如爱因斯坦所证明的那样，这既是节省的金钱，也是通过早期销售获得的金钱。（我们假设CSS的成本比常规IP许可更高，因为它包含更多内容，但风险要低得多，而且成本和风险的乘积（不是总和，而是乘积，因为这些是乘法效应而不是累积效应）因此较低.)从概念上讲，CSS包如下所示：以下是它与SoC许可、IP许可和架构许可的比较：“本质上，该产品是Arm拼接在一起的多核设计，”Defilippi解释道。“这就是互连、CPU、虚拟化IP要求-我们将它们缝合在一起，进行验证，并将其作为生产就绪的RTL可交付成果交付给我们的客户。除了RTL之外，我们还提供与之相关的额外好处：我们提供实现包、平面图、实现脚本以及达到该性能所需的物理IP库以及设计所需的功耗范围。领先的技术。我们提供完整的软件参考堆栈。因此，这包括从固件、电源管理、系统管理、系统所需的运行时安全性等一切内容。我们提供参考堆栈，以确保软件开发从第一天开始，并且我们的客户有一个良好的起点。最后但并非最不重要的一点是，我们不仅包括工艺节点，还包括我们的领先技术。每年都会有一些新的、令人兴奋的事情出现。当然，现在的一个例子就是CXL内存扩展池。”现在想象一下，特别是如果您位于中国、印度、非洲，甚至位于美国或欧洲的具有成本意识的超大规模企业、云构建商或HPC中心，并且您没有大量熟悉高级服务器CPU的熟练工程师设计或正确设计和测试它们的工具，以便快速推出下一代芯片。那么CSS方法不仅可以大大加快速度，而且可以从一开始就制造出芯片。但时间很重要，以下是Arm如何计算通过CSS包与使用普通IP许可证相比节省的时间：节省80个工程师一年的时间是相当可观的，特别是在定制自由度仍然存在的情况下。问题是：与芯片制造商所做的大量工作相比，CSS设计的价值有多大？将芯片从概念变为服务器、网络设备或存储阵列需要多少成本？这比使用Intel或AMD的X86服务器或AmpereComputing的Arm芯片便宜多少？这些麻烦值得吗？嗯，随着AWS和阿里巴巴制造自己的Arm芯片，而且有传言称Google也将这样做，微软、腾讯和百度（以及阿里巴巴、Google和甲骨文）也使用AmpereComputing的AltraArm芯片，看来这是值得的。ArmCPU为他们节省了资金，并且在他们的服务器群中所占的比例越来越大。而且，他们通过自己的努力拥有更直接的控制权，并通过与安培计算的紧密合作获得更间接的控制权。当然，超大规模厂商和云构建商仍会购买大量英特尔和AMDCPU。但正如我们多次说过的那样，这将是为了支持旧版WindowsServer，有时甚至是Linux应用程序，他们会故意对基于它们的实例收取额外费用，英特尔和AMD也会对底层芯片收取额外费用。没有人在我们看到的分层上串通一气，但英特尔和AMD没有动力与Graviton和其他公司竞争。他们只是将15%、20%、25%的超大规模和云机群让给Arm，他们对无需打价格战就能获得85%、80%、75%的更大机群感到满意。“Perseus”N2核心网格的CSS实现可从24个核心扩展到64个核心，并且可以使用UCI-Express（而非CCIX）或专有互连将其中四个核心组合在一个封装中，以扩展到插槽中的256个核心。根据客户的需求提供小芯片。考虑到许多现代处理器将执行预期的HPC和...PC版：https://www.cnbeta.com.tw/articles/soft/1380973.htm手机版：https://m.cnbeta.com.tw/view/1380973.htm

#中共出新招下半年或爆发大规模雪崩https://www.bannedbook.org/bnews/bait/2024050

相关推荐

中共出新招中小企业救专家存疑

又出新招了via

加速CPU设计，Arm再出新招

中共出新招救中小企业专家存疑#新唐人新闻精选https://www.bannedbook.org/bnews/bannedvid

明著抢！中共出新招勒令有钱人交出20%财富https://www.bannedbook.org/bnews/ccpdope/20

小心下半年