中央社压制陈情抗议中国公安出新招：蓝色遮羞布

又出新招了via

世界灯塔的遮羞布。

扯开裆的遮羞布时…

压制民众抗议中共公安出新招中共避谈动态清零山东最大方舱被群拆美中高层会谈布林肯警告中共资本大佬包凡失联中共再打金融业信心崩盘？仅

加速CPU设计，Arm再出新招

加速CPU设计，Arm再出新招在本周的HotChips2023上，ArmLtd在宣布（再次）上市后展示了其“Demeter”V2内核，该公司还推出了“Genesis”N2计算子系统，简称CSS智能包。（我们将单独深入探讨V2核心。）Genesis的这一努力有可能比过去更快地让ArmCPU进入该领域。多年来，Arm一直在朝着将成熟的CPU组装在一起以供客户修改并直接推向市场的目标迈进。早在2000年代末，当Arm接管智能手机时，服务器制造商正在考虑Arm架构如何改进基本上处于垄断地位的X86架构，服务器芯片设计人员从Arm架构许可开始，并开始使用它。这是一种非常昂贵且耗时的创建服务器芯片的方法，尽管比从定制ISA开始要好，但由于大量的软件移植工作，世界无法容忍定制ISA。在Broadcom、高通、AMD和三星等老牌半导体巨头以及Calxeda和AppliedMicro等初创公司多次尝试Arm服务器芯片失败后，以及Cavium凭借其ThunderX和ThunderX2CPU取得了一些有限的成功后，Arm决定将其推出。Neoverse的工作于2018年10月推出，它不仅提供了服务器芯片核心的路线图，还提供了参考架构，用于将这些核心转变为适当的CPU，并混合了其他Arm知识产权（例如片上芯片）网状互连和第三方内存、PCI-Express控制器和以太网控制器。这些Neoverse设计是针对台积电的特定工艺节点量身定制的，这使得服务器芯片制造商更容易更快地采取行动。我们从来不确定Neoverse是否比架构许可证更便宜或更贵。你可以用多种不同的方式来论证它。Neoverse完成了更多的工作，但与Arm架构许可证相比，自由度有限。也许更重要的是，正如我们所说，如果Arm不能比开源的RISC-VISA和设计更便宜，那么它可以更快。由于客户不耐烦，Arm无论如何都必须更快。以下是2022年9月公布的最新Neoverse路线图：最初，只有一个内核系列-N系列-但Arm将其分为三个内核系列和三个相应的平台，每个平台都针对系统市场的不同部分。N系列核心和平台针对主流服务器工作负载，其中每瓦性能驱动设计，而V系列具有更重的矢量处理，针对计算密集型工作负载，例如AI训练和推理以及HPC模拟和建模。E系列旨在实现吞吐量计算，并且不仅针对更高的每瓦性能进行了优化，而且还以比N系列更低的热封装实现了最大吞吐量。现在不仅有三个系列的内核和平台，还有两种方法：DIY和CSS。所以现在新的Neoverse路线图看起来像是硬塞进去了CSS选项：我们已经为我们所知的每个核心和平台添加了代号。Neoverse的努力让芯片公司在设计上取得了优势，而且许多公司已经做到了。富士通的A64FX芯片比当前任何供应商都早得多（比Neoverse的努力早了很多年），并且在许多方面都可以被视为“Kronos”V0实现，因为它发明了可扩展矢量扩展并将其带入了-IntelAVX-512的位向量极限。亚马逊在其Graviton1芯片中使用了原始Neoverse堆栈中的“Maya”CortexA72，在其Graviton2芯片中使用了“Ares”N1，在其Graviton3芯片中使用了“Zeus”V1。十多年前，NVIDIA最初使用其Arm架构许可来创建“Denver”服务器处理器，但已改用“Grace”CPU芯片的V2内核现在即将上市。AmpereComputing的Altra和AltraMaxArmCPU中使用N1内核，但现在正在开发定制内核。显然，阿里巴巴已经为其倚天710处理器定制了Armv9核心，如果这是真的，那么NVIDIA的Grace并没有市场上第一个Armv9核心。印度政府正在其“Aum”A48Z处理器中使用V1内核。还有其他的，但这些是最重要的。他们都花费了大量资金来创建Arm服务器芯片。但这既关乎时间，也关乎金钱。众所周知，爱因斯坦证明了时间就是疯狂的金钱，也证明了能量就是疯狂的物质。正如Arm产品管理高级总监JeffDefilippi在HotChips上的Arm演讲之前解释的那样，随着摩尔定律的耗尽，对专用芯片的需求不断增长，芯片设计人员面临的压力也在不断增加。正如上图所示，随着晶体管尺寸的缩小，设计芯片的成本也在上升，而在7纳米节点之后，每个晶体管的制造成本也在上升，但该图没有显示这一点。Arm的CSS知识产权包旨在加快设计速度，从时间就是金钱的意义上来说，至少可以将金钱转化为节省的时间，正如爱因斯坦所证明的那样，这既是节省的金钱，也是通过早期销售获得的金钱。（我们假设CSS的成本比常规IP许可更高，因为它包含更多内容，但风险要低得多，而且成本和风险的乘积（不是总和，而是乘积，因为这些是乘法效应而不是累积效应）因此较低.)从概念上讲，CSS包如下所示：以下是它与SoC许可、IP许可和架构许可的比较：“本质上，该产品是Arm拼接在一起的多核设计，”Defilippi解释道。“这就是互连、CPU、虚拟化IP要求-我们将它们缝合在一起，进行验证，并将其作为生产就绪的RTL可交付成果交付给我们的客户。除了RTL之外，我们还提供与之相关的额外好处：我们提供实现包、平面图、实现脚本以及达到该性能所需的物理IP库以及设计所需的功耗范围。领先的技术。我们提供完整的软件参考堆栈。因此，这包括从固件、电源管理、系统管理、系统所需的运行时安全性等一切内容。我们提供参考堆栈，以确保软件开发从第一天开始，并且我们的客户有一个良好的起点。最后但并非最不重要的一点是，我们不仅包括工艺节点，还包括我们的领先技术。每年都会有一些新的、令人兴奋的事情出现。当然，现在的一个例子就是CXL内存扩展池。”现在想象一下，特别是如果您位于中国、印度、非洲，甚至位于美国或欧洲的具有成本意识的超大规模企业、云构建商或HPC中心，并且您没有大量熟悉高级服务器CPU的熟练工程师设计或正确设计和测试它们的工具，以便快速推出下一代芯片。那么CSS方法不仅可以大大加快速度，而且可以从一开始就制造出芯片。但时间很重要，以下是Arm如何计算通过CSS包与使用普通IP许可证相比节省的时间：节省80个工程师一年的时间是相当可观的，特别是在定制自由度仍然存在的情况下。问题是：与芯片制造商所做的大量工作相比，CSS设计的价值有多大？将芯片从概念变为服务器、网络设备或存储阵列需要多少成本？这比使用Intel或AMD的X86服务器或AmpereComputing的Arm芯片便宜多少？这些麻烦值得吗？嗯，随着AWS和阿里巴巴制造自己的Arm芯片，而且有传言称Google也将这样做，微软、腾讯和百度（以及阿里巴巴、Google和甲骨文）也使用AmpereComputing的AltraArm芯片，看来这是值得的。ArmCPU为他们节省了资金，并且在他们的服务器群中所占的比例越来越大。而且，他们通过自己的努力拥有更直接的控制权，并通过与安培计算的紧密合作获得更间接的控制权。当然，超大规模厂商和云构建商仍会购买大量英特尔和AMDCPU。但正如我们多次说过的那样，这将是为了支持旧版WindowsServer，有时甚至是Linux应用程序，他们会故意对基于它们的实例收取额外费用，英特尔和AMD也会对底层芯片收取额外费用。没有人在我们看到的分层上串通一气，但英特尔和AMD没有动力与Graviton和其他公司竞争。他们只是将15%、20%、25%的超大规模和云机群让给Arm，他们对无需打价格战就能获得85%、80%、75%的更大机群感到满意。“Perseus”N2核心网格的CSS实现可从24个核心扩展到64个核心，并且可以使用UCI-Express（而非CCIX）或专有互连将其中四个核心组合在一个封装中，以扩展到插槽中的256个核心。根据客户的需求提供小芯片。考虑到许多现代处理器将执行预期的HPC和...PC版：https://www.cnbeta.com.tw/articles/soft/1380973.htm手机版：https://m.cnbeta.com.tw/view/1380973.htm

中央社压制陈情抗议中国公安出新招：蓝色遮羞布

相关推荐

又出新招了via

世界灯塔的遮羞布。

扯开裆的遮羞布时…

压制民众抗议中共公安出新招中共避谈动态清零山东最大方舱被群拆美中高层会谈布林肯警告中共资本大佬包凡失联中共再打金融业信心崩盘？仅

加速CPU设计，Arm再出新招

遮羞布都冲掉了还玩？