#中共出新招下半年或爆发大规模雪崩https://www.bannedbook.org/bnews/bait/2024050

None

相关推荐

封面图片

中共出新招中小企业救专家存疑

封面图片

又出新招了via

封面图片

加速CPU设计,Arm再出新招

加速CPU设计,Arm再出新招在本周的HotChips2023上,ArmLtd在宣布(再次)上市后展示了其“Demeter”V2内核,该公司还推出了“Genesis”N2计算子系统,简称CSS智能包。(我们将单独深入探讨V2核心。)Genesis的这一努力有可能比过去更快地让ArmCPU进入该领域。多年来,Arm一直在朝着将成熟的CPU组装在一起以供客户修改并直接推向市场的目标迈进。早在2000年代末,当Arm接管智能手机时,服务器制造商正在考虑Arm架构如何改进基本上处于垄断地位的X86架构,服务器芯片设计人员从Arm架构许可开始,并开始使用它。这是一种非常昂贵且耗时的创建服务器芯片的方法,尽管比从定制ISA开始要好,但由于大量的软件移植工作,世界无法容忍定制ISA。在Broadcom、高通、AMD和三星等老牌半导体巨头以及Calxeda和AppliedMicro等初创公司多次尝试Arm服务器芯片失败后,以及Cavium凭借其ThunderX和ThunderX2CPU取得了一些有限的成功后,Arm决定将其推出。Neoverse的工作于2018年10月推出,它不仅提供了服务器芯片核心的路线图,还提供了参考架构,用于将这些核心转变为适当的CPU,并混合了其他Arm知识产权(例如片上芯片)网状互连和第三方内存、PCI-Express控制器和以太网控制器。这些Neoverse设计是针对台积电的特定工艺节点量身定制的,这使得服务器芯片制造商更容易更快地采取行动。我们从来不确定Neoverse是否比架构许可证更便宜或更贵。你可以用多种不同的方式来论证它。Neoverse完成了更多的工作,但与Arm架构许可证相比,自由度有限。也许更重要的是,正如我们所说,如果Arm不能比开源的RISC-VISA和设计更便宜,那么它可以更快。由于客户不耐烦,Arm无论如何都必须更快。以下是2022年9月公布的最新Neoverse路线图:最初,只有一个内核系列-N系列-但Arm将其分为三个内核系列和三个相应的平台,每个平台都针对系统市场的不同部分。N系列核心和平台针对主流服务器工作负载,其中每瓦性能驱动设计,而V系列具有更重的矢量处理,针对计算密集型工作负载,例如AI训练和推理以及HPC模拟和建模。E系列旨在实现吞吐量计算,并且不仅针对更高的每瓦性能进行了优化,而且还以比N系列更低的热封装实现了最大吞吐量。现在不仅有三个系列的内核和平台,还有两种方法:DIY和CSS。所以现在新的Neoverse路线图看起来像是硬塞进去了CSS选项:我们已经为我们所知的每个核心和平台添加了代号。Neoverse的努力让芯片公司在设计上取得了优势,而且许多公司已经做到了。富士通的A64FX芯片比当前任何供应商都早得多(比Neoverse的努力早了很多年),并且在许多方面都可以被视为“Kronos”V0实现,因为它发明了可扩展矢量扩展并将其带入了-IntelAVX-512的位向量极限。亚马逊在其Graviton1芯片中使用了原始Neoverse堆栈中的“Maya”CortexA72,在其Graviton2芯片中使用了“Ares”N1,在其Graviton3芯片中使用了“Zeus”V1。十多年前,NVIDIA最初使用其Arm架构许可来创建“Denver”服务器处理器,但已改用“Grace”CPU芯片的V2内核现在即将上市。AmpereComputing的Altra和AltraMaxArmCPU中使用N1内核,但现在正在开发定制内核。显然,阿里巴巴已经为其倚天710处理器定制了Armv9核心,如果这是真的,那么NVIDIA的Grace并没有市场上第一个Armv9核心。印度政府正在其“Aum”A48Z处理器中使用V1内核。还有其他的,但这些是最重要的。他们都花费了大量资金来创建Arm服务器芯片。但这既关乎时间,也关乎金钱。众所周知,爱因斯坦证明了时间就是疯狂的金钱,也证明了能量就是疯狂的物质。正如Arm产品管理高级总监JeffDefilippi在HotChips上的Arm演讲之前解释的那样,随着摩尔定律的耗尽,对专用芯片的需求不断增长,芯片设计人员面临的压力也在不断增加。正如上图所示,随着晶体管尺寸的缩小,设计芯片的成本也在上升,而在7纳米节点之后,每个晶体管的制造成本也在上升,但该图没有显示这一点。Arm的CSS知识产权包旨在加快设计速度,从时间就是金钱的意义上来说,至少可以将金钱转化为节省的时间,正如爱因斯坦所证明的那样,这既是节省的金钱,也是通过早期销售获得的金钱。(我们假设CSS的成本比常规IP许可更高,因为它包含更多内容,但风险要低得多,而且成本和风险的乘积(不是总和,而是乘积,因为这些是乘法效应而不是累积效应)因此较低.)从概念上讲,CSS包如下所示:以下是它与SoC许可、IP许可和架构许可的比较:“本质上,该产品是Arm拼接在一起的多核设计,”Defilippi解释道。“这就是互连、CPU、虚拟化IP要求-我们将它们缝合在一起,进行验证,并将其作为生产就绪的RTL可交付成果交付给我们的客户。除了RTL之外,我们还提供与之相关的额外好处:我们提供实现包、平面图、实现脚本以及达到该性能所需的物理IP库以及设计所需的功耗范围。领先的技术。我们提供完整的软件参考堆栈。因此,这包括从固件、电源管理、系统管理、系统所需的运行时安全性等一切内容。我们提供参考堆栈,以确保软件开发从第一天开始,并且我们的客户有一个良好的起点。最后但并非最不重要的一点是,我们不仅包括工艺节点,还包括我们的领先技术。每年都会有一些新的、令人兴奋的事情出现。当然,现在的一个例子就是CXL内存扩展池。”现在想象一下,特别是如果您位于中国、印度、非洲,甚至位于美国或欧洲的具有成本意识的超大规模企业、云构建商或HPC中心,并且您没有大量熟悉高级服务器CPU的熟练工程师设计或正确设计和测试它们的工具,以便快速推出下一代芯片。那么CSS方法不仅可以大大加快速度,而且可以从一开始就制造出芯片。但时间很重要,以下是Arm如何计算通过CSS包与使用普通IP许可证相比节省的时间:节省80个工程师一年的时间是相当可观的,特别是在定制自由度仍然存在的情况下。问题是:与芯片制造商所做的大量工作相比,CSS设计的价值有多大?将芯片从概念变为服务器、网络设备或存储阵列需要多少成本?这比使用Intel或AMD的X86服务器或AmpereComputing的Arm芯片便宜多少?这些麻烦值得吗?嗯,随着AWS和阿里巴巴制造自己的Arm芯片,而且有传言称Google也将这样做,微软、腾讯和百度(以及阿里巴巴、Google和甲骨文)也使用AmpereComputing的AltraArm芯片,看来这是值得的。ArmCPU为他们节省了资金,并且在他们的服务器群中所占的比例越来越大。而且,他们通过自己的努力拥有更直接的控制权,并通过与安培计算的紧密合作获得更间接的控制权。当然,超大规模厂商和云构建商仍会购买大量英特尔和AMDCPU。但正如我们多次说过的那样,这将是为了支持旧版WindowsServer,有时甚至是Linux应用程序,他们会故意对基于它们的实例收取额外费用,英特尔和AMD也会对底层芯片收取额外费用。没有人在我们看到的分层上串通一气,但英特尔和AMD没有动力与Graviton和其他公司竞争。他们只是将15%、20%、25%的超大规模和云机群让给Arm,他们对无需打价格战就能获得85%、80%、75%的更大机群感到满意。“Perseus”N2核心网格的CSS实现可从24个核心扩展到64个核心,并且可以使用UCI-Express(而非CCIX)或专有互连将其中四个核心组合在一个封装中,以扩展到插槽中的256个核心。根据客户的需求提供小芯片。考虑到许多现代处理器将执行预期的HPC和...PC版:https://www.cnbeta.com.tw/articles/soft/1380973.htm手机版:https://m.cnbeta.com.tw/view/1380973.htm

封面图片

中共出新招救中小企业专家存疑#新唐人新闻精选https://www.bannedbook.org/bnews/bannedvid

封面图片

明著抢!中共出新招勒令有钱人交出20%财富https://www.bannedbook.org/bnews/ccpdope/20

封面图片

小心下半年

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人