传AMD下一代APU为加入AI能力而牺牲了本属于高速缓存的芯片区域

传AMD下一代APU为加入AI能力而牺牲了本属于高速缓存的芯片区域据Anandtech论坛成员称,AMD已大幅减少了缓存大小,以便在即将推出的StrixPoint硬件上容纳大型人工智能芯片。如果报道属实,那么这将表明AMD和其他处理器供应商正把相当大的赌注押在一个尚未得到证实的趋势上。用户"uzzi38"称,AMD最初打算为StrixPointAPU配备系统级缓存,这将大幅提高CPU和集成显卡的性能。然而,这一计划被增强型神经处理单元(NPU)所取代,后者被定位为推动新一轮人工智能增强型PC的核心功能。另一位论坛成员"adroc_thurston"补充说,StrixPoint最初打算配备16MB的MALL缓存。英特尔(Intel)、AMD和高通(Qualcomm)正在大力推广人工智能,将其作为下一代CPU不可或缺的功能。它们计划利用神经处理单元(NPU)来本地处理生成式人工智能工作负载,这些任务通常由ChatGPT等云服务处理。英特尔去年底推出的MeteorLake引领了这一趋势。英特尔的目标是通过随后发布的ArrowLake、LunarLake和PantherLake等产品提升NPU性能。AMD的StrixPoint也将在今年晚些时候推出,以增强其Zen5CPU和RDNA3.5图形芯片的人工智能功能。这些芯片制造商正在与微软的人工智能驱动PC计划保持一致,其中包括对专用人工智能密钥和至少能达到40TOPs的NPU的要求。然而,硬件制造商和软件开发商尚未充分探索生成式人工智能如何造福最终用户。虽然文本和图像生成是目前的主要应用,但它们面临着版权和可靠性方面的争议。微软的设想是,通过自动执行文件检索或设置调整等任务,人工智能生成技术将彻底改变用户与Windows的交互方式,但这些概念仍未得到验证。论坛帖子中的许多参与者认为,生成式人工智能是一个潜在的泡沫,一旦破裂,可能会对人工智能PC和多代SoC产生负面影响。如果该技术无法吸引主流用户,那么配备NPU的众多产品的实用性可能会受到限制。...PC版:https://www.cnbeta.com.tw/articles/soft/1426964.htm手机版:https://m.cnbeta.com.tw/view/1426964.htm

相关推荐

封面图片

PowerColor的"下一代"AMD Radeon GPU将与NPU协同工作以降低游戏功耗

PowerColor的"下一代"AMDRadeonGPU将与NPU协同工作以降低游戏功耗这项技术在PowerColor的Computex展台上以"EdgeAI"系列的名义进行了展示,展示了如何利用NPU提高显卡的效率。在演示中,PowerColor使用AMDRadeonRX显卡运行了两款游戏:《赛博朋克2077》和《最终幻想15》。这些游戏分别在默认设置、AMD自带的省电模式以及使用RadeonRX7900XTX原型显卡的新NPUAI技术下进行了测试。图片来源:@harukaze5719(QuasarZone)@harukaze5719(QuasarZone)默认情况下,AMDRadeonRXGPU在《赛博朋克2077》中的功耗为263.2瓦,在《最终幻想15》中为338.6瓦。在AMD的省电模式下,显卡的功耗大幅降低,分别为214.5瓦(-18.5%)和271.4瓦(-19.8%)。不过,有了新的NPUAI技术,你可以节省更多的功耗。在启用新技术后,相应游戏的功耗分别降至205.3瓦(-22.0%)和262.9瓦(-22.4%)。PowerColorNPUECOMode技术演示:7900XTX上的赛博朋克2077/最终幻想XV:无省电模式:263.2瓦/338.6瓦省电模式(AMD):214.5瓦/271.4瓦省电模式(NPU):205.3瓦/262.9瓦这种新的人工智能增强型ECO模式可将游戏时的功耗降低22%,但性能略有下降。与AMD的ECO模式设置相比,它仍然是一次不错的升级,而且这只是一个使用外部NPU的早期演示,因此我们也许能在这项技术的最终版本中看到性能方面更好的优化。图片来源:@harukaze5719(QuasarZone)@harukaze5719(QuasarZone)PowerColor称,该技术的工作原理是添加自己的GUI界面作为中间人,将AMDRadeonRXGPU与PC上的NPU连接起来。然后,NPU会卸下VRM和MOSFET的负担,从而节省功耗并降低温度。目前,AMD是唯一一家通过Ryzen8000GAPU提供桌面级NPU解决方案的芯片制造商,因此,我们可能会看到其他各种注入NPU的选项,以配合这些新技术功能。目前尚不清楚该技术是否仅适用于PowerColorGPU,还是会应用于整个AMDRadeonRX系列。AMD的RDNA4GPU预计将采用新的RDNA4图形架构,我们已经听到了关于AMD将在其下一代RadeonRX显卡上大力推广人工智能的传言。PowerColor还表示,由于AMD在今年内不会推出RDNA4,因此它可能会推出采用该技术的RadeonRX7900XTX显卡版本,直到更新的GPU上市。这可能只是PowerColor向我们展示了游戏市场的未来发展方向。...PC版:https://www.cnbeta.com.tw/articles/soft/1434019.htm手机版:https://m.cnbeta.com.tw/view/1434019.htm

封面图片

AMD 下一代 AI 笔记本处理器也有了一个新名字

AMD在2024年台北国际电脑展上宣布了其下一代用于生成式AI工作的Ryzen笔记本处理器:RyzenAI300系列。这是其顶级Ryzen9芯片的重新命名。新的命名规则仍然包括AMD在2022年引入的HX后缀,但它并不表示芯片的功耗。相反,HX将仅指“顶级”或最好的、最快的RyzenAI300芯片。新的RyzenAI芯片基于AMD最新的神经网络、集成显卡和通用处理架构:NPU使用XDNA2架构,iGPU使用RDNA3.5架构,现在拥有多达16个计算单元,CPU使用Zen5架构。这一系列的前两款处理器是RyzenAI9HX370和RyzenAI9365。两者都拥有50TOPS的NPU,但HX型号是其中的高端版本。RyzenAI9HX370是一款拥有12核/24线程的芯片,最高时钟速度为5.1GHz,缓存为36MB,并配有Radeon890M显卡。RyzenAI9365是一款拥有10核/12线程的芯片,最高时钟速度为5.0GHz,缓存为34MB,并配有Radeon880M显卡。RyzenAI9300系列似乎在现有或即将上市的其他NPU配置芯片中拥有最多的TOPS。高通的SnapdragonX系列有45TOPS,苹果的M4有38,而AMD上一代的Ryzen8040系列芯片只有16。英特尔的MeteorLakeUltra7165H大约有10TOPS(但即将推出的LunarLake据说会拉平差距)。AMD声称其XDNA2NPU的计算能力是上一代的五倍,能效是上一代的两倍,这得益于其独特的FP16“块”或NPU架构,可以在不进行量化的情况下处理8位性能(INT8)和16位精度(FP16)的生成式AI工作负载。标签:#AMD#AI频道:@GodlyNews1投稿:@GodlyNewsBot

封面图片

AMD表示将推出下一代FSR“FiedlityFX 超分辨率”AI插帧技术

AMD表示将推出下一代FSR“FiedlityFX超分辨率”AI插帧技术自FSR发布以来,AMD一直反对将人工智能用于其插帧技术,甚至表示除了插帧技术之外,人工智能还有其他有意义的用例。这使得AMD能够让FSR对其旧GPU架构略微开放,甚至为英伟达和英特尔等竞争对手的产品提供支持。AMD在其最新的消费级硬件(如RDNA2和RDNA3)中集成了AI内核,但看起来我们终于可以看到它们被正确使用了,因为AMD已预告计划在其流行的FSR插帧技术的未来版本中集成AI的使用。2024年对我们来说是重要的一年,因为我们花了这么多年时间开发人工智能的硬件和软件功能。我们刚刚完成了人工智能在我们整个产品组合中的应用,包括云、边缘、个人电脑、嵌入式设备、游戏设备,我们正在利用人工智能提升游戏设备的档次,2024年对我们来说确实是一个巨大的部署年,所以现在基石已经有了,能力也有了。AMD首席技术官马克-帕普马斯特(MarkPapermaster)在与诺普利斯(NoPriors)的一次座谈中强调,他们正在努力将人工智能驱动的升级技术引入游戏设备。马克所说的游戏设备,可能不仅仅是指RadeonGPU产品线,还包括游戏机,因为游戏机在AMD的游戏业务中占了很大一部分。虽然我们可能不会在当前的游戏机中看到这项技术,但已经有传言称索尼和微软将更新游戏机阵容,因此这可能是AMD部署下一代插帧技术的一个支点。基于人工智能的插帧技术利大于弊。主要的优点是基于人工智能的插帧处理效果看起来更好,虽然FSR有时在视觉/图像质量上能达到与竞争对手相同的水平,但通常情况并非如此,基于人工智能的解决方案会更胜一筹,AMD正可以利用人工智能消除这一瓶颈。但这也有缺点,需要有特定的人工智能硬件来运行此类算法,这意味着未来的FSR技术可能仅限于特定的架构,英伟达的DLSS也是如此,DLSS3仅在最新的RTX40GPU上提供(支持帧生成)。另一方面,AMD在其最新和较旧的硬件上提供了同样的支持,但与DLSS3相比,其质量和流畅度稍显不足。英特尔也在投资开发自己的帧生成技术,该技术将利用帧外推法取代插值法(DLSS/FSR)。...PC版:https://www.cnbeta.com.tw/articles/soft/1422344.htm手机版:https://m.cnbeta.com.tw/view/1422344.htm

封面图片

下一代人工智能芯片尝试模仿人脑以节省电能

下一代人工智能芯片尝试模仿人脑以节省电能胡萨姆-阿姆鲁奇(HussamAmrouch)开发出了一种可用于人工智能的架构,其功能是同类内存计算方法的两倍。据《自然》(Nature)杂志报道,这位慕尼黑工业大学(TUM)的教授利用被称为铁电场效应晶体管(FeFET)的特殊电路应用了一种新的计算模式。几年内,这可能会被证明适用于生成式人工智能、深度学习算法和机器人应用。基本理念很简单:以前的芯片只在晶体管上进行计算,而现在它们也是数据存储的位置。这样既省时又省力。慕尼黑工业大学(TUM)人工智能处理器设计教授胡萨姆-阿姆鲁奇(HussamAmrouch)说:"因此,芯片的性能也得到了提升。"未来的芯片必须比早期的芯片更快、更高效。因此,它们的发热速度不能太大。如果要支持无人机飞行等场景的实时计算等应用,这一点至关重要。对于计算机来说,这样的任务极其复杂且耗能。HussamAmrouch教授为能源密集型应用开发强大的人工智能芯片。图片来源:AndreasHeddergott/TUM对芯片的这些关键要求可以用数学参数TOPS/W来概括:"每秒每瓦特的太赫兹运算量"。这可以看作是未来芯片的重要技术指标:当提供一瓦(W)功率时,处理器每秒(S)能执行多少万亿次运算(TOP)。博世与弗劳恩霍夫IMPS合作开发的新型人工智能芯片在生产过程中得到了美国GlobalFoundries公司的支持,可提供885TOPS/W。这使得它比同类人工智能芯片(包括三星公司的MRAM芯片)的功能强大一倍。而目前普遍使用的CMOS芯片的运行速度在10-20TOPS/W之间。最近发表在《自然》杂志上的研究结果证明了这一点。受人脑启发的芯片架构研究人员从人类那里借鉴了现代芯片架构的原理。阿姆鲁奇说:"在大脑中,神经元负责处理信号,而突触则能够记住这些信息,他描述了人类如何能够学习和回忆复杂的相互关系。"为此,芯片使用了"铁电"(FeFET)晶体管。这种电子开关具有特殊的附加特性(施加电压时极性反转),即使在切断电源的情况下也能存储信息。此外,它们还能保证在晶体管内同时存储和处理数据。阿姆鲁奇认为:"现在,我们可以构建高效的芯片组,用于深度学习、生成式人工智能或机器人等应用,例如,在这些应用中,数据必须在生成的地方进行处理。"面向市场的芯片之路研究人员的目标是利用这种芯片运行深度学习算法,识别太空中的物体,或处理无人机在飞行过程中产生的数据,而不会出现时滞。不过,慕尼黑工业大学慕尼黑机器人与机器智能综合研究所(MIRMI)的教授认为,要实现这一目标还需要几年时间。他认为,适合实际应用的首款内存芯片最快也要三到五年后才能问世。其中一个原因是工业界的安全要求。例如,在汽车行业使用这种技术之前,仅有可靠的功能是不够的。它还必须符合该行业的特定标准。硬件专家阿姆鲁奇说:"这再次凸显了与计算机科学、信息学和电气工程等不同学科的研究人员开展跨学科合作的重要性。"他认为这是MIRMI的一大优势。...PC版:https://www.cnbeta.com.tw/articles/soft/1396473.htm手机版:https://m.cnbeta.com.tw/view/1396473.htm

封面图片

微软暗示将在ARM平台上推出下一代Windows系统

微软暗示将在ARM平台上推出下一代Windows系统该会议的网页将其描述为"今年Arm-poweredWindows令人兴奋的新体验"。我们期待微软能在Windows11中介绍备受期待的人工智能功能,这些功能将原生运行,因为今年夏天发布的新一波人工智能PC将搭载NPU。神经处理单元(NPU)将提供计算能力,以处理应用程序和操作系统中的特定人工智能任务。我们在"画图"应用中发现了即将推出的基于NPU的功能的蛛丝马迹。除了这个ARM会议,还有多个关于人工智能及其优势的会议。还有许多关于Copilot、开发人员如何为Copilot构建应用程序和插件等的会议。您已经可以在Copilot(网页、应用和Windows11)中使用Adobe、Spotify等扩展功能。微软已与多个品牌合作,通过Copilot中的插件将它们整合在一起。高通公司最新的骁龙XElite芯片将为2024年及以后即将推出的人工智能PC提供动力。泄露的基准测试结果显示,高通公司的芯片速度极快,可以轻松超越M1和M2Mac处理器。最近泄露的信息显示,微软有信心骁龙XElitePC的性能超过M3MacBookAir。因此,它是Windows11中新人工智能功能的完美候选者。其中之一就是备受关注的人工智能资源管理器功能,它将帮助您跟踪您在电脑上执行的每一个操作。最棒的是,你可以用简单的句子询问信息,而不是使用专门的对话格式。ARM专注于在性能和电池续航时间之间取得完美平衡,因此微软将其操作系统的未来押在了ARM上。微软相信,即将推出的人工智能个人电脑将在未来三年内占据个人电脑市场50%的份额。一系列不含NPU的SnapdragonXPlus处理器也将面向入门级和中级PC。...PC版:https://www.cnbeta.com.tw/articles/soft/1427168.htm手机版:https://m.cnbeta.com.tw/view/1427168.htm

封面图片

AMD官宣年更芯片:新款MI325X重磅发布 比H200快1.3倍

AMD官宣年更芯片:新款MI325X重磅发布比H200快1.3倍芯片年更,与领头羊英伟达一较高下自去年以来,英伟达向投资者明确表示,计划将发布周期缩短为每年一次,现在AMD也紧随其后,开始芯片年更。首席执行官苏姿丰(LisaSu)表示“每年都有这样的节奏,是因为市场需要更新的产品和能力......我们每年都会有下一个大事件,这样我们就始终拥有最具竞争力的产品组合。”她详细介绍了该公司未来两年开发人工智能芯片的计划,以挑战行业领导者英伟达。最新的MI325X加速器将于2024年第四季度上市。即将推出的名为MI350的芯片系列,预计将于2025年上市,并将基于新的芯片架构。与现有的MI300系列人工智能芯片相比,MI350在推理方面的性能预计将提高35倍。2026年,MI400系列将会被推出,该系列将基于名为“Next”的架构。如此这般,AMD和英伟达“你方唱罢我登场”,两者之间的较量充满了刀光剑影。开发生成式人工智能程序的竞赛催生了人工智能数据中心的发展,而支撑数据中心的就是这些先进芯片。AMD一直是英伟达的竞争者,后者目前主导着利润丰厚的人工智能半导体市场,占据了约80%的份额。现在,为了追赶英伟达,AMD更加孤注一掷,“人工智能显然是我们公司的头等大事,我们确实利用了公司内部所有的开发能力来实现这一点。”先不管芯片表现如何,AMD此举也是为了吸引投资者的关注。在华尔街“铲子”交易中投入了数十亿美元的投资者一直在寻求芯片公司的长期更新,因为他们要评估生成式AI蓬勃发展的持久性,而这一趋势迄今为止还没有放缓的迹象。自2023年初以来,AMD股价已上涨一倍多。与同期英伟达股价七倍多的涨幅相比,这一涨幅仍然相形见绌。苏姿丰在4月份表示,AMD预计2024年AI芯片销售额约为40亿美元,比之前的估计增加了5亿美元。在Computex活动上,AMD还表示其最新一代中央处理器单元(CPU)可能会在2024年下半年上市。虽然企业一般会优先考虑在数据中心中使用人工智能芯片,但AMD的部分CPU也会与GPU结合使用,不过两者的比例更倾向于GPU。AMD详细介绍了其新型神经处理单元(NPU)的架构,专门用于处理AIPC中的设备端AI任务。随着个人电脑市场走出长达数年的低谷,芯片制造商们一直寄希望于人工智能功能的增强来推动个人电脑市场的增长。惠普和联想等个人电脑供应商将发布包含AMDAIPC芯片的设备。AMD还放出话来,他们的处理器已经超过了微软对Copilot+PC的硬件要求。3nmEPYCTurin,AI负载超越英特尔苏姿丰在Computex2024的主题演讲中宣布,备受期待的第五代EPYCTurin处理器,具有192个核心和384个线程,在人工智能工作中比英特尔Xeon快5.4倍,将于2024年下半年推出。这个3nm芯片标志着AMDZen5架构首次应用于数据中心芯片,AMD声称它们在关键AI工作负载上的性能比英特尔当前一代的Xeon芯片快5.4倍。Turin据说有两个版本:一个使用标准的Zen5核心,另一个使用一种称为Zen5c的密度优化核心。苏姿丰还宣布,AMD现在已经占据了数据中心市场的33%。新的Zen5c芯片将配备多达192个核心和384个线程,采用3nm工艺节点制造,然后与塞入单个插槽的6nmI/ODie(IOD)配对。整个芯片由17个小单元组成。最高核心数型号采用AMD的Zen5c架构,该架构使用密度优化的核心,概念上类似于英特尔的e-cores。不过,AMD率先在数据中心的x86芯片中使用这种核心类型。配备标准全性能Zen5核心的型号配备12个采用N4P工艺节点的计算芯片和一个中央6纳米IOD芯片,总共13个小芯片。AMD声称,在LLM(聊天机器人)中,AMD的优势是Xeon的5.4倍,在翻译模型中是Xeon的2.5倍,在摘要工作中是Xeon的3.9倍。AMD还展示了其128核Turin模型在科学NAMD工作负载中的3.1倍优势,并现场演示了Turin每秒生成的token数量比Xeon多4倍。192核Zen5c芯片是AMDEPYCBergamo的后续系列,后者是业界首款具有密度优化核心的x86数据中心处理器(Zen4c)。Bergamo的最高核心为128个。采用Zen5架构的标准Turin型号可扩展到128个核心,每个核心面积减半但功能不变,与当前一代EPYCGenoa(最高96个核心)相比,实现了强劲的代际提升。Zen5cTurin芯片将与英特尔的144核SierraForest芯片和Ampre的192核AmpereOne处理器展开竞争,前者标志着英特尔在其Xeon数据中心阵容中首次采用效率核心(E-cores),后者则标志着Google和微软正在开发或采用定制芯片。与此同时,标准的Zen5EPYC处理器将迎战英特尔即将推出的Xeon6系列。AMD还分享了一些基准测试,以突出它相对于英特尔竞争型号的优势。随着Turin芯片越来越接近市场,我们可以期待更多的细节。RyzenAI300系列“StrixPoint”处理器AMD揭开RyzenAI300系列“StrixPoint”处理器的神秘面纱——50TOPS的AI性能,Zen5c密度核心首次应用于Ryzen9。StrixPointAPU配备了XDNA2AI加速器,AMD表示该加速器能够实现高达50TOPS的性能,领先于最近微软使用的高通骁龙XElite(45TOPS)。作为一款具有强大集成显卡的APU,游戏也是测试的一部分。AMD希望通过其集成Radeon880M和890MGPU来确保游戏领域的领先地位。根据AMD的演示,RyzenAI300系列芯片平均性能比英特尔CoreUltra185H快36%。这里的平均分数取自六款主要游戏的基准测试,包括《赛博朋克2077》、《无主之地3》、《F123》、《刺客信条幻影》、《古墓丽影:暗影》和《孤岛惊魂6》。代号为StrixPoint的全新RyzenAI300系列芯片,采用全新的Zen5CPU微架构,拥有两种核心、升级的RDNA3.5图形引擎,当然还有AMD全新的XDNA2引擎,可在本地运行AI工作负载。AMD的新品牌方案现在将AI直接带入了芯片名称中,这反映了公司对以AI为重点的全新XDNA2神经处理单元(NPU)的强烈关注。XDNA2现在可提供50TOPS的性能,是AMD第三代AI处理器性能的5倍。这一性能水平超越了WindowsPC的所有其他芯片,包括高通公司前景看好的骁龙XElite,并轻松超过了微软对下一代AIPC的40TOPS要求,这是在本地运行Copilot的最低硬件要求。AMD在其他方面也取得了很多进步,针对轻薄型和超轻型笔记本电脑的Zen5处理器已升级到12核,过去只能使用8个CPU核心,而新的RDNA3.5集成图形引擎最多可使用16个计算单元,比上一代的最多12个有所增加。旗舰级RyzenAI9HX370配备了12个核心和24个线程,基本频率为2.0GHz,峰值频率为5.1GHz。不过,从品牌宣传幻灯片中可以看到,该芯片与GPU和NPU核心一起,在单片芯片上配备了4个标准Zen5核心和8个密度优化的Zen5C核心。这标志着更小的Zen4c核心首次出现在最高级别的Ryzen9移动系列中,因为这些核心以前仅限于AMD采用上一代鹰点芯片的最低端Ryzen5和3型号。与标准的Zen5性能核心相比,AMD的Zen5c核心旨在减少处理器芯片上的空间占用,同时为要求不高的任务提供足够的性能,从而节省电能,并在每平方毫米上提供比以前更多的计算能力。虽然这种技术在概念上与英特尔的E-cores类似,但AMD的Zen5c采用了与标准Zen5核心相同的微架构,并通过较小的核心支持相同的功能,而英特尔的设计则采用了不同的架构和功能支持。不过,较小的Zen5c核心工作时钟频率较低,因此峰值性能不如标准核心,但它们也为其他附加功能(如更大的GPU和NPU)保留了芯片面积。HX370芯片还拥有36MB三级缓存、50TOPSXDNA2NPU和新的RDNA3.5Radeon890M图形引擎。该芯片的额定TDP为28W,但其宽泛的cTDP范围意味着这并不能反映其实际运行功耗水平。RyzenAI9365配备10个核心,包括4个标准Zen5核心和6个经过密度优化的Zen5c核心,基本频率为2.0GHz,峰值频率为5.0GHz。该芯片还配备了50TOPSNPU和一个12-CURDNA3.5Radeon88...PC版:https://www.cnbeta.com.tw/articles/soft/1433501.htm手机版:https://m.cnbeta.com.tw/view/1433501.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人