若考虑成本因素 摩尔定律实际上已失效10年

若考虑成本因素 摩尔定律实际上已失效10年 1965 年,已故英特尔公司联合创始人戈登-摩尔(Gordon Moore)提出了电路板上每平方英寸的晶体管数量大约每两年翻一番的理论。以他的名字命名的这一理论在此后近 60 年的时间里基本保持不变,但最近却持续面临动荡。2014 年,MonolithIC 首席执行官 Zvi Or-Bach 指出,1 亿门晶体管的成本此前一直在稳步下降,在当时的 28nm 节点跌至谷底。据《半导体文摘》(Semiconductor Digest)报道,Shah 在 2023 年 IEDM 大会上发言时,用一张图表支持了 Or-Bach 的说法,该图表显示,1 亿门晶体管的价格从那时起一直保持平稳,这表明晶体管在过去十年中并没有变得更便宜。尽管芯片制造商不断缩小半导体,并将更多半导体封装到功能越来越强大的芯片上,但价格和功耗却在增加。自2017年以来,NVIDIA公司首席执行官黄仁勋曾多次宣称摩尔定律已死,试图解释这一趋势,他表示,更强大的硬件将不可避免地花费更多成本,需要更多能源。最近,有人指责 NVIDIA 首席执行官为 NVIDIA 显卡价格上涨找借口。与此同时,AMD和英特尔的负责人承认摩尔定律至少已经放缓,但声称他们仍然可以通过 3D 封装等创新技术实现有意义的性能和效率提升。Or-Bach 和后来的 Shah 的分析可能与台积电的晶圆涨价相吻合,2014 年 28 纳米之后,台积电的晶圆涨价速度急剧加快。据 DigiTimes 报道,随着 2016 年 10nm 制程的推出,这家台湾巨头的单晶圆成本在随后的两年里翻了一番。据该媒体估计,最新的 3nm 晶圆成本可能达到 20000 美元。随着台积电及其竞争对手在未来几年将目标转向 2 纳米和 1 纳米,进一步的分析表明,半导体行业近期的增长主要来自晶圆价格的上涨。尽管过去几年晶圆销量下降,但台积电晶圆的平均价格却持续上涨。 ... PC版: 手机版:

相关推荐

封面图片

英特尔实现3D先进封装大规模量产 继续推进摩尔定律

英特尔实现3D先进封装大规模量产 继续推进摩尔定律 英特尔表示,在其最新完成升级的美国新墨西哥州Fab 9工厂,实现基于业界领先的半导体封装解决方案的大规模生产,其中包括英特尔突破性的3D封装技术Foveros。据了解,英特尔Foveros是3D先进封装技术,在处理器的制造过程中,能够以垂直而非水平方式堆叠计算模块。英特尔的Foveros和EMIB等封装技术,可以实现在单个封装中集成一万亿个晶体管,并在2030年后继续推进摩尔定律。摩尔定律是Intel创始人之一戈登·摩尔的经验之谈,其核心内容为:集成电路上可以容纳的晶体管数量,每经过18-24个月便会翻一番,而处理器的性能大约每2年翻一倍,同时价格降低一半。英特尔CEO帕特·基辛格此前也曾表示,“对于那些宣告我们(摩尔定律)已经死亡的批评者来说,在元素周期表用完之前,我们绝不会停下!” ... PC版: 手机版:

封面图片

大模型增速远超摩尔定律 MIT最新研究:人类快要喂不饱AI了

大模型增速远超摩尔定律 MIT最新研究:人类快要喂不饱AI了 论文地址: 蓝点表示中心估计值或范围; 蓝色三角形对应于不同大小(范围从1K到1B)的问题的倍增时间; 紫色虚线对应于摩尔定律表示的2年倍增时间。摩尔定律和比尔盖茨摩尔定律(Moore's law)是一种经验或者观察结果,表示集成电路(IC)中的晶体管数量大约每两年翻一番。1965年,仙童半导体(Fairchild Semiconductor)和英特尔的联合创始人Gordon Moore假设集成电路的组件数量每年翻一番,并预测这种增长率将至少再持续十年。1975年,展望下一个十年,他将预测修改为每两年翻一番,复合年增长率(CAGR)为41%。虽然Moore没有使用经验证据来预测历史趋势将继续下去,但他的预测自1975年以来一直成立,所以也就成了“定律”。因为摩尔定律被半导体行业用于指导长期规划和设定研发目标,所以在某种程度上,成了一种自我实现预言。数字电子技术的进步,例如微处理器价格的降低、内存容量(RAM 和闪存)的增加、传感器的改进,甚至数码相机中像素的数量和大小,都与摩尔定律密切相关。数字电子的这些持续变化一直是技术和社会变革、生产力和经济增长的驱动力。不过光靠自我激励肯定是不行的,虽然行业专家没法对摩尔定律能持续多久达成共识,但根据微处理器架构师的报告,自2010年左右以来,整个行业的半导体发展速度已经放缓,略低于摩尔定律预测的速度。下面是维基百科给出的晶体管数量增长趋势图:到了2022年9月,英伟达首席执行官黄仁勋直言“摩尔定律已死”,不过英特尔首席执行官Pat Gelsinger则表示不同意。从下图我们可以看出,英特尔还在努力用各种技术和方法为自己老祖宗提出的定律续命,并表示,问题不大,你看我们还是直线没有弯。Andy and Bill's Law关于算力的增长,有一句话是这样说的:“安迪给的,比尔都拿走(What Andy giveth, Bill taketh away)”。这反映了当时的英特尔首席执行官Andy Grove每次向市场推出新芯片时,微软的CEO比尔·盖茨(Bill Gates)都会通过升级软件来吃掉芯片提升的性能。而以后吃掉芯片算力的就是大模型了,而且根据MIT的这项研究,大模型以后根本吃不饱。研究方法如何定义LLM的能力提升?首先,研究人员对模型的能力进行了量化。基本的思想就是:如果一种算法或架构在基准测试中以一半的计算量获得相同的结果,那么就可以说,它比另一种算法或架构好两倍。有了比赛规则之后,研究人员招募了200多个语言模型来参加比赛,同时为了确保公平公正,比赛所用的数据集是WikiText-103和WikiText-2以及Penn Treebank,代表了多年来用于评估语言模型的高质量文本数据。专注于语言模型开发过程中使用的既定基准,为比较新旧模型提供了连续性。需要注意的是,这里只量化了预训练模型的能力,没有考虑一些“训练后增强”手段,比如思维链提示(COT)、微调技术的改进或者集成搜索的方法(RAG)。模型定义研究人员通过拟合一个满足两个关键目标的模型来评估其性能水平:(1)模型必须与之前关于神经标度定律的工作大致一致;(2)模型应允许分解提高性能的主要因素,例如提高模型中数据或自由参数的使用效率。这里采用的核心方法类似于之前提出的缩放定律,将Dense Transformer的训练损失L与其参数N的数量和训练数据集大小D相关联:其中L是数据集上每个token的交叉熵损失,E、A、B、α和β是常数。E表示数据集的“不可减少损失”,而第二项和第三项分别代表由于模型或数据集的有限性而导致的错误。因为随着时间的推移,实现相同性能水平所需的资源(N 和 D)会减少。为了衡量这一点,作者在模型中引入了“有效数据”和“有效模型大小”的概念:其中的Y表示年份,前面的系数表示进展率,代入上面的缩放定律,可以得到:通过这个公式,就可以估计随着时间的推移,实现相同性能水平所需的更少资源(N和D)的速度。数据集参与测评的包含400多个在WikiText-103(WT103)、WikiText-2(WT2)和Penn Treebank(PTB)上评估的语言模型,其中约60%可用于分析。研究人员首先从大约200篇不同的论文中检索了相关的评估信息,又额外使用框架执行了25个模型的评估。然后,考虑数据的子集,其中包含拟合模型结构所需的信息:token级测试困惑度(决定交叉熵损失)、发布日期、模型参数数量和训练数据集大小,最终筛选出231个模型供分析。这231个语言模型,跨越了超过8个数量级的计算,上图中的每个形状代表一个模型。形状的大小与训练期间使用的计算成正比,困惑度评估来自于现有文献以及作者自己的评估测试。在某些情况下,会从同一篇论文中检索到多个模型,为了避免自相关带来的问题,这里每篇论文最多只选择三个模型。实证结果根据缩放定律,以及作者引入的有效数据、有效参数和有效计算的定义来进行评估,结果表明:有效计算的中位倍增时间为8.4个月,95%置信区间为4.5至14.3个月。上图表示通过交叉验证选择的模型的算法进度估计值。图a显示了倍增时间的汇总估计值,图b显示了从左到右按交叉验证性能递减(MSE测试损耗增加)排序。上图比较了2016年至2020年前后的算法有效计算的估计倍增时间。相对于前期,后期的倍增时间较短,表明在该截止年之后算法进步速度加快。参考资料: ... PC版: 手机版:

封面图片

一片晶圆成本 3 万美元,报告称 2nm 芯片制造成本增加 50%

一片晶圆成本 3 万美元,报告称 2nm 芯片制造成本增加 50% (英文) IT之家 12 月 23 日消息,对于半导体器件制造商来说,维持摩尔定律变得越来越困难和昂贵。International Business Strategies 分析师近日发布报告,称制造商过渡到 2nm 工艺后,相比 3nm 工艺其成本增加 50%,导致每片 2nm 晶圆的成本为 3 万美元(IT之家备注:当前约 21.4 万元人民币)。

封面图片

Azure AI 入门 (三)摩尔定律,GPU与并行计算

Azure AI 入门 (三)摩尔定律,GPU与并行计算 摩尔定律(图一)是英特尔Intel创始人之一戈登·摩尔的经验之谈,其核心内容为:集成电路IC相同面积上可以容纳的晶体管Transistor数目在18个月到24个月便会增加一倍,因此处理器的性能大约每两年翻一倍,同时价格下降为之前的一半。 虽然名为“定律”,但其只是根据20世纪中后期的发展趋势归纳而成。进入21世纪以后,以英特尔为代表的中央处理器CPU的发展趋势渐渐慢于摩尔的预测的。仅依靠单颗处理器的速度提升已无法满足日渐复杂的计算任务,比如3维图形的渲染(3D rendering)。 因此,英伟达Nvidia在1999年提出了硬件图形处理器(Graphics Processing Unit)的概念,以大量的只能完成某些特殊任务的微处理器,代替少量的通用处理器。软件方面,并行计算也从专业科学领域逐渐向大众领域流行。用一个可能不是最恰当的比方,CPU像是由4位特级厨师组成的小组,可以完成任何烹饪任务,而GPU像是用同样工资请来的128位三明治店的员工。GPU不能做很多事,像完成一些特定的菜,但如果任务是制作2000人份的三明治,GPU一定可以依靠并行计算比CPU完成得快许多。 GPU与并行计算的普及,也使得云计算成为了可能。计算机科学家在设计计算任务时通常会首先考虑能否将大任务拆分成能同时进行的更小任务,从而可以同时运行在服务商提供的大量数目的CPU和GPU上。 图二 英伟达创始人黄仁勋 Jensen Huang

封面图片

黄仁勋:世界发展速度正远超摩尔定律,未来两年AI进步惊人

黄仁勋:世界发展速度正远超摩尔定律,未来两年AI进步惊人 当地时间9月17日,黄仁勋在Dreamforce 2024年度会议上表示,“世界正处于发展速度远超摩尔定律的阶段,未来一两内,AI的进步将会非常惊人。” 美女去衣换脸搜索更多

封面图片

纳米:一场台积电们的盛大文字游戏

纳米:一场台积电们的盛大文字游戏 在上个世纪70年代开始,人们利用栅级的尺寸来命名制程的大小。 然而历史证明,“栅级宽度与制程等比例变化”,“制程与晶体管密度等比例变化”,这两个最重要的同步性预测,其实只是上世纪70-90年代的短暂产物。 纳米制程节点、而非晶体管密度,在早期能够代表摩尔定律的发展,就隐含了对这种技术平衡性的追求。纳米命名模式与实际制程的分道扬镳,其实本身就标志乌托邦式的摩尔定律开始解体。 但纳米节点却扮演了一种“遮羞布”式的角色,人们假装摩尔定律还存在,却事实性地绕过了 摩尔定律。 #阅读材料

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人