清华大学研究超高速光电模拟芯片:“挣脱”摩尔定律,算力提升 3000 倍

清华大学研究超高速光电模拟芯片:“挣脱”摩尔定律,算力提升3000倍清华大学自动化系戴琼海院士、吴嘉敏助理教授与电子工程系方璐副教授、乔飞副研究员联合攻关,提出了一种“挣脱”摩尔定律的全新计算架构:光电模拟芯片,算力达到目前高性能商用芯片的3000余倍。相关成果以“高速视觉任务中的纯模拟光电芯片”(All-analogphoto-electronicchipforhigh-speedvisiontasks)为题,以(article)形式发表在《自然》(Nature)期刊上。如果用交通工具的运行时间来类比芯片中信息流计算的时间,那么这枚芯片的出现,相当于将京广高铁8小时的运行时间缩短到8秒钟。在这枚小小的芯片中,清华大学攻关团队创造性地提出了光电深度融合的计算框架。从最本质的物理原理出发,结合了基于电磁波空间传播的光计算,与基于基尔霍夫定律的纯模拟电子计算,“挣脱”传统芯片架构中数据转换速度、精度与功耗相互制约的物理瓶颈,在一枚芯片上突破大规模计算单元集成、高效非线性、高速光电接口三个国际难题。实测表现下,光电融合芯片的系统级算力较现有的高性能芯片架构提升了数千倍。然而,如此惊人的算力,还只是这枚芯片诸多优势的其中之一。在研发团队演示的智能视觉任务和交通场景计算中,光电融合芯片的系统级能效(单位能量可进行的运算数)实测达到了74.8Peta-OPS/W,是现有高性能芯片的400万余倍。形象地说,原本供现有芯片工作一小时的电量,可供它工作500多年。——

相关推荐

封面图片

清华大学成功研发光电模拟芯片:摆脱摩尔定律 能效提升超400万倍

清华大学成功研发光电模拟芯片:摆脱摩尔定律能效提升超400万倍但是随着晶体管尺寸逐渐接近物理极限,近十年内摩尔定律已放缓甚至面临失效。此次清华大学研发的光电模拟芯片,也为摆脱摩尔定律指明了新的方向。据介绍,在光电模拟芯片这一枚芯片上便突破了大规模计算单元集成、高效非线性、高速光电接口三个国际难题。根据官方的实测,光电融合芯片的系统级算力较现有的高性能芯片架构提升了3000余倍,以交通工具来类比的话,相当于将京广高铁8小时的运行时间缩短到了8秒钟。不仅如此,该芯片的系统级能效实测达到了74.8Peta-OPS/W,是现有高性能芯片的400万余倍,相当于原本供现有芯片工作一小时的电量,可供它工作500多年。此外,该芯片光学部分的加工最小线宽仅采用百纳米级,而电路部分仅采用180nmCMOS工艺,就已取得比7纳米制程的高性能芯片多个数量级的性能提升。论文通讯作者之一戴琼海院士介绍道:“开发出人工智能时代的全新计算架构是一座高峰,而将新架构真正落地到现实生活,解决国计民生的重大需求,是更重要的攻关,也是我们的责任。”...PC版:https://www.cnbeta.com.tw/articles/soft/1393187.htm手机版:https://m.cnbeta.com.tw/view/1393187.htm

封面图片

清华大学研制出首个全模拟光电智能计算芯片 性能领先商用产品3000倍

清华大学研制出首个全模拟光电智能计算芯片性能领先商用产品3000倍结合基于电磁波空间传播的光计算,与基于基尔霍夫定律的全模拟电子计算,在一枚芯片上突破了大规模计算单元集成、高效非线性、高速光电接口三个国际难题。在保证高任务性能的同时,实现了超高的计算能效和计算速度。为了确保实验数据的可靠性,攻关团队进行了大规模的实测和验证。首次将端到端跨层协同技术应用到智能视觉交互上,运用等效算力,对能效性能和时延数据进行了精准评估。光电计算芯片ACCEL的计算原理和芯片架构ACCEL共有三大优势:一、超高性能实测表现下,ACCEL芯片的系统级算力达到现有高性能芯片的3000倍。如果用交通工具的时间来类比芯片中信息流计算,那么这枚芯片的出现,相当于将8小时的京广高铁缩短到了8秒钟。二、超低功耗系统级能效为74.8Peta-OPS/W,较现有的高性能GPU、TPU等计算架构,提升了400万倍。形象来说,原本供现有芯片工作1小时的电量,可供它工作500多年。三、超低成本光电融合芯片的光学部分的加工最小线宽仅采用百纳米级,电路部分仅采用180nmCMOS工艺,已取得比7nm制程的高性能芯片多个数量级的性能提升。同时所使用的材料简单易得,造价仅为后者的几十分之一。...PC版:https://www.cnbeta.com.tw/articles/soft/1394375.htm手机版:https://m.cnbeta.com.tw/view/1394375.htm

封面图片

清华大学获芯片领域重要突破

清华大学获芯片领域重要突破记者11日从清华大学获悉,针对大规模光电智能计算难题,清华大学电子工程系副教授方璐课题组、自动化系戴琼海院士课题组,摒弃传统电子深度计算范式,另辟蹊径,首创分布式广度光计算架构,研制大规模干涉-衍射异构集成芯片太极(Taichi),实现160TOPS/W的通用智能计算。在如今大模型通用人工智能蓬勃发展的时代,该科研成果以光子之道,为高性能算力探索新灵感、新架构、新路径。相关科研成果发表于最新一期的国际期刊《科学》。(科技日报)

封面图片

新版摩尔定律来?ChatGPT之父:AI算量18个月翻倍

新版摩尔定律来?ChatGPT之父:AI算量18个月翻倍1965年,时任仙童半导体工程师、后来创立了Intel的戈登·摩尔发文指出,每隔18个月,半导体芯片的晶体管密度就会翻倍,被称为摩尔定律,后续又被时间间隔修正为24个月,也就是两年时间芯片密度翻倍,成本降低一半。至于ChatGPT,它目前使用的是GPT-3大模型,有1750亿参数,已经积累了1亿用户,日活超过1300万,训练阶段总算力消耗约为3640PF-days(即1PetaFLOP/s效率跑3640天),成本预计在500万美元/次。未来会升级到GPT-4模型,有100万亿参数,算力性能需要指数级提升。...PC版:https://www.cnbeta.com.tw/articles/soft/1346599.htm手机版:https://m.cnbeta.com.tw/view/1346599.htm

封面图片

清华大学集成电路学院在忆阻器存算一体芯片领域取得重大突破

清华大学集成电路学院在忆阻器存算一体芯片领域取得重大突破在支持片上学习的忆阻器存算一体芯片领域取得重大突破,有望促进人工智能、自动驾驶可穿戴设备等领域发展。相关成果在线发表于最新一期的《科学》杂志。记忆电阻器(Memristor,忆阻器),是继电阻、电容、电感之后的第四种电路基本元件。它可以在断电之后,仍能“记忆”通过的电荷,被当做新型纳米电子突触器件。存算一体架构彻底消除了数据在逻辑处理器与存储芯片之间的搬迁问题,减少能量消耗及延迟,在边缘计算和云计算中有广泛的应用前景。相同任务下,该芯片实现片上学习的能耗仅为先进工艺下专用集成电路(ASIC)系统的1/35,同时有望实现75倍的能效提升。...PC版:https://www.cnbeta.com.tw/articles/soft/1389449.htm手机版:https://m.cnbeta.com.tw/view/1389449.htm

封面图片

NVIDIA“最强AI芯片”Blackwell B200 GPU令业内惊呼新的摩尔定律诞生

NVIDIA“最强AI芯片”BlackwellB200GPU令业内惊呼新的摩尔定律诞生在GTC直播中,黄仁勋左手举着B200GPU,右手举着H100此外,将两个B200GPU与单个GraceCPU结合在一起的GB200,可以为LLM推理工作负载提供30倍的性能,并且显著提高效率。黄仁勋还强调称:“与H100相比,GB200的成本和能耗降低了25倍!关于市场近期颇为关注的能源消耗问题,B200GPU也交出了最新的答卷。黄仁勋表示,此前训练一个1.8万亿参数模型,需要8000个HopperGPU并消耗15MW电力。但如今,2000个BlackwellGPU就可以实现这一目标,耗电量仅为4MW。在拥有1750亿参数的GPT-3大模型基准测试中,GB200的性能是H100的7倍,训练速度是H100的4倍。值得一提的是,B200GPU的重要进步之一,是采用了第二代Transformer引擎。它通过对每个神经元使用4位(20petaflopsFP4)而不是8位,直接将计算能力、带宽和模型参数规模翻了一倍。而只有当这些大量的GPU连接在一起时,第二个重要区别才会显现,那就是新一代NVLink交换机可以让576个GPU相互通信,双向带宽高达1.8TB/秒。而这就需要英伟达构建一个全新的网络交换芯片,其中包括500亿个晶体管和一些自己的板载计算:拥有3.6teraflopsFP8处理能力。在此之前,仅16个GPU组成的集群,就会耗费60%的时间用于相互通信,只有40%的时间能用于实际计算。一石激起千层浪,“最强AI芯片”的推出让网友纷纷赞叹。其中英伟达高级科学家JimFan直呼:Blackwell新王诞生,新的摩尔定律已经应运而生。DGXGrace-BlackwellGB200:单个机架的计算能力超过1Exaflop。黄仁勋交付给OpenAI的第一台DGX是0.17Petaflops。GPT-4的1.8T参数可在2000个Blackwell上完成90天的训练。还有网友感叹:1000倍成就达成!Blackwell标志着在短短8年内,NVIDIAAI芯片的计算能力实现了提升1000倍的历史性成就。2016年,“Pascal”芯片的计算能力仅为19teraflops,而今天Blackwell的计算能力已经达到了20000teraflops。相关文章:全程回顾黄仁勋GTC演讲:Blackwell架构B200芯片登场英伟达扩大与中国车企合作为比亚迪提供下一代车载芯片英伟达进军机器人领域发布世界首款人形机器人通用基础模型台积电、新思科技首次采用NVIDIA计算光刻平台:最快加速60倍NVIDIA共享虚拟现实环境技术将应用于苹果VisionPro黄仁勋GTC演讲全文:最强AI芯片Blackwell问世推理能力提升30倍...PC版:https://www.cnbeta.com.tw/articles/soft/1424217.htm手机版:https://m.cnbeta.com.tw/view/1424217.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人