清华大学研制出全球首颗“机器学习能在硬件端直接完成”的芯片

清华大学研制出全球首颗“机器学习能在硬件端直接完成”的芯片近日,清华大学集成电路学院教授吴华强、副教授高滨团队基于存算一体计算范式,研制出全球首颗全系统集成的、支持高效片上学习(机器学习能在硬件端直接完成)的忆阻器存算一体芯片,在支持片上学习的忆阻器存算一体芯片领域取得重大突破,有望促进人工智能、自动驾驶可穿戴设备等领域发展。该芯片包含支持完整片上学习所必需的全部电路模块,成功完成图像分类、语音识别和控制任务等多种片上增量学习功能验证,展示出高适应性、高能效、高通用性、高准确率等特点,有效强化智能设备在实际应用场景下的学习适应能力。相同任务下,该芯片实现片上学习的能耗仅为先进工艺下专用集成电路(ASIC)系统的3%,展现出卓越的能效优势,极具满足人工智能时代高算力需求的应用潜力,为突破冯·诺依曼传统计算架构下的能效瓶颈提供了一种创新发展路径。

相关推荐

封面图片

清华大学研制出全球首颗支持片上学习忆阻器存算一体芯片

清华大学研制出全球首颗支持片上学习忆阻器存算一体芯片当前国际上的相关研究主要集中在忆阻器阵列层面的学习功能演示,然而实现全系统集成的、支持高效片上学习的忆阻器芯片仍面临较大挑战,至今尚未实现,主要在于传统的反向传播训练算法所要求的高精度权重更新方式与忆阻器实际特性的适配性较差。据了解,面向传统存算分离架构制约算力提升的重大挑战,吴华强、高滨创造性提出适配忆阻器存算一体,实现高效片上学习的新型通用算法和架构(STELLAR),有效实现大规模模拟型忆阻器阵列与CMOS的单片三维集成,通过算法、架构、集成方式的全流程协同创新,研制出全球首颗全系统集成的、支持高效片上学习的忆阻器存算一体芯片。该芯片包含支持完整片上学习所必需的全部电路模块,成功完成图像分类、语音识别和控制任务等多种片上增量学习功能验证,展示出高适应性、高能效、高通用性、高准确率等特点,有效强化智能设备在实际应用场景下的学习适应能力。相同任务下,该芯片实现片上学习的能耗仅为先进工艺下专用集成电路(ASIC)系统的3%,展现出卓越的能效优势,极具满足人工智能时代高算力需求的应用潜力,为突破冯·诺依曼传统计算架构下的能效瓶颈提供了一种创新发展路径。...PC版:https://www.cnbeta.com.tw/articles/soft/1389045.htm手机版:https://m.cnbeta.com.tw/view/1389045.htm

封面图片

清华大学集成电路学院在忆阻器存算一体芯片领域取得重大突破

清华大学集成电路学院在忆阻器存算一体芯片领域取得重大突破在支持片上学习的忆阻器存算一体芯片领域取得重大突破,有望促进人工智能、自动驾驶可穿戴设备等领域发展。相关成果在线发表于最新一期的《科学》杂志。记忆电阻器(Memristor,忆阻器),是继电阻、电容、电感之后的第四种电路基本元件。它可以在断电之后,仍能“记忆”通过的电荷,被当做新型纳米电子突触器件。存算一体架构彻底消除了数据在逻辑处理器与存储芯片之间的搬迁问题,减少能量消耗及延迟,在边缘计算和云计算中有广泛的应用前景。相同任务下,该芯片实现片上学习的能耗仅为先进工艺下专用集成电路(ASIC)系统的1/35,同时有望实现75倍的能效提升。...PC版:https://www.cnbeta.com.tw/articles/soft/1389449.htm手机版:https://m.cnbeta.com.tw/view/1389449.htm

封面图片

清华大学研制出首个全模拟光电智能计算芯片 性能领先商用产品3000倍

清华大学研制出首个全模拟光电智能计算芯片性能领先商用产品3000倍结合基于电磁波空间传播的光计算,与基于基尔霍夫定律的全模拟电子计算,在一枚芯片上突破了大规模计算单元集成、高效非线性、高速光电接口三个国际难题。在保证高任务性能的同时,实现了超高的计算能效和计算速度。为了确保实验数据的可靠性,攻关团队进行了大规模的实测和验证。首次将端到端跨层协同技术应用到智能视觉交互上,运用等效算力,对能效性能和时延数据进行了精准评估。光电计算芯片ACCEL的计算原理和芯片架构ACCEL共有三大优势:一、超高性能实测表现下,ACCEL芯片的系统级算力达到现有高性能芯片的3000倍。如果用交通工具的时间来类比芯片中信息流计算,那么这枚芯片的出现,相当于将8小时的京广高铁缩短到了8秒钟。二、超低功耗系统级能效为74.8Peta-OPS/W,较现有的高性能GPU、TPU等计算架构,提升了400万倍。形象来说,原本供现有芯片工作1小时的电量,可供它工作500多年。三、超低成本光电融合芯片的光学部分的加工最小线宽仅采用百纳米级,电路部分仅采用180nmCMOS工艺,已取得比7nm制程的高性能芯片多个数量级的性能提升。同时所使用的材料简单易得,造价仅为后者的几十分之一。...PC版:https://www.cnbeta.com.tw/articles/soft/1394375.htm手机版:https://m.cnbeta.com.tw/view/1394375.htm

封面图片

清华大学实现芯片领域重要突破!计算能效超现有芯片2—3个数量级

清华大学实现芯片领域重要突破!计算能效超现有芯片2—3个数量级随着人工智能的蓬勃发展,智能光计算作为新兴计算模态,在后摩尔时代展现出远超硅基电子计算的性能与潜力。但最大的痛点是光的计算优势被困在不适合的电架构中,计算规模受到了限制,无法支撑急需高算力与高能效的复杂大模型智能计算。而太极光芯片的计算能效,直接超越了现有智能芯片2—3个数量级,可以为百亿像素大场景光速智能分析、百亿参数大模型训练推理、毫瓦级低功耗自主智能无人系统提供算力支撑。...PC版:https://www.cnbeta.com.tw/articles/soft/1427088.htm手机版:https://m.cnbeta.com.tw/view/1427088.htm

封面图片

清华大学成功研发光电模拟芯片:摆脱摩尔定律 能效提升超400万倍

清华大学成功研发光电模拟芯片:摆脱摩尔定律能效提升超400万倍但是随着晶体管尺寸逐渐接近物理极限,近十年内摩尔定律已放缓甚至面临失效。此次清华大学研发的光电模拟芯片,也为摆脱摩尔定律指明了新的方向。据介绍,在光电模拟芯片这一枚芯片上便突破了大规模计算单元集成、高效非线性、高速光电接口三个国际难题。根据官方的实测,光电融合芯片的系统级算力较现有的高性能芯片架构提升了3000余倍,以交通工具来类比的话,相当于将京广高铁8小时的运行时间缩短到了8秒钟。不仅如此,该芯片的系统级能效实测达到了74.8Peta-OPS/W,是现有高性能芯片的400万余倍,相当于原本供现有芯片工作一小时的电量,可供它工作500多年。此外,该芯片光学部分的加工最小线宽仅采用百纳米级,而电路部分仅采用180nmCMOS工艺,就已取得比7纳米制程的高性能芯片多个数量级的性能提升。论文通讯作者之一戴琼海院士介绍道:“开发出人工智能时代的全新计算架构是一座高峰,而将新架构真正落地到现实生活,解决国计民生的重大需求,是更重要的攻关,也是我们的责任。”...PC版:https://www.cnbeta.com.tw/articles/soft/1393187.htm手机版:https://m.cnbeta.com.tw/view/1393187.htm

封面图片

清华大学研究超高速光电模拟芯片:“挣脱”摩尔定律,算力提升 3000 倍

清华大学研究超高速光电模拟芯片:“挣脱”摩尔定律,算力提升3000倍清华大学自动化系戴琼海院士、吴嘉敏助理教授与电子工程系方璐副教授、乔飞副研究员联合攻关,提出了一种“挣脱”摩尔定律的全新计算架构:光电模拟芯片,算力达到目前高性能商用芯片的3000余倍。相关成果以“高速视觉任务中的纯模拟光电芯片”(All-analogphoto-electronicchipforhigh-speedvisiontasks)为题,以(article)形式发表在《自然》(Nature)期刊上。如果用交通工具的运行时间来类比芯片中信息流计算的时间,那么这枚芯片的出现,相当于将京广高铁8小时的运行时间缩短到8秒钟。在这枚小小的芯片中,清华大学攻关团队创造性地提出了光电深度融合的计算框架。从最本质的物理原理出发,结合了基于电磁波空间传播的光计算,与基于基尔霍夫定律的纯模拟电子计算,“挣脱”传统芯片架构中数据转换速度、精度与功耗相互制约的物理瓶颈,在一枚芯片上突破大规模计算单元集成、高效非线性、高速光电接口三个国际难题。实测表现下,光电融合芯片的系统级算力较现有的高性能芯片架构提升了数千倍。然而,如此惊人的算力,还只是这枚芯片诸多优势的其中之一。在研发团队演示的智能视觉任务和交通场景计算中,光电融合芯片的系统级能效(单位能量可进行的运算数)实测达到了74.8Peta-OPS/W,是现有高性能芯片的400万余倍。形象地说,原本供现有芯片工作一小时的电量,可供它工作500多年。——

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人