清华团队发布中国AI光芯片“太极” 号称受《周易》启发

清华团队发布中国AI光芯片“太极”号称受《周易》启发该研究成果于北京时间4月12日凌晨以《大规模光芯片“太极”赋能160TOPS/W通用人工智能》为题发表在最新一期的《科学》(Science)上。方璐、戴琼海为论文的通讯作者,电子工程系博士生徐智昊、博士后周天贶(清华大学水木学者)为论文第一作者。“挣脱”算力瓶颈的中国光计算睿智尝试作为人工智能的三驾马车之一,算力是训练AI模型、推理任务的关键。倘若把大模型当作是做一道精致的菜肴,算力就好比一套称手的烹饪工具。世人皆知巧妇难为无米之炊,但再好的厨子,没有一口好锅、一把好刀,面对鲜美的食材也只能望而兴叹。光计算,顾名思义是将计算载体从电变为光,利用光在芯片中的传播进行计算,以其超高的并行度和速度,被认为是未来颠覆性计算架构的最有力竞争方案之一。光芯片具备高速高并行计算优势,被寄予希望用来支撑大模型等先进人工智能应用。智能光计算作为新兴计算模态,在后摩尔时代展现出有望超越硅基电子计算的潜力。然而其计算任务局限于简单的字符分类、基本的图像处理等。其痛点是光的计算优势被困在了不适合的电架构中,计算规模受限,无法支撑亟需高算力与高能效的复杂大模型智能计算。行胜于言,直面科研领域痛点问题,帮助光计算“挣脱”算力瓶颈,另辟蹊径,“从0到1”重新设计适合光计算的新架构,是这个清华团队迈出的关键一步。光电智能技术交叉创新团队部分成员合影(左三为戴琼海院士、右二为方璐副教授)从“无极”而至“太极”的双向奔赴从构思到实验,开辟新赛道、做第一个吃螃蟹的人往往都伴随着巨大的困难与压力。每一个研究成果的背后,都凝缩了团队每一位成员的心血,是历经无数失败与彻夜难眠后,结出的那颗最耀眼的结晶。但方璐却将这次科研历程比拟为一场浪漫的“双向奔赴”:从算法架构上自顶向下探索,在硬件芯片设计上自底向上推演。相异于电子神经网络依赖网络深度以实现复杂的计算与功能,“太极”光芯片架构源自光计算独特的‘全连接’与‘高并行’属性,化深度计算为分布式广度计算,为实现规模易扩展、计算高并行、系统强鲁棒的通用智能光计算探索了新路径。据论文第一作者、电子系博士生徐智昊介绍,在“太极”架构中,自顶向下的编码拆分-解码重构机制,将复杂智能任务化繁为简,拆分为多通道高并行的子任务,构建的分布式‘大感受野’浅层光网络对子任务分而治之,突破物理模拟器件多层深度级联的固有计算误差。化“深”为“广”:分布式广度光计算架构团队以周易典籍‘易有太极,是生两仪’为启发,建立干涉-衍射联合传播模型,融合衍射光计算大规模并行优势与干涉光计算灵活重构特性,将衍射编解码与干涉特征计算进行部分/整体重构复用,以时序复用突破通量瓶颈,自底向上支撑分布式广度光计算架构,为片上大规模通用智能光计算探索了新路径。通俗来讲,干涉-衍射的组合方式仿佛就是在拼乐高玩具。乐高积木可以通过一个模块刘海与另一个模块凸起的契合来完成两个组件的拼接。在科研团队眼中,一旦把干涉、衍射变成基础模块,进行重构复用,可以凭借丰富的想象力搭建出变化无穷的造型。两仪一元:干涉-衍射融合计算芯片据论文报道:“太极”光芯片具备879TMACS/mm²的面积效率与160TOPS/W的能量效率,首次赋能光计算实现自然场景千类对象识别、跨模态内容生成等人工智能复杂任务。“太极”光芯片有望为大模型训练推理、通用人工智能、自主智能无人系统提供算力支撑。复杂智能任务实验结果展示方璐表示,“之所以将光芯片命名为‘太极’,也是希望可以在如今大模型通用人工智能蓬勃发展的时代,以光子之道,为高性能计算探索新灵感、新架构、新路径。”学科交叉融合,探索无限可能“太极”光芯片的诞生是多学科交叉碰撞、探索无限的过程。从一个初步设想到打破常规思维、确立科研思路,从理论计算到架构创新,再到模拟试验、现场实测......每一个重大突破性研究,都涉及不同学科高度交叉融合,催生出“0到1”的成果。北京信息科学与技术国家研究中心的光电智能技术交叉创新团队由来自电子系、自动化系、集成电路学院、软件学院的领域学者和专门研究人员组成。在这里,“理学思维融合工科实践,交叉领域践行原始创新”的理念一以贯之,团队始终致力于为中国成为世界科学中心和创新高地贡献出清华力量。和团队的对话中,“初心”和“坚持”两个词语,被多人反复提及。恰如团队成员所言,“科学研究是一个厚积薄发的过程,不是一蹴而就的,就像在黑暗中来回摸索,可能会经历反复失败,但一定要坚持自己的初心。”一次次“推翻重来”“背水一战”的底气背后,是什么支撑着团队的坚持求索?答案是:良好的学术环境和有组织科研的全方位保障。2021年4月19日,习近平总书记在清华大学考察时强调,重大原始创新成果往往萌发于深厚的基础研究,产生于学科交叉领域,大学在这两方面具有天然优势。要保持对基础研究的持续投入,鼓励自由探索,敢于质疑现有理论,勇于开拓新的方向。“当时,我有幸参与向总书记汇报团队的科研进展,在现场聆听总书记的嘱托。”三年过去,方璐和许多清华人一样,是亲历者、践行者,更是答卷人。方璐认为,这次突破性科研成果的成功取得,是清华大学深入推进有组织科研的一次生动实践。该课题受到科技部2030“新一代人工智能”重大项目、国家自然科学基金委杰青项目、基础科学中心项目,清华大学-之江实验室联合研究中心支持。在合作者中,有来自各个学科、不同背景的成员。他们集思广益,多学科、多角度地探索更多解决途径。跨界交叉、深度融合,创新的火花在学科碰撞中不断迸发,为科研团队厚植基础、勇攀高峰提供了新动能。...PC版:https://www.cnbeta.com.tw/articles/soft/1427181.htm手机版:https://m.cnbeta.com.tw/view/1427181.htm

相关推荐

封面图片

清华大学获芯片领域重要突破

清华大学获芯片领域重要突破记者11日从清华大学获悉,针对大规模光电智能计算难题,清华大学电子工程系副教授方璐课题组、自动化系戴琼海院士课题组,摒弃传统电子深度计算范式,另辟蹊径,首创分布式广度光计算架构,研制大规模干涉-衍射异构集成芯片太极(Taichi),实现160TOPS/W的通用智能计算。在如今大模型通用人工智能蓬勃发展的时代,该科研成果以光子之道,为高性能算力探索新灵感、新架构、新路径。相关科研成果发表于最新一期的国际期刊《科学》。(科技日报)

封面图片

清华大学实现芯片领域重要突破!计算能效超现有芯片2—3个数量级

清华大学实现芯片领域重要突破!计算能效超现有芯片2—3个数量级随着人工智能的蓬勃发展,智能光计算作为新兴计算模态,在后摩尔时代展现出远超硅基电子计算的性能与潜力。但最大的痛点是光的计算优势被困在不适合的电架构中,计算规模受到了限制,无法支撑急需高算力与高能效的复杂大模型智能计算。而太极光芯片的计算能效,直接超越了现有智能芯片2—3个数量级,可以为百亿像素大场景光速智能分析、百亿参数大模型训练推理、毫瓦级低功耗自主智能无人系统提供算力支撑。...PC版:https://www.cnbeta.com.tw/articles/soft/1427088.htm手机版:https://m.cnbeta.com.tw/view/1427088.htm

封面图片

清华大学研究超高速光电模拟芯片:“挣脱”摩尔定律,算力提升 3000 倍

清华大学研究超高速光电模拟芯片:“挣脱”摩尔定律,算力提升3000倍清华大学自动化系戴琼海院士、吴嘉敏助理教授与电子工程系方璐副教授、乔飞副研究员联合攻关,提出了一种“挣脱”摩尔定律的全新计算架构:光电模拟芯片,算力达到目前高性能商用芯片的3000余倍。相关成果以“高速视觉任务中的纯模拟光电芯片”(All-analogphoto-electronicchipforhigh-speedvisiontasks)为题,以(article)形式发表在《自然》(Nature)期刊上。如果用交通工具的运行时间来类比芯片中信息流计算的时间,那么这枚芯片的出现,相当于将京广高铁8小时的运行时间缩短到8秒钟。在这枚小小的芯片中,清华大学攻关团队创造性地提出了光电深度融合的计算框架。从最本质的物理原理出发,结合了基于电磁波空间传播的光计算,与基于基尔霍夫定律的纯模拟电子计算,“挣脱”传统芯片架构中数据转换速度、精度与功耗相互制约的物理瓶颈,在一枚芯片上突破大规模计算单元集成、高效非线性、高速光电接口三个国际难题。实测表现下,光电融合芯片的系统级算力较现有的高性能芯片架构提升了数千倍。然而,如此惊人的算力,还只是这枚芯片诸多优势的其中之一。在研发团队演示的智能视觉任务和交通场景计算中,光电融合芯片的系统级能效(单位能量可进行的运算数)实测达到了74.8Peta-OPS/W,是现有高性能芯片的400万余倍。形象地说,原本供现有芯片工作一小时的电量,可供它工作500多年。——

封面图片

清华大学研制出首个全模拟光电智能计算芯片 性能领先商用产品3000倍

清华大学研制出首个全模拟光电智能计算芯片性能领先商用产品3000倍结合基于电磁波空间传播的光计算,与基于基尔霍夫定律的全模拟电子计算,在一枚芯片上突破了大规模计算单元集成、高效非线性、高速光电接口三个国际难题。在保证高任务性能的同时,实现了超高的计算能效和计算速度。为了确保实验数据的可靠性,攻关团队进行了大规模的实测和验证。首次将端到端跨层协同技术应用到智能视觉交互上,运用等效算力,对能效性能和时延数据进行了精准评估。光电计算芯片ACCEL的计算原理和芯片架构ACCEL共有三大优势:一、超高性能实测表现下,ACCEL芯片的系统级算力达到现有高性能芯片的3000倍。如果用交通工具的时间来类比芯片中信息流计算,那么这枚芯片的出现,相当于将8小时的京广高铁缩短到了8秒钟。二、超低功耗系统级能效为74.8Peta-OPS/W,较现有的高性能GPU、TPU等计算架构,提升了400万倍。形象来说,原本供现有芯片工作1小时的电量,可供它工作500多年。三、超低成本光电融合芯片的光学部分的加工最小线宽仅采用百纳米级,电路部分仅采用180nmCMOS工艺,已取得比7nm制程的高性能芯片多个数量级的性能提升。同时所使用的材料简单易得,造价仅为后者的几十分之一。...PC版:https://www.cnbeta.com.tw/articles/soft/1394375.htm手机版:https://m.cnbeta.com.tw/view/1394375.htm

封面图片

清华大学研制出全球首颗“机器学习能在硬件端直接完成”的芯片

清华大学研制出全球首颗“机器学习能在硬件端直接完成”的芯片近日,清华大学集成电路学院教授吴华强、副教授高滨团队基于存算一体计算范式,研制出全球首颗全系统集成的、支持高效片上学习(机器学习能在硬件端直接完成)的忆阻器存算一体芯片,在支持片上学习的忆阻器存算一体芯片领域取得重大突破,有望促进人工智能、自动驾驶可穿戴设备等领域发展。该芯片包含支持完整片上学习所必需的全部电路模块,成功完成图像分类、语音识别和控制任务等多种片上增量学习功能验证,展示出高适应性、高能效、高通用性、高准确率等特点,有效强化智能设备在实际应用场景下的学习适应能力。相同任务下,该芯片实现片上学习的能耗仅为先进工艺下专用集成电路(ASIC)系统的3%,展现出卓越的能效优势,极具满足人工智能时代高算力需求的应用潜力,为突破冯·诺依曼传统计算架构下的能效瓶颈提供了一种创新发展路径。

封面图片

清华姚期智院士领衔:全球首颗零知识证明 SOC 芯片研发成功

清华姚期智院士领衔:全球首颗零知识证明SOC芯片研发成功由清华大学大学姚期智院士领衔发起,并由清华大学交叉信息研究院孵化的初创企业--深圳市智芯华玺信息技术有限公司研制的全球首颗零知识证明(ZKP)SOC芯片(AccsealLEOchip)一次流片成功,拥有完全自主知识产权。AccsealLEOchip基于12nm先进工艺制程,可进行复杂的多标量乘法(MSM)和数论变换(NTT)运算,支持可编程设计,可支持后量子密码、多方安全计算和联邦学习的加速运算,芯片性能较传统CPU快千倍以上,成本可降低十倍。目前已完成工程样片测试,2024年一季度即可实现量产上市。图灵奖得主姚期智院士表示:“数字经济的核心技术涉及数据、算法与算力三个方面。以隐私计算、区块链技术与零知识证明为代表的交叉信息技术将扮演基础设施的角色。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人