马斯克xAI首个研究成果发布 创始成员杨格&姚班校友共同一作

马斯克xAI首个研究成果发布创始成员杨格&姚班校友共同一作这次的新论文,就归属该系列,重点探讨了“如何训练无限深度网络”。为此,杨格本人还专门在??上进行了一场直播分享。一起来看看有哪些精彩内容值得mark~训练无限深度神经网络简单来说,这篇文章研究的是残差网络(ResNet)在深度方向的扩展。我们知道,残差网络解决了深度增加时,深度卷积神经网络性能退化的问题。但当网络继续加深,训练一个好的深度残差网络仍非易事:当网络加深时,特征的规模会不断增大,导致网络不稳定;加深网络后,需要重新调整超参数,工作量不小……杨格和他的小伙伴们的想法是,找到一种深度参数化方法,既可以学习特征,又可以实现超参数迁移。他们首先想到了无限宽神经网络存在的两种极限情况:要么是核机(kernelmachines),要么是特征学习器(featurelearners)。对于后者而言,最佳超参数是不会随宽度变化而变化的。在这里,他们使用TensorPrograms框架分析了无限宽网络的极限情况。正如前文提到的,TensorPrograms是杨格的一项长期研究目标:用数学语言,建立能够描述和分析神经网络架构的底层编程语言。具体而言,TensorPrograms由矩阵乘法和激活函数组成。杨格发现,如果神经网络函数能够使用这种语言表达,就可以自动且完备地进行初始化分析。数学推导的部分,这里不做具体展开,我们可以浅浅感受一下画风……在这些推导分析的基础之上,作者提出了Depth-μP方法,可以实现深度方向上的超参数迁移,大大简化了不同深度下的超参数调节。Depth-μP包含以下要点:每个残差分支和深度L的平方根成反比的系数a/sqrt(L)。每个权重矩阵的学习率随深度L变大而减小,具体取决于优化算法的类型。对于SGD,学习率取常数η,对于Adam等自适应优化算法,学习率取η/sqrt(L)。值得关注的是,作者发现,当残差块深度为1时,Depth-μP是深度参数化的最优方式,可以保证超参数随着深度的增加而收敛,实现深度方向的超参数传递。但当残差块深度≥2时,还是会出现超参数迁移失败和训练性能下降的问题。另外,论文还探讨了“特征多样性”的概念,认为它在深度网络中发挥着关键作用。论文的另一位共同一作是来自普林斯顿的DingliYu。他本科毕业于清华姚班,目前在普林斯顿计算机科学系攻读博士。杨格在直播中都说了啥?在直播中,杨格还就观众感兴趣的问题进行了解答。在不改变原意基础上,量子位对部分问题做了梳理。Q:对于我们许多人来说,(论文内容)可能超出了我们的理解范围。但我想知道,你提到的模型与我们能够体验到的ChatGPT以及OpenAI的技术有何不同?这篇论文与OpenAI的成果相比有什么显著的差异或是创新点?杨格:我简单评论一下,我想说这些特性目前与实际应用并没有直接关系,更像是研究性质的。当然,做这一切的最终目标是为了让模型更好、更安全,然后造福人类。我们现在所进行的是描述预期的效果,它不一定会有直接的影响。现在我们同处一条船上,我们正在做我们所能做的事,无论是短期工作还是长期应用研究,都是为了让它造福每个人。Q:听起来像是你们正在建造一个能够进行推理的人工计算机大脑,所以这是你们正在研究的吗?此外,我还是一位母亲,我7岁的儿子对数学非常感兴趣,你有什么可以让他继续对AI领域保持兴趣和热情的建议吗?杨格:“新型网络”指的是人工神经网络,我认为它是现代众多技术的支柱,包括您每天使用的Google、Facebook、Instagram等,这些服务的底层都使用了这些人工神经网络。这些网络大约在六七十年前受到动物、人类的真实神经网络启发而诞生,但已与真实的神经科学有所偏离。这些网络本质上是数学问题,因此我们掌握这些新的数学问题后进行大量分析,可以深入地理解这些神经网络。虽然我们尚不明确真正的神经元的连接方式,但通过数学研究,我们能优化这些人工神经网络,助力科技公司改善人们的生活。关于您的第二个问题,听说您的儿子对数学非常感兴趣,这太棒了。这是在技术领域创造伟大成就和改善每个人生活的基础。我想给的建议是,首先您要保持您儿子对数学的热情,这非常重要。一旦失去了这份热爱,想再继续学习就会变得很困难。还要注意观察他喜欢的东西,让学习过程变得有趣,进一步激发他的兴趣。同时,也要培养他对事物运作原理的好奇心,并尝试培养一种科学思维,要在好奇心的驱使下研究。就像拆解事物,尝试理解它们的工作原理。如果一个人失去了对宇宙数学真理的探索热情,可能很难再有前进的动力。总的来说,我建议您培养您儿子对这个世界,特别是对数学和科学本质的浓厚兴趣和好奇心。Q:我有一个更为抽象的问题。你有了深度趋近于无穷的想法,然后根据这种想法写了这篇论文。那你是否考虑过采用不同架构的神经网络?不是带有神经元和无数层的标准架构,而是完全不同的东西。比如这些神经元的连接方式完全不同,也许是某种正方形?杨格:其实关于非线性以及我们这项工作中对层数的洞察,都只是非常初级的研究。关于什么是合适的结构,或者应该是怎样的结构,当然还有很多可以探讨的问题。像Meta团队之前就研究了随机连接神经元会发生什么,得到了一些有趣的结果。所以,这里绝对还有很多可以做的事情。现在我确实没有具体的答案来说什么将是正确的或者更好的结构。关于杨格杨格出生于湖南省,小学毕业后去了美国,本科就读于哈佛师从丘成桐教授。△杨格与丘成桐,图源:杨格Twitter2017年,杨格哈佛毕业,之后在沈向洋引荐下进入微软。在微软,杨格获得了沈向洋的高度评价。几个月前,在一场名为“基础科学与人工智能”的论坛上,沈向洋公开表示:微软研究院平时只招博士生的,杨格作为一个本科毕业生进了微软研究院。不仅进了微软研究院,过去这五年还做得无比优秀,特别是在GPT发展过程中做了举足轻重的贡献。值得一提的是,他本人也曾承认GPT-4就用到了他的μTransfer(TensorPrograms系列)方法。而杨格对TensorPrograms的研究,从很早就开始了,2019年就发表了“TensorProgramsI”,在微软工作时也是持续深入探索。他认为深度学习中几乎任何计算都可以表示为TensorPrograms。今年7月,马斯克宣布成立新公司xAI,杨格离开微软,加入xAI创始团队,成为xAI的数学家。加入xAI后,杨格不止一次透露TensorPrograms项目长期目标是开发大规模深度学习的“万物理论”,也就是找到一种理论上的规则,可以真正理解AI大模型的行为。他还表示:AI将使每个人都能以此前难以想象的方式理解我们的数学宇宙。论文链接:https://arxiv.org/abs/2310.02244...PC版:https://www.cnbeta.com.tw/articles/soft/1391405.htm手机版:https://m.cnbeta.com.tw/view/1391405.htm

相关推荐

封面图片

马斯克xAI创始成员中国首发声:ChatGPT时代“乱世出英雄”

马斯克xAI创始成员中国首发声:ChatGPT时代“乱世出英雄”在国际基础科学大会的“基础科学与人工智能”论坛上,他谈及了自己一直以来、也是接下来要进行的数学AI工作,以及对大模型当前发展现状的看法。而他的个人经历也再次浮出水面,为更多人所关注。接下来要进行什么研究?在国际基础科学大会上,杨格就自己正在研究的方向进行了一场演讲。演讲主题,主要与AI和数学交叉学科有关——从数学角度出发,建立一种描述神经网络架构的统一编程语言TensorPrograms。这是他从微软研究院开始就一直钻研的领域,继2019年连续独立发表的两篇论文之后,迄今这一项目已经有7篇相关论文问世。具体来说,TensorPrograms项目有一个“短期目标”和一个“长期目标”。短期来看,这个编程语言能实现在设计新神经网络架构时,自动进行初始化条件分析,并给出其中最优的超参数初始化条件,从而让模型训练更顺利。毕竟此前,这一领域的初始化设置几乎“全靠经验”。长期而言,TensorPrograms项目的目标是开发大规模深度学习的“万物理论”。这也与杨格在Twitter说的、他在xAI要进行的研究方向一致:目前无论是大模型还是其他AI研究方向,都依旧没有真正意义上解决AI“黑箱”的问题,换而言之,AI究竟走哪种研究方向(堆叠更大参数量的模型、还是MoE)收益更高,还没有一个明确的结论。因此,TensorPrograms最终目标是找到一种理论上的规则,可以真正理解AI大模型的行为。TensorPrograms最新的项目进展,是微软与OpenAI合作发表的论文µTransfer,杨格以共同一作的身份完成了这项研究。这项研究的核心是帮助大模型找到最合适的超参数配置,从而替更多模型节省时间和算力成本,否则对于大模型来说,“重训”是一个非常浪费参数的行为。目前这项研究已经开源,杨格也在这次的演讲中着重以µTransfer为例,介绍了TensorPrograms项目的进展。从这几篇研究论文侧重的AI模型来看,大模型如今已经是杨格研究的重点方向之一。一个值得关注的点就是,μTransfer已经用到GPT-4中了。公众号“安迪的写作间”作者在杨格(GregYang)演讲结束后,和他聊了聊:下台我问了他关于GPT-4用到μTransfer了吗,给出肯定回答。所以,他究竟如何看待大模型的未来?在这次论坛的圆桌对话上,杨格也提到了自己对大模型发展方向的看法。他认为,继续堆叠大模型参数可以让模型效果越来越好,但这有个前提,即数据集的质量和数量必须要上升。以前收集网络数据就行,如今训练集必须变得更偏向数学、科学、更有逻辑性,才能提高模型的科学和数学推理能力。同时,杨格也给了如今拼搏在科研、交叉创新一线的AI研究人员一点建议,就是“Followyourdreams”:这一阶段的很多杰出的搞AI的人,像工程师、研究人员,有几个都是像我这样没有读博士,只是就想去干,拼一下就拼出结果的,像AlecRadford,GPT-1、GPT-2都是他自己做的,后来OpenAI就开始砸钱了。曹操说的“乱世出英雄”,这是个新世界,你不要想一些外部环境,直接去干,很有可能擦出火花,这就是要你自己有热情。没错,当年的杨格,打破了微软研究院“只招博士生”的惯例,本科毕业就进入了这一机构工作。他在学术经历上究竟有什么过人之处?换而言之,为何他会成为马斯克选中的“12人”之一?杨格是谁?杨格出生于湖南省,在北京读完小学后,就去了美国,本科考上了哈佛数学系。在哈佛的头两年,杨格参加了鼓手团、咨询团等众多活动。大二结束时,有着音乐梦的他决定休学全身心投入音乐事业,成为一名电子舞曲音乐制作人和DJ,取艺名“Zeta”。也是在此期间,杨格接触到了人工智能。一年半后,杨格发现自己的“真爱”终归还是数学,于是又回到了哈佛。读完春季学期的课程后,他又休学两年,这一次他没有执着于音乐,而是快速学习了数学和理论计算机科学,以及人工智能的前沿进展,此外还广泛涉猎物理学、生物学和神经科学。此外,他还研究起了神经图灵机,并结合可微拓扑学中的思路,提出“LieAccessNeuralTuringMachine”,发表于ICLR。再次回哈佛,杨格师从丘成桐教授。△杨格与丘成桐,图源:杨格Twitter2017年,杨格顺利从哈佛毕业,拿到了数学学士学位和计算机科学硕士学位。并获得了2018年摩根奖荣誉提名(HonorableMentionforthe2018FrankandBrennieMorganPrizeforOutstandingResearchinMathematicsbyanUndergraduateStudent)。毕业后,老师丘成桐曾问杨格“你毕业去哪儿”,他说“我要去Google”。丘成桐说“Google这种很差的公司就不要去了,我有个朋友叫沈向洋,我马上给他打电话”。后来,沈向洋让菲尔兹奖获得者MichaelFreedman面试了杨格:面试之后(Michael)说这个小孩不得了,那时候他才刚刚本科毕业,但在哈佛至少是前五名(的水平)。我(沈向洋)当时就跟杨格讲,你把Google的Offer拿来给我看一看,我给你加一块钱,就来微软吧。最后杨格选择了微软。而进入微软后杨格也获得了沈向洋的高度评价:微软研究院平时只招博士生的,杨格作为一个本科毕业生进了微软研究院,不仅进了微软研究院,过去这五年还做得无比优秀,特别是在GPT发展过程中做了举足轻重的贡献。进入微软后,杨格的重要成果之一就是持续开发上面提到的“TensorPrograms”框架,其中还用GPT-3对所提出的超参数迁移方法进行了验证,相关论文已收录于NeurIPS、ICML等顶会:此外,Google学术数据显示,杨格从2015开始发布论文,至今已有34篇。其中引用量最高为415,这也是他在微软的工作,杨格在这个项目中担任主要指导(Primarymentor)。目前,杨格个人主页和Twitter主页等均已更新,已离开微软研究院,加入xAI,接下来将继续做数学工作。杨格做出了新一轮的选择,但从第一次休学过后,他再也没有放弃对数学的热爱。在这次的论坛上,杨格也被问到,当时去从事音乐后又转到数学研究,是怎样一直坚定走到现在的?杨格回答道:其实就是个人爱好,在我大二休学之前,我一直都是数学比较好的人,可能会觉得一辈子在这种(数学研究中)。之后虽然我去搞音乐,但有段时间自己思考后,发现其实我个人还是很热爱数学。这里面可能有外在动机(motivationextrinsic)和内在动机(motivationintrinsic)。像数学答卷老师给你100分,你觉得很高兴,这是外在的。这种外在和内在混在一起,可能感觉不到自己真心的爱好,但是后来休息一段时间以后,感觉(对数学)是发自内心的热爱,之后就走了这么长的路。OneMoreThing还记得前段时间杨格给大伙儿推荐的300多本(大部分是数学)书吗?不少网友看过之后,表示“书单实在太长了,不是普通人能看完的”,还有网友调侃“能不能用GPT帮我总结一下”……论坛结束后,我们也和杨格聊了聊,了解了他对ChatGPT等大模型的一些看法。提问:看到您前段时间推荐了大概300本多书,有很大一部分是数学书,您认为AI是否有可能把它直接总结成一个核心的要点给我们?平时在日常生活中,您是不是也会用GPT-4一样的模型,去帮助做一些数学的基础研究什么的?杨格:我觉得AI的总结能力(summarization)现在应该挺好的了,做简单的总结应该没问题。但你要再深入理解它里面的道理,像是一些数学道理的话,可能AI现在的帮助还不是那么大。日常生活的话,是会经常用到(大模型)。提问:可以透露一下主要是用在哪些方面吗?杨格:我觉得最有用的方法就是写程序吧。比如有些程序你确实可以...PC版:https://www.cnbeta.com.tw/articles/soft/1375151.htm手机版:https://m.cnbeta.com.tw/view/1375151.htm

封面图片

华为云盘古气象大模型研究成果在《Nature》正刊发表

华为云盘古气象大模型研究成果在《Nature》正刊发表北京,2023年7月6日,《自然》(Nature)杂志正刊发表了华为云盘古大模型研发团队研究成果——《三维神经网络用于精准中期全球天气预报》(《Accuratemedium-rangeglobalweatherforecastingwith3Dneuralnetworks》)。盘古气象大模型能够提供全球气象秒级预报,其气象预测结果包括位势、湿度、风速、温度、海平面气压等,可以直接应用于多个气象研究细分场景,欧洲中期预报中心和中央气象台等都在实测中发现盘古预测的优越性。相关论文:消息来源:投稿:@ZaiHuaBot群组:@ZaiHuaChat频道:@TestFlightCN

封面图片

“无光刻可重构集成光子处理器”研究成果公布

“无光刻可重构集成光子处理器”研究成果公布该团队报告了一种集成光子处理器的无光刻范例,利用其实时可重构性,实现了具有高度灵活性的光子神经网络,可执行和重新配置复杂的计算算法,加快信息处理速度以满足长期性能要求。按照团队的说法,用于机器学习应用的光子芯片面临着复杂制造过程的障碍,其中光刻图案是固定的、可重新编程的能力有限、容易出错或损坏并且价格昂贵,通过消除对光刻的需求,芯片克服了这些障碍,并提供了更高的准确性和最终的可重新配置性,因为它消除了预定义功能的各种限制。团队还表示,上述成果可以很容易地将它与经典电子产品结合起来,通过对其重新编程,即时改变激光模式,以实现人工智能网络片上训练的实时可重构计算。...PC版:https://www.cnbeta.com.tw/articles/soft/1359925.htm手机版:https://m.cnbeta.com.tw/view/1359925.htm

封面图片

马斯克公司在人脑植入设备 之前几十年脑机融合研究成果几何?

马斯克公司在人脑植入设备之前几十年脑机融合研究成果几何?科学家们几十年来一直致力于通过直接接入人体神经系统来治疗某些残疾和疾病。许多科学家对马斯克的声明表示赞赏,同时也谨慎指出,Neuralink公开发布的信息并不多。美国宾州匹兹堡大学(UniversityofPittsburgh)物理医学与康复系副教授罗伯特·冈特(RobertGaunt)表示:“把设备植入人体内可不是一件小事。”“但我认为,如果不是几十年来在神经科学方面的研究和能力,即使马斯克也不会接受这样的项目。”马斯克的声明很突然。除了消息本身,几乎没有提供什么实质性信息:“第一个人昨天接受了Neuralink的植入物,恢复得很好。初步结果显示,神经元尖峰检测很有前景。”许多科学家对马斯克的声明表示赞赏,同时也谨慎指出,Neuralink的临床试验还处于非常早期的阶段,公开发布的信息并不多。但研究人员也表示,Neuralink已经取得了重大进展,正在做初创公司所擅长的事情:利用基础科学知识努力制造出真正可行的产品。冈特自己的研究重点就是通过脑机接口设备等植入物来恢复运动控制和触觉等人体机能。冈特说,现在搞清楚Neuralink植入物对人类是否有效还为时过早,但公司声明是一个“令人兴奋的进展”。他表示Neuralink实现的新目标大力助推了一个过去15年中已经经历过快速发展的行业。20世纪90年代末,第一个脑机接口设备被植入人体,当时这项研究是由一位名叫菲尔·肯尼迪(PhilKennedy)的神经学家所领导。他们的想法是,这些设备植入后,可以让受伤后的大脑回路保持完整,从而执行基本的运动和功能。匹兹堡大学物理医学和康复系副教授詹妮弗·科林格(JenniferCollinger)举例说,当一个人想着移动自己的手或看着别人移动自己的手时,大脑中许多相同的神经元就会活跃起来,就好像他们自己在做这个动作一样。她说:“你可以在与这些运动相关的神经数据中找到活动模式,所以本质上可以扭转这种关系,然后控制实际运动。”2004年,一种名为Utaharray的微型设备首次被植入人体,使瘫痪患者能够用神经脉冲控制电脑光标。这个装置是由犹他大学的理查德·诺曼(RichardNormann)发明的,看起来像一个带有细刺的小芯片,实际上有几十个微小的电极。这一设备被设计成通过皮肤上的开口附着在头骨上。科学家们已经能够通过Utaharray展示脑机接口如何帮助人们用思想控制机械手臂,刺激肌肉和四肢活动,使用计算机和其他外部设备,甚至于解码手写和语音。科林格的研究重点是恢复患者的手部功能,让他们不仅可以移动自己的手或手臂,还可以自行操纵物体,让患者生活自理所需的各项人体机能得以恢复。她说,“所有这些都是非常重要的概念性证明,表明这项技术可能是有用的。”无论是马斯克的初创公司Neuralink,还是Synchron和PrecisionNeuroscience等其他类似私营企业,本质上都是在利用几十年来的研究成果,为更多患者提供更实用的脑机接口设备。Neuralink去年获得美国食品和药物管理局的批准,可以进行首次人体临床研究。关于选中谁植入设备以及手术过程的细节很少,但Neuralink一直在开发一种大脑植入设备,让患者用他们的思想控制电脑、电话或其他外部设备。Neuralink已经取得了几次重大飞跃。与Utaharray不同,Neuralink的设备是完全可植入的,这意味着患者最终受到的限制可能会受到更少。目前大多数植入物仍需要人们在受控的实验室环境中进行活动。“这在工程上是一个巨大挑战,”冈特说。“这是学术界和其他人几十年来一直想要降低风险的那种东西,真正实现确实需要在工程领域艰苦卓绝、同心协力。”Neuralink一路走来也有坎坷。公司也因为激进组织和内部员工投诉称Neuralink虐待实验动物后而陷入争议之中。据报道,除了Neuralink自己报告的2019年“不良手术事件”外,调查没有发现有任何违规行为的证据。虽然Neuralink并不是第一个将脑机接口设备完全植入人体内的公司,但冈特说,公司已经大大提高了这些设备记录神经活动能力。Neuralink还使用最新的机器人完成手术,而不是专业神经外科医生来植入设备。加州大学戴维斯分校神经外科助理教授、加州大学戴维斯分校神经修复实验室联合主任谢尔盖·斯塔维斯基(SergeyStavisky)说:“这与人们以前所做的工作完全不同。”斯塔维斯基说,用机器人自动化这一过程可以提升效率,效果也更好。“你可以植入更多,可以快速植入,可以避开血管,”他说,“但这也很难,而且是全新方法,必须证明机器人是安全的。”证明安全性将是Neuralink进行临床试验的主要作用之一。在接下来的几个月里Neuralink需要证明,设备能够正常运行,不会产生严重的不良影响。植入物是否能如预期那样起作用还有待观察。马斯克在声明中表示,患者“恢复得很好”,初步结果“显示,神经元尖峰检测很有前景”。在没有具体数据的情况下,很难知道马斯克的说法意味着什么。但冈特说,这可能表明电极已经到位,附近的神经元已经被激活,植入物基本上可以检测到神经元活动。他解释说,“这基本上意味着,至少在某种程度上是有效的。”马斯克表示,早期临床试验的目标是治疗瘫痪或高位截瘫患者。如果这个装置成功了,有一天可能会被用来治疗一系列疾病。与斯塔维斯基共同负责加州大学戴维斯分校神经修复实验室的神经外科医生大卫·布兰德曼(DavidBrandman)使用过完全植入设备来治疗帕金森病、癫痫和异常疼痛患者。他说,当涉及到具体医疗需求时,脑机接口的确可以给包括中风幸存者、脊髓损伤、瘫痪和肌萎缩侧索硬化症(ALS)患者带来巨大影响。除了临床应用之外,生物工程的科幻概念很容易让人产生天马行空的想象。马斯克在2022年曾表示,他自己计划某一天接受Neuralink的植入物。然而,许多科学家认为这种想法目前还太过遥远,而且不太实际。“我认为现在谈论这个还为时过早,”布兰德曼说。“有太多需要这些设备的人。任何强调’如果’和‘可能会发生什么’的做法都是在伤害需要设备的人。”虽然大脑控制装置的想法可能会增强人类能力,但科学家们一致认为,到目前为止,还没有证据表明这些植入物能可以改善正常人的身体机能。冈特说:“认为这些设备将使我们实现任何超人能力的想法只是科幻小说。”尽管如此,Neuralink的临床试验曾代表了神经科学和生物工程领域的重大进展。冈特和其他人都表示,工业界介入并在学术界已经取得的成就之上实现目标是很自然的事,不会掩盖他们的研究成果。冈特说:“大学和学术实验室是真正擅长开辟全新领域的地方,它们涉足从未有人涉足的领域,尝试那些对公司和投资者来说风险太大、不愿投入资金的东西。”他补充说,一旦大脑植入物展现出真正能力,私营公司就会开始相继投入大量资源和资本,打造出商业上可行的产品。冈特说,如果说Neuralink有什么不同的话,那就是它的早期成功证明了资助基础科学研究的重要性。然而,可能很难预测行业发展会给学术界带来怎样的影响。斯塔维斯基将这一过程比作冲浪。他说,这取决于学术界能否找出这一领域的下一个前沿,并以一种可能再次转化成商业模式的方式推动科学发展。冈特说,这说明所有关于马斯克和Neuralink的新闻和讨论并非没有影响。“每隔一段时间,当这类事情发生时,我确实会在一场生存危机中清醒过来,”他说,“但当现实到来时,我就会想到,总还会有挑战和基础科学需要解决。”...PC版:https://www.cnbeta.com.tw/articles/soft/1416201.htm手机版:https://m.cnbeta.com.tw/view/1416201.htm

封面图片

【英特尔发布大型神经拟态系统,业内首个11.5亿个人工神经元系统】

【英特尔发布大型神经拟态系统,业内首个11.5亿个人工神经元系统】#美国英特尔公司日前发布名为HalaPoint的大型神经拟态系统,旨在支持类脑人工智能领域的前沿研究,解决人工智能在效率和可持续性等方面的挑战。根据英特尔公司发表的新闻公报,英特尔在其第一代大规模研究系统PohoikiSprings的基础上,改进了HalaPoint大型神经拟态系统的架构,将神经元容量提高了10倍以上,性能提高了12倍。HalaPoint系统最初部署在美国桑迪亚国家实验室,由1152个英特尔Loihi2处理器组成,包括分布在140544个处理核心上的11.5亿个人工神经元和1280亿个人工突触。在运行传统深度神经网络时,每秒可进行20千万亿次运算。(新华网)

封面图片

机器学习技术开始试图预测罕见的灾难性事件 如地震或大流行病

机器学习技术开始试图预测罕见的灾难性事件如地震或大流行病然而,来自布朗大学和麻省理工学院的一组科学家表明,这不一定是这样的。在《自然-计算科学》上发表的一项研究中,研究人员解释了他们如何利用需要较少数据进行准确预测的统计算法,并与布朗大学开发的机器学习技术相结合。这种结合使他们能够在缺乏历史数据的情况下预测罕见事件的情景、概率甚至是时间线。这样做,研究小组发现,这个新的框架可以提供一种方法来规避传统上这些类型的计算所需要的大量数据,而基本上将预测罕见事件的巨大挑战归结为质量大于数量的问题。"你必须意识到这些是随机事件,"布朗大学应用数学和工程系教授、研究报告作者乔治-卡尔尼亚达基斯说。"像COVID-19这样的大流行病的爆发,墨西哥湾的环境灾难,地震,加利福尼亚的巨大野火,30米高的海浪掀翻了一艘船……这些都是罕见的事件,由于它们是罕见的,我们没有大量的历史数据。我们没有足够的过去的样本来预测它们在未来的发展。我们在论文中解决的问题是。什么是我们可以使用的最佳数据,以尽量减少我们需要的数据点的数量?"研究人员在一种称为主动学习的顺序采样技术中找到了答案。这些类型的统计算法不仅能够分析输入它们的数据,更重要的是,它们可以从信息中学习,标记新的相关数据点,这些数据点对正在计算的结果同样重要,甚至更重要。在最基本的层面上,它们允许用更少的钱做更多的事。这对研究人员在研究中使用的机器学习模型至关重要。该模型被称为DeepOnet,是一种人工神经网络,它使用连续层中相互连接的节点,大致模仿人脑中神经元的连接。DeepOnet被称为深度神经算子。它比典型的人工神经网络更先进、更强大,因为它实际上是两个神经网络合一,在两个平行网络中处理数据。这使它能够以极快的速度分析巨大的数据集和场景,一旦它学会了它所寻找的东西,就能吐出同样巨大的概率集。这个强大的工具的瓶颈,特别是在涉及到罕见事件时,是深度神经操作者需要大量的数据来训练,以进行有效和准确的计算。在论文中,研究团队表明,结合主动学习技术,DeepOnet模型可以得到训练,了解要寻找哪些参数或前兆,导致有人正在分析的灾难性事件,即使没有很多数据点。Karniadakis说:"主旨不是把每一个可能的数据都放进系统,而是主动寻找将标志着罕见事件的事件,我们可能没有很多真实事件的例子,但我们可能有那些前兆。通过数学,我们识别它们,它们与真实事件一起将帮助我们训练这个数据饥渴的运算装置。"在论文中,研究人员将该方法应用于确定大流行期间危险尖峰的参数和不同的概率范围,寻找和预测"流氓波浪",以及估计一艘船何时会因压力而裂成两半。例如,对于流氓波浪--大于周围波浪大小两倍的波浪--研究人员发现他们可以通过观察可能的波浪条件来发现和量化无赖波何时形成,这些波浪随着时间的推移非线性地相互作用,导致波浪有时是其原始大小的三倍。研究人员发现他们的新方法优于更多的传统建模工作,他们认为它提出了一个框架,可以有效地发现和预测各种罕见事件。在论文中,研究小组概述了科学家应该如何设计未来的实验,以便他们能够最大限度地降低成本并提高预测的准确性。例如,Karniadakis已经在与环境科学家合作,使用这种新方法来预测气候事件,如飓风。这项研究由麻省理工学院的EthanPickering和ThemistoklisSapsis领导。DeepOnet是由Karniadakis和其他布朗研究人员在2019年推出的。他们目前正在为该技术申请专利。这项研究得到了国防高级研究计划局、空军研究实验室和海军研究办公室的资金支持。...PC版:https://www.cnbeta.com.tw/articles/soft/1341361.htm手机版:https://m.cnbeta.com.tw/view/1341361.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人