DeepMind攻克50年数学难题史上最快矩阵乘法算法登Nature封面

DeepMind攻克50年数学难题史上最快矩阵乘法算法登Nature封面DeepMind碾压人类高手的AI围棋大师AlphaZero，下一个目标是数学算法！现已发现50年以来最快的矩阵乘法算法。下围棋碾压人类的AlphaZero，开始搞数学算法了，先从矩阵乘法开始！PC版：https://www.cnbeta.com/articles/soft/1324285.htm手机版：https://m.cnbeta.com/view/1324285.htm

在Telegram中查看

相关推荐

DeepMind攻克50年数学难题史上最快矩阵乘法算法登Nature封面https://www.cnbeta.com/articles/tech/1324285.htm

DeepMind推出AlphaTensor，用AI发现矩阵乘法新算法

DeepMind推出AlphaTensor，用AI发现矩阵乘法新算法数千年来，算法一直在帮助数学家进行基本运算。古埃及人发明了一种不需要乘法表就能得出两个数字的乘积的算法；欧几里得描述了一种沿用至今的计算最大公约数的算法；在伊斯兰的黄金时代，花拉子米设计出了求解线性方程和二次方程的新算法。尽管现如今我们对算法已经非常熟悉，但发现新算法的过程仍是非常困难的。在一篇于近期发表在《自然》杂志上的论文中，DeepMind团队介绍了第一个用于发现新的、高效的、可证明正确的基本算法（如矩阵乘法）的人工智能系统——AlphaTensor。它打破了一个保持了50多年的记录，发现了一种能更快地计算两个矩阵之间的乘法的算法...来自：雷锋频道：@kejiqu群组：@kejiquchat投稿：@kejiqubot

Nature：DeepMind大模型突破60年数学难题解法超出人类已有认知

Nature：DeepMind大模型突破60年数学难题解法超出人类已有认知这项技术名为FunSearch，其中的Fun是函数（Function）一词的简写。利用大模型解决长期存在的科学难题，产生以前不存在的可验证且有价值*的新信息。在Nature论文配套的新闻解读中，DeepMind负责人称“我们使用大模型的方式是当做创造力引擎”。这是第一次有人证明基于大模型的系统可以超越数学家和计算机科学家的认知。它不仅新颖，而且比当今存在的任何其他东西都更有效。针对这项成果，有网友感慨：如果这是真的，那可是人类自火之后最重要的发现了。那么，FunSearch都解决了哪些问题呢？找到NP-hard问题更优解法DeepMind具体展示了两类问题，它们都属于NP-hard问题。在学界看来，没有而且可能永远也不会有一种算法能在所有情况下都在多项式时间内找到NP-hard问题的精确解。面对这样的问题，研究者通常会寻找近似解或适用于特定情况的有效算法。具体到FunSearch，它解决的第一类NP-hard问题是Capset问题，是上限集问题的一种，它的描述是这样的：在一个n维空间中的每个维度上都有等距的n个点（共n^n个，比如3维就是3*3*3），从中找出尽可能多的点构成一个集合，要求集合中任选3个点均不共线，这样的集合中最多有多少个点？如果看上去有些难以理解，不妨再了解一下Capset问题的前身——上世纪70年代遗传学家MarshaFalco发明的一套卡牌游戏。这套卡牌游戏中一共有81张牌，每张牌中都有1至3个颜色图案，同一张牌中的图案颜色、形状和阴影完都全相同。这套牌一共有3种颜色、3种形状和3种阴影，加上图案数量的不同，一共有3*3*3*3=81张，玩家需要翻开一些纸牌，找到3张牌的特殊组合。如果把这种“特殊组合”的具体方式用离散几何形式进行表达，就得到了Capset问题。Capset问题同样诞生于70年代，由牛津大学数学家RonGraham提出，而第一个重要结果直到90年代才出现。2007年，陶哲轩在一篇博客文章中提到，这是他最喜欢的开放式数学问题。在FunSearch出现之前，Capset问题最重大的突破是美国数学家JordanEllenberg和荷兰数学家DionGijswijt于2016年提出的。通过多项式方法，Ellenberg和Gijswijt将n>6时（n≤6时可精确找到最大集合）此类问题解的上确界缩小到了2.756^n。同样在n>6时，下确界的较新数字则是2.218^n，由布里斯托大学博士生FredTyrrell在2022年提出。但这个下确界仅仅存在于理论上——当n=8时，人类能构建出的最大集合中只有496个点，而按照Tyrrell的结论，点的数量应不少于585.7个。FunSearch则将集合规模扩大到了512个点——虽然和理论值依旧存在差距，但仍被视为20年来在此问题上最重大的突破。同时，Capset集合大小的下确界也被FunSearch提高到了2.2202^n。第二类是在线装箱问题：假设有一组容量为C的标准集装箱和n个物品序列（物品大小不超过C），这些物品按一定顺序到达。“在线”是指操作者无法事先看到所有的物品，但必须在物品到达时立刻决定将物品装入哪个集装箱。最终的目标，是使所用集装箱数量尽可能小。在线装箱问题引起广泛研究是从上世纪70年代开始的，最早更是可以追溯到1831年高斯所研究的布局问题。经过近200年的研究，仍然没有成熟的理论和有效的数值计算方法。传统上常用的贪心算法包括FirstFit和BestFit两种：FirstFit是指将每个物品放入第一个能容纳它的箱子中。BestFit则是将每个物品放入能容纳它的且箱子中剩余空间最小的箱子。而FunSearch则提出了新的算法，该算法在OR和Weibull两个测试数据集中，所用集装箱的数量均大幅下降。特别是在当测试集物品数目达到10万时，FunSearch找到的方案，消耗集装箱数量只比理论下界多出了0.03%。（下表中的数据表示与理论下界的差异，数字越小表现越好）那么，FunSearch是如何实现的呢？搜索“程序”而不是“答案”整体上看，FunSearch的工作流程是一个迭代过程，核心是搜索能解决问题的程序，而不是问题答案本身。搜索，正是DeepMind自AlphaGo以来一直坚持探索的路线。联合创始人ShaneLegg曾在一次访谈中作出解释：AlphaGo击败李世石的关键“第37步”从何而来？不是来自人类对弈数据，而是来自对概率空间的搜索。当前大模型只是模仿、混合不同的训练数据，要想产生真正的创造力并超越目前的架构，就需要结合搜索。回到最新成果FunSearch，系统当中有一个程序库，每次迭代时，系统会从其中搜索初始程序并输入大模型（实验用PaLM2，其他只要支持代码也兼容）。大模型在此基础上构建生成新的程序，并交给自动评估系统，得分最高的程序会被加入程序库，从而实现自我循环。其中，评估系统会根据用户的问题生成测试用例，然后判断候选程序的输出是否正确。根据复杂程度不同，判断正误的方法既包括直接检查输出值，也包括对相关函数进行调用。同时评估系统还设置有容错逻辑，避免超时等问题影响整体流程。最终，系统会根据备选程序在这些测试用例上的行为给出整体评分，为结果生成和后续程序库更新提供依据。论文合著者威斯康星大学麦迪逊分校的JordanEllenberg认为，FunSearch的一个重要特点是，人们可以看到AI产生的成功解决方案并从中学习，与之前AI的黑箱模式完全不同。对我来说最令人兴奋的是建立人机协作的新模式，我不希望用它们来替代人类数学家，而是作为力量倍增器。...PC版：https://www.cnbeta.com.tw/articles/soft/1404741.htm手机版：https://m.cnbeta.com.tw/view/1404741.htm

DeepMind人工智能可以在各种游戏中击败人类

DeepMind人工智能可以在各种游戏中击败人类曾在DeepMind从事人工智能研究的MartinSchmid现在就职于一家名为均衡技术的初创公司。他表示，SoG模型可以追溯到两个项目。其中一个是DeepStack，这是由加拿大阿尔伯塔大学的Schmid等团队开发的人工智能，是第一个在扑克比赛中击败人类职业选手的人工智能。另一个是DeepMind的AlphaZero，它在国际象棋和围棋等游戏中击败了最优秀的人类棋手。这两种模型的不同之处在于，一种专注于不完美的知识游戏——玩家不知道其他玩家的状态，比如扑克游戏中的手牌；另一种专注于完美的知识游戏，比如国际象棋，双方玩家在任何时候都能看到所有棋子的位置。这两者需要根本不同的方法。DeepMind雇佣了整个DeepStack团队，目的是建立一个可以推广两种类型游戏的模型，从而诞生了SoG。Schmid表示，SoG最初是一份如何学习游戏的“蓝图”，然后通过实践来改进游戏。然后，这个初学者模型可以在不同的游戏中自由发挥，并教会自己如何与另一个版本的自己对抗，学习新的策略，逐渐变得更有能力。尽管DeepMind之前的AlphaZero可以适应完美的知识游戏，但SoG可以适应完美和不完美知识游戏，使其更具通用性。研究人员在国际象棋、围棋、扑克和一款名为“苏格兰场”的棋盘游戏上测试了SoG，还在Leduc扑克和一款定制版的“苏格兰场”上测试了SoG，结果发现它可以击败几个现有的人工智能模型和人类玩家。Schmid说，它应该也能学会玩其他游戏。“有很多游戏你可以直接扔给它，它真的非常非常擅长。”与DeepMind更专业的算法相比，这种广泛的能力在性能上略有下降，但SoG在学习的大多数游戏中都可以轻松击败最优秀的人类玩家。Schmid说，SoG学会了与自己对抗，以便在游戏中提高水平，但也要从游戏的当前状态探索可能出现的情况，即使它在玩一个不完美的知识游戏。“当你在玩像扑克这样的游戏时，你很难弄清楚，如果不知道对手持有什么牌，该如何找到最佳的下一步策略。”Schmid说，“所以有一些来自AlphaZero的想法，还有一些来自DeepStack的想法，形成了这个庞大的想法组合，这就是游戏学生。”未参与这项研究的英国爱丁堡大学的MichaelRovatsos表示，尽管这一研究成果令人印象深刻，但要想将人工智能视为普遍智能，还有很长的路要走，因为游戏是一种所有规则和行为都被明确定义的环境，而不是现实世界。“这里要强调的重要一点是，这是一个受控的、独立的人工环境，在这个环境中，每件事的意义和每一个动作的结果都是非常清楚的。”Rovatsos说，“这个问题是一个玩具问题，因为尽管它可能非常复杂，但它不是真实的。”相关论文信息：https://doi.org/10.1126/sciadv.adg3256...PC版：https://www.cnbeta.com.tw/articles/soft/1399535.htm手机版：https://m.cnbeta.com.tw/view/1399535.htm

DeepMind AI在复杂游戏西洋陆军棋中挺进专家级

DeepMindAI在复杂游戏西洋陆军棋中挺进专家级12月1日的《科学》杂志描述了这一成就，紧接着一项研究报告称人工智能可以玩《强权外交》，其中玩家必须在合作和竞争中进行谈判。研究战略推理和游戏理论的计算机科学家迈克尔-韦尔曼（MichaelWellman）说："近年来，人工智能在质量上不同的游戏特征被征服--或掌握到新的水平--的速度相当惊人。《西洋陆军棋》和《强权外交》彼此之间有很大的不同，而且还拥有与已经达到类似里程碑的游戏明显不同的挑战性特征。"《西洋陆军棋》的特点使其比国际象棋、围棋或扑克复杂得多，所有这些游戏都已被人工智能所掌握。在战略游戏中，两名玩家在棋盘上各放40个棋子，但不能看到对手的棋子是什么。目标是轮流移动棋子以消除对手的棋子并夺取旗帜。战略游戏的游戏树--所有可能的游戏方式的图形--有10535个状态，而围棋是10360个。游戏开始时，Stratego就有1066个可能的走法，这使双人德州扑克中的106个这样的开始情况相形见绌。位于巴黎的DeepMind研究员朱利安-佩罗拉（JulienPerolat）说："Stratego中可能出现的结果数量之复杂，意味着在完全信息游戏上表现良好的算法，甚至那些对扑克有用的算法都不起作用。"自学成才的人工智能在战略游戏围棋方面表现最好因此，佩罗拉特和同事们开发了DeepNash。这个人工智能的名字是对美国数学家约翰-纳什(JohnNash)的致敬，他的工作导致了纳什均衡这一术语的出现，这是一组稳定的策略，所有的游戏参与者都可以遵循，这样就没有玩家通过改变自己的策略而获益。游戏可以有零个、一个或多个纳什均衡。DeepNash将强化学习算法与深度神经网络相结合，以找到纳什均衡。强化学习涉及寻找最佳政策，以决定游戏的每个状态的行动。为了学习一个最佳政策，DeepNash与自己进行了55亿次游戏。如果一方获得奖励，另一方就会受到惩罚，而神经网络的参数--代表政策--也会相应地进行调整。最终，DeepNash收敛于一个近似的纳什均衡状态。与AlphaGo等之前的游戏AI不同，DeepNash不会通过游戏树搜索来优化自己。在4月份的两个星期里，DeepNash在网络游戏平台Gravon上与人类战略家进行了竞争。在50场比赛之后，DeepNash在2002年以来所有Gravon战略游戏玩家中排名第三。"我们的工作表明，像Stratego这样复杂的游戏，涉及不完美的信息，不需要搜索技术来解决，"团队成员、驻巴黎的DeepMind研究员卡尔-图伊斯说。"这真是人工智能的一大进步。""结果令人印象深刻，"总部位于纽约的MetaAI的研究员诺姆-布朗同意，他领导的团队在2019年报告了玩起了基于扑克的AIPluribus4。《强权外交》游戏的表现布朗和他在MetaAI的同事将目光投向了一个不同的挑战：建立一个能玩外交的人工智能，这是一个最多有七个玩家的游戏，每个玩家代表一战前欧洲的一个大国。目标是通过移动单位（舰队和军队）获得对供应中心的控制。重要的是，该游戏需要玩家之间的私下交流和积极合作，与围棋或战略游戏等双人游戏不同。"当你超越双人零和游戏时，纳什均衡的概念对于与人类打好关系不再那么有用，"布朗说。因此，该团队根据涉及人类玩家的在线版《强权外交》游戏的125261场数据训练其人工智能--名为Cicero。结合这些数据和一些自我游戏数据，Cicero的战略推理模块（SRM）学会了预测，对于给定的游戏状态和累积的信息，其他玩家的可能政策。利用这种预测，SRM选择了一个最佳的行动，并向Cicero的对话模块发出了它的"意图"。对话模块建立在一个27亿个参数的语言模型上，该模型在互联网的文本上进行了预训练，然后利用人们玩的外交游戏的信息进行微调。考虑到来自SRM的意图，该模块产生了一个对话信息（例如，代表英国的西塞罗可能会问法国。"你想支持我加入比利时一方吗？"）。在11月22日的《科学》论文中，该团队报告说，在40场在线游戏中，"CiceroAI取得了比人类玩家的平均分数高一倍以上的成绩，并在参加过多场游戏的参与者中排名前10%"。真实世界的行为布朗认为，能够与人类互动并对人类的次优甚至非理性行为进行解释的玩游戏的人工智能可以为现实世界的应用铺平道路。他说："如果你正在制造一辆自动驾驶汽车，你不想假设道路上的所有其他司机都是完全理性的，并且会表现得很好。Cicero是朝着这个方向迈出的一大步。我们仍然有一只脚在游戏世界里，但现在我们也有一只脚在现实世界里。"威尔曼同意这一看法，但他说还需要更多的工作。他说："这些技术中的许多确实与娱乐游戏之外的现实世界应用有关，尽管如此，在某些时候，领先的人工智能研究实验室需要超越娱乐环境，并找出如何衡量我们真正关心的更小的现实世界'游戏'的科学进展。"...PC版：https://www.cnbeta.com.tw/articles/soft/1334237.htm手机版：https://m.cnbeta.com.tw/view/1334237.htm

数学家利用人工智能和新型聚类算法识别新出现的COVID-19变种

数学家利用人工智能和新型聚类算法识别新出现的COVID-19变种叠加在冠状病毒插图上的CLASSIX聚类结果的风格化图像。资料来源：曼彻斯特大学、疾病预防控制中心/MSMI的AlissaEckert；MAMS的DanHiggins本周发表在《美国国家科学院院刊》（PNAS）上的这项研究可以支持传统的病毒进化追踪方法，如系统发育分析，目前这种方法需要大量的手工整理。曼彻斯特大学研究员、论文第一作者和通讯作者罗伯托-卡万齐（RobertoCahuantzi）说："自从COVID-19出现以来，我们已经看到了多波新的变种、传播性增强、免疫反应逃避和疾病严重性增加。科学家们现在正加紧努力，以便在α、δ和Ω等这些令人担忧的新变种出现的最初阶段就将其定位。如果我们能找到一种快速有效的方法，就能更积极地采取应对措施，比如开发有针对性的疫苗，甚至有可能在变异体形成之前就将其消灭。"拟议的COVID-19变异识别方法步骤示意图。资料来源：曼彻斯特大学与许多其他RNA病毒一样，COVID-19的变异率很高，而且两代之间的间隔时间很短，这意味着它的进化速度极快。这意味着识别未来可能出现问题的新毒株需要付出巨大的努力。目前，GISAID数据库（全球共享所有流感数据倡议）提供了近1600万个序列，该数据库提供了流感病毒的基因组数据。从这些数据中绘制出所有COVID-19基因组的进化和历史，目前需要耗费大量的计算机和人力时间。所述方法实现了此类任务的自动化。研究人员只用了一到两天时间，就用一台标准的现代笔记本电脑处理了570万个高覆盖率序列；这是现有方法无法做到的，由于减少了资源需求，更多研究人员掌握了识别相关病原体菌株的能力。曼彻斯特大学数学科学教授托马斯-豪斯（ThomasHouse）说："大流行期间产生了前所未有的大量基因数据，这要求我们改进方法，对其进行彻底分析。数据仍在快速增长，但如果不显示出整理这些数据的益处，这些数据就有可能被移除或删除。""我们知道，人类专家的时间是有限的，因此我们的方法不应该完全取代人类的工作，而应该与他们并肩工作，以便更快地完成工作，并将我们的专家解放出来，从事其他重要的开发工作"。拟议方法的工作原理是通过计数将COVID-19病毒的基因序列分解成以数字表示的较小"词"（称为3-mers）。然后，它利用机器学习技术，根据单词模式将相似的序列分组。曼彻斯特大学应用数学教授斯特凡-居特尔（StefanGüttel）说："与传统方法相比，我们开发的聚类算法CLASSIX对计算的要求要低得多，而且是完全可解释的，也就是说，它能对计算出的聚类提供文字和视觉上的解释"。RobertoCahuantzi补充说："我们的分析是一个概念验证，证明了机器学习方法作为一种预警工具的潜在用途，可用于早期发现新出现的主要变种，而无需依赖生成系统发育。虽然系统发生学仍然是了解病毒祖先的'黄金标准'，但这些机器学习方法能够以较低的计算成本容纳比当前系统发生学方法多几个数量级的序列"。编译自:ScitechDaily...PC版：https://www.cnbeta.com.tw/articles/soft/1424973.htm手机版：https://m.cnbeta.com.tw/view/1424973.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人