谷歌DeepMind利用大型语言模型解决了一个长期困扰人类的数学难题https://www.bannedbook.org/bne

谷歌 DeepMind 利用大型语言模型解决了一个长期困扰人类的数学难题

谷歌DeepMind利用大型语言模型解决了一个长期困扰人类的数学难题谷歌DeepMind利用一大型语言模型成功破解了一项著名的未解数学难题。研究人员发表在《自然》杂志上的一篇中表示，这是首次使用大型语言模型发现长期科学难题的解决方案，产生了可验证且有价值的新信息，这些信息之前并不存在。“这不在训练数据中，甚至以前都不知道，”谷歌DeepMind研究副总裁PushmeetKohli说道。它结合了一个名为Codey的大型语言模型，这是Google的PaLM2的一个版本，经过对计算机代码进行了精细调整，还与其他系统结合使用，拒绝不正确或荒谬的答案，并将正确的答案重新插入其中。经过数百万次建议和几十次总体过程的重复——这花了几天的时间——FunSearch能够提出代码，产生了一个正确且以前未知的解决方案，解决了capset问题，涉及找到某一类型集合的最大大小。——

Nature：DeepMind大模型突破60年数学难题解法超出人类已有认知

Nature：DeepMind大模型突破60年数学难题解法超出人类已有认知这项技术名为FunSearch，其中的Fun是函数（Function）一词的简写。利用大模型解决长期存在的科学难题，产生以前不存在的可验证且有价值*的新信息。在Nature论文配套的新闻解读中，DeepMind负责人称“我们使用大模型的方式是当做创造力引擎”。这是第一次有人证明基于大模型的系统可以超越数学家和计算机科学家的认知。它不仅新颖，而且比当今存在的任何其他东西都更有效。针对这项成果，有网友感慨：如果这是真的，那可是人类自火之后最重要的发现了。那么，FunSearch都解决了哪些问题呢？找到NP-hard问题更优解法DeepMind具体展示了两类问题，它们都属于NP-hard问题。在学界看来，没有而且可能永远也不会有一种算法能在所有情况下都在多项式时间内找到NP-hard问题的精确解。面对这样的问题，研究者通常会寻找近似解或适用于特定情况的有效算法。具体到FunSearch，它解决的第一类NP-hard问题是Capset问题，是上限集问题的一种，它的描述是这样的：在一个n维空间中的每个维度上都有等距的n个点（共n^n个，比如3维就是3*3*3），从中找出尽可能多的点构成一个集合，要求集合中任选3个点均不共线，这样的集合中最多有多少个点？如果看上去有些难以理解，不妨再了解一下Capset问题的前身——上世纪70年代遗传学家MarshaFalco发明的一套卡牌游戏。这套卡牌游戏中一共有81张牌，每张牌中都有1至3个颜色图案，同一张牌中的图案颜色、形状和阴影完都全相同。这套牌一共有3种颜色、3种形状和3种阴影，加上图案数量的不同，一共有3*3*3*3=81张，玩家需要翻开一些纸牌，找到3张牌的特殊组合。如果把这种“特殊组合”的具体方式用离散几何形式进行表达，就得到了Capset问题。Capset问题同样诞生于70年代，由牛津大学数学家RonGraham提出，而第一个重要结果直到90年代才出现。2007年，陶哲轩在一篇博客文章中提到，这是他最喜欢的开放式数学问题。在FunSearch出现之前，Capset问题最重大的突破是美国数学家JordanEllenberg和荷兰数学家DionGijswijt于2016年提出的。通过多项式方法，Ellenberg和Gijswijt将n>6时（n≤6时可精确找到最大集合）此类问题解的上确界缩小到了2.756^n。同样在n>6时，下确界的较新数字则是2.218^n，由布里斯托大学博士生FredTyrrell在2022年提出。但这个下确界仅仅存在于理论上——当n=8时，人类能构建出的最大集合中只有496个点，而按照Tyrrell的结论，点的数量应不少于585.7个。FunSearch则将集合规模扩大到了512个点——虽然和理论值依旧存在差距，但仍被视为20年来在此问题上最重大的突破。同时，Capset集合大小的下确界也被FunSearch提高到了2.2202^n。第二类是在线装箱问题：假设有一组容量为C的标准集装箱和n个物品序列（物品大小不超过C），这些物品按一定顺序到达。“在线”是指操作者无法事先看到所有的物品，但必须在物品到达时立刻决定将物品装入哪个集装箱。最终的目标，是使所用集装箱数量尽可能小。在线装箱问题引起广泛研究是从上世纪70年代开始的，最早更是可以追溯到1831年高斯所研究的布局问题。经过近200年的研究，仍然没有成熟的理论和有效的数值计算方法。传统上常用的贪心算法包括FirstFit和BestFit两种：FirstFit是指将每个物品放入第一个能容纳它的箱子中。BestFit则是将每个物品放入能容纳它的且箱子中剩余空间最小的箱子。而FunSearch则提出了新的算法，该算法在OR和Weibull两个测试数据集中，所用集装箱的数量均大幅下降。特别是在当测试集物品数目达到10万时，FunSearch找到的方案，消耗集装箱数量只比理论下界多出了0.03%。（下表中的数据表示与理论下界的差异，数字越小表现越好）那么，FunSearch是如何实现的呢？搜索“程序”而不是“答案”整体上看，FunSearch的工作流程是一个迭代过程，核心是搜索能解决问题的程序，而不是问题答案本身。搜索，正是DeepMind自AlphaGo以来一直坚持探索的路线。联合创始人ShaneLegg曾在一次访谈中作出解释：AlphaGo击败李世石的关键“第37步”从何而来？不是来自人类对弈数据，而是来自对概率空间的搜索。当前大模型只是模仿、混合不同的训练数据，要想产生真正的创造力并超越目前的架构，就需要结合搜索。回到最新成果FunSearch，系统当中有一个程序库，每次迭代时，系统会从其中搜索初始程序并输入大模型（实验用PaLM2，其他只要支持代码也兼容）。大模型在此基础上构建生成新的程序，并交给自动评估系统，得分最高的程序会被加入程序库，从而实现自我循环。其中，评估系统会根据用户的问题生成测试用例，然后判断候选程序的输出是否正确。根据复杂程度不同，判断正误的方法既包括直接检查输出值，也包括对相关函数进行调用。同时评估系统还设置有容错逻辑，避免超时等问题影响整体流程。最终，系统会根据备选程序在这些测试用例上的行为给出整体评分，为结果生成和后续程序库更新提供依据。论文合著者威斯康星大学麦迪逊分校的JordanEllenberg认为，FunSearch的一个重要特点是，人们可以看到AI产生的成功解决方案并从中学习，与之前AI的黑箱模式完全不同。对我来说最令人兴奋的是建立人机协作的新模式，我不希望用它们来替代人类数学家，而是作为力量倍增器。...PC版：https://www.cnbeta.com.tw/articles/soft/1404741.htm手机版：https://m.cnbeta.com.tw/view/1404741.htm

Nature：DeepMind大模型突破60年数学难题，解法超出人类已有认知量子位https://www.qbitai.com/

谷歌推出最新的大型语言模型 Gemini 1.0

谷歌推出最新的大型语言模型Gemini1.0谷歌发布最新的大型语言模型Gemini，谷歌CEO皮查伊在6月份的I/O开发者大会上首次透露了该模型，现在正式向公众推出。谷歌针对不同场景发布了三种不同尺寸的版本。例如Google的人工智能聊天机器人Bard现在由可扩展的GeminiPro提供支持。GeminiNano是轻量版本，旨在Android设备上本地离线运行，Pixel8Pro成为首款搭载此模型的设备。GeminiUltra，它是谷歌迄今为止创建的最强大的LLM，适用于高度复杂的任务。似乎主要是为数据中心和企业应用设计的。——

【谷歌计划于周三推出一款通用大型语言模型PaLM 2】

【谷歌计划于周三推出一款通用大型语言模型PaLM2】5月9日消息，据财联社报道，谷歌将于美东时间周三举行一年一度的年度开发者大会。文件显示，谷歌本次活动的主题是：人工智能如何“帮助人们充分发挥潜力”，并介绍谷歌在人工智能领域的一系列技术更新，包括提供对谷歌自家聊天机器人Bard和Search的“生成体验”。根据谷歌的内部文件，在本次大会上，谷歌将推出其最新、最先进的通用大型语言模型PaLM2。PaLM2包含100多种语言，一直在谷歌内部运行，代号为“统一语言模型。它能够执行广泛的编码和数学测试，以及创造性写作测试和分析。谷歌于2022年4月首次宣布了其PaLM语言模型。今年3月，该公司为PaLM推出了一个API，同时推出了一系列人工智能企业工具，据称这些工具将帮助企业“从简单的自然语言提示中生成文本、图像、代码、视频、音频等”。

谷歌 DeepMind 推出活细胞人工智能模型

谷歌DeepMind推出活细胞人工智能模型谷歌的DeepMind推出了一个人工智能模型，用于研究生命的基本构成要素及其在细胞内的相互作用，推动了揭示疾病秘密和寻找疾病(如癌症)疗法的努力。根据周三在《自然》期刊上发表的一篇论文，最初于2018年开发的AlphaFold3对微小生物结构外观和相互作用做出了迄今最精确的预测。同构实验室的首席人工智能官马克斯•贾德伯格表示，AlphaFold3的能力为研究人员提供了新的机会，可以迅速识别潜在的新药分子。同构实验室与制药公司礼来和诺华有合作关系。“这使得我们的科学家和药物设计师能够在原子水平上创造和测试假设，并且在几秒钟内使用AlphaFold3生成高度准确的结构预测。”贾德伯格说，“与可能需要数月甚至数年的实验相比，这是非常快速的。”AlphaFold3展示了“显著提高”的预测准确性，超过了许多现有的专业工具，包括基于前两代技术的工具。研究表明，开发正确的人工智能深度学习框架，可以大大减少获取“生物相关性能”所需的数据量。——

相关推荐