DeepMind 发布Dreamer V3,第一个从头开始在 Minecraft 中收集钻石的通用算法 - 解决人工智能中的一个

DeepMind 发布Dreamer V3,第一个从头开始在 Minecraft 中收集钻石的通用算法 - 解决人工智能中的一个重要挑战。 它学会了在不调整的情况下掌握许多领域,使强化学习得到广泛应用。

相关推荐

封面图片

谷歌 DeepMind 首席执行官表示其下​​一个算法将超越 ChatGPT

谷歌 DeepMind 首席执行官表示其下​​一个算法将超越 ChatGPT Demis Hassabis 表示,该公司正在开发一种名为 Gemini 的系统,该系统的技术曾帮助 阿尔法狗(AlphaGo)在 2016 年击败人类围棋冠军。 2016年,一个来自谷歌 DeepMind 人工智能实验室的名为 阿尔法狗(AlphaGo)的人工智能程序在棋盘游戏围棋中击败了人类冠军选手,创造了历史。现在,DeepMind 联合创始人兼首席执行官 Demis Hassabis 表示,他的工程师正在使用 AlphaGo 的技术来制造一个名为 Gemini 的人工智能系统,该系统将比 OpenAI 的ChatGPT背后的系统更强大。 DeepMind 的 Gemini 仍在开发中,是一种处理文本的大型语言模型,本质上与为ChatGPT 提供支持的 GPT-4类似。但哈萨比斯表示,他的团队将现有技术与 AlphaGo 中使用的技术结合起来,旨在赋予系统新的功能,例如规划或解决问题的能力。 来源:

封面图片

这个有意思,第一个能在 Minecraft 中与你亲自互动的 AI Agent。演示视频翻译为中文了。

这个有意思,第一个能在 Minecraft 中与你亲自互动的 AI Agent。演示视频翻译为中文了。 以前AI 控制的非玩家角色(NPC)主要只能进行简单的行走和对话。 Altera bots 不仅能够建造、聊天,还能进行团队合作,就跟一个正常的游戏内好友一样跟你一起玩。 这里申请体验:

封面图片

谷歌开门放“狗”:AlphaGo研发部门DeepMind CEO表示其下一个算法将超越 ChatGPT

谷歌开门放“狗”:AlphaGo研发部门DeepMind CEO表示其下一个算法将超越 ChatGPT Demis Hassabis 表示,该公司正在开发一种名为 Gemini 的系统,该系统的技术曾帮助阿尔法狗(AlphaGo)在 2016 年击败人类围棋冠军。 2016年,一个来自谷歌 DeepMind 人工智能实验室的名为阿尔法狗(AlphaGo)的人工智能程序在棋盘游戏围棋中击败了人类冠军选手,创造了历史。现在,DeepMind 联合创始人兼首席执行官 Demis Hassabis 表示,他的工程师正在使用 AlphaGo 的技术来制造一个名为 Gemini 的人工智能系统,该系统将比 OpenAI 的ChatGPT背后的系统更强大。 DeepMind 的 Gemini 仍在开发中,是一种处理文本的大型语言模型,本质上与为ChatGPT 提供支持的 GPT-4类似。但哈萨比斯表示,他的团队将现有技术与 AlphaGo 中使用的技术结合起来,旨在赋予系统新的功能,例如规划或解决问题的能力。 ,

封面图片

生成式人工智能让机器人离通用目标又近一步

生成式人工智能让机器人离通用目标又近一步 研究人员一直在努力开发一种机器人智能,使其能够充分利用双足仿人设计所带来的广泛运动能力。在机器人技术中使用生成式人工智能也是近期的热门话题。麻省理工学院的最新研究表明,后者可能会对前者产生深远影响。在通往通用系统的道路上,最大的挑战之一就是培训。我们已经掌握了培训人类从事不同工作的最佳方法。机器人技术的方法虽然前景广阔,但却支离破碎。有很多有前途的方法,包括强化学习和模仿学习,但未来的解决方案可能会涉及这些方法的组合,并通过生成式人工智能模型加以增强。麻省理工学院团队提出的主要用途之一,就是从这些小型特定任务数据集中整理相关信息的能力。这种方法被称为策略合成(PoCo)。任务包括有用的机器人动作,如敲钉子和用锅铲翻转东西。团队指出:"[研究人员]训练一个单独的扩散模型,学习一种策略或政策,利用一个特定的数据集完成一项任务。然后,他们将扩散模型学习到的策略组合成一个通用策略,使机器人能够在各种环境下执行多项任务。"根据麻省理工学院公布的数据,采用扩散模型后,任务性能提高了 20%。这包括执行需要多种工具的任务的能力,以及学习/适应陌生任务的能力。该系统能够将来自不同数据集的相关信息整合到执行任务所需的行动链中。"这种方法的好处之一是,我们可以将政策结合起来,以获得两个世界的最佳效果,"论文的第一作者王立瑞说。"例如,在真实世界数据基础上训练的政策可能会更灵巧,而在模拟基础上训练的政策可能会更通用"。这项具体工作的目标是创建智能系统,使机器人能够交换不同的工具来执行不同的任务。多用途系统的普及将使该行业离通用梦想更近一步。 ... PC版: 手机版:

封面图片

Deepmind 推出了一个可以自我改进的AI机器人代理:

Deepmind 推出了一个可以自我改进的AI机器人代理: 它能自我学习并在不同的机械臂上执行各种任务,而且还能自我生成新的训练数据以改进其技术。 RoboCat的学习速度非常快。只需要观察100次左右的演示,就可以学会操控机械臂来完成各式各样的任务,并且它还能通过自生成的数据来进行迭代改进。 RoboCat的一些主要特点: 1、多任务和自适应能力:RoboCat是第一个能够解决和适应多个任务,并在不同的真实机器人上执行这些任务的代理。 2、快速学习:RoboCat的学习速度比其他最先进的模型快得多。它可以通过观察少至100个示例来学习新任务,因为它从大型多样化的数据集中获取信息。这将有助于加速机器人研究,因为它减少了对人工监督训练的需求,这是创建通用机器人的重要步骤。 3、自我改进:RoboCat基于Deepmind的多模型模型Gato,它可以在模拟和物理环境中处理语言、图像和动作。将Gato的架构与大型训练数据集结合起来,该数据集包含了各种机器人臂解决数百种不同任务的图像和动作序列。 4、操作新的机器人臂和解决更复杂的任务:通过RoboCat的多样化训练,它在几个小时内学会了操作不同的机器人臂。虽然它已经在两爪夹具的臂上进行了训练,但它能够适应更复杂的臂,这种臂有三个手指的夹具和两倍的可控输入。 5、自我改进的通才:RoboCat有一个训练的良性循环:它学习的新任务越多,它在学习其他新任务上就越好。最初版本的RoboCat在以前未见过的任务上的成功率只有36%,这是在每个任务上从500个示例中学习后的结果。但是最新的RoboCat,在对更多任务进行了训练后,将这个成功率提高了一倍多。

封面图片

最近因为一个契机,我从头开始参与基础大模型的训练开发。亲身经历去实践这个过程令我兴奋,也让我学到很多。有一些心得体会可以分享:

最近因为一个契机,我从头开始参与基础大模型的训练开发。亲身经历去实践这个过程令我兴奋,也让我学到很多。有一些心得体会可以分享: 1. 人们常说GPT模型学习了整个互联网的数据,听上去只要能够把整个互联网爬下来就可以了,这个说法并不准确。训练的原始数据的确是来自互联网(CommonCrawl和私域的内容),但是实际拿来训练用的只是其中的子集一个精心挑选的高质量子集。Sam Altman和Lex Friedman的访谈中说过,他们在数据上的大部分努力是去筛选信息,而不是堆积信息。原始数据需要经过大量的筛选、去重、格式化的处理,这个过程耗时耗力,也往往被忽视,但却是至关重要的。 2. 随着模型的参数上到百亿甚至千亿,很多新的能力开始涌现,而很多工程上的麻烦也随之而来。为了应对如此庞大的数据和模型体量,系统里几乎每个角落都需要优化,从数据处理、切分、训练时的样本和机器分布、梯度下降的稳定性、存储等等,各个方面都需要对应做提升,避免成为短板。一个成功的大模型背后离不开几十上百个细节的工程优化。 3. 一个还不成熟、有待考验的心得:现在想要做一个LLM,你并不需要一支庞大的团队。你只需要不到10个有经验、有行动力、能够高效合作的工程师就可以了。Meta、OpenAI、HuggingFace等团队都为这个生态提供了非常实用的轮子,只要使用得当,就可以获得明显的助力。当然,人数上可以精简,GPU计算资源还是得管够。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人