:一种新的生成式交互环境模型,能通过无监督学习,用未标注的互联网视频数据训练而成。

:一种新的生成式交互环境模型,能通过无监督学习,用未标注的互联网视频数据训练而成。 Genie具有11B参数,能将文本、合成图像、照片甚至手绘草图转换为可交互的虚拟世界。这一模型打破了传统世界模型需要特定领域数据和动作标签的局限,通过学习潜动作空间,实现了对生成环境的逐帧控制。 研究表明,Genie不仅能够创造多样的互动体验,还能够训练未来的通用智能体,通过对未见过的视频进行模仿学习,预示着人工智能领域迈向开放式学习和创造无限数据的新时代。

相关推荐

封面图片

Google DeepMind 公布 Genie 模型,可生成可交互的虚拟环境

Google DeepMind 公布 Genie 模型,可生成可交互的虚拟环境 Google DeepMind 今天介绍了 Genie ,一种根据互联网视频训练的基础世界模型,可以从合成图像、照片甚至草图生成无数种可玩(动作可控)的世界。 Genie 可以用它以前从未见过的图像来作为输入,使人们能够与生成的虚拟世界进行交互。它由一个时空视频标记器、一个自回归动力学模型和一个简单且可扩展的潜在行动模型组成。该模型可根据没有任何标注数据的公开互联网视频的大型数据集进行训练。该模型当前专注于 2D 平台游戏和机器人的视频,但其方法是通用的,并且可以扩展到任何类型的领域和更大的数据集。 团队还通过使用 Google 的 RT-1 机器人的摄像头视频数据训练模型,表明 Genie 能够学习与现实世界一致的动作空间。这可能产生一个现实世界模拟器,以便训练未来的通用智能体。 ,

封面图片

谷歌 DeepMind 公布能生成可互动环境的世界模型 Genie 2

谷歌 DeepMind 公布能生成可互动环境的世界模型 Genie 2 谷歌 DeepMind 推出第二代 Genie 模型,其可以根据单个图像和文本描述生成交互式实时 3D 世界场景。以 Genie 世界模型作为基础模型,可以为自动驾驶或具身人工智能生成无限多的训练数据,进一步推动 AI 发展。 Genie 2 可以生成“丰富多样的 3D 世界”,其中包括用户可以使用鼠标或键盘进行跳跃和游泳等动作的世界。该模型经过视频训练,能够模拟物体交互、动画、灯光、物理、反射和“NPC”的行为,并拥有记忆能力。在谷歌公布大量示例中,许多看起来都像 3A 游戏,原因很可能是该模型的训练数据包含热门游戏的通关视频。 TechCrunch,Google 博客-电报频道- #娟姐新闻:@juanjienews

封面图片

人工智能垃圾开始污染互联网

人工智能垃圾开始污染互联网 5 月初,新闻网站评级公司 NewsGuard 发现 49 个假新闻网站使用人工智能生成内容。该公司联合创始人 戈登·克罗维茨 表示,截至 6 月底,这一数字已达到 277 个。“这个数字正在呈指数级增长,”克罗维茨说。并表示,这些网站的创建似乎是为了通过Google展示广告网络赚钱。 研究人员还指出,人工智能技术有可能被用于制造政治虚假信息和用于黑客攻击的定向信息。网络安全公司Zscaler表示,现在判断人工智能是否被犯罪分子广泛使用还为时过早,但该公司预计人工智能将被用来创建高质量的的假冒钓鱼网页,这些网页旨在诱骗受害者下载恶意软件软件或泄露他们的用户名和密码。 在YouTube上,ChatGPT淘金热正如火如荼地进行着。数十个提供如何利用OpenAI技术赚钱的建议的视频已被观看了数十万次。其中许多视频提出了涉及垃圾内容的可疑计划。有些视频告诉观众,他们每周可以赚到数千美元,敦促他们编写电子书或在博客上出售广告,这些博客上充斥着人工智能生成的内容,然后可以通过在谷歌搜索中弹出广告来获得广告收入。 《Clarkesworld》杂志的出版商 Neil Clarke 表示,今年早些时候,该杂志不得不暂时停止接受在线投稿,因为数百个人工智能生成的故事让该杂志不堪重负。Clarke 表示, 提交内容是由在线视频推动的,这些视频建议人们使用 ChatGPT 创建内容并向 Clarkesworld 投稿。 如果互联网上越来越多地充斥着人工智能生成的内容,这可能会成为人工智能公司本身的问题。这是因为它们的大型语言模型在公共数据集上进行自我训练。随着这些数据集越来越多地充满人工智能生成的内容,研究人员担心语言模型将变得不那么有用,这种现象被称为“模型崩溃”。 来源:

封面图片

谷歌DeepMind推出Genie模型:110亿参数、可基于图片生成2D游戏

谷歌DeepMind推出Genie模型:110亿参数、可基于图片生成2D游戏 另有一个动态模型,用于在给定潜在动作和过去帧token的情况下,预测视频的下一帧。这三个组件共同协作,使得Genie能够生成具有高度交互性和可控性的虚拟世界。Genie通过了网络上超过20万小时的2D游戏视频训练,目前只是一个研究预览版,这些游戏更像是2D平台游戏,而不是完全的VR游戏。此外,它能生成图像和其他资产,将你的草图变成一个完全实现的开放世界,然后根据玩家提供的操作预测下一个像素帧,Genie还可以应用于设计相关的创作领域,进一步拓宽了创作者的想象空间。 ... PC版: 手机版:

封面图片

中国互联网协会副秘书长裴玮近日在 2024 中国互联网大会上发布《中国互联网发展报告 (2024)》。《报告》指出,在人工智能领

中国互联网协会副秘书长裴玮近日在 2024 中国互联网大会上发布《中国互联网发展报告 (2024)》。《报告》指出,在人工智能领域,2023 年我国人工智能产业应用进程持续推进,核心产业规模达到 5784 亿元。截至 2024 年 3 月,我国人工智能企业数量超过 4500 家,已有 714 个大模型完成生成式人工智能服务备案。(上证报)

封面图片

【国家发改委:支持开展通用人工智能大模型和垂直领域人工智能大模型训练】

【国家发改委:支持开展通用人工智能大模型和垂直领域人工智能大模型训练】 12 月 15 日,国家发改委就《“数据要素 ×”三年行动计划(2024-2026 年)(征求意见稿)》向社会公开征求意见。意见稿提出,以科学数据支持大模型开发,深入挖掘包含科技文献在内的各类科学数据,通过细粒度的知识抽取,构建科学知识资源底座,建设高质量语料库和基础科学数据集,支持开展通用人工智能大模型和垂直领域人工智能大模型训练。探索科研新范式,面向新范式需求迫切的重点科研领域,充分依托各类数据库与知识库,推进跨机构、跨学科、跨领域协同创新,发现新规律,创造新知识,加速科学研究范式变革。 快讯/广告 联系 @xingkong888885

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人