谷歌DeepMind推出AI基础世界模型Genie:110亿参数、可基于图片生成2D游戏

None

相关推荐

封面图片

谷歌DeepMind推出Genie模型:110亿参数、可基于图片生成2D游戏

谷歌DeepMind推出Genie模型:110亿参数、可基于图片生成2D游戏 另有一个动态模型,用于在给定潜在动作和过去帧token的情况下,预测视频的下一帧。这三个组件共同协作,使得Genie能够生成具有高度交互性和可控性的虚拟世界。Genie通过了网络上超过20万小时的2D游戏视频训练,目前只是一个研究预览版,这些游戏更像是2D平台游戏,而不是完全的VR游戏。此外,它能生成图像和其他资产,将你的草图变成一个完全实现的开放世界,然后根据玩家提供的操作预测下一个像素帧,Genie还可以应用于设计相关的创作领域,进一步拓宽了创作者的想象空间。 ... PC版: 手机版:

封面图片

ℹGoogle DeepMind 推出 Genie,给草图图片就能生成 AI 游戏世界#

ℹGoogle DeepMind 推出 Genie,给草图图片就能生成 AI 游戏世界# AI 发展的速度真的实在是太快阿!继几周前 OpenAI 带来惊人的 Sora 模型之后,稍早 Google DeepMind 也推出一个...

封面图片

Google DeepMind 公布 Genie 模型,可生成可交互的虚拟环境

Google DeepMind 公布 Genie 模型,可生成可交互的虚拟环境 Google DeepMind 今天介绍了 Genie ,一种根据互联网视频训练的基础世界模型,可以从合成图像、照片甚至草图生成无数种可玩(动作可控)的世界。 Genie 可以用它以前从未见过的图像来作为输入,使人们能够与生成的虚拟世界进行交互。它由一个时空视频标记器、一个自回归动力学模型和一个简单且可扩展的潜在行动模型组成。该模型可根据没有任何标注数据的公开互联网视频的大型数据集进行训练。该模型当前专注于 2D 平台游戏和机器人的视频,但其方法是通用的,并且可以扩展到任何类型的领域和更大的数据集。 团队还通过使用 Google 的 RT-1 机器人的摄像头视频数据训练模型,表明 Genie 能够学习与现实世界一致的动作空间。这可能产生一个现实世界模拟器,以便训练未来的通用智能体。 ,

封面图片

文字或图片就能创造游戏?Google 推出生成式互动环境 AI 模型「Genie」

封面图片

谷歌 DeepMind 推出活细胞人工智能模型

谷歌 DeepMind 推出活细胞人工智能模型 谷歌的 DeepMind 推出了一个人工智能模型,用于研究生命的基本构成要素及其在细胞内的相互作用,推动了揭示疾病秘密和寻找疾病(如癌症)疗法的努力。根据周三在《自然》期刊上发表的一篇论文,最初于2018年开发的AlphaFold 3对微小生物结构外观和相互作用做出了迄今最精确的预测。同构实验室的首席人工智能官马克斯•贾德伯格表示,AlphaFold 3的能力为研究人员提供了新的机会,可以迅速识别潜在的新药分子。同构实验室与制药公司礼来和诺华有合作关系。“这使得我们的科学家和药物设计师能够在原子水平上创造和测试假设,并且在几秒钟内使用AlphaFold 3生成高度准确的结构预测。”贾德伯格说,“与可能需要数月甚至数年的实验相比,这是非常快速的。”AlphaFold 3展示了“显著提高”的预测准确性,超过了许多现有的专业工具,包括基于前两代技术的工具。研究表明,开发正确的人工智能深度学习框架,可以大大减少获取“生物相关性能”所需的数据量。

封面图片

Google DeepMind推出Gemma模型

Google DeepMind推出Gemma模型 这是一款轻量级、先进的开源模型,供开发者和研究人员用于AI构建。Gemma模型家族包括Gemma 2B和Gemma 7B两种尺寸,能够在不同的设备类型上运行,包括笔记本电脑、桌面电脑、IoT设备、移动设备和云端。 性能和设计 Gemma模型在技术和基础设施组件上与Gemini共享,这使得Gemma 2B和7B在其大小范围内相比其他开放模型具有最佳性能。 Gemma模型不仅可以直接在开发者的笔记本电脑或桌面电脑上运行,而且在关键基准测试中的表现超过了更大的模型,同时遵循严格的安全和负责任输出标准。 主要特点: 1.轻量级、高性能模型:Gemma模型家族包括Gemma 2B和Gemma 7B两种尺寸,提供预训练和指令调优的变体,针对其大小范围内相比其他开放模型具有最佳性能。 2.跨框架工具链支持:支持JAX、PyTorch和TensorFlow通过原生Keras 3.0进行推理和监督式微调(SFT),适应多种开发需求和环境。 3.易于入门和集成:提供准备就绪的Colab和Kaggle笔记本,以及与Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM等流行工具的集成,方便开发者快速上手。 4.高效的运算能力:针对多个AI硬件平台上进行优化,确保在NVIDIA GPU和Google Cloud TPU上的行业领先性能。通过与NVIDIA的合作,无论是在数据中心、云端还是本地RTX AI PC上,都确保了行业领先的性能和与尖端技术的集成。 Gemma模型能够在不同的设备类型上运行,包括笔记本电脑、桌面电脑、IoT设备、移动设备和云端。这种广泛的兼容性使得模型能够适应各种应用场景和需求。 |

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人