Google推出Lumiere人工智能视频创作系统

Google推出Lumiere人工智能视频创作系统 它可以截取一张图片,克隆出该图片的风格,然后利用这种风格制作出大量其他主题的视频,这些视频看起来和感觉上都非常相似,简直就像是从一家品牌代理公司制作出来的。它可以使用你自己的源视频,把所有东西都变成乐高、折纸或花朵你只需要告诉它。从上面的演示中可以看出,Lumiere 拥有迄今为止我们所见过的最先进的视频内画功能。你只需在不喜欢的画面部分涂上颜色,Lumiere 就会自动填充该区域,效果美轮美奂,如果你不仔细看,可能根本不会注意到。前男友出现在你最喜欢的视频中?不会太久的。相关研究团队表示,Lumiere 的"时空 U 型网络架构"能一次性构建视频的整个长度而以前的模型通常是先生成起始帧和结束帧,然后再猜测中间会发生什么。不管怎么做,结果不言自明这是生成式人工智能视频的新技术水平。Inpainting功能令人难以置信;只需空白部分画面,它就会帮你补上。目前,这只是一个研究项目这样Google就不必为了版权、虚假信息、安全、仇恨言论、裸体、隐私和其他各种政策而大力阉割系统这一过程必然会导致这些生成模型的输出质量下降。 ... PC版: 手机版:

相关推荐

封面图片

谷歌的新视频生成人工智能模型Lumiere采用了一种名为Space-Time-U-Net(简称STUNet)的新扩散模型,这个模

谷歌的新视频生成人工智能模型Lumiere采用了一种名为Space-Time-U-Net(简称STUNet)的新扩散模型,这个模型能够识别视频中物体的位置(空间)以及它们是如何同时移动和变化的(时间)。据Ars Technica报道,这种方法让Lumiere能够一次性创造出视频,而不是把小的静态画面拼接起来。 Lumiere首先根据提示创建一个基础画面。然后,它利用STUNet框架开始推算画面中的物体将如何移动,以此创造出连贯的多个画面,营造出流畅运动的视觉效果。与稳定视频扩散(Stable Video Diffusion)的25帧相比,Lumiere还能生成80帧视频。 标签: #Google #AI #Lumiere 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

OpenAI 推出文本到视频人工智能模型 Sora

OpenAI 推出文本到视频人工智能模型 Sora 根据 OpenAI 的介绍博文,Sora 能够创建"具有多个角色、特定运动类型以及主体和背景准确细节的复杂场景"。该公司还指出,该模型能够理解物体"在物理世界中的存在方式",还能"准确解释道具并生成表达生动情感的引人注目的角色"。该模型还能根据静态图像生成视频,以及在现有视频中填充缺失的帧或扩展视频。OpenAI 的博文中包含的 Sora 生成的演示包括淘金热时期加利福尼亚州的空中场景、从东京火车内部拍摄的视频等。许多演示都有人工智能的痕迹比如在一段博物馆的视频中,地板疑似在移动。OpenAI 表示,该模型"可能难以准确模拟复杂场景的物理现象",但总体而言,演示结果令人印象深刻。几年前,像 Midjourney 这样的文本到图像生成器在模型将文字转化为图像的能力方面处于领先地位。但最近,视频技术开始飞速进步:Runway 和 Pika 等公司都展示了自己令人印象深刻的文字转视频模型,而Google的 Lumiere 也将成为 OpenAI 在这一领域的主要竞争对手之一。与 Sora 类似,Lumiere 也为用户提供了文字转换视频的工具,还能让用户通过静态图像创建视频。Sora 目前只对"红队"人员开放,他们负责评估模型的潜在危害和风险。OpenAI 还向一些视觉艺术家、设计师和电影制片人提供访问权限,以获得反馈意见。它指出,现有模型可能无法准确模拟复杂场景的物理现象,也可能无法正确解释某些因果关系。本月早些时候,OpenAI 宣布将在其文本到图像工具 DALL-E 3 中添加水印,但指出这些水印"很容易去除"。与其他人工智能产品一样,OpenAI 将不得不面对人工智能逼真视频被误认为是真实视频的后果。 ... PC版: 手机版:

封面图片

Google为Workspace推出人工智能辅助视频工具Vids

Google为Workspace推出人工智能辅助视频工具Vids Vids 提供了一个时间轴界面,可按时间顺序将 Drive 或其他地方的视频资产组合在一起。这与 Slides 允许用户在幻灯片的左右时间轴中排列内容的方式类似。用户可以在应用程序中录制配音或拍摄自己。有多种模板和背景可供选择,还有一个用于添加视频、图片或音频的媒体库。Google的人工智能助手可以生成初始故事板、脚本或文本到语音的配音,从而加快整个过程。Google介绍说:它可以生成一个您可以轻松编辑的故事板,在选择风格后,它还可以将您的初稿与素材视频、图片和背景音乐中的建议场景组合在一起。它还可以帮助您为信息配上合适的配音可以从我们的预设配音中选择,也可以使用您自己的配音。Vids的设计目标是消除对视频制作专业知识的需求,让任何员工都能快速轻松地制作培训视频、演示文稿、更新或营销内容。初步测试表明,大多数视频平均时长不到三分钟,就像OpenAI 的 Sora 视频应用程序一样。Vids 不仅能导出完成的视频,还能实现深度协作。用户可以分享他们创建的视频,并邀请其他人发表评论、做笔记,甚至直接编辑视频。评论和修改都是在线可见的,这体现了Google努力使生产力工具像文档和电子表格一样灵活用于协作。虽然 Loom 和 ClickUp 等其他服务也提供类似功能,但通过与 Gmail、Calendar、Docs 和其他 Workspace 产品的合作,Google在整合方面具有很大的优势。移动应用程序也在开发中,可以方便地在旅途中创建视频。 ... PC版: 手机版:

封面图片

谷歌将生成式人工智能引入 Google 地图

谷歌将生成式人工智能引入 Google 地图 当地时间2月1日,谷歌宣布推出使用生成式人工智能来发现地点的新方法。只需用户说出要寻找的内容 (无论是多么具体、独特或广泛),谷歌的大语言模型 (LLM) 就会分析 Google 地图上超过 2.5 亿个地点的详细信息以及来自超过 3 亿贡献者的社区的可信见解,从而快速提出去哪里的建议。这项早期访问实验将于本周在美国启动。

封面图片

Google推出人工智能图像生成工具TextFX

Google推出人工智能图像生成工具TextFX Google在一篇博文中写道:"ImageFX 专为实验和创意而设计,它可以让你通过简单的文字提示来创建图片,然后通过使用表现力芯片的新提示方式轻松修改图片。"Google声称,它已采取措施确保 TextFX 不会被以非预期的方式使用,例如通过添加"技术保障"来限制"有问题的输出",如暴力、攻击性和色情内容。TextFX 还为"指定人物"(可能是公众人物)设置了一个提示级过滤器尽管Google在其新闻材料中并没有特别明确这一点。"我们从一开始就对训练数据的安全性进行了投资,"Google说。"根据我们的人工智能原则,我们还进行了广泛的对抗性测试和红队合作,以识别和减少潜在的有害和有问题的内容"。作为一项额外的安全措施,Google在使用ImageFX制作的图片上标注了SynthID数字水印,据称这种数字水印对图片编辑和裁剪具有很强的抵御能力。Google在博文中继续介绍道:"SynthID 水印肉眼无法察觉,但可用于识别。通过'关于此图片'中增加的洞察力,当你在Google搜索或 Chrome 浏览器中看到一张图片时,你就会知道它是否可能是由Google的人工智能工具生成的。"你可以在Google用于人工智能实验项目的网络应用程序 AI Test Kitchen 中找到 ImageFX。Imagen 2 扩展在今天的相关新闻中,Google表示,从本周开始,它将把 Imagen 2 带到更多的产品和服务中,包括下一代人工智能搜索体验和人工智能托管服务 Vertex AI 系列。现在,Imagen 2 还支持Google广告中的文本到图片功能和Google GenAI 生产力产品套件 Workspace 中的 Duet AI,它已经进入了Google的 SGE(搜索生成体验)。SGE 于去年 10 月开始在Google图片搜索中为用户提供图片生成工具,现在则利用 Imagen 2 生成图片。用户可以输入一个提示,说明他们想要什么样的图片,SGE 会在 SGE 对话体验中直接返回四个结果。Imagen 2 的另一个样本在 Vertex AI 中,Imagen 2 可通过 API 提供给Google云客户。在其他地方,Imagen 2 现在可以通过Google的人工智能聊天机器人 Bard 调用。Google解释说:"有了Imagen 2,Bard可以理解简单或复杂的提示,这样你就可以生成一系列高质量的图像。只需输入一个描述比如'创建一个狗骑冲浪板的图像'Bard就会生成定制的、范围广泛的视觉图像,帮助你把想法变为现实。"Google仍未透露用于训练 Imagen 2 的数据,这并不令人意外。像Google这样的 GenAI 供应商是否可以在公开数据(甚至是受版权保护的数据)上训练模型,然后再将该模型商业化,这是一个未决的法律问题。相关诉讼正在法院审理中,供应商认为他们受到合理使用原则的保护。但尘埃落定尚需时日。与此同时,Google对此事保持沉默,以策安全。 ... PC版: 手机版:

封面图片

Google新型人工智能可将图像转化为可玩的小游戏

Google新型人工智能可将图像转化为可玩的小游戏 Google DeepMind 最近发布了一款人工智能模型 Genie,它可以利用静态图像制作小型互动游戏。Google表示,这项技术背后的基础可以促进其他应用,比如训练人工智能机器人。Genie是在大约 20 万小时的公开游戏画面(可能来自Google子公司 YouTube)基础上训练出来的。目前还不清楚使用它的人是否会与这些游戏的创作者发生版权纠纷。值得注意的是,人工智能不需要文本或动作标签来解释它所看到的内容,它只需通过视频帧来解读哪些元素应作为地形,哪些元素应作为可控制的头像。Genie还能解读图像中的三维深度,从而在游戏中模拟视差滚动。该工具可以根据绘画、草图、渲染图、照片和其他类型的图像构建小型视频游戏关卡。由于Genie可以处理它以前从未见过的图片,因此它还可以根据人工智能生成的内容构建环境,从而为使用一个人工智能的内容在另一个人工智能中创造新事物开辟了前景。不过,还有改进的余地。与其他人工智能模型一样,Genie也会产生幻觉。此外,最初的迭代版本只能记忆多达 16 个帧,这严重限制了它在保持一致的情况下构建关卡的大小。该模型 1fps 的运行速度也有很大的改进空间。为确保准确性,Genie 的初步演示侧重于复制 2D 平台游戏。不过,Google表示,可以训练它创建其他类型的游戏和虚拟内容。例如,Google表示,Genie 可以帮助更有效地训练某些机器人。使用人工模拟进行的训练只能提供有限的场景,而 Genie 可以构建更广泛的虚拟环境和对象,供机器人学习。通过进一步开发,Genie 可以将交互式布景变成生成式人工智能的下一个主要领域。目前,视频正成为人们关注的焦点,尤其是 OpenAI 在上个月推出了 Sora,它可以制作逼真的 60 秒 1080p 短片。不出所料,人工智能生成的视频并不完美,但它代表了该技术的重大飞跃。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人