【OpenAI推出AI系统,将文本转换为逼真的视频】

【OpenAI推出AI系统,将文本转换为逼真的视频】 OpenAI公布了一种新的人工智能系统,该系统可以根据用户的文本提示创建逼真的视频,使其成为最新一家采用生成视频技术的人工智能公司。该公司周四在一篇博客文章中表示,这款名为Sora的人工智能系统可以快速制作长达一分钟的视频,这些视频可以呈现“具有多个角色、特定类型的动作、以及主题和背景的准确细节的复杂场景”。OpenAI首席执行官Sam Altman表示,该工具最初将提供给“有限数量的创作者”。

相关推荐

封面图片

OpenAI 推出文本到视频人工智能模型 Sora

OpenAI 推出文本到视频人工智能模型 Sora 根据 OpenAI 的介绍博文,Sora 能够创建"具有多个角色、特定运动类型以及主体和背景准确细节的复杂场景"。该公司还指出,该模型能够理解物体"在物理世界中的存在方式",还能"准确解释道具并生成表达生动情感的引人注目的角色"。该模型还能根据静态图像生成视频,以及在现有视频中填充缺失的帧或扩展视频。OpenAI 的博文中包含的 Sora 生成的演示包括淘金热时期加利福尼亚州的空中场景、从东京火车内部拍摄的视频等。许多演示都有人工智能的痕迹比如在一段博物馆的视频中,地板疑似在移动。OpenAI 表示,该模型"可能难以准确模拟复杂场景的物理现象",但总体而言,演示结果令人印象深刻。几年前,像 Midjourney 这样的文本到图像生成器在模型将文字转化为图像的能力方面处于领先地位。但最近,视频技术开始飞速进步:Runway 和 Pika 等公司都展示了自己令人印象深刻的文字转视频模型,而Google的 Lumiere 也将成为 OpenAI 在这一领域的主要竞争对手之一。与 Sora 类似,Lumiere 也为用户提供了文字转换视频的工具,还能让用户通过静态图像创建视频。Sora 目前只对"红队"人员开放,他们负责评估模型的潜在危害和风险。OpenAI 还向一些视觉艺术家、设计师和电影制片人提供访问权限,以获得反馈意见。它指出,现有模型可能无法准确模拟复杂场景的物理现象,也可能无法正确解释某些因果关系。本月早些时候,OpenAI 宣布将在其文本到图像工具 DALL-E 3 中添加水印,但指出这些水印"很容易去除"。与其他人工智能产品一样,OpenAI 将不得不面对人工智能逼真视频被误认为是真实视频的后果。 ... PC版: 手机版:

封面图片

ChatGPT 所有者 OpenAI 推出工具来检测人工智能生成的文本

ChatGPT 所有者 OpenAI 推出工具来检测人工智能生成的文本 ================== “在我们对英语文本的‘挑战集’的评估中,我们的分类器正确地将 26% 的人工智能写的文本(真阳性)识别为‘可能是人工智能写的’,而将人类写的文本错误地标记为人工智能写的占 9%(假阳性),”OpenAI 员工写道 ======= 对抗训练是吧

封面图片

Google推出Lumiere生成式AI 可基于文本提示创建逼真的图像和视频

Google推出Lumiere生成式AI 可基于文本提示创建逼真的图像和视频 这听起来可能并不令人印象深刻,但有了最新的生成式人工智能工具的帮助,我们就能走得更远,创造出令人惊叹的作品。Lumiere 还使用扩散概率模型来帮助生成图像。这与时空 U-Net 相结合。对于那些不了解的人来说,U-Net 是一种架构,它能带来时间上的放大和缩小,以及添加到图像中的注意力区块。最棒的是,这种新的生成式人工智能工具可以与许多其他模型一起使用,这将有助于创建比我们之前看到的任何图像和视频都更加逼真的图像和视频。Lumiere 可用于创建以下内容:电影胶片将图像的单一部分制作成动画动画视频中的一个物体可以被另一个物体取代风格化生成:任何创作的艺术风格都可以改变为其他风格图像到视频:帮助制作任何所需图像的动画视频到视频:允许用户创建不同艺术风格的视频在撰写本文时,Lumiere创建的视频长度最长仅为 5 秒,而且还不具备创建视频转换和多角度摄像的功能。另外值得注意的是,如果你想试用 Lumiere,仅靠标准 GPU 是不行的。PC本身必须有强大的图形处理能力,否则该工具根本无法运行。访问试用: ... PC版: 手机版:

封面图片

OpenAI推出将文本转换为视频的AI系统Sora

封面图片

Meta的新AI功能可以将文字提示变成视频

Meta的新AI功能可以将文字提示变成视频 虽然效果相当粗糙,但该系统让人们看到了人工智能在该领域的未来步伐,它是今年引起广泛关注的文本到图像人工智能系统的明显进步。 Meta公司宣布的Make-A-Video尚未向公众开放,这可能会促使其他人工智能实验室发布自己的版本。这也提出了一些重大的道德问题。 仅在上个月,人工智能实验室OpenAI就向所有人提供了其最新的文本-图像人工智能系统DALL-E,而人工智能初创公司Stability.AI则推出了稳定的开源的文本-图像系统。 但文本到视频的AI伴随着一些更大的挑战。首先,这些模型需要大量的计算能力。它们比大型文本到图像的人工智能模型的计算量还要大,后者使用数百万张图像进行训练,因为仅仅拼凑一个短视频就需要数百张图像。这意味着在可预见的未来,只有大型科技公司才有能力建立这些系统。它们的训练也比较棘手,因为没有大规模的高质量视频与文本配对的数据集。

封面图片

亚马逊宣布推出“Bedrock”AI 平台以对抗 OpenAI

亚马逊宣布推出“Bedrock”AI 平台以对抗 OpenAI 亚马逊周四宣布,它正在为企业发布一个名为Amazon Bedrock的人工智能平台,它将在生成人工智能领域与 OpenAI 和其他公司的企业产品展开竞争。 Bedrock 是一套生成式人工智能工具,可以帮助亚马逊网络服务客户在亚马逊数据服务器上运行业务的企业构建聊天机器人、生成和总结文本,以及根据提示制作和分类图像。 Bedrock 用户可以通过从一系列被称为“基础模型”的机器学习模型中进行选择来执行特定任务,例如,内容营销经理可以使用 Bedrock 通过为其提供数据来为新的手袋系列创建有针对性的广告活动,这样它就可以为每个产品生成产品社交媒体帖子、展示广告。 Amazon 的生成式 AI 工具包的预览目前仅限于特定的 AWS 客户。据亚马逊称,到目前为止,优步和纽约时报等公司使用的人工智能文档生成公司 Coda 正在使用 Bedrock 来扩展其业务运营。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人