OpenAI 发布介绍 Sora，文本转视频模型

“OpenAI发布文字生成视频模型“Sora”，文字prompt生成，可以创建长达 60 秒的，其中包含高度详细的场景、

“OpenAI发布文字生成视频模型“Sora”，文字prompt生成视频，可以创建长达 60 秒的视频，其中包含高度详细的场景、复杂的摄像机运动以及充满活力情感的多个角色。” “DEMO Prompt: “Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.”” https://twitter.com/OpenAI/status/1758192957386342435 https://openai.com/sora by huburr from ibuki帰宅…

OPENAI发布从文本创建视频的AI模型

OPENAI发布从文本创建视频的AI模型当地时间周四，OPENAI宣布推出Sora，这是一种从文本创建视频的AI模型。可以根据文本提示创建现实且富有想象力的场景。Sora可以生成长达一分钟的视频，同时保持视觉质量并遵守用户的提示。、

OpenAI 推出文本到视频人工智能模型 Sora

OpenAI 推出文本到视频人工智能模型 Sora 根据 OpenAI 的介绍博文，Sora 能够创建"具有多个角色、特定运动类型以及主体和背景准确细节的复杂场景"。该公司还指出，该模型能够理解物体"在物理世界中的存在方式"，还能"准确解释道具并生成表达生动情感的引人注目的角色"。该模型还能根据静态图像生成视频，以及在现有视频中填充缺失的帧或扩展视频。OpenAI 的博文中包含的 Sora 生成的演示包括淘金热时期加利福尼亚州的空中场景、从东京火车内部拍摄的视频等。许多演示都有人工智能的痕迹比如在一段博物馆的视频中，地板疑似在移动。OpenAI 表示，该模型"可能难以准确模拟复杂场景的物理现象"，但总体而言，演示结果令人印象深刻。几年前，像 Midjourney 这样的文本到图像生成器在模型将文字转化为图像的能力方面处于领先地位。但最近，视频技术开始飞速进步：Runway 和 Pika 等公司都展示了自己令人印象深刻的文字转视频模型，而Google的 Lumiere 也将成为 OpenAI 在这一领域的主要竞争对手之一。与 Sora 类似，Lumiere 也为用户提供了文字转换视频的工具，还能让用户通过静态图像创建视频。Sora 目前只对"红队"人员开放，他们负责评估模型的潜在危害和风险。OpenAI 还向一些视觉艺术家、设计师和电影制片人提供访问权限，以获得反馈意见。它指出，现有模型可能无法准确模拟复杂场景的物理现象，也可能无法正确解释某些因果关系。本月早些时候，OpenAI 宣布将在其文本到图像工具 DALL-E 3 中添加水印，但指出这些水印"很容易去除"。与其他人工智能产品一样，OpenAI 将不得不面对人工智能逼真视频被误认为是真实视频的后果。 ... PC版：手机版：

OpenAI 发布文生视频模型 Sora

OpenAI 发布文生视频模型 Sora 2月16日凌晨，OpenAI再次扔出一枚深水炸弹，发布了首个文生视频模型。Sora可以直接输出长达60秒的视频，并且包含高度细致的背景、复杂的多角度镜头，以及富有情感的多个角色。一位YouTube博主Paddy Galloway发表了对Sora的感想，他表示内容创作行业已经永远的改变了，并且毫不夸张。“我进入YouTube世界已经15年时间，但OpenAI刚刚的展示让我无言…动画师/3D艺术家们有麻烦了，素材网站将变得无关紧要，任何人都可以无壁垒获得难以置信的产品，内容背后的‘想法’和故事将变得更加重要。” 但Sora模型当前也存在弱点。OpenAI称它可能难以准确模拟复杂场景的物理原理，并且可能无法理解因果关系。例如，一个人可能咬了一口饼干后，饼干会没有咬痕，玻璃破碎的物理过程可能也无法被准确呈现。频道：@kejiqu 群组：@kejiquchat

OpenAI的Sora AI视频应用将于2024年公开发布

OpenAI的Sora AI视频应用将于2024年公开发布到目前为止，OpenAI 只允许少数受邀用户试用 Sora，部分原因是公司希望确保使用的安全性。不过，OpenAI 的首席技术官米拉-穆拉提（Mira Murati）在接受《华尔街日报》采访时表示，目前的计划是在 2024 年晚些时候向公众推出 OpenAI。事实上，她说"可能还要几个月"才能公开发布 Sora。人们对 Sora 以及所有基于文本提示的人工智能工具的担忧之一，是其大型语言模型的数据来源。就 Sora 而言，Murati 说它使用了 OpenAI 从 Shutterstock 获得授权的内容。不过，她拒绝透露更多数据来源，称这些数据来自"公开或授权数据"。目前，Sora 只能创建无声视频，而且在创建过程中不能对这些剪辑进行编辑。穆拉提确实说过，OpenAI 正在努力为 Sora 的剪辑添加音频和编辑工具。目前，还没有消息表明 OpenAI 将向公众收取多少使用 Sora 的费用。据 Murati 称，OpenAI 希望将 Sora 的定价与其 DALL-E 3 AI 艺术创作者的定价类似。不过，米拉补充说，Sora 在功能和支持方面对 OpenAI 来说"要昂贵得多"。当然，OpenAI 最大的财务和开发合作伙伴是微软，微软已将其 Chat-GPT 和 DALL-E 模型纳入其 Copilot 服务。就在 Sora 发布之后，有人问微软 X（前 Twitter）广告和网络服务主管 Mikhail Parakhin，Sora 是否也会加入 Copilot。帕拉金回答说："最终会的，但这需要时间"。 ... PC版：手机版：

OpenAI的Sora视频生成模型也能用来渲染游戏

OpenAI的Sora视频生成模型也能用来渲染视频游戏这篇题为《作为世界模拟器的视频生成模型》（Video generation models as world simulators）的论文由多位 OpenAI 研究人员共同撰写，揭开了 Sora 架构关键方面的神秘面纱例如，Sora 可以生成任意分辨率和长宽比（最高 1080p）的视频。根据论文所述，Sora 能够执行一系列图像和视频编辑任务，从创建循环视频、向前或向后延伸视频到更改现有视频的背景。但最吸引笔者的还是 Sora"模拟数字世界"的能力，OpenAI 的合著者如是说。在一次实验中，OpenAI 将 Sora 放到 Minecraft 上，让它在控制玩家的同时渲染世界及其动态（包括物理）。Sora 在 Minecraft 中控制一名玩家，并渲染视频游戏世界，请注意，颗粒感是由视频到 GIF 的转换工具造成的，而不是 Sora。图片来源：OpenAIOpenAI那么，Sora 是如何做到这一点的呢？正如 NVIDIA 高级研究员 Jim Fan（通过 Quartz）所说，与其说 Sora 是一个创意引擎，不如说它是一个"数据驱动的物理引擎"。它不仅能生成单张照片或视频，还能确定环境中每个物体的物理特性，并根据这些计算结果渲染照片或视频（或交互式 3D 世界，视情况而定）。合著者写道："这些功能表明，继续扩展视频模型是开发物理和数字世界以及其中的物体、动物和人的高能力模拟器的一条大有可为的途径。"现在，Sora在视频游戏领域也有其通常的局限性。该模型无法准确模拟玻璃碎裂等基本互动的物理过程。即使在可以建模的互动中，Sora 也经常出现不一致的情况，例如在渲染一个人吃汉堡时，却无法渲染汉堡上的咬痕。不过，如果我没看错的话，Sora 似乎可以为更逼真（甚至可能是逼真）的程序生成游戏铺平道路。这既令人兴奋，又令人恐惧（考虑到Deepfake的影响）这也许就是为什么 OpenAI 选择暂时将 Sora 关在一个非常有限的访问程序后面的原因。相关文章:OpenAI 推出文本到视频人工智能模型 SoraOpenAI首个视频生成模型发布能生成长达1分钟的高清视频 ... PC版：手机版：

相关推荐

“OpenAI发布文字生成视频模型“Sora”，文字prompt生成，可以创建长达 60 秒的，其中包含高度详细的场景、

OPENAI发布从文本创建视频的AI模型

OpenAI 推出文本到视频人工智能模型 Sora

OpenAI 发布文生视频模型 Sora

OpenAI的Sora AI视频应用将于2024年公开发布

OpenAI的Sora视频生成模型也能用来渲染游戏