OpenAI 推出文本到视频人工智能模型 Sora

OpenAI推出文本到视频人工智能模型Sora根据OpenAI的介绍博文,Sora能够创建"具有多个角色、特定运动类型以及主体和背景准确细节的复杂场景"。该公司还指出,该模型能够理解物体"在物理世界中的存在方式",还能"准确解释道具并生成表达生动情感的引人注目的角色"。该模型还能根据静态图像生成视频,以及在现有视频中填充缺失的帧或扩展视频。OpenAI的博文中包含的Sora生成的演示包括淘金热时期加利福尼亚州的空中场景、从东京火车内部拍摄的视频等。许多演示都有人工智能的痕迹--比如在一段博物馆的视频中,地板疑似在移动。OpenAI表示,该模型"可能难以准确模拟复杂场景的物理现象",但总体而言,演示结果令人印象深刻。几年前,像Midjourney这样的文本到图像生成器在模型将文字转化为图像的能力方面处于领先地位。但最近,视频技术开始飞速进步:Runway和Pika等公司都展示了自己令人印象深刻的文字转视频模型,而Google的Lumiere也将成为OpenAI在这一领域的主要竞争对手之一。与Sora类似,Lumiere也为用户提供了文字转换视频的工具,还能让用户通过静态图像创建视频。Sora目前只对"红队"人员开放,他们负责评估模型的潜在危害和风险。OpenAI还向一些视觉艺术家、设计师和电影制片人提供访问权限,以获得反馈意见。它指出,现有模型可能无法准确模拟复杂场景的物理现象,也可能无法正确解释某些因果关系。本月早些时候,OpenAI宣布将在其文本到图像工具DALL-E3中添加水印,但指出这些水印"很容易去除"。与其他人工智能产品一样,OpenAI将不得不面对人工智能逼真视频被误认为是真实视频的后果。...PC版:https://www.cnbeta.com.tw/articles/soft/1418385.htm手机版:https://m.cnbeta.com.tw/view/1418385.htm

相关推荐

封面图片

人工智能公司 OpenAI 向好莱坞推荐视频生成技术Sora

人工智能公司OpenAI向好莱坞推荐视频生成技术Sora人工智能公司OpenAI在好莱坞发起了魅力攻势,与派拉蒙、环球和华纳兄弟探索等主要电影公司举行了会议,展示其视频生成技术Sora,并缓解对人工智能模型将损害电影行业的担忧。据多位知情人士透露,首席执行官萨姆•奥尔特曼和首席运营官布拉德•莱特卡普在最近几天举行的会议上向电影行业巨头的高管们做了介绍。奥尔特曼和莱特卡普展示了Sora—一个新的生成式人工智能模型,能够根据简单的文字提示生成细节栩栩如生的视频。——

封面图片

人工智能初创公司 Runway 发布文本到视频模型 Gen-2

人工智能初创公司Runway发布文本到视频模型Gen-2Gen-2支持从文本到视频、图像到视频、文本+图像到视频各种场景,可以从几句用户提示中生成简短的视频片段。用户可通过Runway的加入Gen-2候补名单。Runway同时协助开发了开源图像生成模型StableDiffusion,比起拥有巨大资源的科技巨头,Runway只是一个45人团队的人工智能初创公司,这也反映着初创公司在生成式AI上的潜力有多么惊人。投稿:@ZaiHuabot频道:@TestFlightCN

封面图片

重磅: Open AI 正式推出文生视频模型 Sora

重磅:OpenAI正式推出文生视频模型Sora名为Sora视频模型突然降临,OpenAI目前提供的情报,所揭示的一些惊人能力:-Sora根据用户提示可以生成长达一分钟的视频,同时保持视觉质量。(在这部电影预告片的提示词,非常简介:讲述30岁的太空人头戴红色羊毛针织摩托车头盔的冒险故事,蓝天、盐碱沙漠、电影风格、35毫米胶片拍摄、色彩鲜明。)-Sora能够生成包含多个角色、特定运动类型以及主体和背景准确细节的复杂场景。-Sora将理解你。这意味着和Dall·E3有着类似的体验,它具有非凡的语言理解力。-Sora还能理解这些事物在物理世界中是如何存在的;换句话说,Sora理解关于世界如何通过知识和规律进行表征,这可能是重大突破之一。(Hans注,这并不代表它是完美理解世界)-Sora还能在单个生成的视频中创建多个镜头,准确地体现角色和视觉风格。-Sora是一种采取了Transformer架构的扩散模型,不仅能生成还能延长,让模型一次性预测多帧画面,确保主体一致性。-更多官方案例参考https://openai.com/sora安全方面的声明和步骤:OpenA正在与红队人员(错误信息、仇恨内容和偏见等领域的专家)合作,他们将对模型进行对抗性测试。还在开发一些工具来帮助检测误导性内容,例如检测分类器,它可以分辨出视频是由Sora生成的。OpenAI相信,从现实世界的使用中学习,是随着时间的推移创建和发布越来越安全的人工智能系统的重要组成部分。Text2Video的生态位差不多在去年这个时候,Runway所引爆的Text2Video相关的生态位开启了重构好莱坞的想象空间。不到一年Sora的横空出生,其必将带来难以想像的变革力量。这是山峰再一次的快速攀升。从多模态的深远意义来说,我强烈意识到OpenAI描述的野心:「Sora是能够理解和模拟现实世界的模型的基础,我们相信这种能力将是实现AGI的重要里程碑。」Invalidmedia:

封面图片

Sora 出世 人工智能将引领新一轮行业变革

Sora出世人工智能将引领新一轮行业变革2月16日凌晨,OpenAI公司发布最新“文生视频”大模型Sora,并附带发布了多条由Sora生成的视频,相较于目前“文生视频”业内主流的数秒钟版本,此次发布的Sora可以一次性生成一分钟的视频。Sora的发布毫无悬念地再次引发了整个市场的高度关注。有人认为Sora创新的模型架构为大模型的发展开辟了新道路,也有人认为Sora的推出让通用人工智能到来的日期大大提前,还有市场人士表示Sora的爆红与OpenAI高超的营销密不可分。可以预见的是,Sora的横空出世,无疑将促使人工智能引领新一轮行业变革。(上海证券报)

封面图片

Adobe探索与OpenAI合作 增加人工智能视频工具

Adobe探索与OpenAI合作增加人工智能视频工具Adobe周一表示,该公司正处于允许在其视频编辑软件中使用OpenAI等第三方生成的人工智能工具的早期阶段。Adobe的PremierePro应用程序广泛应用于电视和电影行业。该公司计划在今年为该软件添加基于人工智能的功能,例如用人工智能生成的物体填充场景中的某些部分,或者无需视频编辑人员繁琐的手工操作就能移除场景中的干扰因素。这两项功能都将依赖于Firefly,Adobe已经在其用于编辑静态图像的Photoshop软件中部署了这一人工智能模型。但Adobe周一也表示,它正在开发一种方法,让用户利用来自OpenAI以及初创公司Runway和PikaLabs的第三方工具,在PremierePro中生成和使用视频。Adobe的股价今年已经下跌了约20%,此举可以帮助其解决华尔街的担忧,即用于生成图像和视频的人工智能工具会使其核心业务面临风险。来源:格隆汇

封面图片

OpenAI 推出 AI 系统,将文本转换为逼真的视频

OpenAI推出AI系统,将文本转换为逼真的视频OpenAI公布了一种新的人工智能系统,该系统可以根据用户的文本提示创建逼真的视频,使其成为最新一家采用生成视频技术的人工智能公司。该公司周四在一篇博客文章中表示,这款名为Sora的人工智能系统可以快速制作长达一分钟的视频,这些视频可以呈现“具有多个角色、特定类型的动作、以及主题和背景的准确细节的复杂场景”。OpenAI首席执行官SamAltman表示,该工具最初将提供给“有限数量的创作者”。OpenAI还授予一个专家团队访问权限,该团队负责评估Sora的安全性,然后将其纳入公司的产品中。作为推出该产品的准备工作的一部分,OpenAI表示正在开发工具,以帮助检测视频是由Sora生成的。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人