AIGC变天？OpenAI推出文生视频模型Sora 官方合集来了

AIGC变天？OpenAI推出文生视频模型Sora 官方视频合集来了 Prompt: “Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.”美丽雪景中的东京城繁忙喧嚣。摄像机穿过繁忙的街道，跟随几个人享受美丽的雪景和在附近摊位购物。美丽的樱花瓣随风飘落，与雪花一起飞舞。Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.”几头巨大的羊毛猛犸象踏过雪地草甸，它们长长的羊毛皮毛在风中轻轻摆动，远处覆盖着雪的树木和戏剧性的雪顶山脉，午后的光线透过稀疏的云层和远处高悬的太阳创造出温暖的光芒，低角度的摄像机视角令人惊叹，以美妙的摄影技术捕捉这大型毛茸茸的哺乳动物，景深效果。Prompt: “A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.”一部电影预告，展现一个穿着红色羊毛编织摩托车头盔的30岁太空人的冒险，蓝天、盐沼、电影风格，使用35mm胶片拍摄，色彩鲜艳。Prompt: “A gorgeously rendered papercraft world of a coral reef, rife with colorful fish and sea creatures.”一个华丽渲染的纸艺世界珊瑚礁，充满了五彩缤纷的鱼类和海洋生物。Prompt: “Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. the art style is 3d and realistic, with a focus on lighting and texture. the mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with wide eyes and open mouth. its pose and expression convey a sense of innocence and playfulness, as if it is exploring the world around it for the first time. the use of warm colors and dramatic lighting further enhances the cozy atmosphere of the image.”动画场景特写一个短小毛茸茸的怪物跪在一根融化的红蜡烛旁。艺术风格为3D且逼真，专注于光照和质感。画面氛围充满了惊奇和好奇，当怪物睁大眼睛，张开嘴巴凝视着火焰时。它的姿势和表情传达出一种纯真和顽皮的感觉，仿佛它是第一次探索周围的世界。温暖的色彩和戏剧性的光照进一步增强了画面的舒适氛围。Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually. the street is damp and reflective, creating a mirror effect of the colorful lights. many pedestrians walk about.”一位时尚女士走在东京街头，街道充满了温暖的霓虹灯和动态的城市标志。她穿着黑色皮夹克，一条长红裙和黑色靴子，并携带一个黑色手提包。她戴着太阳镜和红色口红，自信而随意地行走。街道潮湿且能反射，创造出色彩斑斓灯光的镜面效果。许多行人来往。Prompt: A bicycle race on ocean with different animals as athletes riding the bicycles with drone camera view一场在海面上的自行车比赛，不同的动物作为运动员骑着自行车，无人机摄像机视角。Prompt: A instructional cooking session for homemade gnocchi hosted by a grandmother social media influencer set in a rustic Tuscan country kitchen with cinematic lighting由一位祖母社交媒体影响者主持的家庭自制意大利面食教学课程，设置在具有电影级照明的乡村托斯卡纳厨房中。Prompt: Two golden retrievers podcasting on top of a mountain两只金毛寻回犬在山顶上播客。Prompt: a futuristic drone race at sunset on the planet mars在火星上日落时分的未来派无人机比赛。纽约时报相关报道：OpenAI 公布新技术Sora，能即时生成令人瞩目的视频OpenAI, 一家位于旧金山的创业公司，最近推出了一项名为Sora的新技术。这项技术能够基于简短描述即时生成视频，展示了如同从好莱坞电影中提取出来的画面。Sora的演示视频包括毛茸茸的猛犸象在雪地中奔跑、怪物凝视融化的蜡烛，以及仿佛通过飞跃城市拍摄的东京街景等短片。作为ChatGPT聊天机器人和静态图像生成器DALL-E的背后公司，OpenAI正与包括Runway和大型科技巨头如Google及Meta（Facebook和Instagram的母公司）等在内的多家公司竞争，以改进这种即时视频生成技术。这项技术不仅可以加速经验丰富的电影制作人的工作，也可能完全取代经验较少的数字艺术家。然而，这项技术也可能成为在线虚假信息的快速且低成本的制作方式，使得网络上区分真实内容变得更加困难。华盛顿大学专门研究人工智能的教授Oren Etzioni表示：“我非常担心这类技术会影响一些竞争激烈的选举。”OpenAI将其新系统命名为Sora，取自日语中“天空”的意思，象征着无限的创造潜力。公司目前还未向公众发布Sora，因为它还在努力了解系统的潜在危险。相反，OpenAI正在与一小群学者和其他外部研究人员共享这项技术，这些人将对其进行“红队”测试，寻找可能的滥用方式。OpenAI正在对系统生成的视频加上水印，以标识这些视频是由AI生成的。但该公司承认这些水印可以被移除，且可能难以被察觉。Sora生成视频的方式是响应简短的描述，尽管视频可能令人印象深刻，但并不总是完美的，可能会包含奇怪和不合逻辑的图像。例如，该系统最近生成了一个人正在吃饼干的视频但饼干从未变小。随着DALL-E、Midjourney等静态图像生成器在过去几年的快速改进，它们现在生成的图像几乎与照片无法区分。这使得在线识别虚假信息变得更加困难，许多数字艺术家抱怨说，这让他们更难找到工作。密歇根州的电影概念艺术家Reid Southen表示：“当Midjourney在2022年首次推出时，我们都笑称‘哦，那很可爱’。现在，人们因为Midjourney而失去工作。” ... PC版：手机版：

在Telegram中查看

相关推荐

OpenAI 推出文本到视频人工智能模型 Sora

OpenAI 推出文本到视频人工智能模型 Sora 根据 OpenAI 的介绍博文，Sora 能够创建"具有多个角色、特定运动类型以及主体和背景准确细节的复杂场景"。该公司还指出，该模型能够理解物体"在物理世界中的存在方式"，还能"准确解释道具并生成表达生动情感的引人注目的角色"。该模型还能根据静态图像生成视频，以及在现有视频中填充缺失的帧或扩展视频。OpenAI 的博文中包含的 Sora 生成的演示包括淘金热时期加利福尼亚州的空中场景、从东京火车内部拍摄的视频等。许多演示都有人工智能的痕迹比如在一段博物馆的视频中，地板疑似在移动。OpenAI 表示，该模型"可能难以准确模拟复杂场景的物理现象"，但总体而言，演示结果令人印象深刻。几年前，像 Midjourney 这样的文本到图像生成器在模型将文字转化为图像的能力方面处于领先地位。但最近，视频技术开始飞速进步：Runway 和 Pika 等公司都展示了自己令人印象深刻的文字转视频模型，而Google的 Lumiere 也将成为 OpenAI 在这一领域的主要竞争对手之一。与 Sora 类似，Lumiere 也为用户提供了文字转换视频的工具，还能让用户通过静态图像创建视频。Sora 目前只对"红队"人员开放，他们负责评估模型的潜在危害和风险。OpenAI 还向一些视觉艺术家、设计师和电影制片人提供访问权限，以获得反馈意见。它指出，现有模型可能无法准确模拟复杂场景的物理现象，也可能无法正确解释某些因果关系。本月早些时候，OpenAI 宣布将在其文本到图像工具 DALL-E 3 中添加水印，但指出这些水印"很容易去除"。与其他人工智能产品一样，OpenAI 将不得不面对人工智能逼真视频被误认为是真实视频的后果。 ... PC版：手机版：

重磅： Open AI 正式推出文生视频模型 Sora

重磅： Open AI 正式推出文生视频模型 Sora 名为Sora 视频模型突然降临，Open AI 目前提供的情报，所揭示的一些惊人能力： - Sora 根据用户提示可以生成长达一分钟的视频，同时保持视觉质量。（在这部电影预告片的提示词，非常简介：讲述 30 岁的太空人头戴红色羊毛针织摩托车头盔的冒险故事，蓝天、盐碱沙漠、电影风格、35 毫米胶片拍摄、色彩鲜明。） - Sora 能够生成包含多个角色、特定运动类型以及主体和背景准确细节的复杂场景。 - Sora 将理解你。这意味着和Dall·E 3有着类似的体验，它具有非凡的语言理解力。 - Sora 还能理解这些事物在物理世界中是如何存在的；换句话说，Sora 理解关于世界如何通过知识和规律进行表征，这可能是重大突破之一。（Hans注，这并不代表它是完美理解世界） - Sora 还能在单个生成的视频中创建多个镜头，准确地体现角色和视觉风格。 - Sora 是一种采取了Transformer架构的扩散模型，不仅能生成还能延长，让模型一次性预测多帧画面，确保主体一致性。 - 更多官方案例参考安全方面的声明和步骤： Open A 正在与红队人员（错误信息、仇恨内容和偏见等领域的专家）合作，他们将对模型进行对抗性测试。还在开发一些工具来帮助检测误导性内容，例如检测分类器，它可以分辨出视频是由 Sora 生成的。 Open AI相信，从现实世界的使用中学习，是随着时间的推移创建和发布越来越安全的人工智能系统的重要组成部分。 Text 2 Video 的生态位差不多在去年这个时候，Runway 所引爆的 Text 2 Video相关的生态位开启了重构好莱坞的想象空间。不到一年 Sora 的横空出生，其必将带来难以想像的变革力量。这是山峰再一次的快速攀升。从多模态的深远意义来说，我强烈意识到 Open AI 描述的野心：「Sora 是能够理解和模拟现实世界的模型的基础，我们相信这种能力将是实现 AGI 的重要里程碑。」 Invalid media:

“OpenAI发布文字生成视频模型“Sora”，文字prompt生成，可以创建长达 60 秒的，其中包含高度详细的场景、

“OpenAI发布文字生成视频模型“Sora”，文字prompt生成视频，可以创建长达 60 秒的视频，其中包含高度详细的场景、复杂的摄像机运动以及充满活力情感的多个角色。” “DEMO Prompt: “Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.”” https://twitter.com/OpenAI/status/1758192957386342435 https://openai.com/sora by huburr from ibuki帰宅…

OpenAI 发布文生视频模型 Sora

OpenAI 发布文生视频模型 Sora 2月16日凌晨，OpenAI再次扔出一枚深水炸弹，发布了首个文生视频模型。Sora可以直接输出长达60秒的视频，并且包含高度细致的背景、复杂的多角度镜头，以及富有情感的多个角色。一位YouTube博主Paddy Galloway发表了对Sora的感想，他表示内容创作行业已经永远的改变了，并且毫不夸张。“我进入YouTube世界已经15年时间，但OpenAI刚刚的展示让我无言…动画师/3D艺术家们有麻烦了，素材网站将变得无关紧要，任何人都可以无壁垒获得难以置信的产品，内容背后的‘想法’和故事将变得更加重要。” 但Sora模型当前也存在弱点。OpenAI称它可能难以准确模拟复杂场景的物理原理，并且可能无法理解因果关系。例如，一个人可能咬了一口饼干后，饼干会没有咬痕，玻璃破碎的物理过程可能也无法被准确呈现。频道：@kejiqu 群组：@kejiquchat

奥尔特曼选取网友提示词用OpenAI新款大模型Sora生成视频

奥尔特曼选取网友提示词用OpenAI新款大模型Sora生成视频一位时髦女士漫步在东京街头，周围是温暖闪烁的霓虹灯和动感的城市标志。一名年约三十的宇航员戴着红色针织摩托头盔展开冒险之旅，电影预告片呈现其穿梭于蓝天白云与盐湖沙漠之间的精彩瞬间，独特的电影风格、采用35毫米胶片拍摄，色彩鲜艳。竖屏超近景视角下，这只蜥蜴细节拉满：OpenAI表示，公司正在教授人工智能理解和模拟运动中的物理世界，目标是训练出能够帮助人们解决需要与现实世界互动的问题的模型。在此，隆重推出文本到视频模型Sora。Sora可以生成长达一分钟的视频，同时保证视觉质量和符合用户提示的要求。OpenAI创始人兼CEOSam Altman（奥尔特曼）太会玩了，让网友评论回复Prompt（大语言模型中的提示词），他选一些用Sora生成视频。截至发稿，奥尔特曼连发多条根据网友提示词生成的视频，包括不同动物在海上进行自行车比赛、发布自制面疙瘩烹饪教学视频的祖母、两只金毛犬在山顶做播客、日落时分火星上进行的一场无人机竞赛等。但这些视频时长为9秒至17秒不等。技术层面，Sora采用扩散模型（diffusion probabilistic models）技术，基于Transformer架构，但为了解决Transformer架构核心组件注意力机制的长文本、高分辨率图像处理等问题，扩散模型用可扩展性更强的状态空间模型（SSM）主干替代了传统架构中的注意力机制，可以使用更少的算力，生成高分辨率图像。此前Midjourney与Stable Diffusion的图像与视频生成器同样基于扩散模型。同时，Sora也存在一定的技术不成熟之处。OpenAI表示，Sora可能难以准确模拟复杂场景的物理原理，可能无法理解因果关系，可能混淆提示的空间细节，可能难以精确描述随着时间推移发生的事件，如遵循特定的相机轨迹等。根据OpenAI关于Sora的技术报告《Video generation models as world simulators》（以下简称报告），跟大语言模型一样，Sora也有涌现的模拟能力。OpenAI方面在技术报告中表示，并未将Sora单纯视作视频模型，而是将视频生成模型作为“世界模拟器”，不仅可以在不同设备的原生宽高比直接创建内容，而且展示了一些有趣的模拟能力，如3D一致性、长期一致性和对象持久性等。目前Sora能够生成一分钟的高保真视频，OpenAI认为扩展视频生成模型是构建物理世界通用模拟器的一条有前途的途径。报告指出，OpenAI研究了在视频数据上进行大规模训练的生成模型。具体而言，联合训练了文本条件扩散模型，该模型可处理不同持续时间、分辨率和长宽比的视频和图像。OpenAI利用了一种基于时空补丁的视频和图像潜在代码的变压器架构。最大的模型Sora能够生成一分钟的高保真视频。结果表明，扩展视频生成模型是构建通用物理世界模拟器的有前途的途径。报告重点介绍了OpenAI将各类型视觉数据转化为统一表示的方法，这种方法能够对生成模型进行大规模训练，并对Sora的能力与局限进行定性评估。先前的大量研究已经探索了使用多种方法对视频数据进行生成建模，包括循环网络、生成对抗网络、自回归转换器和扩散模型。这些研究往往只关注于狭窄类别的视觉数据、较短的视频或固定大小的视频。而Sora是一个通用的视觉数据模型，它能够生成跨越不同时长、纵横比和分辨率的视频和图像，甚至能够生成长达一分钟的高清视频。OpenAI从大型语言模型中汲取灵感，这些模型通过训练互联网规模的数据获得通用能力。LLM范式的成功在一定程度上得益于令牌的使用，这些令牌巧妙地统一了文本的不同模式代码、数学和各种自然语言。在这项工作中，OpenAI考虑视觉数据的生成模型如何继承这些优势。虽然LLM有文本令牌，但Sora有视觉补丁。之前已经证明，补丁是视觉数据模型的有效表示。补丁是一种高度可扩展且有效的表示，可用于在多种类型的视频和图像上训练生成模型。Sora支持采样多种分辨率视频，包括1920x1080p的宽屏视频、1080x1920的竖屏视频以及介于两者之间的所有分辨率。这使得Sora能够直接以原生纵横比为不同的设备创建内容。同时，它还允许在生成全分辨率内容之前，使用相同的模型快速制作较小尺寸的内容原型。 ... PC版：手机版：

从 2 月 15 日 OpenAI 发布 Sora 模型到现在，官方一共发布了 85 个 demo 视频，其中官网 48 个，T

从 2 月 15 日 OpenAI 发布 Sora 模型到现在，官方一共发布了 85 个 demo 视频，其中官网 48 个，Tiktok 8 个， (Twitter) 29 个。这 85 个视频被我全部存档在了这里：包含每个视频的 prompt、prompt 中文翻译、原始链接、发布时间。由于 Sora 尚未正式对公众开放使用，可以粗略地认为，除了官方发布的视频之外，其余宣称是「Sora 生成」的视频大概率为伪造。在 Sora 正式对公众开放之前，这个数据库会尽可能保持更新。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人