Sora 生成的 27 秒的视频,提示词理解也很好,右下角那个水印的动效非常漂亮。

Sora 生成的 27 秒的视频,提示词理解也很好,右下角那个水印的动效非常漂亮。 提示:画面中,一只橙白相间的虎斑猫在茂密的花园里欢快地穿行,仿佛在追逐着什么。它的眼神中充满了喜悦,小跑着,一边观察着周围的树枝、花朵和叶子。它穿梭在狭窄的小径上,穿行于繁茂的植被间。整个场景从贴近地面的角度拍摄,紧跟着这只猫,营造出一种低角度但亲密的视觉效果。画面呈现出电影级的温暖色调和细腻的质感,透过树叶和植物间隙洒下的斑驳阳光与猫的橙色毛皮形成了迷人的对比。每个画面都清晰锐利,具有浅景深的效果,让观众感觉仿佛置身其间。

相关推荐

封面图片

: Sora 生成的 27 秒的视频,提示词理解也很好,右下角那个水印的动效非常漂亮。…

封面图片

一套非常简单的提示词效果却意外的好,可以生成八九十年代的电影质感照片,而且里面的人物装扮也非常复古和到位,MJ V6 真是太强大

一套非常简单的提示词效果却意外的好,可以生成八九十年代的电影质感照片,而且里面的人物装扮也非常复古和到位,MJ V6 真是太强大了,对画面氛围装扮和照片质感的把握都非常好。 把第一个逗号前面的提示词换掉就行,可以是中国道士,可以是刀客,也可以是将军女侠。 提示词: Chinese swordsman wearing robe and hat, DVD screengrab, 1980s fantasy cinema, ar 9:16 style raw

封面图片

震撼!牛逼!OpenAI 发布了 Sora,一种文字生成视频的技术,从演示看,效果还是相当不错的。

震撼!牛逼!OpenAI 发布了 Sora,一种文字生成视频的技术,从演示看,效果还是相当不错的。 Sora 的强大之处在于其能够根据文本描述,生成长达 60 秒的视频,其中包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。 目前,Sora已对网络安全的红队成员开放,以评估其可能存在的风险或潜在伤害。同时,OpenAI 也邀请了视觉艺术家、设计师和电影制作人使用Sora,收集他们的反馈,以使模型更好地服务于创意行业。 Sora能够创造出包含多个角色、特定动作类型以及与主题和背景相符的详细场景。这款模型不仅能理解用户的指令,还能洞察这些元素在现实世界中的表现。 Sora对语言有着深刻的理解,能够精准地捕捉到用户的需求,并创造出充满生命力、情感丰富的角色。此外,Sora还能在同一视频中创造出多个画面,同时保持角色和视觉风格的一致性。 当然,Sora还不是完美的。比如在模拟复杂场景的物理效应,以及理解某些特定因果关系时,它可能会遇到难题。举个例子,视频中的人物可能会咬一口饼干,但饼干上可能看不到明显的咬痕。 在处理空间细节,比如分辨左右时,Sora也可能会出现混淆;在精确描述一段时间内发生的事件,如特定的摄影机移动轨迹时,也可能显得力不从心。 - 视频二提示词:一位时髦的女士穿行在东京的街头,街道充满了温暖的霓虹灯光和动感的城市标志。她穿着一件黑色皮夹克,一条长红裙和黑色靴子,手拿一个黑色手提包。她戴着太阳镜和红色口红。她走路既自信又随意。街道潮湿且能反射,创造出彩色灯光的镜面效果。许多行人来来往往。 产品地址:

封面图片

Sora炸裂科技圈:真神还是焦虑制造机?

Sora炸裂科技圈:真神还是焦虑制造机? ▲图:主角出场镜头拉近,可以清晰看到小美修长的脖子和优美的下颌线,让整个画面充满了令人无法抗拒的神秘和美感。▲图:细节展示实际上,整个短视频中,从街景到行人,包括小美,在现实中根本不存在。这是OpenAI最新产品Sora制作的演示视频,而正是这个视频,让周鸿祎做出了AGI发展将会10倍提速的预言。传统方式制作这样一段1分钟的视频成本非常高。除了需要选址,选演员,提前进行分镜构图,架设机位外等,想要碰上如此理想的天气,还需要赌一赌运气。落日转瞬即逝,一旦失误就只能第二天重头来过。拍摄完成后,是非常耗时的后期制作。不仅要调整画面色调,还要仔细核对画面中是否有瑕疵,比如眼镜反射的画面会不会导致穿帮、路人中是否出现不协调元素等等。但Sora出马,全部流程就是(字面意义上的)一句话的事。Sora官网上公布了十几段“制作”精良的高清演示短片, 从现实人物到3D动画,所有短片都是通过一句话生成的。▲图:Sora展示视频看过这些短片后,我科技圈的朋友集体表示“炸裂”;大众圈的朋友表示“AI都到了这种程度了吗”;而摄影圈的朋友表示,尽管还是能看出和人类摄影师有一点点差距,但依然被Sora的效果震撼了,进而纷纷开始和我讨论起失业以后,除了送外卖还可以从事什么工作。但如果我们抛开网上铺天盖地、对Sora近乎玄幻的赞誉,跳出官网演示视频的魅惑就会发现,Sora本质上是生成式AI在视频领域的一个应用,一个diffusion transformer模型。而官方宣传的Sora所有功能,例如通过文字或者图片生成高清短视频,在此基础上进行扩展生成一段更长的视频等,其实很多公司都在做。比较知名的产品包括已经商用的Runway,免费的Pika,以及还在完善阶段的Google Lumiere、Meta Make-A-Video,还有一些知名度稍低的产品如Leonardo,FinalFrame等等。这里就有一个很大的疑问:凭什么出圈的又是Sora,它真有网上说的那么神吗?凭借更逼真的效果OpenAI再次出圈1月24日,Google研究人员公布了一段Lumiere的演示视频。画质非常高清,且真实。▲图:由Lumiere生成的游泳海龟视频Lumiere除了可以生成真实图片外,还可以实现一键换装、根据图片和提示词生成动态视频等功能。▲图:一键换装▲图:通过图片生成视频2月15日,刚刚过完情人节的Google在疯狂星期四又重磅推出了下一代AI产品Gemini 1.5。在此前的演示视频中,Gemini已经展现了其在图像识别和多轮对话中的逆天能力。演示视频中,演示人员画了一个类似鸭子的轮廓让Gemini辨认,Gemini表示它觉得像个鸟。▲图:Gemini演示但是当演示人员画上了波浪后,Gemini表示通过长脖子长嘴又会游泳这几个依据,判断这是只鸭子。▲图:Gemini演示随后演示人员拿了个玩具小鸭子问Gemini这个东西是什么材质做的,Gemini表示看起来可能是橡胶也可能是塑料。而当演示人员捏响橡胶鸭子后,Gemini立刻判断出是用柔软的橡胶做成的。▲图:Gemini演示就在圈内很多人认为Google将要凭借Lumiere和Gemini拿下今年头条的时候,OpenAI仅仅用Sora就轻松获得了更高的关注度。Sora这个词很有意思,它在韩语中表示海螺壳,在日语中表示天空,在芬兰语中表示砂砾。这就很难不让人想到《海底两万里》的鹦鹉螺号,《沙丘》,以及“我们的目标是星辰大海”的豪情壮志。而且Sora是一个比较常见的名字,比Lumiere(法语,光)更短、更好读。和GPT当年的故事如出一辙,Sora也是踩着竞争对手以碾压式的优势胜出。相比同类产品,Sora能抓住提示词的精髓,巧妙地生成具有多个角色和特定动作的场景。有人做过对比,使用同样的提示词,让AI生成一个在花园里、似乎正在追逐什么东西、快乐奔跑的黄白相间的猫,最终结果的差距十分明显。▲图:不同AI产品的效果对比上面由Sora生成的视频看起来非常真实,甚至在奔跑时候,猫腮帮子上的毛都会随着脑袋起伏。而下面通过Pika, Runway, Leonardo, FinalFrame生成的视频,猫不仅看起来不像真的,连动作都很诡异。在生成的视频时长上,Sora也碾压友商。Sora可以生成1分钟的视频,相对的,Pika是3秒,Runway是4秒,Lumiere是5秒。最重要的是,Sora有望解决一个生成式AI的痛点,那就是同样的提示词通常不会生成同样的结果,例如“黄白相间的猫”这个提示词,不同的视频里会出现不同模样的黄白相间的猫。导致的结果,就是无法通过拼接来创作更长的视频。尽管Sora一出道就秀出了远超同行的肌肉,但Sora并没有选择像Pika、Runway一样,开放给大众使用,而是采取了Google、Meta类似的保守策略,先官宣来吊足大家胃口,然后慢慢内测,等待一个合适的时机,再向大众开放。因为,有很多关键问题,大家都没有找到好的解决方案。AI一调皮人类就头疼生成式AI天生就有一个“不按物理定律出牌”的老毛病,即便是看起来已经非常接近真实世界的Sora也不例外。这个问题过于明显,以至于OpenAI都懒得去遮掩,干脆自己先大方的说了出来。从内测用户流出的视频可以发现,Sora无视物理法则随意发挥的意愿十分高涨,而这种意愿在“必须还原物理世界”的规则约束下,很容易生成像人类做梦一样的场景。有过做梦经历的朋友应该会这样的体会:明明梦是虚幻的,但在梦里你的感受又很“真实”。下面就是个很典型的例子。▲图:Sora的梦境物理注意看,视频中的这个杯子莫名其妙的跳了起来并侧翻在桌面上,杯中的液体在杯子跳起来的一瞬间穿透了杯底铺满桌面,而最终杯子连同里面剩余的液体一起,融进了桌面。▲图:融进桌面的杯子这样的视频显然无法应用在正式的场合,大概率只能出现在B站的鬼畜区,告诉你一个学了3年动画的人,是如何因为一个毕业作品被老师轰出门外的故事。此外,Sora对算力有很高的要求。下面这个视频演示了低算力和高算力之间的差距能有多可怕。▲图:算力差距而想要高算力,就得花更多的钱。以Runway为例,个人版收费模式分3档,标准版为每月15美元,可以制作一个125秒的Gen-1视频,或者44秒的Gen-2视频,相当于每秒1-2.4元人民币,超出部分需要额外付费。Pro版每月35美元,至尊版每月95美元。而用户如果希望加快视频的产出效率,也需要额外购买“时间”。能力越大危险越大生成式AI在社会层面有几个老生常谈的问题。首先就是造假问题。AI生成的视频越真实,造假就越容易。最直接的解决办法是将AI生成的内容打上一个特殊的标签,以便于平台将其和人工拍摄的视频进行区分,OpenAI和Google的确也在做这件事。但水印的问题在于,它可以在分享的过程中会被人恶意抹除。例如通过截图、录屏的方式获得视频副本,不会带有任何水印。其次是版权问题。版权问题比造假更加复杂,它既是一个形而上的宏大概念,又和每一个创作者的个人利益息息相关。目前对版权的争论主要集中在AI和人类对齐的过程中,比如,AI通过学习别的艺术家的风格在此基础上进行的创作,和人类以同样方式进行的创作,本质上有没有区别?而更直白的问题则是,AI到底是来帮我赚钱的,还是来跟我抢钱呢?这些问题一个比一个难解决,也就意味着Sora们至少在短时间内不会向公众开放。从某种角度来看,这或许对于视频制作者是一个好消息,至少有了更多的缓冲时间,来思考如何应对接下来Sora们带来的冲击。无论如何,Sora们向公众开放,只是时间问题,至于会不会像周鸿祎预言的那么快,可能还存在疑问。但有一点毫无疑问:那时候的Sora们,... PC版: 手机版:

封面图片

AIGC变天?OpenAI推出文生视频模型Sora 官方合集来了

AIGC变天?OpenAI推出文生视频模型Sora 官方视频合集来了 Prompt:  “Beautiful, snowy Tokyo city is bustling. The camera moves through the  bustling city street, following several people enjoying the beautiful  snowy weather and shopping at nearby stalls. Gorgeous sakura petals are  flying through the wind along with snowflakes.”美丽雪景中的东京城繁忙喧嚣。摄像机穿过繁忙的街道,跟随几个人享受美丽的雪景和在附近摊位购物。美丽的樱花瓣随风飘落,与雪花一起飞舞。Prompt:  “Several giant wooly mammoths approach treading through a snowy meadow,  their long wooly fur lightly blows in the wind as they walk, snow  covered trees and dramatic snow capped mountains in the distance, mid  afternoon light with wispy clouds and a sun high in the distance creates  a warm glow, the low camera view is stunning capturing the large furry  mammal with beautiful photography, depth of field.”几头巨大的羊毛猛犸象踏过雪地草甸,它们长长的羊毛皮毛在风中轻轻摆动,远处覆盖着雪的树木和戏剧性的雪顶山脉,午后的光线透过稀疏的云层和远处高悬的太阳创造出温暖的光芒,低角度的摄像机视角令人惊叹,以美妙的摄影技术捕捉这大型毛茸茸的哺乳动物,景深效果。Prompt:  “A movie trailer featuring the adventures of the 30 year old space man  wearing a red wool knitted motorcycle helmet, blue sky, salt desert,  cinematic style, shot on 35mm film, vivid colors.”一部电影预告,展现一个穿着红色羊毛编织摩托车头盔的30岁太空人的冒险,蓝天、盐沼、电影风格,使用35mm胶片拍摄,色彩鲜艳。Prompt: “A gorgeously rendered papercraft world of a coral reef, rife with colorful fish and sea creatures.”一个华丽渲染的纸艺世界珊瑚礁,充满了五彩缤纷的鱼类和海洋生物。Prompt:  “Animated scene features a close-up of a short fluffy monster kneeling  beside a melting red candle. the art style is 3d and realistic, with a  focus on lighting and texture. the mood of the painting is one of wonder  and curiosity, as the monster gazes at the flame with wide eyes and  open mouth. its pose and expression convey a sense of innocence and  playfulness, as if it is exploring the world around it for the first  time. the use of warm colors and dramatic lighting further enhances the  cozy atmosphere of the image.”动画场景特写一个短小毛茸茸的怪物跪在一根融化的红蜡烛旁。艺术风格为3D且逼真,专注于光照和质感。画面氛围充满了惊奇和好奇,当怪物睁大眼睛,张开嘴巴凝视着火焰时。它的姿势和表情传达出一种纯真和顽皮的感觉,仿佛它是第一次探索周围的世界。温暖的色彩和戏剧性的光照进一步增强了画面的舒适氛围。Prompt:  “A stylish woman walks down a Tokyo street filled with warm glowing  neon and animated city signage. she wears a black leather jacket, a long  red dress, and black boots, and carries a black purse. she wears  sunglasses and red lipstick. she walks confidently and casually. the  street is damp and reflective, creating a mirror effect of the colorful  lights. many pedestrians walk about.”一位时尚女士走在东京街头,街道充满了温暖的霓虹灯和动态的城市标志。她穿着黑色皮夹克,一条长红裙和黑色靴子,并携带一个黑色手提包。她戴着太阳镜和红色口红,自信而随意地行走。街道潮湿且能反射,创造出色彩斑斓灯光的镜面效果。许多行人来往。Prompt: A bicycle race on ocean with different animals as athletes riding the bicycles with drone camera view一场在海面上的自行车比赛,不同的动物作为运动员骑着自行车,无人机摄像机视角。Prompt:  A instructional cooking session for homemade gnocchi hosted by a  grandmother social media influencer set in a rustic Tuscan country  kitchen with cinematic lighting由一位祖母社交媒体影响者主持的家庭自制意大利面食教学课程,设置在具有电影级照明的乡村托斯卡纳厨房中。Prompt: Two golden retrievers podcasting on top of a mountain两只金毛寻回犬在山顶上播客。Prompt: a futuristic drone race at sunset on the planet mars在火星上日落时分的未来派无人机比赛。纽约时报相关报道:OpenAI 公布新技术Sora,能即时生成令人瞩目的视频OpenAI,   一家位于旧金山的创业公司,最近推出了一项名为Sora的新技术。这项技术能够基于简短描述即时生成视频,展示了如同从好莱坞电影中提取出来的画面。Sora的演示视频包括毛茸茸的猛犸象在雪地中奔跑、怪物凝视融化的蜡烛,以及仿佛通过飞跃城市拍摄的东京街景等短片。作为ChatGPT聊天机器人和静态图像生成器DALL-E的背后公司,OpenAI正与包括Runway和大型科技巨头如Google及Meta(Facebook和Instagram的母公司)等在内的多家公司竞争,以改进这种即时视频生成技术。这项技术不仅可以加速经验丰富的电影制作人的工作,也可能完全取代经验较少的数字艺术家。然而,这项技术也可能成为在线虚假信息的快速且低成本的制作方式,使得网络上区分真实内容变得更加困难。华盛顿大学专门研究人工智能的教授Oren Etzioni表示:“我非常担心这类技术会影响一些竞争激烈的选举。”OpenAI将其新系统命名为Sora,取自日语中“天空”的意思,象征着无限的创造潜力。公司目前还未向公众发布Sora,因为它还在努力了解系统的潜在危险。相反,OpenAI正在与一小群学者和其他外部研究人员共享这项技术,这些人将对其进行“红队”测试,寻找可能的滥用方式。OpenAI正在对系统生成的视频加上水印,以标识这些视频是由AI生成的。但该公司承认这些水印可以被移除,且可能难以被察觉。Sora生成视频的方式是响应简短的描述,尽管视频可能令人印象深刻,但并不总是完美的,可能会包含奇怪和不合逻辑的图像。例如,该系统最近生成了一个人正在吃饼干的视频但饼干从未变小。随着DALL-E、Midjourney等静态图像生成器在过去几年的快速改进,它们现在生成的图像几乎与照片无法区分。这使得在线识别虚假信息变得更加困难,许多数字艺术家抱怨说,这让他们更难找到工作。密歇根州的电影概念艺术家Reid Southen表示:“当Midjourney在2022年首次推出时,我们都笑称‘哦,那很可爱’。现在,人们因为Midjourney而失去工作。” ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人