后续面对sora或者类sora的强大工具,我们怎么思考/怎么使用/或者要求我们具备什么样的能力?

后续面对sora或者类sora的强大工具,我们怎么思考/怎么使用/或者要求我们具备什么样的能力?昨天上午写prompt时产生的想法在使用时,我会反倒觉得不应该把他们当作纯工具:他们应该是共同协作完成目标项目的partner,要让他们参与创作其中。如果是纯工具心态,你对自己的能力要求是我怎么才能更好地驾驭它、使用它,我如何讲好一个故事告诉他去执行;但Gen-AI是可以理解学习的,反倒在使用时应该适当留白,少点约束,即很核心的是如何平衡规范性与创造性

相关推荐

封面图片

重磅: Open AI 正式推出文生视频模型 Sora

重磅:OpenAI正式推出文生视频模型Sora名为Sora视频模型突然降临,OpenAI目前提供的情报,所揭示的一些惊人能力:-Sora根据用户提示可以生成长达一分钟的视频,同时保持视觉质量。(在这部电影预告片的提示词,非常简介:讲述30岁的太空人头戴红色羊毛针织摩托车头盔的冒险故事,蓝天、盐碱沙漠、电影风格、35毫米胶片拍摄、色彩鲜明。)-Sora能够生成包含多个角色、特定运动类型以及主体和背景准确细节的复杂场景。-Sora将理解你。这意味着和Dall·E3有着类似的体验,它具有非凡的语言理解力。-Sora还能理解这些事物在物理世界中是如何存在的;换句话说,Sora理解关于世界如何通过知识和规律进行表征,这可能是重大突破之一。(Hans注,这并不代表它是完美理解世界)-Sora还能在单个生成的视频中创建多个镜头,准确地体现角色和视觉风格。-Sora是一种采取了Transformer架构的扩散模型,不仅能生成还能延长,让模型一次性预测多帧画面,确保主体一致性。-更多官方案例参考https://openai.com/sora安全方面的声明和步骤:OpenA正在与红队人员(错误信息、仇恨内容和偏见等领域的专家)合作,他们将对模型进行对抗性测试。还在开发一些工具来帮助检测误导性内容,例如检测分类器,它可以分辨出视频是由Sora生成的。OpenAI相信,从现实世界的使用中学习,是随着时间的推移创建和发布越来越安全的人工智能系统的重要组成部分。Text2Video的生态位差不多在去年这个时候,Runway所引爆的Text2Video相关的生态位开启了重构好莱坞的想象空间。不到一年Sora的横空出生,其必将带来难以想像的变革力量。这是山峰再一次的快速攀升。从多模态的深远意义来说,我强烈意识到OpenAI描述的野心:「Sora是能够理解和模拟现实世界的模型的基础,我们相信这种能力将是实现AGI的重要里程碑。」Invalidmedia:

封面图片

OpenAI的首席技术官Mira Murati在接受华尔街日报采访时对Sora的进行了详细介绍。| video

OpenAI的首席技术官MiraMurati在接受华尔街日报采访时对Sora的进行了详细介绍。发布时间:Sora目前还在开发和测试阶段,OpenAI计划在今年内的某个时间发布Sora,具体时间可能考虑到全球选举等因素,目前仍在打磨中,且正在进行外部测试,尤其关注电影行业的创作者。生成时间:关于生成视频的时间,720P分辨率或20秒长视频,生成时间大概在几分钟,这取决于提示的复杂性,这与传言中需要数个小时的说法不同,同时他们也在优化资源。目前视频没有声音,Sora未来可能会支持视频声效。数据来源:当被问及Sora训练的素材是否包括YouTube、Instagram和Facebook上的视频时,MiraMurati的回答是不确定的。她没有明确确认这些平台的视频是否被用作训练数据,称Sora的训练数据来自公开可用和授权的数据,最后结束后确认训练数据包括Shutterstock的内容。计算资源:Sora的生成过程相比于ChatGPT和DALI需要更多的计算资源,OpenAI致力于优化技术,降低成本,便于公众使用。安全性和可靠性:Sora目前正在进行红队测试(测试工具的安全性、可靠性和缺陷),以识别潜在的漏洞、偏见和其他有害问题。内容限制:与DALLE类似,Sora在生成内容时也会有一些限制,例如不生成公众人物的图像,以避免误导和滥用。裸露内容:关于裸露内容的处理,提到OpenAI正在与艺术家和创作者合作,以确定工具应该提供的灵活性水平和合理的限制,但没有具体提到如何区分艺术和色情的内容​​。正在研究对视频进行水印标记,但是相对一水印,视频内容的审核限制更为重要,因为随着生成的视频更加真实,用户将无法分辨视频内容的真实性,防止生成误导内容。

封面图片

2023,我们不得不面对ChatGPT引发的混乱

2023,我们不得不面对ChatGPT引发的混乱1月28日,美国“内幕”网站发表文章称,“ChatGPT才出现两个月,就已造成了难以言喻的混乱。”虽然ChatGPT诞生于去年,却有媒体把2023年视为ChatGPT元年。在我看来,这主要想说明,2023年将是人们不得不面对ChatGPT所引发混乱的一年。ChatGPT带来的惊喜与焦虑自诞生伊始,ChatGPT便受到了人们的狂热关注,各国注册者众多,但往往被告知“现在已经满负荷运转”而无法注册。历经月余,我终于在不久前注册成功,随后亲历的一些试验结果既令人惊喜和赞叹,也让我和诸多教育工作者一样感到担忧。我的一个体验是——用英文发出指令,“请写一首包含白雪与树林的(英文)诗歌”。在不到一分钟的时间,ChatGPT就给出了一首近乎完美的英文诗歌。我将其在朋友圈发布后,有许多英文系教授都深感惊喜,并赞叹“水平相当高!写得极好!太神奇了!”当然,ChatGPT的功能远不止于此。据“内幕”报告称,研究人员最近让ChatGPT通过了美国一项极其艰难的考试——美国医疗执照考试。该考试由三部分组成,报告称,ChatGPT“在没有任何培训或强化的情况下,所有三项考试成绩均达到或接近通过门槛”。这一成绩自然得到人们的夸赞。然而在称赞背后,人们应该看到ChatGPT之于学术界的焦虑与恐慌。事实上,在ChatGPT刚刚问世不久,很多人就感受到它给写作带来的巨大威胁。以《大西洋月刊》为例,它在ChatGPT诞生不到10天,便连续发表两篇颇有些耸人听闻的文章,一篇题为《大学中的论文已死》,一篇题为《高中英语的终结》。将两篇文章对照看,不难发现其所论述的是一回事儿,即从中学到大学,人们在语文教育与通识教育中一直训练学生掌握的写作本领已经走入死胡同。正如《大学中的论文已死》中所说,高校中的论文,尤其是本科生论文,长期作为人文教育的核心,是我们教育学生如何研究、思考和写作的方式。但是,人工智能的出现造成了整个传统即将被彻底颠覆的现象。《大学中的论文已死》一文还引述加拿大多伦多大学副教授凯文·布莱恩的话——他对ChatGPT的表现深感震惊,认为如此一来,自己就无法再给学生布置课外作业了。事实上,构建语言技术的工程师和语言教育工作者都没有为这一新生事物的出现及其后果做好准备。学术界仓促应战虽然几年前人们已经在谈人工智能时代的到来,但当ChatGPT如海啸般迎面砸来时,学术界基本上还是属于仓促应战。目前看,最主要的应对措施就是政策封堵、禁止使用或限制性使用。由于学校中已经出现学生使用AI生成的内容冒充个人作业,而人工智能造成的剽窃行为在当下的学术规则中很难得到证明,包括英国、法国、美国在内的诸多教育部门均出台政策,禁止在学校使用ChatGPT。当然,学术界受到的影响更大。1月26日,《科学》主编索普以社论的形式发表题为《ChatGPT很好玩,但不能成为作者》的文章,称在不到两个月的时间里,ChatGPT已经成为一种文化轰动,且对科学界和学术界造成严重影响。ChatGPT对撰写科学论文所带来的影响很令人担忧。他说,人们在最近的一项研究中发现,有大量由ChatGPT创建的论文摘要被提交给学术审稿人,但被发现比例不超过63%。他预计,今后这种由人工智能生成的文本将会更多。索普强调,多年来,《科学》系列期刊的作者会签署一份许可证,证明“该作品是原创的”。对于该刊来说,这足以表明ChatGPT所编写的文本是不可接受的——毕竟它是从ChatGPT中抄袭而来。索普说,我们现在正在更新编辑规则,强调不能在作品中使用由ChatGPT(或任何其他人工智能工具)所生成的文本,数字、图像或图形也不行。他特别强调,人工智能程序不能成为作者。如有违反,将构成科学不端行为,这与窜改图像或抄袭无异。在《科学》发表社论的前两天,《自然》也发表文章指出ChatGPT等工具威胁着科学的透明度,进而宣示该刊使用它们的基本规则,即任何人工智能工具都不会被接受为研究论文的署名作者,因为任何作者都承担着对所发表作品的责任,而人工智能工具无法做到这点。文章同时指出,如果研究人员使用了有关程序,应该在方法或致谢部分加以说明。包括《细胞》《柳叶刀》等在内的诸多科学类期刊也都发布了与此大体一致的规则。高校被迫修改反剽窃条例相比科学界,高校受到的影响更大。1月22日,美国斯坦福大学的《每日斯坦福》发表文章称,根据该报进行的一项非正式民意调查,有大量学生已经在期末考试中使用了ChatGPT。1月28日,《福布斯》发表文章称,“89%的学生承认使用ChatGPT做家庭作业,教育工作者正在与剽窃作斗争”。若想知道问题的严重性,不妨来看看《福布斯》对学生所做的详细调查。其中,48%的学生承认使用ChatGPT进行家庭测试或测验。53%的学生用它写了一篇论文,22%的学生用它写了一篇论文的大纲。72%的大学生认为ChatGPT应在他们的大学网络中被禁用。同时,在对ChatGPT有所了解的大学教授中,有72%的教授担心其用于作弊;超过1/3的教育工作者认为,ChatGPT应该在学校尤其是大学中被禁止,而66%的人支持学生使用它。学生之所以对此趋之若鹜,实在是因为ChatGPT的功能过于强大。根据美国宾夕法尼亚大学沃顿商学院MBA教授泰维奇的说法,ChatGPT在常青藤联盟MBA级别的运营管理考试中的表现能获得“B或B-”的成绩。据《华尔街日报》报道,美国犹他州韦伯州立大学的一位教授要求ChatGPT用他的声音写一条推文。几分钟内,该程序发出了十几条消息。这位教授对此的反应是,“天哪!这是有史以来最伟大的作弊工具。”由此,是否禁止ChatGPT真的成了人们需要面对的一个问题。当然,更多教师在思考该如何在自己的课程、学习指南中去部署阻止作弊的策略,并确保学生学会独立思考。美国一些高校已经将新技术纳入其学术诚信中。华盛顿大学和佛蒙特大学等已经修改了它们的学术诚信策略,将使用ChatGPT等人工智能工具纳入剽窃等学术不端范围。能否拓展使用当然,也有一些教师对ChatGPT的出现与发展持更积极的态度。据报道,宾夕法尼亚大学沃顿商学院副教授莫里克鼓励自己的学生使用ChatGPT。在他看来,“我们已经身处人工智能的世界,那就让我们分享人工智能的成果吧”。需要注意的是,莫里克在接受采访时说:“即使我不要求(他们使用ChatGPT),也可能无法阻止他们(去使用)。”这其中的无奈需要引起我们的关注。莫里克也承认,对于人工智能如何改变课堂评估,自己同样焦虑,但他认为教育工作者要与时俱进。他强调,当年高校曾经教学生如何在一个有计算器的世界里做数学,现在高校面临的挑战是要让学生意识到,世界再次发生变化,我们要教会他们怎样适应这种变化。赞同者中,有人持一个有趣的观点——目前专门校订英语写作中语法问题的人工智能程序Grammarly早已出现,既然人们可以使用它修改自己的语法、语汇等,为什么不能将ChatGPT视为此类程序的一种扩展呢?值得注意的是,近日,《美国高等教育纪事》发布公告,该报将与大学创新联盟主办网络会议,讨论“用于学生的人工智能工具”。该报指出,人工智能已经广泛应用于多个领域,但随着其进入高等教育,如何使其成为以学生为中心的使用工具?高校是否会采用人工智能已经不再是一个问题,现在关注的是如何合乎道德且高效地应用人工智能,改善学生的体验。希望教育领域、学术界和技术专家在此次会议上围绕高教机构如何从...PC版:https://www.cnbeta.com.tw/articles/soft/1342047.htm手机版:https://m.cnbeta.com.tw/view/1342047.htm

封面图片

299元卖Sora内测账号 中文互联网的创造力全拿来骗钱了

299元卖Sora内测账号中文互联网的创造力全拿来骗钱了某个自称清华博士的卖课博主,刷屏了我的朋友圈。他一门199元的AI入门课,光是在视频号里,就卖了520 多份,数量还在不断上涨。还有人扒出,这门AI课他一年售出25万套,销售额将近5000 万。在他Sora相关的视频下面,更是有人阴阳:唯一可以和奥特曼平起平坐的华人大神。不过,我去偌大的互联网逛了逛,发现比他离谱的,其实还多得是,网上已经有一大批人打着Sora 的噱头赚钱了。他们主要分成两派,一派是卖账号、另一派才是卖课,而且开口就要价99到999不等,主打的就是一个上不封顶。像是公众号上,卖账号的奇葩文章就层出不穷,比如号称“ 永久激活GPT-4.0+Sora”,任谁看了都想立马上车使用吧。结果我们点进去一看,发现就是个卖GPT接口的。嗯,全文除了标题带了Sora,基本跟Sora没有半毛钱关系。在某些个社交媒体平台上,也有人自称有内部渠道,可以搞到Sora的内测账号。我也立马找了个账号哥加了微信,结果,他直接就伸手要价299。然后张口闭口就是内部渠道没法儿换IP登录,所以我还是没法子上手,只能账号哥团队代测。但,这毕竟是Sora,代测也行吧。不过就在我要转账,准备见见世面的时候,他却突然说他们自己要研究,来不及帮我测了。虽然这次没损失钱,但总有一种被溜了的感觉。而如果说账号哥们主打一个瞒天过海,那么卖课哥们则是各显神通了。因为在Sora都还没开放试用的情况下,那些卖课哥,到底能教些啥?为了整明白,我这个老怨种也是花了99元大洋,入手了某付费平台上,用户数比较多的一门Sora课。仅仅一两天时间,这门课已经卖掉120 多份,上万大洋轻松到手。点进课程主页,那股子熟悉的淘金味儿是拉满了。什么 “ 做第一个吃鱼的人! ” 、 “ 最新一手资料,全网首发 ” 、 “ 今年最大的风口出现了...” 。这几句话一撩,谁能忍,立马转账付钱。当你兴冲冲付完,准备进来美美吃鱼的时候。它才话锋一转,跟你说:现在Sora还在内测,又说什么连账号还没开放注册,只有早期付费用户才能用,而且只有1000 名左右。但别担心,他也贴心承诺,一有账号,立马分享。好吧,账号是薅不到了,那我学点干货总行吧。结果,点开学习资料一看,发现怎么只是把官方几个案例和表述,英译中了一下,就丢进来了。一个33页的文档,有一半是官方案例翻译。一到真的得出干货的地方,就立马打马虎眼。比如怎么写提示词、怎么实操,就跟你说敬请关注。毕竟,人家根本就没上线,他们要是能拿得出实操就怪了。除了搬运官方案例之外,文档的另外一半,则全是互联网的现成文章,懒都赖得给你总结一下。好一个借别人的手,来赚自己钱。当然,咱自己也在反思,为啥我自己写的Sora文章,没被卖课哥们选上。看到这,你可能觉得我我这次是血本无归了。只能说且慢,因为这些卖课哥还真不把我当外人,他们把目前Sora能赚钱的法子,都分享了出来。只不过这些赚钱路子,都还挺刑的。其中有一条,就是让你也去卖课的。另外,就是让大家上架一个跟Sora很像的APP或者域名。然后,背后偷偷接入其他文生视频平台的接口,比如说Runway。说白了,就是挂羊头卖狗肉,把人先骗进来再说。等到Sora正式发布之后,再偷偷换回来。可以说是既骗到了流量和钱,又给自己留了退路。果然,越(bu )聪( yao )明( lian )的人,越能赚大钱。正当我我准备替大家继续挖挖,有没有更多路子的时候,课程却突然显示72小时之后才能查看。这是因为 72 小时之后,消费者就无法退款了。是的,全都是套路。而当消费者觉得这钱花的不值,在群里发牢骚:怎么又没账号,又没法下载,资料也不够的时候。就会有人跳出来,甩你一段经典发言:花钱只是给自己一个机会。总而言之,虽然 Sora 的官方应用啥时候公测还没个准信儿,但这帮卖课、搞诈骗的,显然已经 “ 遥遥领先 ” 了。也难怪,最后整得OpenAI官方的人都不得不出来辟谣:俺们还没有开放访问呢,大伙们别给骗了。其实,这波Sora掀起来的卖课风潮,可以理解。因为Sora刚问世,就创飞了Adobe,各种失业、下岗的声音又在普通人中间散播了一圈焦虑。图注:Adobe在Sora发布次日(2月16日 )股价暴跌7.41%再加上媒体们各种天花乱坠地夸,什么 “ 里程碑 ”“ 跨时代 ” 的词都用上了。在券商领域,国内那几家知名的证券公司也没有放过这一波热度,抢着发研报。所以气氛烘托到这,有些 “ 专家 ” 闻着味儿就来了。卖 GPT 课的时候,卖课哥还能给自己辩驳两下子,说这是知识付费,愿者买单。但 Sora 现在连产品都还不知道在哪,国内几乎也没有谁真正上手试用过,有些人还敢漫天要价,就真的是黑心的萝卜——坏透了。说实在的,这两年生成式AI的发展的确是上了高速,大伙儿都不想再错失上车的机会,这种技术迭代整得大家都挺焦虑的。如果是想学学怎么借AI来提高自己的工作效率,花点小钱省得自己摸黑瞎搞,其实无可厚非。但像Sora这种,可能内部还要迭代好几版才能落地的应用,咱们或许可以先观望看看。如果你实在想买,又不知道怎么分辨好坏,那我最后免费分享一条价值百元的心得:目前为止,看到说买课程就送内测账号的,跑就对了。最后,我有个大胆的猜测,奥特曼这会儿还没把Sora开放给大伙们使用,不会是刚买了Sora课,还没学完吧。( 手动狗头 )...PC版:https://www.cnbeta.com.tw/articles/soft/1419555.htm手机版:https://m.cnbeta.com.tw/view/1419555.htm

封面图片

Sora官方发布首支MV《Worldweight》

Sora官方发布首支MV《Worldweight》据了解,这首《Worldweight》的音乐是由艺术家AugustKamp作曲;而MV的画面内容,正是他借助Sora来完成的。用AugustKamp自己的话来说:“我心中的Worldweight,终于有了具象的视觉效果。”他回忆起两年前创作这首歌时的情景:当时我感受到了音乐的流淌,仿佛是我的心血和灵魂的流露。外面还下着雨,而我却幸运地能够将这些情感倾注到歌曲中,通过音乐将这些感觉保存下来。而现在随着Sora的出现,则成了一种将原本只存在于他闭眼时的想象,转化为可以与他人共享的艺术形式的方式。这并非是AugustKamp第一次用AIGC技术来制作MV。早在上个月,他就在自己的Instagram账号中剧透了AI生成的MV片段:CurrentTime 0:00/Duration 0:27自动播放同样的,这支MV片段的每一帧画面,都是由Sora生成。很多网友们在看到Sora制作出来的MV之后可谓是感慨万千,有人评价道:Sora好像把一觉睡了300年所经历的梦给复刻出来了。也有人觉得Sora做的MV(比梦)更加神奇和梦幻:跨次元的“电缆”终于出现了。嗯,Sora的这一波操作可以说是又赢麻了。不过有一说一,虽说AIGC在MusicVideo的“video”中好评如潮,但在“music”这件事上,画风却并非如此。欧美天后们联名抗议AIGC没错,和当年画家们抵制AIGC一样,乐坛也出现了如出一辙的事情。完整名单如下:在这次联名抗议的名单中,很多人都是当今全球顶流——麻辣鸡(NickiMinaj)、水果姐(KatyPerry)、碧梨(BillieEilish)等人都坐不住了。他们所签署的这封联名信是针对人工智能开发者、科技公司和数字平台,并要求:停止使用人工智能(AI)来侵犯和贬低人类艺术家的权利。艺术家们特别指出了目前存在一些问题,如:AI技术复制艺术家的声音未经补偿使用艺术家的作品来训练AI模型以及稀释支付给艺术家的版税池等等他们认为这些问题不仅损害了艺术家的经济利益,也对他们的创作自由和艺术价值构成了威胁。在这封信中,艺术家们呼吁科技和AI领域的合作伙伴们共同努力,建立一个负责任的市场环境,保持音乐的质量,而不是简单地用AI取代人类艺术家。艺术家们还强调,虽然人工智能在负责任的使用下可以促进人类的创造力,但目前一些平台和开发者的使用方式却是在破坏创造力和削弱艺术家、词曲作者、音乐家及其权利持有者的地位。例如在“AI复制艺术家声音”这件事上,现在只要在网上随便一搜,就能找到诸如下面这样的网站,可以轻松复刻水果姐的歌声:无独有偶,这种现象不仅是在国外,在国内也是频频发生。例如去年火上热搜的“AI孙燕姿”,就是典型的一个例子。除此之外,在做音乐这件最根儿上的事情,AI技术的发展也似乎给艺术家们带来了一定的冲击。例如前阵子爆火的音乐版ChatGPT——Suno就被玩疯了。直接拿菜名“宫保鸡丁”用AI做个音乐剧,就能登上全球AI音乐热门榜前十。可以听听效果:就连说唱歌手Rabbitdog,在听了第一句Suno生成的AI版《MadeinChina》之后,都直接蚌埠住了:简直顶爆了,下课,明天视频不再更了……在操作上也极其的简单,只需要输入风格、主题就能生成;如果输入歌词,AI还能唱起来~而且AI写歌、唱歌这事不仅是国外的技术火了,国内的技术也在路上了。例如就昨天,昆仑万维的天工SkyMusic也开始内测,功能正式的上线应该也快了,感兴趣的小伙伴也是可以蹲一波。OneMoreThing最后,回到MV这件事。流行音乐之王迈克尔杰克逊在1982年开创了现代MV,把流行音乐的MV水平推向了新的高潮。这是属于人类在创造和创意上的高光时刻。而现在,Sora和Suno等AIGC工具却在以另一种“硅基”的生成方式,同样也投入到了创作之中。仅仅42年时间,这一实一虚之间的变化,是有点意思了。参考链接:[1]https://www.youtube.com/watch?v=f75eoFyo9ns[2]https://www.instagram.com/p/C48t0IzvBTi/?hl=en[3]https://artistrightsnow.medium.com/200-artists-urge-tech-platforms-stop-devaluing-music-559fb109bbac[4]https://www.axios.com/2024/04/02/musicians-letter-ai-replace-artists...PC版:https://www.cnbeta.com.tw/articles/soft/1426061.htm手机版:https://m.cnbeta.com.tw/view/1426061.htm

封面图片

Sora炸裂科技圈:真神还是焦虑制造机?

Sora炸裂科技圈:真神还是焦虑制造机?▲图:主角出场镜头拉近,可以清晰看到小美修长的脖子和优美的下颌线,让整个画面充满了令人无法抗拒的神秘和美感。▲图:细节展示实际上,整个短视频中,从街景到行人,包括小美,在现实中根本不存在。这是OpenAI最新产品Sora制作的演示视频,而正是这个视频,让周鸿祎做出了AGI发展将会10倍提速的预言。传统方式制作这样一段1分钟的视频成本非常高。除了需要选址,选演员,提前进行分镜构图,架设机位外等,想要碰上如此理想的天气,还需要赌一赌运气。落日转瞬即逝,一旦失误就只能第二天重头来过。拍摄完成后,是非常耗时的后期制作。不仅要调整画面色调,还要仔细核对画面中是否有瑕疵,比如眼镜反射的画面会不会导致穿帮、路人中是否出现不协调元素等等。但Sora出马,全部流程就是(字面意义上的)一句话的事。Sora官网上公布了十几段“制作”精良的高清演示短片,从现实人物到3D动画,所有短片都是通过一句话生成的。▲图:Sora展示视频看过这些短片后,我科技圈的朋友集体表示“炸裂”;大众圈的朋友表示“AI都到了这种程度了吗”;而摄影圈的朋友表示,尽管还是能看出和人类摄影师有一点点差距,但依然被Sora的效果震撼了,进而纷纷开始和我讨论起失业以后,除了送外卖还可以从事什么工作。但如果我们抛开网上铺天盖地、对Sora近乎玄幻的赞誉,跳出官网演示视频的魅惑就会发现,Sora本质上是生成式AI在视频领域的一个应用,一个diffusiontransformer模型。而官方宣传的Sora所有功能,例如通过文字或者图片生成高清短视频,在此基础上进行扩展生成一段更长的视频等,其实很多公司都在做。比较知名的产品包括已经商用的Runway,免费的Pika,以及还在完善阶段的GoogleLumiere、MetaMake-A-Video,还有一些知名度稍低的产品如Leonardo,FinalFrame等等。这里就有一个很大的疑问:凭什么出圈的又是Sora,它真有网上说的那么神吗?凭借更逼真的效果OpenAI再次出圈1月24日,Google研究人员公布了一段Lumiere的演示视频。画质非常高清,且真实。▲图:由Lumiere生成的游泳海龟视频Lumiere除了可以生成真实图片外,还可以实现一键换装、根据图片和提示词生成动态视频等功能。▲图:一键换装▲图:通过图片生成视频2月15日,刚刚过完情人节的Google在疯狂星期四又重磅推出了下一代AI产品Gemini1.5。在此前的演示视频中,Gemini已经展现了其在图像识别和多轮对话中的逆天能力。演示视频中,演示人员画了一个类似鸭子的轮廓让Gemini辨认,Gemini表示它觉得像个鸟。▲图:Gemini演示但是当演示人员画上了波浪后,Gemini表示通过长脖子长嘴又会游泳这几个依据,判断这是只鸭子。▲图:Gemini演示随后演示人员拿了个玩具小鸭子问Gemini这个东西是什么材质做的,Gemini表示看起来可能是橡胶也可能是塑料。而当演示人员捏响橡胶鸭子后,Gemini立刻判断出是用柔软的橡胶做成的。▲图:Gemini演示就在圈内很多人认为Google将要凭借Lumiere和Gemini拿下今年头条的时候,OpenAI仅仅用Sora就轻松获得了更高的关注度。Sora这个词很有意思,它在韩语中表示海螺壳,在日语中表示天空,在芬兰语中表示砂砾。这就很难不让人想到《海底两万里》的鹦鹉螺号,《沙丘》,以及“我们的目标是星辰大海”的豪情壮志。而且Sora是一个比较常见的名字,比Lumiere(法语,光)更短、更好读。和GPT当年的故事如出一辙,Sora也是踩着竞争对手以碾压式的优势胜出。相比同类产品,Sora能抓住提示词的精髓,巧妙地生成具有多个角色和特定动作的场景。有人做过对比,使用同样的提示词,让AI生成一个在花园里、似乎正在追逐什么东西、快乐奔跑的黄白相间的猫,最终结果的差距十分明显。▲图:不同AI产品的效果对比上面由Sora生成的视频看起来非常真实,甚至在奔跑时候,猫腮帮子上的毛都会随着脑袋起伏。而下面通过Pika,Runway,Leonardo,FinalFrame生成的视频,猫不仅看起来不像真的,连动作都很诡异。在生成的视频时长上,Sora也碾压友商。Sora可以生成1分钟的视频,相对的,Pika是3秒,Runway是4秒,Lumiere是5秒。最重要的是,Sora有望解决一个生成式AI的痛点,那就是同样的提示词通常不会生成同样的结果,例如“黄白相间的猫”这个提示词,不同的视频里会出现不同模样的黄白相间的猫。导致的结果,就是无法通过拼接来创作更长的视频。尽管Sora一出道就秀出了远超同行的肌肉,但Sora并没有选择像Pika、Runway一样,开放给大众使用,而是采取了Google、Meta类似的保守策略,先官宣来吊足大家胃口,然后慢慢内测,等待一个合适的时机,再向大众开放。因为,有很多关键问题,大家都没有找到好的解决方案。AI一调皮人类就头疼生成式AI天生就有一个“不按物理定律出牌”的老毛病,即便是看起来已经非常接近真实世界的Sora也不例外。这个问题过于明显,以至于OpenAI都懒得去遮掩,干脆自己先大方的说了出来。从内测用户流出的视频可以发现,Sora无视物理法则随意发挥的意愿十分高涨,而这种意愿在“必须还原物理世界”的规则约束下,很容易生成像人类做梦一样的场景。有过做梦经历的朋友应该会这样的体会:明明梦是虚幻的,但在梦里你的感受又很“真实”。下面就是个很典型的例子。▲图:Sora的梦境物理注意看,视频中的这个杯子莫名其妙的跳了起来并侧翻在桌面上,杯中的液体在杯子跳起来的一瞬间穿透了杯底铺满桌面,而最终杯子连同里面剩余的液体一起,融进了桌面。▲图:融进桌面的杯子这样的视频显然无法应用在正式的场合,大概率只能出现在B站的鬼畜区,告诉你一个学了3年动画的人,是如何因为一个毕业作品被老师轰出门外的故事。此外,Sora对算力有很高的要求。下面这个视频演示了低算力和高算力之间的差距能有多可怕。▲图:算力差距而想要高算力,就得花更多的钱。以Runway为例,个人版收费模式分3档,标准版为每月15美元,可以制作一个125秒的Gen-1视频,或者44秒的Gen-2视频,相当于每秒1-2.4元人民币,超出部分需要额外付费。Pro版每月35美元,至尊版每月95美元。而用户如果希望加快视频的产出效率,也需要额外购买“时间”。能力越大危险越大生成式AI在社会层面有几个老生常谈的问题。首先就是造假问题。AI生成的视频越真实,造假就越容易。最直接的解决办法是将AI生成的内容打上一个特殊的标签,以便于平台将其和人工拍摄的视频进行区分,OpenAI和Google的确也在做这件事。但水印的问题在于,它可以在分享的过程中会被人恶意抹除。例如通过截图、录屏的方式获得视频副本,不会带有任何水印。其次是版权问题。版权问题比造假更加复杂,它既是一个形而上的宏大概念,又和每一个创作者的个人利益息息相关。目前对版权的争论主要集中在AI和人类对齐的过程中,比如,AI通过学习别的艺术家的风格在此基础上进行的创作,和人类以同样方式进行的创作,本质上有没有区别?而更直白的问题则是,AI到底是来帮我赚钱的,还是来跟我抢钱呢?这些问题一个比一个难解决,也就意味着Sora们至少在短时间内不会向公众开放。从某种角度来看,这或许对于视频制作者是一个好消息,至少有了更多的缓冲时间,来思考如何应对接下来Sora们带来的冲击。无论如何,Sora们向公众开放,只是时间问题,至于会不会像周鸿祎预言的那么快,可能还存在疑问。但有一点毫无疑问:那时候的Sora们,...PC版:https://www.cnbeta.com.tw/articles/soft/1419351.htm手机版:https://m.cnbeta.com.tw/view/1419351.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人