周鸿祎称 Sora 工作原理像人做梦

周鸿祎称Sora工作原理像人做梦今日上午,360创始人、董事长周鸿祎发布视频分享自己对OpenAI最新的文生视频大模型Sora的见解,他写道:“Sora工作原理像人做梦,未来AGI比的就是算力和对世界的理解。”视频中,他讲到:“用传统计算机、图形学、影视工业特效的方法来重现一些画面的时候,我们喜欢的是3D件模型、建立光照、搞粒子模型、然后一帧一帧地渲染。这种方法实际上是效率非常低、耗费非常贵的。是用一种最笨的方法模拟出了这个世界。但Sora的方法非常像人类的做梦——我们会梦到各种奇奇怪怪的东西,做梦所产生的依据是我们在正常生活中眼睛看到的东西,这种积累的经验,是不需要3D建模然后一帧一帧渲染的。”他还把近期人们关注的Sora在视频中出现的Bug等比做人在做梦时同样会产生的幻觉等违背现实规律的情况。

相关推荐

封面图片

周鸿祎称Sora生成视频堪比CG:未做3D建模 只需文字就可逼真描绘

周鸿祎称Sora生成视频堪比CG:未做3D建模只需文字就可逼真描绘他认为,对比Pika和Runway是做不出这样效果的。Pika和Runbway实际上是基于图形图像本身的操作来进行生成。只是形成一种比较简单的计算机动画的效果。周鸿祎说:“即使是用常规呢计算机CG电影工业特效来看这三个画面,那也会非常难做,但是到了Sora这里,这些细节都会变得非常简单,只要给出一些文字的提示要求,就能逼真描绘出来”。他认为,Sora是没有做3D建模的。如果Sora也只是用3D建模再进行渲染,那么这和传统的电影工业走的是一样的路,这样就不具备颠覆性和革命性了。周鸿祎猜测Sora做到如此效果有三点原因:1、Sora模拟了人类观察、描绘、表现世界的方法。如果人类画师用笔画出来这三个场景,人类的大脑里不需要3D建模,因为人类对世界有基本认知。人类可以随意想象出自己要做的事,可以控制自己所想。2、Sora在学习的过程中,用了很多视频、电影的内容来作为训练输入。当输入一些画面,不仅要解读出画面的元素,还要解读出一些物理定律。openAI的论文中曾提到recaptioning技术,意思是对每一帧画面都能够用文字来描述。这点也正符合人类认知世界的方法。3、openAI产生了很多3D内容。不排除它用现在游戏引擎做了很多实时3D模型的渲染,再利用这些3D模型把更多的物理知识训练给Sora。周鸿祎表示,Sora是记录文生视频AIGC的工具,它反映了AI对世界的理解,是从文字进入图像,再从图像展示对这个世界3D模型的理解。...PC版:https://www.cnbeta.com.tw/articles/soft/1418931.htm手机版:https://m.cnbeta.com.tw/view/1418931.htm

封面图片

关于Sora,觉得周鸿祎分享的观点讲的很好,尤其是第四点:

关于Sora,觉得周鸿祎分享的观点讲的很好,尤其是第四点:大语言模型最牛的是,它不是填空机,而是能完整地理解这个世界的知识。这次很多人从技术上、从产品体验上分析Sora,强调它能输出60秒视频,保持多镜头的一致性,模拟自然世界和物理规律,实际这些都比较表象,最重要的是Sora的技术思路完全不一样,因为这之前我们做视频做图用的都是Diffusion,你可以把视频看成是多个真实图片的组合,它并没有真正掌握这个世界的知识。现在所有的文生图、文生视频都是在2D平面上对图形元素进行操作,并没有适用物理定律。但Sora产生的视频里,它能像人一样理解坦克是有巨大冲击力的,坦克能撞毁汽车,而不会出现汽车撞毁坦克这样的情况。所以我理解这次OpenAl利用它的大语言模型优势,把LLM和Diffusion结合起来训练,让Sora实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的,才能跳出2D的范围模拟真实的物理世界。这都是大模型的功劳。

封面图片

【周鸿祎:Sora 意味着 AGI实现将从10年缩短到1年】

【周鸿祎:Sora意味着AGI实现将从10年缩短到1年】对于OpenAI发布的首个视频生成模型Sora,2月16日,周鸿祎在微博表示,这次很多人从技术上、从产品体验上分析Sora,实际这些都比较表象,最重要的是Sora的技术思路完全不一样。周鸿祎表示,这次OpenAl利用大语言模型优势,把LLM和Diffusion结合起来训练,让Sora实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的,才能跳出2D的范围模拟真实的物理世界。这都是大模型的功劳。周鸿祎认为,OpenAl训练这个模型应该会阅读大量视频。一旦人工智能接上摄像头,把所有的电影都看一遍,把YouTube上和TikTok的视频都看一遍,对世界的理解将远远超过文字学习,一幅图胜过千言万语,而视频传递的信息量又远远超过一幅图,这就离AGI真的就不远了,不是10年20年的问题,可能一两年很快就可以实现。(全天候科技)

封面图片

【追赶Sora难在哪?周鸿祎回应:算力是问题,集中国内所有AI企业的算力或许是方法之一】

【追赶Sora难在哪?周鸿祎回应:算力是问题,集中国内所有AI企业的算力或许是方法之一】Sora火爆的当下,国内大模型企业如何追赶Sora,难点在哪儿?360集团创始人周鸿祎对此认为,Sora的技术路线如果被开源,国内将能很快赶上,但在追赶Sora时,算力有可能成为门槛,对此,集中国内所有AI企业的算力或许是方法之一。Sora视频分析对算力的消耗应该是远远超过千亿模型的。所以,当现在国内显卡都被卡脖子之后,算力就可能会是一个问题。“目前,Meta已经有50万块GPU,明年可能会买百万块,微软应该也会按照百万级别去下订单。而国内的所有人工智能公司加在一起可能有50万块GPU,但都分散在各个公司里。”(新京报)

封面图片

追赶 Sora 难在哪 周鸿祎回应:算力是问题 集中国内所有 AI 企业的算力或许是方法之一

追赶Sora难在哪周鸿祎回应:算力是问题集中国内所有AI企业的算力或许是方法之一Sora火爆的当下,国内大模型企业如何追赶Sora,难点在哪儿?360集团创始人周鸿祎对此认为,Sora的技术路线如果被开源,国内将能很快赶上,但在追赶Sora时,算力有可能成为门槛,对此,集中国内所有AI企业的算力或许是方法之一。Sora视频分析对算力的消耗应该是远远超过千亿模型的。所以,当现在国内显卡都被卡脖子之后,算力就可能会是一个问题。“目前,Meta已经有50万块GPU,明年可能会买百万块,微软应该也会按照百万级别去下订单。而国内的所有人工智能公司加在一起可能有50万块GPU,但都分散在各个公司里。”

封面图片

周鸿祎:推测 Sora 生成视频应没有靠 3D 建模训练 而是模拟人类智能

周鸿祎:推测Sora生成视频应没有靠3D建模训练而是模拟人类智能在抖音个人直播间中,360创始人周鸿祎表示对OpenAI文生视频应用Sora的逼真效果十分惊讶。据其推测,Sora生成逼真的视频背后应该没有靠3D建模训练。如果Sora也只用3D建模再进行渲染,那么这和传统的电影工业走的是一样的路。他认为,Sora应该是模拟人类智能理解真实世界规律,掌握了人类观察、描绘、表现世界的方法。人类的大脑里不需要3D建模,因为人类对真实世界的物理规律有基本认知,可以控制自己所想。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人