周鸿祎谈视频模型Sora：未必短期能击败TikTok，但中美AI差距将进一步拉大

周鸿祎谈视频模型Sora：未必短期能击败TikTok，但中美AI差距将进一步拉大据新浪科技，360董事长周鸿祎谈到了人工智能企业OpenAI今天发布的文字转视频模型Sora。周鸿祎表示，Sora对短视频行业有巨大的颠覆，但未必能那么快击败TikTok，更多是创作力工具。此外，他认为，中美两国的人工智能差距在拉大。来源：格隆汇

在Telegram中查看

相关推荐

周鸿祎谈Sora模型：中美AI差距可能还在加大

周鸿祎谈Sora模型：中美AI差距可能还在加大周鸿祎表示，AI不一定那么快颠覆所有行业，但它能激发更多人的创作力。今天 Sora 可能给广告业、电影预告片、短视频行业带来巨大的颠覆，但它不一定那么快击败 TikTok，更可能成为 TikTok的创作工具。同时，周鸿祎还谈到中美AI差距，他认为：OpenAl手里应该还藏着一些秘密武器，无论是 GPT-5，还是机器自我学习自动产生内容，包括 AIGC。他们手里的武器并没有全拿出来。这样看来中国跟美国的 AI 差距可能还在加大。以下为全文：Sora意味着 AGI实现将从10年缩短到1年年前我在风马牛演讲上分享了大模型十大趋势预测，没想到年还没过完，就验证了好几个从 Gemini、英伟达的 Chat With RTX到 OpenA!发布 Sora，大家都觉得很炸裂。朋友问我怎么看 Sora，我谈几个观点，总体来说就是我认为AGI很快会实现，就这几年的事儿了:第一，科技竞争最终比拼的是让人才密度和深厚积累。很多人说 Sora的效果吊打 Pika和Runway。这很正常，和创业者团队比OpenAl 这种有核心技术的公司实力还是非常强劲的。有人认为有了 AI以后创业公司只需要做个体户就行，实际今天再次证明这种想法是非常可笑的。第二，AI不一定那么快颠覆所有行业，但它能激发更多人的创作力。今天很多人谈到 Sora 对影视工业的打击，我倒不觉得是这样，因为机器能生产一个好视频，但视频的主题、脚本和分镜头策划、台词的配合，都需要人的创意至少需要人给提示词。一个视频或者电影是由无数个 60 秒组成的。今天 Sora 可能给广告业、电影预告片、短视频行业带来巨大的颠覆，但它不一定那么快击败 TikTok，更可能成为 TikTok的创作工具。第三，我一直说国内大模型发展水平表面看已经接近 GPT-3.5 了，但实际上跟 4.0 比还有一年半的差距。而且我相信 OpenAl手里应该还藏着一些秘密武器，无论是 GPT-5，还是机器自我学习自动产生内容，包括 AIGC。奥特曼是个营销大师，知道怎样掌握节奏，他们手里的武器并没有全拿出来。这样看来中国跟美国的 AI 差距可能还在加大。第四，大语言模型最牛的是，它不是填空机，而是能完整地理解这个世界的知识。这次很多人从技术上、从产品体验上分析Sora，强调它能输出 60 秒视频，保持多镜头的一致性，模拟自然世界和物理规律，实际这些都比较表象，最重要的是 Sora 的技术思路完全不一样。因为这之前我们做视频做图用的都是 Diffusion，你可以把视频看成是多个真实图片的组合，它并没有真正掌握这个世界的知识。现在所有的文生图、文生视频都是在 2D 平面上对图形元素进行操作，并没有适用物理定律。但 Sora 产生的视频里，它能像人一样理解坦克是有巨大冲击力的，坦克能撞毁汽车，而不会出现汽车撞毁坦克这样的情况。所以我理解这次 OpenAl 利用它的大语言模型优势，把LLM 和 Diffusion 结合起来训练，让 Sora 实现了对现实世界的理解和对世界的模拟两层能力，这样产生的视频才是真实的，才能跳出 2D 的范围模拟真实的物理世界。这都是大模型的功劳。这也代表未来的方向。有强劲的大模型做底子，基于对人类语言的理解，对人类知识和世界模型的了解，再叠加很多其他的技术，就可以创造各个领域的超级工具，比如生物医学蛋白质和基因研究，包括物理、化学、数学的学科研究上，大模型都会发挥作用。这次 Sora对物理世界的模拟，至少将会对机器人具身智能和自动驾驶带来巨大的影响。原来的自动驾驶技术过度强调感知层面，而没有工作在认知层面。其实人在驾驶汽车的时候，很多判断是基于对这个世界的理解。比如对方的速度怎么样，能否发生碰撞，碰撞严重性如何，如果没有对世界的理解就很难做出一个真正的无人驾驶。所以这次 Sora 只是小试牛刀，它展现的不仅仅是一个视频制作的能力，它展现的是大模型对真实世界有了理解和模拟之后，会带来新的成果和突破。第五，Open Al训练这个模型应该会阅读大量视频。大模型加上 Diffusion 技术需要对这个世界进行进一步了解，学习样本就会以视频和摄像头捕捉到的画面为主。一旦人工智能接上摄像头，把所有的电影都看一遍，把YouTube 上和 TikTok 的视频都看一遍，对世界的理解将远远超过文字学习，一幅图胜过千言万语，而视频传递的信息量又远远超过一幅图，这就离AGI真的就不远了，不是10年20年的问题，可能一两年很快就可以实现。 ... PC版：手机版：

周鸿祎将推出免费AI培训课程:李一舟不该收费

周鸿祎将推出免费AI培训课程:李一舟不该收费 “李一舟最大的问题是不该对相关课程收费，应该免费”，周鸿祎直言。同时他还透露，自己将推出免费的AI培训课程，为用户做更多的AI科普。根据此前报道，李一舟自称是“清华博士”的大V，其推出的199元AI课程，已在短视频平台上吸引到上百万的粉丝。有数据显示，李一舟售卖的AI课名为《每个人的人工智能课》，一年内卖出约25万套，销售额约5000万。此消息一出就登上热搜，网友的评论褒贬不一。而此次周鸿祎直接表态“李一舟不该收费”，也证明他对此事持反对意见。实际上，周鸿祎对AI有很多自己的理解。他在个人微博上不止一次谈到AI，尤其是近期很火的Sora模型。据悉，Sora是美国人工智能研究公司OpenAI发布的人工智能文生视频大模型，可以根据用户的文本提示创建最长60秒的逼真视频，能理解用户在提示中提出的要求。他认为Sora模型意味着 AGI将实现从10年缩短到1年。AI不一定那么快颠覆所有行业，但它能激发更多人的创作力。此外他还强调，今天Sora可能给广告业、电影预告片、短视频行业带来巨大的颠覆，但它不一定那么快击败TikTok，更可能成为TikTok的创作工具。由此可见，周鸿祎若真推出AI课程，或许会为用户普及到更多的AI知识。 ... PC版：手机版：

周鸿祎称Sora生成视频堪比CG：未做3D建模只需文字就可逼真描绘

周鸿祎称Sora生成视频堪比CG：未做3D建模只需文字就可逼真描绘他认为，对比Pika和Runway是做不出这样效果的。Pika和Runbway实际上是基于图形图像本身的操作来进行生成。只是形成一种比较简单的计算机动画的效果。周鸿祎说：“即使是用常规呢计算机CG电影工业特效来看这三个画面，那也会非常难做，但是到了Sora这里，这些细节都会变得非常简单，只要给出一些文字的提示要求，就能逼真描绘出来”。他认为，Sora是没有做3D建模的。如果Sora也只是用3D建模再进行渲染，那么这和传统的电影工业走的是一样的路，这样就不具备颠覆性和革命性了。周鸿祎猜测Sora做到如此效果有三点原因：1、Sora模拟了人类观察、描绘、表现世界的方法。如果人类画师用笔画出来这三个场景，人类的大脑里不需要3D建模，因为人类对世界有基本认知。人类可以随意想象出自己要做的事，可以控制自己所想。2、Sora在学习的过程中，用了很多视频、电影的内容来作为训练输入。当输入一些画面，不仅要解读出画面的元素，还要解读出一些物理定律。openAI的论文中曾提到recaptioning技术，意思是对每一帧画面都能够用文字来描述。这点也正符合人类认知世界的方法。3、openAI产生了很多3D内容。不排除它用现在游戏引擎做了很多实时3D模型的渲染，再利用这些3D模型把更多的物理知识训练给Sora。周鸿祎表示，Sora是记录文生视频AIGC的工具，它反映了AI对世界的理解，是从文字进入图像，再从图像展示对这个世界3D模型的理解。 ... PC版：手机版：

360周鸿祎：GPT一定会产生意识不担心“失业潮”

360周鸿祎：GPT一定会产生意识不担心“失业潮” 在2023数字安全发展与高峰论坛上，三六零创始人周鸿祎谈到，GPT未来一定会产生意识。（它）产生意识并不可怕，可怕的是它还在持续的自我进化，能力不断的更新。我们需要做到让其安全可控。周鸿祎认为，“GPT是场新工业革命，其意义超越了互联网、iPhone的发明。”未来每个行业、企业、个人都会拥有定制化GPT。在场景化、工程化、产品化、商业化方面，中国拥有优势，有能力发展自己的人工智能大语言模型。但中国的大语言模型距离GPT-4有两到三年的差距，需要更多的宽容和耐心。周鸿祎还表示，对于人工智能将带来“失业潮”他持乐观态度。

关于Sora，觉得周鸿祎分享的观点讲的很好，尤其是第四点：

关于Sora，觉得周鸿祎分享的观点讲的很好，尤其是第四点：大语言模型最牛的是，它不是填空机，而是能完整地理解这个世界的知识。这次很多人从技术上、从产品体验上分析 Sora，强调它能输出 60 秒视频，保持多镜头的一致性，模拟自然世界和物理规律，实际这些都比较表象，最重要的是 Sora 的技术思路完全不一样，因为这之前我们做视频做图用的都是 Diffusion，你可以把视频看成是多个真实图片的组合，它并没有真正掌握这个世界的知识。现在所有的文生图、文生视频都是在 2D 平面上对图形元素进行操作，并没有适用物理定律。但 Sora 产生的视频里，它能像人一样理解坦克是有巨大冲击力的，坦克能撞毁汽车，而不会出现汽车撞毁坦克这样的情况。所以我理解这次 OpenAl 利用它的大语言模型优势，把LLM 和 Diffusion 结合起来训练，让 Sora 实现了对现实世界的理解和对世界的模拟两层能力，这样产生的视频才是真实的，才能跳出 2D 的范围模拟真实的物理世界。这都是大模型的功劳。

周鸿祎暴论：sora有什么了不起？只要敢开源，我就能追上！

周鸿祎暴论：sora有什么了不起？只要敢开源，我就能追上！之前看过周鸿祎的一些采访，他的发言和神情让人生理不适，当时不清楚为什么，现在想来应该是他身上的那种支味恶心到我了。这个B近两年也做不出来什么产品，就靠着暴论引起大家讨论，我在此祝周大老板出门掉进下水道淹死，也算是为民除害了。开源了几十年丑国终于想开了不养虎为患了，丑国你开你马勒戈壁的源，一开源支那傻逼码畜就老鼠上桌得意

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人