周鸿祎谈视频模型Sora:未必短期能击败TikTok,但中美AI差距将进一步拉大

周鸿祎谈视频模型Sora:未必短期能击败TikTok,但中美AI差距将进一步拉大 据新浪科技,360董事长周鸿祎谈到了人工智能企业OpenAI今天发布的文字转视频模型Sora。周鸿祎表示,Sora对短视频行业有巨大的颠覆,但未必能那么快击败TikTok,更多是创作力工具。此外,他认为,中美两国的人工智能差距在拉大。 来源:格隆汇

相关推荐

封面图片

周鸿祎谈Sora模型:中美AI差距可能还在加大

周鸿祎谈Sora模型:中美AI差距可能还在加大 周鸿祎表示,AI不一定那么快颠覆所有行业,但它能激发更多人的创作力。今天 Sora 可能给广告业、电影预告片、短视频行业带来巨大的颠覆,但它不一定那么快击败 TikTok,更可能成为 TikTok的创作工具。同时,周鸿祎还谈到中美AI差距,他认为:OpenAl手里应该还藏着一些秘密武器,无论是 GPT-5,还是机器自我学习自动产生内容,包括 AIGC。他们手里的武器并没有全拿出来。这样看来中国跟美国的 AI 差距可能还在加大。以下为全文:Sora意味着 AGI实现将从10年缩短到1年年前我在风马牛演讲上分享了大模型十大趋势预测,没想到年还没过完,就验证了好几个从 Gemini、英伟达的 Chat With RTX到 OpenA!发布 Sora,大家都觉得很炸裂。朋友问我怎么看 Sora,我谈几个观点,总体来说就是我认为AGI很快会实现,就这几年的事儿了:第一,科技竞争最终比拼的是让人才密度和深厚积累。很多人说 Sora的效果吊打 Pika和Runway。这很正常,和创业者团队比OpenAl 这种有核心技术的公司实力还是非常强劲的。有人认为有了 AI以后创业公司只需要做个体户就行,实际今天再次证明这种想法是非常可笑的。第二,AI不一定那么快颠覆所有行业,但它能激发更多人的创作力。今天很多人谈到 Sora 对影视工业的打击,我倒不觉得是这样,因为机器能生产一个好视频,但视频的主题、脚本和分镜头策划、台词的配合,都需要人的创意至少需要人给提示词。一个视频或者电影是由无数个 60 秒组成的。今天 Sora 可能给广告业、电影预告片、短视频行业带来巨大的颠覆,但它不一定那么快击败 TikTok,更可能成为 TikTok的创作工具。第三,我一直说国内大模型发展水平表面看已经接近 GPT-3.5 了,但实际上跟 4.0 比还有一年半的差距。而且我相信 OpenAl手里应该还藏着一些秘密武器,无论是 GPT-5,还是机器自我学习自动产生内容,包括 AIGC。奥特曼是个营销大师,知道怎样掌握节奏,他们手里的武器并没有全拿出来。这样看来中国跟美国的 AI 差距可能还在加大。第四,大语言模型最牛的是,它不是填空机,而是能完整地理解这个世界的知识。这次很多人从技术上、从产品体验上分析Sora,强调它能输出 60 秒视频,保持多镜头的一致性,模拟自然世界和物理规律,实际这些都比较表象,最重要的是 Sora 的技术思路完全不一样。因为这之前我们做视频做图用的都是 Diffusion,你可以把视频看成是多个真实图片的组合,它并没有真正掌握这个世界的知识。现在所有的文生图、文生视频都是在 2D 平面上对图形元素进行操作,并没有适用物理定律。但 Sora 产生的视频里,它能像人一样理解坦克是有巨大冲击力的,坦克能撞毁汽车,而不会出现汽车撞毁坦克这样的情况。所以我理解这次 OpenAl 利用它的大语言模型优势,把LLM 和 Diffusion 结合起来训练,让 Sora 实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的,才能跳出 2D 的范围模拟真实的物理世界。这都是大模型的功劳。这也代表未来的方向。有强劲的大模型做底子,基于对人类语言的理解,对人类知识和世界模型的了解,再叠加很多其他的技术,就可以创造各个领域的超级工具,比如生物医学蛋白质和基因研究,包括物理、化学、数学的学科研究上,大模型都会发挥作用。这次 Sora对物理世界的模拟,至少将会对机器人具身智能和自动驾驶带来巨大的影响。原来的自动驾驶技术过度强调感知层面,而没有工作在认知层面。其实人在驾驶汽车的时候,很多判断是基于对这个世界的理解。比如对方的速度怎么样,能否发生碰撞,碰撞严重性如何,如果没有对世界的理解就很难做出一个真正的无人驾驶。所以这次 Sora 只是小试牛刀,它展现的不仅仅是一个视频制作的能力,它展现的是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。第五,Open Al训练这个模型应该会阅读大量视频。大模型加上 Diffusion 技术需要对这个世界进行进一步了解,学习样本就会以视频和摄像头捕捉到的画面为主。一旦人工智能接上摄像头,把所有的电影都看一遍,把YouTube 上和 TikTok 的视频都看一遍,对世界的理解将远远超过文字学习,一幅图胜过千言万语,而视频传递的信息量又远远超过一幅图,这就离AGI真的就不远了,不是10年20年的问题,可能一两年很快就可以实现。 ... PC版: 手机版:

封面图片

360创始人周鸿祎谈Sora:中美AI差距可能还在加大

360创始人周鸿祎谈Sora:中美AI差距可能还在加大 人工智能ChatGPT母公司OpenAI星期四(2月15日)公布了一种新的人工智能系统Sora,该系统可以根据用户的文本提示创建逼真的视频。360创始人周鸿祎星期五(16日)发文说,OpenAI CEO是个营销大师,知道怎样掌握节奏,他们手里的武器并没有全拿出来。这样看来中国跟美国的AI差距可能还在加大。” 周鸿祎在个人微博上发文说,科技竞争最终比拼的是让人才密度和深厚积累。AI不一定那么快颠覆所有行业,但它能激发更多人的创作力。 周鸿祎还说,很多人担心Sora对影视工业的打击,但在他看来,机器能生产一个好视频,但视频的主题、脚本和分镜头策划、台词的配合,都需要人的创意,至少需要人给提示词。一个视频或者电影是由无数个60秒组成的。Sora可能给广告业、电影预告片、短视频行业带来巨大的颠覆,但它不一定那么快击败TikTok,更可能成为TikTok的创作工具。 他说,一旦人工智能接上摄像头,把所有的电影都看一遍,把YouTube上和 TikTok 的视频都看一遍,对世界的理解将远远超过文字学习,一幅图胜过千言万语,这就离AGI(通用人工智能)真的就不远了,不是10年20年的问题,可能一两年很快就可以实现。 周鸿祎还认为,尽管中国大模型发展水平表面看已经接近GPT-3.5,但实际上跟4.0比还有一年半的差距。OpenAl手里应该还有一些秘密武器,无论是GPT-5,还是机器自我学习自动产生内容,“奥尔特曼(OpenAI CEO)是个营销大师,知道怎样掌握节奏,他们手里的武器并没有全拿出来。这样看来中国跟美国的AI差距可能还在加大。” 周鸿祎提到,有了大模型技术作为基础,再加上人类知识的引导,可以创造各个领域的超级工具,例如在生物医学、蛋白质、基因研究,包括物理、化学、数学的学科研究上,大模型都会发挥作用。 2024年2月17日 8:39 AM

封面图片

周鸿祎将推出免费AI培训课程:李一舟不该收费

周鸿祎将推出免费AI培训课程:李一舟不该收费 “李一舟最大的问题是不该对相关课程收费,应该免费”,周鸿祎直言。同时他还透露,自己将推出免费的AI培训课程,为用户做更多的AI科普。根据此前报道,李一舟自称是“清华博士”的大V,其推出的199元AI课程,已在短视频平台上吸引到上百万的粉丝。有数据显示,李一舟售卖的AI课名为《每个人的人工智能课》,一年内卖出约25万套,销售额约5000万。此消息一出就登上热搜,网友的评论褒贬不一。而此次周鸿祎直接表态“李一舟不该收费”,也证明他对此事持反对意见。实际上,周鸿祎对AI有很多自己的理解。他在个人微博上不止一次谈到AI,尤其是近期很火的Sora模型。据悉,Sora是美国人工智能研究公司OpenAI发布的人工智能文生视频大模型,可以根据用户的文本提示创建最长60秒的逼真视频,能理解用户在提示中提出的要求。他认为Sora模型意味着 AGI将实现从10年缩短到1年。AI不一定那么快颠覆所有行业,但它能激发更多人的创作力。此外他还强调,今天Sora可能给广告业、电影预告片、短视频行业带来巨大的颠覆,但它不一定那么快击败TikTok,更可能成为TikTok的创作工具。由此可见,周鸿祎若真推出AI课程,或许会为用户普及到更多的AI知识。 ... PC版: 手机版:

封面图片

周鸿祎称Sora生成视频堪比CG:未做3D建模 只需文字就可逼真描绘

周鸿祎称Sora生成视频堪比CG:未做3D建模 只需文字就可逼真描绘 他认为,对比Pika和Runway是做不出这样效果的。Pika和Runbway实际上是基于图形图像本身的操作来进行生成。只是形成一种比较简单的计算机动画的效果。周鸿祎说:“即使是用常规呢计算机CG电影工业特效来看这三个画面,那也会非常难做,但是到了Sora这里,这些细节都会变得非常简单,只要给出一些文字的提示要求,就能逼真描绘出来”。他认为,Sora是没有做3D建模的。如果Sora也只是用3D建模再进行渲染,那么这和传统的电影工业走的是一样的路,这样就不具备颠覆性和革命性了。周鸿祎猜测Sora做到如此效果有三点原因:1、Sora模拟了人类观察、描绘、表现世界的方法。如果人类画师用笔画出来这三个场景,人类的大脑里不需要3D建模,因为人类对世界有基本认知。人类可以随意想象出自己要做的事,可以控制自己所想。2、Sora在学习的过程中,用了很多视频、电影的内容来作为训练输入。当输入一些画面,不仅要解读出画面的元素,还要解读出一些物理定律。openAI的论文中曾提到recaptioning技术,意思是对每一帧画面都能够用文字来描述。这点也正符合人类认知世界的方法。3、openAI产生了很多3D内容。不排除它用现在游戏引擎做了很多实时3D模型的渲染,再利用这些3D模型把更多的物理知识训练给Sora。周鸿祎表示,Sora是记录文生视频AIGC的工具,它反映了AI对世界的理解,是从文字进入图像,再从图像展示对这个世界3D模型的理解。 ... PC版: 手机版:

封面图片

师徒和解靠“大模型”?周鸿祎傅盛到底聊了啥?

师徒和解靠“大模型”?周鸿祎傅盛到底聊了啥? 傅盛本人还亲自转发了这则海报并配文称,“惊不惊喜?意不意外?AI的力量啊!”,他还调侃称:“男人之间,就没有一个大模型解决不了的事儿…”关于大模型,周鸿祎傅盛到底聊了啥?本次发布会的主题是AI大潮下如何创新?傅盛认为,从技术狂欢到商业落地,私有化大模型是王道。2023年AI大模型席卷全球,成为科技风向标,2024年大模型主要关注的是应用落地。周鸿祎表示,2023年年初的时候,ChatGPT出来的时候,所有人都觉得造大模型就是造原子弹,就是曼哈顿计划。但有了开源之后,到2023年年底,可能造原子弹的都发现自己实际上是在造茶叶蛋。周鸿祎表示,今天的大模型一定是两极分化。一方面,千亿、万亿级别的大模型将会出现;另一方面,应用于具体场景,将大模型做小也是一种趋势。傅盛表示,2023年是人类历史的第三个科学奇迹年,底层范式正在改变,智能和技术“涌现”,新的创新机遇开启。“2023年将会是人类科技史上非常重要的一年,是一个奇迹年,ChatGPT的横空出世,使得人类对于科技的探索能够达到一个新的高度,对人类底层生活会发生新的重构,我们如果不去适应,就会跟不上这个时代。”傅盛说道。傅盛表示。在他看来,在今天这个时代下,每个创业者都该找到不同的道路,而不是别人已经比你更强的道路。对话开始,周鸿祎表示参加此次对话主要有以下几点原因:第一是傅盛和我都有很多变化,看许多事情也变得柔和了。周鸿祎认为,没必要一直抓住过去陈芝麻烂谷子的事不放,要向前看。第二是抱着学习的心态听大模型发展,支持创业者。最后是来吸粉的。周鸿祎笑称,短视频和直播已经不是原来的规则和模式,现在是网红时代,每个人都应该学习做网红,所以自己也需要培养自己的网红气质,抓住一切机会吸粉。在聊到大模型未来发展路径时,周鸿祎指出,一定要给AI找场景,而不是瞄着OpenAI造要用大模型,围绕小切口、大纵深去赋能。“创业者应该结合小的业务场景,用AI深入解决。给场景辅以AI,而不是拿AI找场景”周鸿祎说道。周鸿祎还补充道,做大模型还要有长期主义,AI很热,但不要焦虑,2024可能会出现一些杀手级应用,但是可能不会有特别大的应用出现,要目光长远。傅盛认为,年轻的创业者现在入场做大模型是很有必要的,但不要做大家都做的,要注重组合式创新。从并肩作战到反目成仇傅盛曾经是周鸿祎手下最得力的干将。2003年,傅盛进入周鸿祎的3721公司,因为会议记录做得好而受到周鸿祎青睐。就是在这一年,3721公司在和百度经历多番口水仗、法律诉讼后,卖给了雅虎。傅盛跟着周鸿祎也一并加盟雅虎。2005年,百度上市,周鸿祎离开雅虎,创办奇虎公司,傅盛再度加入其麾下。起初,奇虎的主业是搜索,周鸿祎一门心思都扑在上面,但这块业务始终没有太大起色,反而是傅盛带队做出的“流氓克星”(后改名为360安全卫士)火了。于是,周鸿祎转变战略目标,将公司主营业务从搜索转向网络安全,并把公司改名为“奇虎360”。也正是从这时候开始,周鸿祎和傅盛心生嫌隙。作为项目的主要负责人,傅盛为360安全卫士付出了很多心血,被称为“360安全卫士之父”。但在该业务的发展上,他与周鸿祎出现了矛盾。有人说,这是老板在摘果子。可在老板看来,自己地盘上结出的果子自然是属于他的,不存在抢下属功劳一说。最终在2008年10月,傅盛辞职离开。因为奇虎公司与傅盛签署了一份18个月的竞业协议,从奇虎离职之后,他曾进入风投行业,也曾自己创业,但反响不佳。直到遇见自己的贵人雷军,傅盛才迎来事业的又一个春天。2009年,傅盛创办可牛影像。2010年5月,可牛杀毒软件发布。6个月后,可牛与雷军带领的金山安全合并成立金山网络,傅盛出任CEO。紧接着,官司就找上门。2011年,周鸿祎公司起诉傅盛,细数其三大“罪状”:利用奇虎机密资料,开发可牛杀毒软件;违反竞业协议,私自创业;挖走前员工。双方闹上法庭,最后以周鸿祎败诉告终。此后,傅盛的事业进入加速期。2014年3月,金山网络更名为猎豹移动,傅盛继任CEO。同年5月8日,傅盛带领公司登陆纽交所上市。2016年,傅盛涉足人工智能领域,成立猎豹星空公司,两年后其机器人新品发布。AI大模型是傅盛和周鸿祎共同关注的重点。去年6月,360智脑大模型正式发布;9月,360智脑大模型面向公众开放;12月,360智脑通过国家大模型标准符合性测试,称是全国首个原生安全大模型。周鸿祎认为,美国产业界已经“All in AI”,通过AI创新寻找增量市场,自己是坚定的发展派,呼吁更多企业建立“AI信仰”,All in AI做创新。傅盛也多次提到要“All in AI”,他旗下的猎户星空是一家以 AI 技术研发为核心的服务机器人公司,在去年推出了大模型应用“聚言”,为企业客户提供大模型咨询与AI服务一站式解决方案。近日,猎豹移动宣布公司通过控股和全资子公司对猎户星空进行增资,总增资额约合3.69亿元。 ... PC版: 手机版:

封面图片

关于Sora,觉得周鸿祎分享的观点讲的很好,尤其是第四点:

关于Sora,觉得周鸿祎分享的观点讲的很好,尤其是第四点: 大语言模型最牛的是,它不是填空机,而是能完整地理解这个世界的知识。 这次很多人从技术上、从产品体验上分析 Sora,强调它能输出 60 秒视频,保持多镜头的一致性,模拟自然世界和物理规律,实际这些都比较表象,最重要的是 Sora 的技术思路完全不一样,因为这之前我们做视频做图用的都是 Diffusion,你可以把视频看成是多个真实图片的组合,它并没有真正掌握这个世界的知识。现在所有的文生图、文生视频都是在 2D 平面上对图形元素进行操作,并没有适用物理定律。 但 Sora 产生的视频里,它能像人一样理解坦克是有巨大冲击力的,坦克能撞毁汽车,而不会出现汽车撞毁坦克这样的情况。 所以我理解这次 OpenAl 利用它的大语言模型优势,把LLM 和 Diffusion 结合起来训练,让 Sora 实现了对现实世界的理解和对世界的模拟两层能力, 这样产生的视频才是真实的,才能跳出 2D 的范围模拟真实的物理世界。这都是大模型的功劳。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人