周鸿祎:Sora 意味着实现通用人工智能可能从10年缩短至1年

None

相关推荐

封面图片

周鸿祎:Sora意味着AGI实现将从10年缩短到1年 #抽屉IT

封面图片

周鸿祎谈Sora模型:中美AI差距可能还在加大

周鸿祎谈Sora模型:中美AI差距可能还在加大 周鸿祎表示,AI不一定那么快颠覆所有行业,但它能激发更多人的创作力。今天 Sora 可能给广告业、电影预告片、短视频行业带来巨大的颠覆,但它不一定那么快击败 TikTok,更可能成为 TikTok的创作工具。同时,周鸿祎还谈到中美AI差距,他认为:OpenAl手里应该还藏着一些秘密武器,无论是 GPT-5,还是机器自我学习自动产生内容,包括 AIGC。他们手里的武器并没有全拿出来。这样看来中国跟美国的 AI 差距可能还在加大。以下为全文:Sora意味着 AGI实现将从10年缩短到1年年前我在风马牛演讲上分享了大模型十大趋势预测,没想到年还没过完,就验证了好几个从 Gemini、英伟达的 Chat With RTX到 OpenA!发布 Sora,大家都觉得很炸裂。朋友问我怎么看 Sora,我谈几个观点,总体来说就是我认为AGI很快会实现,就这几年的事儿了:第一,科技竞争最终比拼的是让人才密度和深厚积累。很多人说 Sora的效果吊打 Pika和Runway。这很正常,和创业者团队比OpenAl 这种有核心技术的公司实力还是非常强劲的。有人认为有了 AI以后创业公司只需要做个体户就行,实际今天再次证明这种想法是非常可笑的。第二,AI不一定那么快颠覆所有行业,但它能激发更多人的创作力。今天很多人谈到 Sora 对影视工业的打击,我倒不觉得是这样,因为机器能生产一个好视频,但视频的主题、脚本和分镜头策划、台词的配合,都需要人的创意至少需要人给提示词。一个视频或者电影是由无数个 60 秒组成的。今天 Sora 可能给广告业、电影预告片、短视频行业带来巨大的颠覆,但它不一定那么快击败 TikTok,更可能成为 TikTok的创作工具。第三,我一直说国内大模型发展水平表面看已经接近 GPT-3.5 了,但实际上跟 4.0 比还有一年半的差距。而且我相信 OpenAl手里应该还藏着一些秘密武器,无论是 GPT-5,还是机器自我学习自动产生内容,包括 AIGC。奥特曼是个营销大师,知道怎样掌握节奏,他们手里的武器并没有全拿出来。这样看来中国跟美国的 AI 差距可能还在加大。第四,大语言模型最牛的是,它不是填空机,而是能完整地理解这个世界的知识。这次很多人从技术上、从产品体验上分析Sora,强调它能输出 60 秒视频,保持多镜头的一致性,模拟自然世界和物理规律,实际这些都比较表象,最重要的是 Sora 的技术思路完全不一样。因为这之前我们做视频做图用的都是 Diffusion,你可以把视频看成是多个真实图片的组合,它并没有真正掌握这个世界的知识。现在所有的文生图、文生视频都是在 2D 平面上对图形元素进行操作,并没有适用物理定律。但 Sora 产生的视频里,它能像人一样理解坦克是有巨大冲击力的,坦克能撞毁汽车,而不会出现汽车撞毁坦克这样的情况。所以我理解这次 OpenAl 利用它的大语言模型优势,把LLM 和 Diffusion 结合起来训练,让 Sora 实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的,才能跳出 2D 的范围模拟真实的物理世界。这都是大模型的功劳。这也代表未来的方向。有强劲的大模型做底子,基于对人类语言的理解,对人类知识和世界模型的了解,再叠加很多其他的技术,就可以创造各个领域的超级工具,比如生物医学蛋白质和基因研究,包括物理、化学、数学的学科研究上,大模型都会发挥作用。这次 Sora对物理世界的模拟,至少将会对机器人具身智能和自动驾驶带来巨大的影响。原来的自动驾驶技术过度强调感知层面,而没有工作在认知层面。其实人在驾驶汽车的时候,很多判断是基于对这个世界的理解。比如对方的速度怎么样,能否发生碰撞,碰撞严重性如何,如果没有对世界的理解就很难做出一个真正的无人驾驶。所以这次 Sora 只是小试牛刀,它展现的不仅仅是一个视频制作的能力,它展现的是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。第五,Open Al训练这个模型应该会阅读大量视频。大模型加上 Diffusion 技术需要对这个世界进行进一步了解,学习样本就会以视频和摄像头捕捉到的画面为主。一旦人工智能接上摄像头,把所有的电影都看一遍,把YouTube 上和 TikTok 的视频都看一遍,对世界的理解将远远超过文字学习,一幅图胜过千言万语,而视频传递的信息量又远远超过一幅图,这就离AGI真的就不远了,不是10年20年的问题,可能一两年很快就可以实现。 ... PC版: 手机版:

封面图片

英伟达CEO黄仁勋:通用人工智能可能在五年内到来

英伟达CEO黄仁勋:通用人工智能可能在五年内到来 美东时间 3 月 1 日,英伟达 CEO 黄仁勋在参加 2024 年斯坦福经济政策研究所峰会时表示,“按照某些定义,通用人工智能 (AGI)可能在短短五年内到来。” 黄仁勋在活动中被问到“创造出能像人类一样思考的计算机需要多久”这一问题,他回答说,答案很大程度取决于“如何定义”。若对于上述计算机的定义是“能够通过人类测试”,那么通用人工智能将很快到来。 就目前而言,人工智能可以通过诸如法律考试等测试,但在专业医学测试(如胃肠病学)上仍然存在困难。黄仁勋认为,五年后,AI 有望能通过“任何一项测试”。黄仁勋同时表示,“很难让 AI 成为一名工程师”,要实现更高要求的通用人工智能“可能仍会很难”,对此他给出的理由是科学家在“如何描述人类思维的工作方式”方面仍存分歧。 通用人工智能(AGI)又称“强人工智能”,指的是人工智能可以像人类一样学习和推理,有可能解决复杂的问题并独立做出决策。但目前仍没有公认的人类智能定义,不同领域科学家对通用人工智能的定义和标准也各不相同。来源 , 频道:@kejiqu 群组:@kejiquchat

封面图片

《通用人工智能的火花:GPT-4早期实验[中文]》

《通用人工智能的火花:GPT-4早期实验[中文]》 简介:本书系统解析通用人工智能的火花:GPT-4早期实验[中文]的核心内容,并结合实用案例帮助读者加深理解。内容涵盖其发展历程、关键概念及实际应用,提供深入的知识探索路径。适合对该主题有兴趣的学习者,帮助拓宽视野并提高专业素养。 标签: #通 #通用人工 #知识 #学习 文件大小:NG 链接:https://pan.quark.cn/s/8fdc7e3ccbe3

封面图片

谷歌旗下DeepMind CEO表示通用人工智能或将在几年内实现

谷歌旗下DeepMind CEO表示通用人工智能或将在几年内实现 谷歌旗下人工智能子公司 DeepMind 的 CEO 戴米斯・哈萨比斯表示,通用人工智能 (AGI) 可能在几年内实现。AGI 指的是一种计算机具有人类水平认知能力的系统。他还补充说,研究人员尚未就 AGI 的合适定义达成一致。"我认为,未来几年我们将拥有非常强大、非常通用的系统。” 对于 AGI 实现的时间,哈萨比斯周二在接受采访时称,AI 研究的速度可能会在目前已经很快的基础上进一步提速。“过去几年的进展相当令人难以置信,”哈萨比斯说,“我没看到有任何理由会放慢这一进程。我认为它甚至可能会加速。所以我认为我们可能只需要几年,也许在十年内。”来源 , 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

封面图片

谷歌DeepMind首席执行官Demis Hassabis表示,通用人工智能有望在几年内变成现实。通用人工智能拥有与人类同等的认

谷歌DeepMind首席执行官Demis Hassabis表示,通用人工智能有望在几年内变成现实。通用人工智能拥有与人类同等的认知能力。 “过去几年的发展相当惊人,”Hassabis说。“我看不出有减缓的理由。我认为甚至可能加速。所以我认为可能只需要几年,也许是在十年之内。”

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人