详解Sora,为什么是AGI的又一个里程碑时刻? #抽屉IT

None

相关推荐

封面图片

这是中国第几款国产新冠mRNA疫苗了?一个里程碑又一个里程碑。

封面图片

OpenAI Sora问世 通往AGI的又一个ChatGPT时刻

OpenAI Sora问世 通往AGI的又一个ChatGPT时刻 因为看完Sora你可能会发现,OpenAI自己可能要用它先杀死GPT-4了。每个人都可以创造自己的世界了先来看看Sora。人们一直期待GPT-5,但Sora带来的轰动不亚于一次GPT-5的发布。作为OpenAI 首推的文本转视频模型,Sora能够根据文本指令或静态图像生成长达 1分钟的视频,其中包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。同时也接受现有视频扩展或填补缺失的帧。每条提示60秒的视频长度与Pika Labs的3秒、Meta Emu Video的4秒、和Runway公司Gen-2的18秒相比,妥妥地铁赢了。并且从官方发布的演示来看,无论从视频流畅度还是细节表现能力上,Sora的效果都相当惊艳。比如官推里这条14秒的东京雪景视频。提示词:Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.“美丽的,被雪覆盖的东京正繁忙着。镜头穿过繁忙的城市街道,跟随着几个享受雪景和在附近摊位购物的人。美丽的樱花瓣随风飘落,与雪花一同飞舞。”穿着时尚的女性漫步在霓虹背景的东京街头,地面有积水倒影。对于五官和皮肤的刻画十分真实,特别是痘印和法令纹,细节让人惊叹。猛犸象自冰川雪原中缓步从来,背后升腾起雪雾。烛火旁纯真顽皮的3D动画小怪物,光影、表情和毛茸茸的细节满分:一名24岁女性的眼部特写,足以以假乱真。无人机视角的海浪拍打着Big Sur加瑞角海岸崖壁,落日洒下金色光芒。窗台上的花朵开放延时影像:民众们上街舞龙,庆祝中国农历春节。可爱小猫咪在线安抚起床气。夜晚街道跑着的快乐小狗。两艘微型海盗船在一杯咖啡里对峙。加州淘金时代罕见“历史影像”流出 像吗?Sora做的。目前Sora还在测试阶段,仅对部分评估人员、视觉艺术家、设计师和电影制作人们开放访问权限,拿到试用资格的人们已经开始想象力横飞。Sam Altman就转发网友用Sora制作的“金光灿灿动物园”视频,玩起了自己的“What”梗:他还邀请大家踊跃提出想用Sora制作视频的提示词,团队马上为大家生成,瞬间8千多条回复。网友脑洞大开,要看海洋生物的自行车公开赛。两只金毛在山上戴着耳机开播客。当然也不忘cue一下去向成谜的Ilya,要求生成一个“Ilya眼中的真实世界”。不过OpenAI也表示,虽然Sora 对自然语言有着深入的理解,能够准确洞悉提示词,生成表达丰富的内容,并可以创建多个镜头、保持角色和视觉风格的一致性,但仍不可避免地存在一些弱点。例如,它在准确模拟复杂场景的物理现象方面存在困难,也可能不理解特定的因果关系。比方说“一个人咬一口饼干后,饼干上可能并没有咬痕。”模型也可能混淆提示的空间细节,像是弄错左右。或者“在准确体现随时间发生的事件方面遇到困难,比如遵循特定的摄像机轨迹”。Sora也使用了DALL·E 3的recaptioning技术,该技术涉及为视觉训练数据生成高度描述性的标题。因此模型能够更忠实地按照用户在生成视频中的文本指令进行操作。它能够一次性生成整个视频,或是扩展已生成的视频使其变长。通过让模型一次性预见多帧,解决了即使主体暂时离开视线也能保持不变的挑战性问题。关于安全性,OpenAI表示正与错误信息、仇恨内容和偏见等领域的专家合作,对模型进行对抗性测试。同时也在开发帮助检测误导性内容的工具,识别视频是否由Sora生成。对于违反使用政策的文本提示,例如暴力、仇恨和侵犯他人知识产权等内容,将拒绝显示给用户。除此以外,为DALL·E 3产品构建的现有安全方法也同样适用于Sora。“尽管进行了广泛的研究和测试,我们仍无法预测人们将如何利用我们的技术,也无法预见人们如何滥用它。这就是为什么我们相信,从真实世界的用例中学习,是随时间构建越来越安全的AI系统的关键组成部分。”OpenAI对 Sora信心满满,认为这为模型理解和模拟真实世界奠定了基础,是“实现AGI的重要里程碑”。网友们也第n+1次纷纷哀悼起相关赛道的公司们:“OpenAI就是不能停止杀死创业公司。”“天哪,现在起我们要弄清什么是真的,什么是假的。”“我的工作没了。”“整个影像素材行业被血洗,安息吧。”能杀死GPT-4的世界模型?这不就是吗OpenAI一如既往没有给出很详细的技术说明,但一些只言片语已经足够让你浮想联翩。其中最吸引我们注意的第一个点,是对数据的处理。Sora是一个扩散模型(diffusion model),采用类似GPT的Transformer架构。而在解决训练中文本资料与视频数据之间的统一方面,OpenAI表示,他们在处理图像和视频数据时,把对它们进行分割后得到的最小单元,称为小块(patches),也就是对应LLM里的基本单元tokens。这是一个很重要的技术细节。把它作为模型处理的基本单元,使得深度学习算法能够更有效地处理各种视觉数据,涵盖不同的持续时间、分辨率和宽高比。从最终的震撼效果看,你很难不得出这样一个结论:对语言的理解能力,是可以迁移到对更多形态的数据的理解方法上去的。此前的Dalle-3的效果就被公认很大程度来自OpenAI在GPT上积累的领先N代的语言能力,哪怕是个图像为输出的模型,语言能力提升也是至关重要的。而今天的视频模型,同样如此。至于它是如何做到的,有不少行业内的专家给出了相同的猜测:它的训练数据里使用了游戏领域最前端的物理引擎Unreal Engine5,简单粗暴的理解,就是语言能力足够强大之后,它带来的泛化能力直接可以学习引擎生成的图像视频数据和它体现出的模式,然后还可以直接用学习来的,引擎最能理解的方式给这些利用了引擎的强大技术的视觉模型模块下指令,生成我们看到的逼真强大的对物理世界体现出“理解”的视频。基于这个猜测,OpenAI简短的介绍中的这句话似乎就更加重要了:“Sora 是能够理解和模拟现实世界的模型的基础,OpenAI相信这一功能将成为实现AGI的重要里程碑。”理解,现实,世界。这不就是人们总在争论的那个唯一有可能“干掉”GPT-4的世界模型。现在,OpenAI搞出来了它的雏形,摆在了你的面前。看起来,这个模型学会了关于 3D 几何形状和一致性的知识,而且并非OpenAI训练团队预先设定的,而是完全是通过观察大量数据自然而然地学会的。负责Sora训练的OpenAI科学家Tim Brooks表示,AGI将能够模拟物理世界,而Sora就是迈向这个方向的关键一步。显然,在OpenAI眼里,它不只是一个“文生视频模型”,而是更大的东西。我们如果尝试进一步给一个暴论,就是:语言是理解一切的基础,理解了视频后,世界模型才会到来。可能这才是比今天刷屏感慨“现实不存在了”之外,更恐怖的地方。这可能是人类通往AGI的又一个ChatGPT时刻。 ... PC版: 手机版:

封面图片

又一个里程碑式反垄断 1998年微软被分拆,苹果这次会重蹈覆辙么?

又一个里程碑式反垄断 1998年微软被分拆,苹果这次会重蹈覆辙么? “苹果的每一步行为,都筑起并加强了围绕其智能手机垄断地位的护城河。”美国司法部在诉讼文件中写道。在司法部看来,苹果的崛起在一定程度上受益于1998年微软的反垄断案,现在他们需要另一场里程碑式的反垄断行动,来推动科技创新。这一次反垄断起诉,痛击苹果“围墙花园式的商业模式”的核心,可能会扰乱苹果公司的商业模式,影响数十亿用户使用iPhone的方式,也成了苹果一夜市值蒸发1100亿美元(约合人民币7919亿元)的重要原因。美国反垄断法起源于1890年的《谢尔曼法》,而针对科技巨头的主要参考案例就是20世纪90年代微软的反垄断诉讼,从1998年持续到2001年,最终以微软付出了18亿美元的和解费用、禁止参与可能损及竞争对手的排他性交易以及开放部分源码的代价告终。针对美国科技巨头的反垄断案在2024年正进入高潮,除了苹果外,Google、亚马逊、Meta都坐上了被告席:Google两起反垄断案缠身,5月初将进行搜索垄断结案陈词,年初还将接受司法部关于广告垄断的诉讼;亚马逊去年9月被指控非法垄断在线零售;Meta,10多年前的收购Whatsapp和Instagram的两起交易再被审查。对于巨头们来说,反垄断案是一场漫长的马拉松,苹果、Google、亚马逊、Meta面临的法律挑战可能会持续至未来数年,而这也是对他们未来营收前景和股价的巨大考验。司法部:未吸取微软的教训,苹果变本加厉在美国司法部看来,苹果没有吸取微软“反垄断”案子的教训,反而“变本加厉”,美国司法部长Merrick Garland直言,按收入算,苹果控制着全国70%以上的智能手机市场,庞大的市场份额非自然竞争所得,而是“通过违反联邦反垄断法”获得的。“苹果利用其市场地位,破坏了原本可以让用户更容易选择不同操作系统的技术。诉讼中提到,苹果采取了许多与微软相同的策略。”Garland在新闻发布会上指出,拥有垄断地位本身并不违法,但使用某些手段来维持或保持垄断地位是违法的。诉讼中指出,1998年苹果联合创始人史蒂夫·乔布斯批评微软在操作系统领域针对苹果的垄断行为和“肮脏策略”,并“求助于司法部”,希望微软可以“公平竞争”。而今,苹果自己却对竞争对手实施了更严格的限制,那时苹果用户可以在Windows电脑上使用iPod,微软也没有对从苹果iTunes商店下载的每首歌收取30%的费用。司法部声明中主要列举了苹果构成垄断和排他的五大典型行为:1.限制跨平台应用:苹果对应用做出限制,导致它们无法在不同设备上提供一致的用户体验,用户在不同平台上使用同一款应用时,可能无法获得一致的体验。2.限制流媒体游戏和应用:苹果对流媒体服务的限制迫使用户支付了更昂贵的智能手机硬件费用。用户本可以在不购买昂贵苹果设备的情况下玩到这些游戏、享受这些高质量视频。3.Android用户的消息和视频体验不佳:iPhone拒绝将其他软件的短信与自己的iMessage应用程序整合在一起,导致iPhone用户和非iPhone用户在发送视频或接受信息时会出现错误及体验不理想。4.让智能手表变得不智能:Apple Watch手表对iPhone的依赖使得苹果将用户锁定在了iOS生态中,iPhone与第三方智能手表的配合则不够理想。5.拒绝全面开放数字钱包:苹果限制轻点支付功能、限制第三方开发跨平台数字钱包,损害了企业和客户在手机上独立于苹果之外进行安全数字交易的能力。同时,司法部列举了一系列进入智能手机市场的壁垒,如高昂的零部件采购成本、复杂的硬件和软件设计、获取分销协议的难度等。近年来,苹果利用这些限制,对从App Store下载和购买的应用收取30%的“税”。对于司法部的一长串的指控,苹果立刻给出回应,称美国联邦政府的司法行动将开创“危险的先例”,这是一种强制压制技术创新的行径。苹果在3月21日上午发布的一份声明中指出,他们是靠自己的实力在竞争激烈的市场中脱颖而出的。霍兰德&哈特律师事务所反垄断合伙人Paul Swanson认为,反垄断法一般并不要求一家公司必须与其他公司合作,苹果增加自己产品和服务吸引力的行为,以及不与其他公司合作的决定并不一定违反反垄断法。媒体报道称,在苹果和Epic的案件中,法院发现,苹果的主导地位并不是源于“锁定”或者“强制”,而是源于“用户对现有设备的满意度”。因此就行业壁垒而言,苹果可能会辩称,产品差异化和集成不等同于排他。苹果的ios系统是一个完全集成的平台,具有针对特定功能的内置应用程序,客户选择它是因为喜欢,而不是因为他们想要转向Android但受到阻拦。与微软的垄断案有何异同?有分析指出,苹果此次垄断诉讼案与上世纪90年代美国司法部对微软提起的反垄断诉讼有不少相似之处。1998年5月18日,司法部联合了19个州控告微软多项垄断行为,主要包括违法进行排他性销售安排、将IE浏览器与Windows系统捆绑销售、使用不法手段垄断浏览器市场等。在司法部看来,微软的免费策略尽管短期内让消费者受益,但长期来看,这一行为会把很多中小公司挤出市场,阻碍了竞争对手的发展,也就扼杀了创新活力,最终会减少消费者的选择,损害消费者的利益。微软方面则据理力争:其一,将IE浏览器与 Windows系统捆绑销售,属于功能的集成化,扩大了服务的提供范围。其二,反垄断法是为了保护消费者的利益而制定,微软为其提供了免费服务,倒逼网景在内的同类产品取消收费,为广大消费者带来了切实的利益。2000年6月,法院做出正式判决,要求微软停止捆绑销售行为,更致命的是,还计划将微软一分为二:一部分运营操作系统业务,另一部分运营其它软件业务。尽管最终微软免于被一分为二,但还是付出了高额和解费用并开放部分源码的代价。回顾微软案后不难看出,两起案件均涉及:1.对各自所在市场的垄断行为的指控,微软被指控垄断PC操作系统,而苹果则被指控垄断智能手机市场;2.利用市场地位维持垄断地位进行的一系列排他行动:在这两起案件中,都声称公司滥用市场支配力来扼杀竞争并维持其主导地位。有观点认为,这两个案例之间还有有一个关键的区别:微软当年在PC操作系统市场上拥有绝对优势,而苹果在智能手机市场上的垄断地位则没有那么明显。因而,要证明苹果的垄断行为,司法部必须首先证明苹果具有足够的市场实力来排除竞争对手。微软遭受垄断诉讼时,Windows操作系统在PC操作系统市场上拥有超过90%的市场份额,占据绝对主导地位。据高盛估计,2000年微软操作系统在所有计算设备上的占有率达到97%。单纯就市占率的数字来说,苹果的市场份额并不如当时的微软,司法部在诉讼中称,如果以收入为衡量标准,苹果在美国智能手机市场上的市场份额超过70%。这与以出货量为衡量标准的结果不同,根据Counterpoint Research的统计数据,截至2023年最后一个季度,苹果的市场份额接近64%。媒体总结称,从2019年开始针对苹果的反垄断调查就开始了,苹果一般会从两方面为自己的商业模式辩护,首先,苹果称自己的模式是“做大蛋糕”,与开发者、创作者、企业一起创造机会。苹果CEO库克在2020年对反垄断委员会提到,苹果与三星、Google等手机厂商竞争,并没有占据主导的市场份额。反垄断诉讼是一场“马拉松”但不论苹果的诉讼官司以何种结果结束,这注定是一场“耗时耗力”的马拉松。耶鲁大学研究员Dina Srinavasan直言,反垄断案件会持续很久,苹果的反垄断诉讼不仅... PC版: 手机版:

封面图片

里程碑书系描述:各学科史上的250个里程碑事件!7门学科的简史!全球畅销百万册!

里程碑书系 描述:各学科史上的250个里程碑事件!7门学科的简史!全球畅销百万册! 链接: 大小:100MB 标签:#book #电子书 #套装 来自:雷锋 频道:@Aliyundrive_Share_Channel 群组:@alyd_g 投稿:@AliYunPanBot

封面图片

里程碑书系描述:各学科史上的250个里程碑事件!7门学科的简史!全球畅销百万册!

里程碑书系 描述:各学科史上的250个里程碑事件!7门学科的简史!全球畅销百万册! 链接:https://www.aliyundrive.com/s/bmv6cxkd2h8 大小:100MB 标签:#book #电子书 #套装 来自:雷锋 版权:版权反馈/DMCA 频道:@shareAliyun 群组:@aliyundriveShare 投稿:@aliyun_share_bot

封面图片

《里程碑》 剧情

里程碑Lakshvir Saran / 苏文德·维奇

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人