#视频 若把AI绘制的机器人图像与真人身穿套装拍摄的照片放在一起,你能分辨出吗?OpenAI Dall-E 2、Stabilit

#视频 若把AI绘制的机器人图像与真人身穿机器人套装拍摄的照片放在一起,你能分辨出吗?OpenAI Dall-E 2、Stability AI DreamStudio等人工智能驱动的作画生成器可将用户输入的文本转化为图像。《华尔街日报》科技专栏作家Joanna Stern解释了AI作画技术背后的机器学习原理等。

相关推荐

封面图片

#视频 与OpenAI的ChatGPT和微软的必应相比,谷歌新人工智能聊天机器人Bard所受限制更多。此外,它也可能出错。中,谷

#视频 与OpenAI的ChatGPT和微软的必应相比,谷歌新人工智能聊天机器人Bard所受限制更多。此外,它也可能出错。视频中,谷歌产品副总裁Sissie Hsiao接受《华尔街日报》科技专栏作家Joanna Stern独家采访,谈论了背后的原因。

封面图片

#视频 微软正将大热聊天机器人ChatGPT背后的技术整合到其必应搜索引擎中。《华尔街日报》科技专栏作家Joanna Stern

#视频 微软正将大热聊天机器人ChatGPT背后的技术整合到其必应搜索引擎中。《华尔街日报》科技专栏作家Joanna Stern前往微软总部,体验了能以对话方式回应查询的人工智能版必应,还与微软CEO纳德拉聊了聊人工智能将如何颠覆搜索引擎。

封面图片

OpenAI宣布关闭DALL-E 2图像生成模型 因为已经有更强大的DALL-E 3

OpenAI宣布关闭DALL-E 2图像生成模型 因为已经有更强大的DALL-E 3 到 2023 年 9 月 OpenAI 宣布推出 DALL-E 3,这是 DALL-E 2 的升级版本,具有更好的图片生成特性,例如可以生成更高质量的图片、更准确地反映提示词,尤其是在处理常提示词内容是可以更好地理解并创建图片。当然重点是新版本解决了文本内容和人手的问题,文本内容指的是如果要在图片中显示一段文字或单词,那么 AI 模型无法处理;人手问题则是生成时人类可能有六只手指等。在 DALL-E 3 发布半年后,OpenAI 现在已经决定退役 DALL-E 2,当用户尝试登录 OpenAI 访问 DALL-E 2 页面时,页面会提示:我们不再允许新用户使用 DALL-E 2,DALL-E 3 具有更高质量的图像、改进了提示依从性,我们已经开始推出图像编辑功能,该功能适用于 ChatGPT Plus、ChatGPT Team、ChatGPT Enterprise 以及 OpenAI API 用户。所以实际上用户是无法继续使用 DALL-E 2 生成图像的,当然这也不是什么坏事,用户可以继续使用 DALL-E 3 并创建更多有趣的内容。 ... PC版: 手机版:

封面图片

用人脑活动的潜伏扩散模型进行高分辨率图像重建:

用人脑活动的潜伏扩散模型进行高分辨率图像重建: OpenAI 的 CTO Mira Murati 介绍: 微软将Windows 11的一堆功能加入了AI能力: OpenAI、TikTok 等公司签署 AI 透明协议: 为什么搜索引擎不以更有益的方式整合类似ChatGPT的机器人?: 有任何问题和想法欢迎随时与我交流。

封面图片

OpenAI CTO:Sora今年将发布 会添加语音功能

OpenAI CTO:Sora今年将发布 会添加语音功能 以下为翻译全文:某个清晨醒来时,你是否曾幻想过一头公牛在精致的瓷器店中悠然自得地行走的场景?要实现这一奇幻景象,你有三种途径:A)联系当地的动物驯养师以及知名家居品牌Crate & Barrel;B)雇请顶尖的好莱坞动画制作人;C)使用神奇的AI工具Sora,简单输入指令即可。欢迎进入人工智能的下一个“魔法世界”。在这里,你的语言能够化作逼真、流畅且细腻的视频画面。OpenAI计划在今年晚些时候向大众推出其文本到视频的转换工具Sora。尽管正式发布尚需时日,但OpenAI已经向我们揭示了这款工具的惊人潜力:仅需精心设计的文本指令,便可创造出几乎足以替代许多视频制作专业人员的作品。《华尔街日报》专栏作家乔安娜·斯特恩(Joanna Stern)向该公司提交了几条由她自己编写的提示,比如一条美人鱼和她的螃蟹伙伴评测智能手机,或是一头公牛在精致的瓷器店内自由漫步。斯特恩随后亲身体验了Sora的神奇之处,她利用这款工具制作了一段模拟对OpenAI首席技术官穆拉蒂进行虚拟视频采访的片段,两人深入剖析了这些有趣的问题,并对该技术的潜在问题进行了探讨。OpenAI在上个月首次展示了用其生成式人工智能工具制作的视频预览,整个互联网为之沸腾。与之前那些断断续续、分辨率低下的人工智能视频技术相比,Sora生成的内容无疑是一场视觉盛宴,堪比高品质的自然纪录片或大制作电影。与之前的人工智能技术相似,Sora首先让我们对其能力感到惊叹,随即又担忧其对社会的影响。面对斯特恩的担忧,穆拉蒂向她保证,OpenAI在发布这一强大工具时将采取慎重的步骤。但这并不意味着一切都将无忧无虑。这些超逼真视频真的是Sora生成的吗?斯特恩对Sora生成的视频感到深深震撼:从无人机视角拍摄的意大利阿马尔菲海岸的壮观景色,到手持自拍杆的柯基犬,再到冲浪板上活泼的动画水獭,这些画面无一不展示了Sora在创意和细节处理上的强大能力。她进一步挑战Sora,要求它生成更接近日常生活的场景:“两名30多岁、棕发的职业女性在一个明亮的演播室里坐下接受新闻采访。”Sora生成的视频中,两位女性的嘴唇和头发动作自然流畅,皮夹克的细节也清晰可见。穆拉蒂透露,这段20秒长、720P分辨率的视频仅用了几分钟就完成了生成,尽管目前还未加入声音。但她承诺,OpenAI正在计划为Sora增添语音功能。为了对比Sora与其他工具的区别,斯特恩也在另一个AI视频生成器Runway上输入了相同的提示。然而,得到的结果大相径庭,Runway生成的画面是两个模糊、幽灵般的女性形象,它们看起来像是直接从恶梦中走出来的,令人毛骨悚然。那么,Sora究竟是如何实现这一神奇转换的呢?尽管解释其内部工作原理可能比解释美人鱼的进化还要复杂,但简单来说,Sora背后的AI模型通过分析大量视频数据,学会了识别和理解各种物体与动作。输入文本提示后,模型能够迅速勾勒出整个场景的基本轮廓,并逐帧添加细节。行业观察人士和竞争对手,包括Runway的首席执行官,都认为OpenAI的这些显著成就归功于其巨大的计算资源和庞大的训练数据量。但OpenAI最近也面临着版权侵犯的指控,因未经授权使用大量在线内容训练其ChatGPT模型。当被问及OpenAI为训练Sora使用了哪些数据时,穆拉蒂表示:“我们主要使用了公开可获取的数据及已授权数据。”。当被进一步追问这些数据是否包括YouTube、Instagram和Facebook上的视频时,穆拉蒂表示她并不清楚具体细节,但后来确认,已授权的材料确实包含了知名版权图片网站Shutterstock上的内容。人工智能模型对普通用户来说往往是个神秘的黑匣子。我们看到的是输入和输出,而中间的处理过程则不得而知。因此,我们可能永远无法完全理解为何生成的内容展现出某些特定的风格或特征。例如,斯特恩提到的那条美人鱼身旁的甲壳类伙伴留着类似《海绵宝宝》中蟹老板的胡须,这是否是模型的创新还是某种偶然?穆拉蒂还告诉斯特恩,当前Sora生成视频的成本远高于该公司的图像生成器Dall-E。但她承诺,在Sora正式向公众发布前,团队将对其进行优化,以降低计算资源消耗。如何识别人工智能生成视频?在当前的早期阶段,人工智能生成的内容中还存在一些明显的瑕疵。例如,在Sora生成的采访视频中,一位浅发色女子的一只手似乎多出了五根手指。对此,穆拉蒂解释道:“准确再现手部运动真的很难。”在另一次测试中,斯特恩期望看到一个机器人从电影制片人手中夺走摄像机的场景。但Sora生成的是一位人类电影制片人突变成机器人,场面显得突兀且不自然。更有甚者,背景中的黄色出租车也不知怎的变成了银色轿车。穆拉蒂承认模型“在维持连贯性方面表现尚可,但并不完美”。这引出了一个深刻的议题:当这些缺陷得到修正,人工智能生成的视频愈发逼真时,我们如何区分真实与人工智能生成的视频?Sora生成的每个视频下方都会有一个水印。穆拉蒂解释说,最终这些视频还将包含元数据,以标示其生成方式和来源。此外,OpenAI设有一个名为“Sora红队”的安全测试小组。该团队的职责是提供各种提示,探索潜在的漏洞、偏见和其他可能的有害结果。穆拉蒂说:“这就是我们目前还没有广泛部署这些系统的原因。我们需要先弄清楚这些问题,然后才能放心地将其推向市场。”就Sora的提示词政策而言,穆拉蒂透露,它可能借鉴OpenAI的另一工具Dall-E的做法。例如,为了防止滥用和侵犯隐私,用户将无法使用Sora来生成公众人物的形象。当斯特恩试图输入“在任美国总统的电视新闻画面”时,Sora拒绝了这一请求。斯特恩也尝试让Sora生成“在东欧小镇上行走的士兵”的视频,但也遭到了拒绝。对于裸露等敏感内容的提示,穆拉蒂表示OpenAI正在与艺术家和专家紧密合作,共同探讨如何在不阻碍创意表现的同时,设立合理的“护栏和限制”。将与好莱坞合作随技术发展,像Sora这样的AI工具将变得更强大、更精细。这种进步可能会改变传统的工作方式,如无人机操作员或插画家的角色,引起好莱坞既期待又忧虑的反响。演员、电影制片人和工作室老板泰勒·佩里(Tyler Perry)表示,看到Sora的潜力后,他宣布暂停耗资8亿美元的工作室扩建计划。他认为这项技术能够削减布景和外景拍摄的成本,但同时也对电影行业和演员的未来抱有担忧。代表好莱坞和全美各地动画艺术家的动画协会主席珍妮特·莫雷诺·金(Jeanette Moreno King)也称,尽管艺术创作决策仍需人类参与和判断力,未来却是充满不确定性的迷雾。爱德华·萨奇(EdwardSaatchi)及其人工智能视频工作室Fable正梦想打造一个AI版Netflix:仅需输入一段文本提示,便可呈现完整的电视剧集。对于Sora对视频制作行业的潜在影响,穆拉蒂重申了OpenAI采取的缓步审慎策略。她表示,OpenAI正在与行业内部人士合作,进行早期的测试和反馈征集,希望全球的电影制作者和创作者能加入这一探索过程,共同促进电影产业的发展。如果将OpenAI比作一开始提到的那头在瓷器店里自由漫步的公牛,那么它目前可能需要小心行事。但最终,它可能不可避免地将带来一些破坏。 ... PC版: 手机版:

封面图片

OpenAI再陷巨大争议?Sora训练数据被质疑非法 CTO采访疯狂翻车

OpenAI再陷巨大争议?Sora训练数据被质疑非法 CTO采访疯狂翻车 前几天Murati接受华尔街日报采访时,被问及Sora训练数据的这段视频,已经在全网爆火,引起网友热议。准备好,WSJ女记者要放大招了“Sora是用什么数据训练的?”Murati接下来的表现,十分值得玩味。她眨了数次眼睛,目光闪烁,思考几秒之后略带迟疑地给出了一个官方味十足的答案“我们使用的是公开可用的数据,以及经过许可的数据。”记者继续出招:“所以,你们是用了YouTube上的视频吗?”Murati的反应亮了。她撇了撇嘴,眼神茫然地望向空中,犹豫了几秒后只得承认“关于这个情况,我不太确定。”记者步步紧逼:“那Facebook和Instagram上的视频呢?”Murati的表情仿佛已经在崩溃的边缘“你知道,如果这些数据可以公开使用……对……可以公开使用的话……可能是用了这些数据,但我不确定,真的不太确定。”然后她无奈地伸开双手,表示差不多得了。但记者还在发问:“Shutterstock呢?我知道你们公司和他们有合作。”Murati摇了摇头,表示,“关于使用数据的细节,我是不会详细说的,但我们用的数据肯定是公开的,或者许可使用的。”仓促上阵的Murati肯定没想到,记者会准备得如此充分,让她几乎直接掉在坑里。如果处理不够得当,OpenAI极有可能会继续吃官司。网友形容Murati的窘迫表现有人预言:Murati的反应绝对会被做成表情包,全网热转。训练AI模型数据所面临的巨大版权争议,是这一年多全球相关人士讨论最多的话题。如今,ChatGPT让OpenAI的估值暴涨到了800亿美元;而Sora又几乎要颠覆动辄上百亿票房的好莱坞影视行业 。然而这些收益却进了OpenAI的腰包,而做出关键贡献的数据所有者,却分文无收,甚至反而被掀了饭碗。OpenAI被纽约时报起诉、ChatGPT被怒喷应当“销毁”的故事,会再一次上演吗?网友:她的微表情在说谎这段采访的视频一出,业内人士和网友都震惊了。有网友锐评道,这个采访看起来很愚蠢,整个对话仿佛是下面这个样子你是坏人吗?不是。你是坏人吧?呃……不是吧?不是。你到底是坏人吗?听着,我不是坏人。还有网友展开了微表情分析,认为Murati很有可能是在说谎。科技专栏作家Brian Merchant批评道,Murati的表现“要么是对自己公司的产品惊人的无知,要么就是在谎言无论哪种可能,都非常可怕!”的确,对于一个AI公司CTO来说,她的表现是完全不合格的。那么问题来了,如果是后一种可能,Murati为什么要撒谎呢?如果她意识到自己需要撒谎来掩盖某些事实,那就说明,她心里明白OpenAI的做法是在违法的边缘试探。而在未来,当OpenAI被法官问话时,这很可能就会给OpenAI埋下一个大坑。“看起来,OpenAI要面临一场大型诉讼了”目前,OpenAI正面临着好几场由作家和纽约时报发起的诉讼,后者声称,他们受版权保护的作品未经许可,就被OpenAI用来训练ChatGPT等模型。与此同时,外媒纷纷发表文章,嘲讽Murati在采访中表现出的样子太不专业。CTO的这个表现,对官司缠身的OpenAI可真不算个好消息。如果CTO都无法坚定地回答,现在公司旗下最热门新模型的训练数据来自哪里,那也就证明了,OpenAI高层甚至对这个问题根本就没关注。据WSJ报道,在采访结束后,Murati证实,Shutterstock上的视频确实包含在Sora的训练集中。不过,网上有海量的视频内容,OpenAI从Shutterstock得到的,恐怕也只是Sora训练数据池中的一小滴水而已。其实,这件事情之所以能引起轩然大波,也是因为它直接指向了问题的本质在公共领域的数据,所属权到底属于个人,还是完全共有?从前,数据飞轮还没能给LLM加速到日进斗金的程度时,这个问题没有放到台面上讨论过。而现在,它背后代表了巨大的利益。也有一些人为Murati和OpenAI辩护。他们认为,既然你把东西发到了网上,就应该默认它属于公共资产。如果你不想公开,那就应该让它们保持私密。也就是说,一旦事情在公共场合发生,它就属于整个人类。这么说来,我们在往网上发东西时,都得时刻小心翼翼了。一家价值数十亿美元的AI公司,很可能会把你随手拍的家人朋友的视频,用作生成式AI模型的养料,获得惊人的利润。对于这个数据监管的争议,斯坦福教授Christopher Manning表示,目前最合适的AI监管办法之一,就是要求模型厂商记录下他们使用过的所有训练数据。欧洲议会刚刚通过的AI法案,也同样强调了这一点。Sora最新一波演示出炉!虽然在之前的采访里已经提到,Sora生成的视频还有很多bug,但这些不断被放出的演示,依然在不断惊艳世人。比如瓷器店里的公牛。扛着摄像机的女记者忽然变成了机器人。(x拿着手机的小美人鱼,旁边是她的蟹助手。还拉着Runway对比了一波,生成两个镜头前的女记者。Sora还在不断掀起飓风其实,Sora的传奇故事,才刚刚揭开序幕。一个月前,曾给《死侍2》做特效的44岁视觉艺术家Greg Pilon,突然感觉:自己的行业似乎面临着末日的钟声。他见到Sora的第一眼,就有这种强烈的感觉。无人机拍摄的海岸、一个男人在巴黎咖啡馆深沉地思考人生的画面、一个在迪斯科舞厅跳舞的袋鼠……这些惊艳的场景也令他恐惧。Sora的先进程度,已经远超任何视频AI。Pilon曾以为,粗糙的AI要威胁自己的生计,且得等几年,但Sora却表明:被淘汰的危机已经近在眼前。“我现在觉得,两年后,我可能就会被取代了。”虽然Sora还未发布,但仅仅是一些demo,就已经引起了好莱坞和游戏界的巨大轰动。团队的三位负责人在最新的专访中,对Sora进行了一些介绍电影前段时间最刷屏的新闻之一,就是好莱坞大导Tyler Perry在Sora刚刚发布一周后,取消8亿美元工作室扩建计划的消息。对此,导演Scott Mann也认为,Sora将“给我们的行业带来自电影摄影机发明以来最大的变革。”2018年,Mann参与创立了Flawless,来开发AI电影制作工具。他们最受瞩目的产品,能够解决电影编辑中的配音问题这不仅可以节省昂贵的重拍费用,还可以用AI调整演员的嘴型来与另一种语言同步,从而帮助电影顺利地进入国际市场。在最近的作品《Fall》中,他就利用Flawless对其中的30多处粗口进行了配音处理。因此,电影达到了PG-13级别,扩大了受众范围。在300万美元的预算下,《Fall》的票房收入达到将近2200万美元,回报近7倍。不过,Flawless的工作,或许很快就能由Sora完成了。而给《权力的游戏》和《吸血鬼日记》做特效的视觉工程师Pilon也发现,Sora很可能在几分钟内,完成他曾经要花费数月才能完成的工作。“没有人预料到它会进展得这么快,”Pilon说。“我们曾认为可能还需十年的技术,现在看来仅需几年。”游戏视频游戏公司Midwest Games的创始人Ben Kvalo也表示,自己行业中的某些员工,的确会被AI淘汰。与艺术家们擅长的特定风格不同,生成式AI能够创造出任何风格,或尝试全新的风格。而那些与视频游戏开发者合作,为游戏初期角色和场景勾勒草图的概念艺术家,很可能会因此失去工作。不过,小规模的开发团队,却可能从中受益。他们本来请不起概念艺术家,现在却可以做出视觉上更高水平的游戏项目,从而大赚一笔了。而有朝一日,生成式AI也将达到一个新高度让游戏能够搭载“有意识”的NPC。现在的游戏中,NPC还停留在说简单台词、做基本动作的阶段,如果AI能让他们自发对话、即兴行动,故事情节会更丰富。广告而在广告领域,许多业内人士也坚信,AI模型比大家预料更早地淘汰员工。不同于电影和游... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人