Google一员工承认Gemini的演示视频造假

Google一员工承认Gemini的演示视频造假根据彭博社消息,谷歌在被要求发表评论时承认,视频演示并不是实时的,而是使用了原始镜头中的静止图像帧,然后编写了文本提示,让Gemini做出回应。彭博专栏作家帕米·奥尔森(ParmyOlson)在文章中指出,谷歌自己也承认,视频是剪辑过的。该公司在YouTube的描述中表示:“为了演示的目的,为了简洁起见,延迟被减少了,Gemini的输出也被缩短了。”此外,GoogleDeepMind的研究副总裁奥瑞奥·维纳尔斯(OriolVinyals)也在社交平台发文,介绍了如何录制Gemini的演示视频。OriolVinyals表示,谷歌为Gemini提供的多模态能力和即时响应将在12月13日开放Pro访问权限时供开发者使用。不过Demo视频里的内容是使用Ultra模型做到的。视频中的所有人类提示和AI输出都是真实的,但为简洁起见进行了缩短。来源:https://view.inews.qq.com/k/20231208A050HZ00?no-redirect=1&web_channel=wap&openApp=false投稿:@TNSubmbot频道:@TestFlightCN

相关推荐

封面图片

Google承认刚推出的Gemini AI至少有一段性能演示是经过剪辑的

Google承认刚推出的GeminiAI至少有一段性能演示是经过剪辑的这段六分钟的视频展示了Gemini的多模态功能(例如,口语对话提示与图像识别相结合)。双子座似乎能快速识别图像(甚至是连线图片),在几秒钟内做出反应,并实时跟踪杯球游戏中的纸团。当然,人类可以做到所有这些,但这是一个能够识别并预测接下来会发生什么的人工智能。不过,点击YouTube上的视频描述,Google有一个重要的免责声明:"为了演示的目的,延迟已经减少,双子座的输出已经缩短,以求简洁"。这正是奥尔森不满意的地方。根据她在彭博社发表的文章,Google在被要求发表评论时承认,视频演示并不是通过语音提示实时进行的,而是使用了原始镜头中的静止图像帧,然后写出文字提示,让双子座做出回应。奥尔森写道:"这与Google似乎在暗示的内容大相径庭:人可以与双子座进行流畅的语音对话,同时双子座会实时观察并回应周围的世界。公平地说,Google公司经常编辑演示视频,尤其是许多公司希望避免现场演示带来的任何技术故障。稍作调整是常有的事。但是,Google在视频演示方面一直存在问题。人们曾怀疑Google的Duplex演示(还记得Duplex吗?Duplex是一款人工智能语音助手,可以打电话给发廊和餐馆预订房间。而预先录制的人工智能模型视频往往会让人更加怀疑。"在这种情况下,奥尔森认为Google是在"作秀",目的是误导人们,让他们不知道Gemini仍然落后于OpenAI的GPT。Google对此并不认同。当被问及演示的真实性时,Google指出了GoogleDeepMind研究副总裁兼深度学习负责人OriolVinyals(也是Gemini的联合负责人)的一篇文章,其中解释了团队是如何制作视频的。Vinyals说:"视频中的所有用户提示和输出都是真实的,为了简洁起见进行了缩短。视频展示了使用Gemini构建的多模式用户体验。我们制作它是为了激励开发人员。"他补充说,团队给双子座提供了图片和文本,并要求它预测接下来会发生什么。这当然是处理这种情况的一种方法,但对Google来说可能并不合适--至少在公众看来,Google已经被OpenAI今年的巨大成功吓了一跳。如果Google想激励开发者,就不能通过精心剪辑的宣传片,这些宣传片可能会歪曲人工智能的能力。而是通过让记者和开发人员实际体验产品。让人们在小型公开测试版中用双子座做蠢事。让我们看看它到底有多强大。...PC版:https://www.cnbeta.com.tw/articles/soft/1402937.htm手机版:https://m.cnbeta.com.tw/view/1402937.htm

封面图片

Google推出Gemini后,ChatGPT 开始恢复部分用户开通PLUS 的资格

Google推出Gemini后,ChatGPT开始恢复部分用户开通PLUS的资格后续:Google承认Gemini演示”造假”YouTube上的视频描述,可以发现Google有一个重要的免责声明:「为了演示的目的,他们已经减少延迟,为了简洁,Gemini的输出也缩短了。」根据彭博社消息,谷歌在被要求发表评论时承认,视频演示并不是实时的,而是使用了原始镜头中的静止图像帧,然后编写了文本提示,让Gemini做出回应。视频看起来很美好,然而,却也反映出了这一问题:视频不是真实的。人们使用了各种方式来进行验证,包括使用视频的截图来问Bard中的Gemini,发现AI并不能准确地回答问题。标签:#OpenAI#ChatGPT#Gemini频道:@GodlyNews1投稿:@GodlyNewsBot

封面图片

谷歌测试由 Gemini AI 创建的视频演示

谷歌在Workspace实验室推出了新的Vids生产力应用,理念是“如果你能做幻灯片,就能在Vids里做视频。”Vids在四月宣布,允许用户将文档、幻灯片、旁白和视频录音拖放到时间线上,制作一个可以与同事分享的演示视频。通过Workspace实验室预览提供,该功能让Workspace管理员可以选择让用户试用这个由人工智能驱动的视频制作工具。虽然你可以在Vids中生成视频,但不要与像OpenAI的Sora这样的AI工具混淆,后者可以根据提示生成逼真的画面。相比之下,Vids是通过描述你希望Gemini创建的内容来生成展示视频,然后你可以在之后修改视频。你也可以选择使用众多可用模板之一手动开始你的GoogleVids演示草稿,并且有免版权的素材可以用来提升你的创作。标签:#Google#AI#Vids#Gemini频道:@GodlyNews1投稿:@GodlyNewsBot

封面图片

有媒体报道称,一段由人工智能开发机构谷歌DeepMind制作的演示视频夸大了Gemini的性能。这段在网络上广泛流传,显示G

有媒体报道称,一段由人工智能开发机构谷歌DeepMind制作的演示视频夸大了Gemini的性能。这段视频在网络上广泛流传,显示Gemini能够迅速判断画面中的实物并给出像人一样的语音反馈,凸显出惊人的多模态功能。但一些媒体和用户在亲自上手使用时发现,Gemini并不能达到视频中的效果。事实上,谷歌DeepMind承认演示不是实时或以语音进行的。这种营销努力甚至遭到了谷歌内部员工的批评。值得注意的是,谷歌DeepMind首席执行官德米斯・哈萨比斯(DemisHassabis)在接受媒体采访时强调,Gemini是人工智能的新品种——“原生多模态”,区别于现有的“拼凑多模态”模型,即从一开始就使用多种模态(例如音频、视频和图像)训练而成。因此,Gemini开辟了一条人工智能领域前所未见的道路,可能会带来重大的新突破。(澎湃新闻)

封面图片

外媒:谷歌发布Gemini更多是为营销 仍落后于GPT-4

外媒:谷歌发布Gemini更多是为营销仍落后于GPT-4一年前,谷歌被OpenAI的聊天机器人ChatGPT打了个措手不及,此后就一直渴望描绘出自己在人工智能领域快速进步的画面。本周三谷歌突然提前发布了新的人工智能模型Gemini,可以发现魔术中的技巧,并在会计认证考试中取得好成绩。谷歌发布的演示视频也在社交媒体上引起了轰动,但从技术角度来看,谷歌仍然在追赶OpenAI。从谷歌Gemini与OpenAI顶级模型GPT-4的性能对比来看,谷歌最强大的GeminiUltra在高中物理、专业法律测试以及道德场景等大多数基准测试中都优于GPT-4。要知道,当前的人工智能竞赛几乎完全是由这些能力定义的。但在大多数基准测试中,GeminiUltra只比GPT-4高出几个百分点。换句话说,谷歌所谓的顶级人工智能模型较OpenAI至少一年前完成的工作效果提升有限。如果GeminiUltra真如谷歌所说那样在明年1月初发布,那么可能不会在顶级人工智能模型的头把交椅上呆太久时间。在谷歌努力追赶OpenAI的过程中,后者有将近一年的时间来开发新一代人工智能模型GPT-5。谷歌发布在社交媒体X上的演示视频乍一看令人印象深刻。谷歌的人工智能模型能够追踪塑料杯下的纸球,或者在勾勒出图片轮廓之前就推断出会是一只螃蟹,这些都显示出谷歌DeepMind人工智能实验室多年来训练的强大推理能力。这是其他人工智能模型所缺少的功能。但视频中展示的许多其他功能并不是谷歌独有的,ChatGPTPlus3也可以做得到,沃顿商学院教授伊森·莫里克(EthanMollick)就用实验证实了这一点。此外,谷歌也承认演示视频被编辑过。该公司在视频描述中说:“为了达到演示效果,我们缩短了延迟时间,Gemini的输出也压缩了。”这意味着模型做出响应所花费的时间实际上要比视频中展示的长。事实上演示也不是实时的,也没有通过语音交互完成。谷歌的一位发言人在谈到这段视频时表示,这段视频是“使用视频中的静止图像帧,并通过文本提示”制作出来的。有网站展示了其他人如何通过手势、绘画或其他物体的照片与Gemini互动。换句话说,演示视频中的声音只是在解释给Gemini做了哪些人工提示,Gemini输出的依旧是静态图片。这似乎与谷歌所谓一个人可以与Gemini进行流畅对话、模型可以实时观察周围世界并做出反应的暗示完全不同。演示视频也没有说明展示是GeminiUltra人工智能模型。这些细节表明,谷歌更多是在进行营销,希望人们记住自己拥有世界上最大的人工智能研究团队之一,并且比其他任何人都能获得更多数据。正如谷歌在周三所做的那样,公司希望在Chrome、Android和Pixel手机上推出适用于终端设备的Gemini模型,提醒人们公司的部署网络规模有多庞大。但在科技行业,无处不在并不总是看起来那么有优势。早期的手机霸主诺基亚(和黑莓)就经历过惨痛教训,苹果用功能更强大、更直观的iPhone抢走了它们的市场。在软件领域,商业上的成功往往来自于性能最好的系统。几乎可以肯定的是,谷歌这番操作是为了利用OpenAI最近的动荡局势。据报道,当OpenAI董事会暂时罢免首席执行官萨姆·奥特曼(SamAltman),使公司的未来发展受到质疑时,谷歌迅速发起了一场营销活动,说服OpenAI企业客户转向谷歌。现在,随着Gemini的发布,谷歌似乎正在利用这种不确定性。但演示的效果有限。谷歌之前已经展示过新技术,但没有任何进展。到目前为止,谷歌的庞大架构和层叠复杂的产品经理设置使其无法像OpenAI那样灵活发布产品。随着全社会努力应对人工智能的变革性影响,谷歌的最新举措并不是一件坏事,但效果有待观察。可以肯定的是,谷歌仍然在后面努力追赶。...PC版:https://www.cnbeta.com.tw/articles/soft/1402909.htm手机版:https://m.cnbeta.com.tw/view/1402909.htm

封面图片

Google One 新增包含 Gemini Advanced 的套餐

GoogleOne新增包含GeminiAdvanced的套餐谷歌Bard现已重新命名为Gemini。可以访问谷歌最强大的AI模型Ultra1.0的GeminiAdvanced套餐也开放订阅,前两个月免费使用,之后每月19.99美元/18.99英镑/21.99欧元/1950印度卢比/2900円。订阅附带2TB谷歌硬碟空间,此外订阅者很快就能在Gmail、文档、幻灯片、表格等中使用Gemini。https://one.google.com/explore-plan/gemini-advanced

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人