Google一员工承认Gemini的演示视频造假

Google一员工承认Gemini的演示视频造假根据彭博社消息，谷歌在被要求发表评论时承认，视频演示并不是实时的，而是使用了原始镜头中的静止图像帧，然后编写了文本提示，让Gemini做出回应。彭博专栏作家帕米·奥尔森（ParmyOlson）在文章中指出，谷歌自己也承认，视频是剪辑过的。该公司在YouTube的描述中表示：“为了演示的目的，为了简洁起见，延迟被减少了，Gemini的输出也被缩短了。”此外，GoogleDeepMind的研究副总裁奥瑞奥·维纳尔斯（OriolVinyals）也在社交平台发文，介绍了如何录制Gemini的演示视频。OriolVinyals表示，谷歌为Gemini提供的多模态能力和即时响应将在12月13日开放Pro访问权限时供开发者使用。不过Demo视频里的内容是使用Ultra模型做到的。视频中的所有人类提示和AI输出都是真实的，但为简洁起见进行了缩短。来源：https://view.inews.qq.com/k/20231208A050HZ00?no-redirect=1&web_channel=wap&openApp=false投稿：@TNSubmbot频道：@TestFlightCN

在Telegram中查看

相关推荐

Google承认刚推出的Gemini AI至少有一段性能演示是经过剪辑的

Google承认刚推出的GeminiAI至少有一段性能演示是经过剪辑的这段六分钟的视频展示了Gemini的多模态功能（例如，口语对话提示与图像识别相结合）。双子座似乎能快速识别图像（甚至是连线图片），在几秒钟内做出反应，并实时跟踪杯球游戏中的纸团。当然，人类可以做到所有这些，但这是一个能够识别并预测接下来会发生什么的人工智能。不过，点击YouTube上的视频描述，Google有一个重要的免责声明："为了演示的目的，延迟已经减少，双子座的输出已经缩短，以求简洁"。这正是奥尔森不满意的地方。根据她在彭博社发表的文章，Google在被要求发表评论时承认，视频演示并不是通过语音提示实时进行的，而是使用了原始镜头中的静止图像帧，然后写出文字提示，让双子座做出回应。奥尔森写道："这与Google似乎在暗示的内容大相径庭：人可以与双子座进行流畅的语音对话，同时双子座会实时观察并回应周围的世界。公平地说，Google公司经常编辑演示视频，尤其是许多公司希望避免现场演示带来的任何技术故障。稍作调整是常有的事。但是，Google在视频演示方面一直存在问题。人们曾怀疑Google的Duplex演示（还记得Duplex吗？Duplex是一款人工智能语音助手，可以打电话给发廊和餐馆预订房间。而预先录制的人工智能模型视频往往会让人更加怀疑。"在这种情况下，奥尔森认为Google是在"作秀"，目的是误导人们，让他们不知道Gemini仍然落后于OpenAI的GPT。Google对此并不认同。当被问及演示的真实性时，Google指出了GoogleDeepMind研究副总裁兼深度学习负责人OriolVinyals（也是Gemini的联合负责人）的一篇文章，其中解释了团队是如何制作视频的。Vinyals说："视频中的所有用户提示和输出都是真实的，为了简洁起见进行了缩短。视频展示了使用Gemini构建的多模式用户体验。我们制作它是为了激励开发人员。"他补充说，团队给双子座提供了图片和文本，并要求它预测接下来会发生什么。这当然是处理这种情况的一种方法，但对Google来说可能并不合适--至少在公众看来，Google已经被OpenAI今年的巨大成功吓了一跳。如果Google想激励开发者，就不能通过精心剪辑的宣传片，这些宣传片可能会歪曲人工智能的能力。而是通过让记者和开发人员实际体验产品。让人们在小型公开测试版中用双子座做蠢事。让我们看看它到底有多强大。...PC版：https://www.cnbeta.com.tw/articles/soft/1402937.htm手机版：https://m.cnbeta.com.tw/view/1402937.htm

Google推出Gemini后，ChatGPT 开始恢复部分用户开通PLUS 的资格

Google推出Gemini后，ChatGPT开始恢复部分用户开通PLUS的资格后续：Google承认Gemini演示”造假”YouTube上的视频描述，可以发现Google有一个重要的免责声明：「为了演示的目的，他们已经减少延迟，为了简洁，Gemini的输出也缩短了。」根据彭博社消息，谷歌在被要求发表评论时承认，视频演示并不是实时的，而是使用了原始镜头中的静止图像帧，然后编写了文本提示，让Gemini做出回应。视频看起来很美好，然而，却也反映出了这一问题：视频不是真实的。人们使用了各种方式来进行验证，包括使用视频的截图来问Bard中的Gemini，发现AI并不能准确地回答问题。标签:#OpenAI#ChatGPT#Gemini频道:@GodlyNews1投稿:@GodlyNewsBot

谷歌测试由 Gemini AI 创建的视频演示

谷歌在Workspace实验室推出了新的Vids生产力应用，理念是“如果你能做幻灯片，就能在Vids里做视频。”Vids在四月宣布，允许用户将文档、幻灯片、旁白和视频录音拖放到时间线上，制作一个可以与同事分享的演示视频。通过Workspace实验室预览提供，该功能让Workspace管理员可以选择让用户试用这个由人工智能驱动的视频制作工具。虽然你可以在Vids中生成视频，但不要与像OpenAI的Sora这样的AI工具混淆，后者可以根据提示生成逼真的画面。相比之下，Vids是通过描述你希望Gemini创建的内容来生成展示视频，然后你可以在之后修改视频。你也可以选择使用众多可用模板之一手动开始你的GoogleVids演示草稿，并且有免版权的素材可以用来提升你的创作。标签:#Google#AI#Vids#Gemini频道:@GodlyNews1投稿:@GodlyNewsBot

有媒体报道称，一段由人工智能开发机构谷歌DeepMind制作的演示视频夸大了Gemini的性能。这段在网络上广泛流传，显示G

有媒体报道称，一段由人工智能开发机构谷歌DeepMind制作的演示视频夸大了Gemini的性能。这段视频在网络上广泛流传，显示Gemini能够迅速判断画面中的实物并给出像人一样的语音反馈，凸显出惊人的多模态功能。但一些媒体和用户在亲自上手使用时发现，Gemini并不能达到视频中的效果。事实上，谷歌DeepMind承认演示不是实时或以语音进行的。这种营销努力甚至遭到了谷歌内部员工的批评。值得注意的是，谷歌DeepMind首席执行官德米斯・哈萨比斯（DemisHassabis）在接受媒体采访时强调，Gemini是人工智能的新品种——“原生多模态”，区别于现有的“拼凑多模态”模型，即从一开始就使用多种模态（例如音频、视频和图像）训练而成。因此，Gemini开辟了一条人工智能领域前所未见的道路，可能会带来重大的新突破。（澎湃新闻）

外媒：谷歌发布Gemini更多是为营销仍落后于GPT-4

外媒：谷歌发布Gemini更多是为营销仍落后于GPT-4一年前，谷歌被OpenAI的聊天机器人ChatGPT打了个措手不及，此后就一直渴望描绘出自己在人工智能领域快速进步的画面。本周三谷歌突然提前发布了新的人工智能模型Gemini，可以发现魔术中的技巧，并在会计认证考试中取得好成绩。谷歌发布的演示视频也在社交媒体上引起了轰动，但从技术角度来看，谷歌仍然在追赶OpenAI。从谷歌Gemini与OpenAI顶级模型GPT-4的性能对比来看，谷歌最强大的GeminiUltra在高中物理、专业法律测试以及道德场景等大多数基准测试中都优于GPT-4。要知道，当前的人工智能竞赛几乎完全是由这些能力定义的。但在大多数基准测试中，GeminiUltra只比GPT-4高出几个百分点。换句话说，谷歌所谓的顶级人工智能模型较OpenAI至少一年前完成的工作效果提升有限。如果GeminiUltra真如谷歌所说那样在明年1月初发布，那么可能不会在顶级人工智能模型的头把交椅上呆太久时间。在谷歌努力追赶OpenAI的过程中，后者有将近一年的时间来开发新一代人工智能模型GPT-5。谷歌发布在社交媒体X上的演示视频乍一看令人印象深刻。谷歌的人工智能模型能够追踪塑料杯下的纸球，或者在勾勒出图片轮廓之前就推断出会是一只螃蟹，这些都显示出谷歌DeepMind人工智能实验室多年来训练的强大推理能力。这是其他人工智能模型所缺少的功能。但视频中展示的许多其他功能并不是谷歌独有的，ChatGPTPlus3也可以做得到，沃顿商学院教授伊森·莫里克（EthanMollick）就用实验证实了这一点。此外，谷歌也承认演示视频被编辑过。该公司在视频描述中说：“为了达到演示效果，我们缩短了延迟时间，Gemini的输出也压缩了。”这意味着模型做出响应所花费的时间实际上要比视频中展示的长。事实上演示也不是实时的，也没有通过语音交互完成。谷歌的一位发言人在谈到这段视频时表示，这段视频是“使用视频中的静止图像帧，并通过文本提示”制作出来的。有网站展示了其他人如何通过手势、绘画或其他物体的照片与Gemini互动。换句话说，演示视频中的声音只是在解释给Gemini做了哪些人工提示，Gemini输出的依旧是静态图片。这似乎与谷歌所谓一个人可以与Gemini进行流畅对话、模型可以实时观察周围世界并做出反应的暗示完全不同。演示视频也没有说明展示是GeminiUltra人工智能模型。这些细节表明，谷歌更多是在进行营销，希望人们记住自己拥有世界上最大的人工智能研究团队之一，并且比其他任何人都能获得更多数据。正如谷歌在周三所做的那样，公司希望在Chrome、Android和Pixel手机上推出适用于终端设备的Gemini模型，提醒人们公司的部署网络规模有多庞大。但在科技行业，无处不在并不总是看起来那么有优势。早期的手机霸主诺基亚(和黑莓）就经历过惨痛教训，苹果用功能更强大、更直观的iPhone抢走了它们的市场。在软件领域，商业上的成功往往来自于性能最好的系统。几乎可以肯定的是，谷歌这番操作是为了利用OpenAI最近的动荡局势。据报道，当OpenAI董事会暂时罢免首席执行官萨姆·奥特曼(SamAltman)，使公司的未来发展受到质疑时，谷歌迅速发起了一场营销活动，说服OpenAI企业客户转向谷歌。现在，随着Gemini的发布，谷歌似乎正在利用这种不确定性。但演示的效果有限。谷歌之前已经展示过新技术，但没有任何进展。到目前为止，谷歌的庞大架构和层叠复杂的产品经理设置使其无法像OpenAI那样灵活发布产品。随着全社会努力应对人工智能的变革性影响，谷歌的最新举措并不是一件坏事，但效果有待观察。可以肯定的是，谷歌仍然在后面努力追赶。...PC版：https://www.cnbeta.com.tw/articles/soft/1402909.htm手机版：https://m.cnbeta.com.tw/view/1402909.htm

Google One 新增包含 Gemini Advanced 的套餐

GoogleOne新增包含GeminiAdvanced的套餐谷歌Bard现已重新命名为Gemini。可以访问谷歌最强大的AI模型Ultra1.0的GeminiAdvanced套餐也开放订阅，前两个月免费使用，之后每月19.99美元/18.99英镑/21.99欧元/1950印度卢比/2900円。订阅附带2TB谷歌硬碟空间，此外订阅者很快就能在Gmail、文档、幻灯片、表格等中使用Gemini。https://one.google.com/explore-plan/gemini-advanced

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人