谢尔盖·布林罕见公开表示公司“显然搞砸了”Gemini图像生成系统

谢尔盖·布林罕见公开表示公司“显然搞砸了”Gemini图像生成系统上周六，50 岁的布林在加利福尼亚州希尔斯伯勒的"AGI 之家"向企业家们发表了演讲，该地位于旧金山南部，开发人员和创始人正在那里测试Google的双子座模型。AGI 是人工通用智能（artificial general intelligence）的缩写，指的是一种能够完成与人类同等水平或更高水平任务的人工智能。在回答观众提问时，布林讨论了人工智能对搜索的影响，以及随着人工智能的不断发展，Google如何保持其在核心市场的领先地位。他还谈到了Google上个月推出的Gemini图片生成器的缺陷，该公司在用户发现历史不准确和有问题的回复后撤下了该产品。布林周六说："我们肯定在图像生成上出了问题。我认为这主要是因为测试不彻底。出于好的理由，这肯定会让很多人不高兴。"Google官方上周表示，它计划很快重新推出图像生成功能。布林于 1998 年与拉里-佩奇共同创立了Google，但在 2019 年辞去了 Alphabet 总裁一职。他仍然是董事会成员和主要股东，持有公司价值约 1000 亿美元的股份。他重返公司工作，是为了帮助提升Google在竞争激烈的人工智能市场中的地位。在周六的某些情况下，布林说他是在作"个人"回答，而不是代表公司。他在活动上说："看到这些模型年复一年地发挥作用，我感到非常惊讶。"关于Gemini最近遇到的导致图像结果有缺陷的挑战，他说："我们还不完全明白为什么在很多情况下它会立场偏左，但这不是我们的本意，公司最近在某些内部测试中将准确率提高了 80%。"布林的评论是公司高管首次在现场就Gemini图像生成错误事件发表讲话。此前，Google搜索部门主管普拉巴卡尔- 拉加万（Prabhakar Raghavan）和首席执行官桑达尔-皮查伊（Sundar Pichai）就这一备受争议的推广活动发表了事先准备好的声明。Google拒绝就此事发表评论。布林说，在利用人工智能产生准确结果的斗争中，Google远非孤军奋战。他举例说，OpenAI 的 ChatGPT 和埃隆-马斯克的Grok 服务都是人工智能工具，"比如说，它们说了一些很奇怪的话，绝对让人感觉很左"。他说，AI幻觉或对用户提示的错误反应仍然是"目前的一个大问题"，这是毫无疑问的。"随着时间的推移，我们让他们产生的幻觉越来越少，但如果能实现接近零的突破，我肯定会很兴奋，"布林说。"但不能只指望突破，所以我认为我们会继续循序渐进，随着时间的推移把它降下来、降下来、降下来。"当一位与会者问布林是否希望建立人工智能时，他给出了肯定的回答，并提到人工智能能够帮助"推理"。布林还被问及，考虑到广告收入是Google的核心业务，在线广告将如何受到干扰，之前该公司报告称，在过去几年里，广告增长速度放缓。布林说："我并不太关心商业模式的转变。我认为，25 年来，我们能够免费为每个人提供世界级的信息搜索，并得到广告的支持，这真是太好了。"他承认，业务可能会发生变化："我预计商业模式会随着时间的推移而演变，也许还是广告，因为广告可以做得更好，人工智能能够更好地定制广告。"布林对Google的地位充满信心。他说："我个人认为，只要能产生巨大的价值，我们就能找出商业模式。"除了人工智能，布林还被问及Google在硬件方面的困难，因为最近虚拟现实技术取得了进步。众所周知，Google很早就进入了增强现实市场，推出了现已停产的Google眼镜。他在谈到Google眼镜时说："我觉得我做了一些错误的决定。如果换一种方式，会把Google眼镜当作原型而不是产品。但是，我仍然喜欢这种轻巧的外形。"在谈及关于Apple Vision Pro和Meta 的Quest 耳机时，布林说："它们非常令人印象深刻。"当被问及如何看待Gemini对空间计算或Google地图或街景等产品的影响时，布林的回答充满了好奇："老实说，我还没想过这个问题，但既然你这么说了，是的，我们没有理由不输入更多的 3D 数据，也许有人在做这件事我不知道。" ... PC版：手机版：

在Telegram中查看

相关推荐

出现人种多样性错误后 Google暂停了Gemini AI生成人物图像的功能

出现人种多样性错误后 Google暂停了Gemini AI生成人物图像的功能 "我们已经在努力解决Gemini图像生成功能最近出现的问题，"Google在X 上发布的一份声明中说，"在我们进行这项工作的同时，将暂停生成人的图像，并将很快重新发布一个改进版本。"在Google决定暂停在Gemini中生成人物图像不到 24 小时之前，该公司就其人工智能模型生成的一些历史图像不准确一事道歉。一些Gemini用户在请求生成建国元勋等历史团体或人物的图片时，发现人工智能生成的结果中出现了非白人的人物。这在网上引起了一些阴谋论，认为Google有意避免描绘白人。实测几个Gemini的查询，发现其中包括一个"19 世纪美国参议员"的请求返回的结果包括似乎是黑人和美洲原住民的女性。第一位女参议员是 1922 年的白人女性，因此Gemini的人工智能图像基本上抹去了种族和性别歧视的历史。下面是人工智能模型在用户请求生成人物图片时的反应：我们正在努力提高Gemini生成人物图像的能力。我们预计这项功能将很快恢复，届时我们将通过版本更新通知您。本月早些时候，Google首次通过 Gemini（前身为 Bard）开始提供图像生成功能，以期与 OpenAI 和微软的 Copilot 竞争。与竞争对手一样，图像生成工具也是根据文本输入生成一系列图像。 ... PC版：手机版：

AI技术能复兴Google Glass？谷歌联合创始人谢尔盖·布林回应

AI技术能复兴Google Glass？谷歌联合创始人谢尔盖·布林回应在开幕日主题演讲后的一个小规模媒体问答环节中，布林分享了他对ProjectAstra、Gemini Pro 1.5及他最看重的人工智能应用场景的看法。Project Astra是谷歌展示的最宏大的人工智能项目之一，它的目标是实现“能够展示推理、规划和记忆功能的智能系统”。当被问及Project Astra及其潜在的可穿戴设备形式与十年前的谷歌眼镜相比时，布林说：“这挺有意思，因为它几乎是完美的硬件。”他补充道，“现在来看，它完全可以成为十年后的杀手级应用。我只是希望当初能更准确地预见这一点。”虽然谷歌眼镜的兴衰故事已为人所熟知，但在近年来，随着人工智能技术的发展和对最佳硬件的探索，这一产品的愿景已经得到了复兴无论是眼镜、领章还是其他形态。布林更倾向于一种免提、可穿戴的设备，而不是手机。除了硬件，布林真正兴奋的是人工智能技术这也是他在2019年退休后重返谷歌的主要原因。据悉，自2023年回归公司以来，布林在开发谷歌的人工智能产品如Gemini中发挥了重要作用，Gemini正在成为各种谷歌设备和服务的通用模型基础。今年的I/O大会上，谷歌展示了升级后的Gemini Pro 1.5模型，该模型可以处理高达200万个Token（相比之前为100万个），从而支持更长时间的对话和处理更大尺寸的文件。布林认为，这种AI模型的通用性最令人印象深刻，从提取多个Gmail消息的摘要到编程，这些都是他最喜欢的AI应用场景。布林表示：“作为一名计算机科学家，我想参与到人工智能中去。我认为现在是成为计算机科学家的最好时代。” ... PC版：手机版：

谷歌表示，将暂停Gemini AI生成人物图像的能力，此前该工具被发现生成不准确的历史图像。Gemini一直在创作美国开国元勋和

谷歌表示，将暂停Gemini AI生成人物图像的能力，此前该工具被发现生成不准确的历史图像。Gemini一直在创作美国开国元勋和纳粹时期德国士兵的各种形象，这似乎是在试图颠覆生成式人工智能中存在的性别和种族刻板印象。谷歌在x上发布的一份声明中表示:“我们已经在努力解决Gemini图像生成功能最近出现的问题，在我们这样做的同时，我们将暂停人员图像生成，并将很快重新发布改进版本。” 标签: #Google #Gemini 频道: @GodlyNews1 投稿: @GodlyNewsBot

Google将修正Gemini人工智能输出回答时的史实误差

Google将修正Gemini人工智能输出回答时的史实误差负责监督Gemini开发的Google高级产品总监杰克-克劳奇克（Jack Krawczyk）周三写道，Gemini团队正在努力调整人工智能模型，以便生成更符合历史的准确结果。Krawczyk说："我们知道Gemini公司提供的一些历史图像生成描述不准确，我们正在努力立即解决这个问题。"产品总监在同一篇文章中强调，"Gemini"的设计旨在"反映我们的全球用户群，我们认真对待代表性和偏见问题"，这表明这些结果的产生可能是人工智能努力实现种族包容性的一部分。一些 Gemini 用户发布了截图，声称 Gemini 错误地认为美国原住民男人和印度女人代表了 1820 年代的德国夫妇、非洲裔美国人的开国元勋，亚洲和原住民士兵是 1929 年德国军队的成员，甚至还有“中世纪的英格兰国王”。Krawczyk 说："历史背景有更多细微差别，我们将进一步调整以适应这种情况，"他补充说，非历史请求将继续产生"通用"结果。但是，如果Gemini被修改为执行更严格的历史现实主义，它就不能再被用来创造历史再现。更广泛地说，生成式人工智能工具旨在利用特定的数据集，在一定参数范围内创建内容。这些数据可能有缺陷，也可能根本不正确。众所周知，人工智能模型也会产生"幻觉"，这意味着它们可能会编造虚假信息，只是为了给用户一个回应。如果人工智能不只是作为一种创造性工具来使用，而是用于教育或工作等目的，那么幻觉和不准确性就会成为一个值得关注的问题。自 2022 年 OpenAI 的 ChatGPT 等生成式人工智能工具推出以来，艺术家、记者和大学研究人员发现，人工智能模型在创建图像时可能会显示出固有的种族主义、性别歧视或其他歧视性偏见。Google在其人工智能原则中明确承认了这一问题，并表示作为一家公司，Google正努力避免在其人工智能工具中复制任何"不公平的偏见"。Gemini并不是本周唯一一个给用户带来意外结果的人工智能工具。据报道，ChatGPT 周三也出了点问题，对一些用户的询问做出了毫无意义的回答。OpenAI 表示已经"修复"了这个问题。 ... PC版：手机版：

Google发布Gemini 1.5 Flash人工智能模型比Gemini Pro更轻便与易于使用

Google发布Gemini 1.5 Flash人工智能模型比Gemini Pro更轻便与易于使用 Google DeepMind 首席执行官德米斯-哈萨比斯（Demis Hassabis）在一篇博客文章中写道："[Gemini] 1.5 Flash 擅长摘要、聊天应用、图像和视频字幕、从长文档和表格中提取数据等。"Google之所以创建Gemini 1.5 Flash，是因为开发人员需要一个比Google今年2月发布的专业版更轻便、更便宜的型号。Gemini 1.5 Pro 比该公司去年底发布的 Gemini 原型更高效、更强大。Gemini 1.5 Flash 介于 Gemini 1.5 Pro 和 Gemini 1.5 Nano 之间，是Google在本地设备上运行的最小型号。尽管重量比 Gemini Pro 轻，但功能却同样强大。Google表示，这是通过一个名为"蒸馏"的过程实现的，即把 Gemini 1.5 Pro 中最基本的知识和技能转移到更小的型号上。这意味着，Gemini 1.5 Flash 将获得与 Pro 相同的多模态功能，以及长语境窗口（人工智能模型可一次性摄取的数据量），即一百万个词元。根据Google的说法，这意味着 Gemini 1.5 Flash 将能够一次性分析 1500 页的文档或超过 30000 行的代码库。Gemini 1.5 Flash（或这些型号中的任何一款）并非真正面向消费者。相反，它是开发人员利用Google设计的技术构建自己的人工智能产品和服务的一种更快、更便宜的方式。除了推出 Gemini 1.5 Flash 之外，Google还对 Gemini 1.5 Pro 进行了升级。该公司表示，已经"增强"了该模型编写代码、推理和解析音频与图像的能力。但最大的更新还在后面Google宣布将在今年晚些时候把该模型现有的上下文窗口增加一倍，达到 200 万个词元。这将使它能够同时处理两小时的视频、22 小时的音频、6 万多行代码或 140 多万字。Gemini 1.5 Flash 和 Pro 现在都可以在Google的人工智能工作室和顶点人工智能中进行公开预览。该公司今天还发布了新版 Gemma 开放模型，名为 Gemma 2。不过，除非你是开发人员或喜欢捣鼓构建人工智能应用程序和服务的人，否则这些更新其实并不适合普通消费者。 ... PC版：手机版：

Opera与Google达成合作将Gemini人工智能引入其浏览器

Opera与Google达成合作将Gemini人工智能引入其浏览器歌剧院合作伙伴关系执行副总裁 Per Wetterdal 说：我们两家公司已经合作了 20 多年。我们非常高兴地宣布，双方将在生成式人工智能领域深化合作，进一步加强我们的浏览器人工智能服务套件。Google云北欧地区总经理伊娃-福斯（Eva Fors）在谈到此次合作时说：我们很高兴能提升与 Opera 的长期合作，为其在浏览器领域的人工智能创新提供动力。我们相信人工智能的未来将是开放的，因此我们提供对Google最好的基础设施、人工智能产品、平台和基础模型的访问权限，使企业能够利用生成式人工智能规划自己的发展方向。Google云支持的主要功能包括图像生成和语音输出。Opera One Developer 最新发布的人工智能功能包括使用顶点人工智能（Vertex AI）上的 Imagen 2 模型，并借助Google的文本到音频（text-to-audio）模型，以类似对话的方式朗读回复。最近，Opera 在其浏览器中增加了许多人工智能功能，甚至允许在电脑上下载和使用本地运行的 LLM，允许访问来自 50 多个系列的 150 多个模型，包括 Meta 的 Llama 和 Google 的 Gemma。自 2023 年 6 月推出 Opera One 以来，Opera 一直在追求与其他浏览器的关键差异点，Opera One 对原有的 Opera 浏览器进行了大刀阔斧的改造，包括模块化设计、可对打开的标签进行分组的 Tab Islands，以及首次引入前面提到的 Aria AI。 ... PC版：手机版：

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人