Google将修正Gemini人工智能输出回答时的史实误差

Google将修正Gemini人工智能输出回答时的史实误差负责监督Gemini开发的Google高级产品总监杰克-克劳奇克（Jack Krawczyk）周三写道，Gemini团队正在努力调整人工智能模型，以便生成更符合历史的准确结果。Krawczyk说："我们知道Gemini公司提供的一些历史图像生成描述不准确，我们正在努力立即解决这个问题。"产品总监在同一篇文章中强调，"Gemini"的设计旨在"反映我们的全球用户群，我们认真对待代表性和偏见问题"，这表明这些结果的产生可能是人工智能努力实现种族包容性的一部分。一些 Gemini 用户发布了截图，声称 Gemini 错误地认为美国原住民男人和印度女人代表了 1820 年代的德国夫妇、非洲裔美国人的开国元勋，亚洲和原住民士兵是 1929 年德国军队的成员，甚至还有“中世纪的英格兰国王”。Krawczyk 说："历史背景有更多细微差别，我们将进一步调整以适应这种情况，"他补充说，非历史请求将继续产生"通用"结果。但是，如果Gemini被修改为执行更严格的历史现实主义，它就不能再被用来创造历史再现。更广泛地说，生成式人工智能工具旨在利用特定的数据集，在一定参数范围内创建内容。这些数据可能有缺陷，也可能根本不正确。众所周知，人工智能模型也会产生"幻觉"，这意味着它们可能会编造虚假信息，只是为了给用户一个回应。如果人工智能不只是作为一种创造性工具来使用，而是用于教育或工作等目的，那么幻觉和不准确性就会成为一个值得关注的问题。自 2022 年 OpenAI 的 ChatGPT 等生成式人工智能工具推出以来，艺术家、记者和大学研究人员发现，人工智能模型在创建图像时可能会显示出固有的种族主义、性别歧视或其他歧视性偏见。Google在其人工智能原则中明确承认了这一问题，并表示作为一家公司，Google正努力避免在其人工智能工具中复制任何"不公平的偏见"。Gemini并不是本周唯一一个给用户带来意外结果的人工智能工具。据报道，ChatGPT 周三也出了点问题，对一些用户的询问做出了毫无意义的回答。OpenAI 表示已经"修复"了这个问题。 ... PC版：手机版：

在Telegram中查看

相关推荐

Google发布Gemini 1.5 Flash人工智能模型比Gemini Pro更轻便与易于使用

Google发布Gemini 1.5 Flash人工智能模型比Gemini Pro更轻便与易于使用 Google DeepMind 首席执行官德米斯-哈萨比斯（Demis Hassabis）在一篇博客文章中写道："[Gemini] 1.5 Flash 擅长摘要、聊天应用、图像和视频字幕、从长文档和表格中提取数据等。"Google之所以创建Gemini 1.5 Flash，是因为开发人员需要一个比Google今年2月发布的专业版更轻便、更便宜的型号。Gemini 1.5 Pro 比该公司去年底发布的 Gemini 原型更高效、更强大。Gemini 1.5 Flash 介于 Gemini 1.5 Pro 和 Gemini 1.5 Nano 之间，是Google在本地设备上运行的最小型号。尽管重量比 Gemini Pro 轻，但功能却同样强大。Google表示，这是通过一个名为"蒸馏"的过程实现的，即把 Gemini 1.5 Pro 中最基本的知识和技能转移到更小的型号上。这意味着，Gemini 1.5 Flash 将获得与 Pro 相同的多模态功能，以及长语境窗口（人工智能模型可一次性摄取的数据量），即一百万个词元。根据Google的说法，这意味着 Gemini 1.5 Flash 将能够一次性分析 1500 页的文档或超过 30000 行的代码库。Gemini 1.5 Flash（或这些型号中的任何一款）并非真正面向消费者。相反，它是开发人员利用Google设计的技术构建自己的人工智能产品和服务的一种更快、更便宜的方式。除了推出 Gemini 1.5 Flash 之外，Google还对 Gemini 1.5 Pro 进行了升级。该公司表示，已经"增强"了该模型编写代码、推理和解析音频与图像的能力。但最大的更新还在后面Google宣布将在今年晚些时候把该模型现有的上下文窗口增加一倍，达到 200 万个词元。这将使它能够同时处理两小时的视频、22 小时的音频、6 万多行代码或 140 多万字。Gemini 1.5 Flash 和 Pro 现在都可以在Google的人工智能工作室和顶点人工智能中进行公开预览。该公司今天还发布了新版 Gemma 开放模型，名为 Gemma 2。不过，除非你是开发人员或喜欢捣鼓构建人工智能应用程序和服务的人，否则这些更新其实并不适合普通消费者。 ... PC版：手机版：

Opera与Google达成合作将Gemini人工智能引入其浏览器

Opera与Google达成合作将Gemini人工智能引入其浏览器歌剧院合作伙伴关系执行副总裁 Per Wetterdal 说：我们两家公司已经合作了 20 多年。我们非常高兴地宣布，双方将在生成式人工智能领域深化合作，进一步加强我们的浏览器人工智能服务套件。Google云北欧地区总经理伊娃-福斯（Eva Fors）在谈到此次合作时说：我们很高兴能提升与 Opera 的长期合作，为其在浏览器领域的人工智能创新提供动力。我们相信人工智能的未来将是开放的，因此我们提供对Google最好的基础设施、人工智能产品、平台和基础模型的访问权限，使企业能够利用生成式人工智能规划自己的发展方向。Google云支持的主要功能包括图像生成和语音输出。Opera One Developer 最新发布的人工智能功能包括使用顶点人工智能（Vertex AI）上的 Imagen 2 模型，并借助Google的文本到音频（text-to-audio）模型，以类似对话的方式朗读回复。最近，Opera 在其浏览器中增加了许多人工智能功能，甚至允许在电脑上下载和使用本地运行的 LLM，允许访问来自 50 多个系列的 150 多个模型，包括 Meta 的 Llama 和 Google 的 Gemma。自 2023 年 6 月推出 Opera One 以来，Opera 一直在追求与其他浏览器的关键差异点，Opera One 对原有的 Opera 浏览器进行了大刀阔斧的改造，包括模块化设计、可对打开的标签进行分组的 Tab Islands，以及首次引入前面提到的 Aria AI。 ... PC版：手机版：

Google的下一代人工智能模型Gemini 1.5已基本准备就绪

Google的下一代人工智能模型Gemini 1.5已基本准备就绪 Gemini 1.5 有很多改进：Gemini 1.5 Pro（Google系统中的通用模型）与该公司最近才推出的高端 Gemini Ultra 能力不相上下，而且在 87% 的基准测试中，它都优于 Gemini 1.0 Pro。它采用了一种越来越常见的技术，即"专家混合"（MoE），这意味着当你发送查询时，它只运行整个模型的一部分，而不是一直处理整个模型。这种方法能让用户更快地使用模型，也能让 Google 更高效地运行模型。但是，Gemini 1.5 中的一个新功能让整个公司都特别兴奋：Gemini 1.5 有一个巨大的上下文窗口，这意味着它可以处理更大的查询，一次查看更多的信息。这个窗口高达 100 万个tokens，而 OpenAI 的 GPT-4 为 12.8 万个，目前的 Gemini Pro 为 3.2 万个。"这大约相当于是 10 或 11 个小时的视频，数万行代码"。上下文窗口意味着可以一次性向人工智能机器人询问所有内容。Google CEO皮查伊还表示，研究人员正在测试一个 1000 tokens的上下文窗口这就好比是将《权力的游戏》的整个系列同时播出，或者把整个《指环王》三部曲都放进这个上下文窗口中。这允许在查询时添加大量个人上下文和信息，就像我们极大地扩展了查询窗口一样。目前，Gemini 1.5 只能通过Google的顶点人工智能（Vertex AI）和人工智能工作室（AI Studio）提供给企业用户和开发人员。最终，它将取代Gemini 1.0，而Gemini专业版的标准版本每个人都可以在gemini.google.com和公司的App中使用的版本将是 1.5 专业版，拥有128000 个tokens的上下文窗口，而需要支付额外的费用才能获得百万级的权限。Google还在测试该模式的安全性和道德底线，尤其是新增加的上下文窗口。当全球企业都在试图制定自己的人工智能战略以及是与 OpenAI、Google还是其他公司签署开发者协议时，Google正在为打造最好的人工智能工具而展开一场激烈的竞赛。就在本周，OpenAI 公布了ChatGPT的"记忆能力"，同时似乎准备进军网络搜索领域。到目前为止，Gemini 似乎给人留下了深刻印象，尤其是对于那些已经进入Google生态系统的人来说，但各方都还有很多工作要做。最终，所有这些 1.0、1.5、Pro、Ultras 和企业之争对用户来说并不重要。人们将只需要感受AI，这就像使用智能手机，而不必总是关注手机里面的处理器是怎么工作的。 ... PC版：手机版：

Google为购物功能增添更多人工智能元素

Google为购物功能增添更多人工智能元素这项名为"风格推荐"（Style Recommendations）的最新功能可以让用户在搜索中对商品进行评分，从而了解搜索者的风格和喜好。这有点像 Tinder，不过对象是衬衫。在找到自己喜欢的衣服后，购物者可以指定自己喜欢的品牌，这样就能立即从这些选择中找到更多服装。Google曾测试过人工智能工具，帮助人们找到更多自己喜欢的商品。11 月，该公司的"搜索生成体验"（Search Generative Experience）用户测试了一种图像生成功能，它能根据提示拼凑出夹克和其他服装。然后，人们可以根据人工智能图像找到类似的商品。该公司还测试了虚拟试穿功能，购物者可以看到品牌服装的穿着效果。这两项功能现已在 Google Shopping 上上线。Google与其他电子商务平台一道，将人工智能生成工具引入购物领域。亚马逊的购物助手"鲁弗斯"（Rufus）可以回答顾客对商品的询问，该公司还提供人工智能驱动的尺码建议。然而，人工智能驱动的购物功能仍是新生事物，可能会导致出现问题商品，有时候人工智能购物体验令人困惑，而且买到的衣服原型并不适合人类。 ... PC版：手机版：

Google发布了一对开源人工智能模型Gemma 2B和7B 适用于较小的任务

Google发布了一对开源人工智能模型Gemma 2B和7B 适用于较小的任务不过，这些模型在复杂性上的不足，可能会在速度和使用成本上得到弥补。尽管规模较小，但Google声称，Gemma 模型"在关键基准测试中明显超越了更大的模型"，并且"能够直接在开发人员的笔记本电脑或台式电脑上运行"。这些模型将通过 Kaggle、Hugging Face、NVIDIA 的 NeMo 和Google的 Vertex AI 提供。Gemma 进入开源生态系统的方式与 Gemini 的发布方式截然不同。虽然开发者可以在 Gemini 的基础上进行开发，但他们要么通过 API，要么在Google的 Vertex AI 平台上进行开发。Gemini 被认为是一种封闭的人工智能模式。通过将 Gemma 开源，更多的人可以尝试使用Google的人工智能，而不是转向提供更好访问权的竞争对手。无论组织规模、用户数量和项目类型如何，这两种尺寸的模型都将获得商业许可。不过，与其他公司一样，Google通常禁止将其模型用于武器开发项目等特定任务。Gemma 还将提供"负责任的人工智能工具包"，因为开放模型比 Gemini 等封闭系统更难设置防护措施。Google DeepMind 产品管理总监特里斯-瓦肯汀说，"由于开放模型的固有风险，公司对 Gemma 进行了更广泛的重新设计"。负责任的人工智能工具包允许开发人员在项目中部署 Gemma 时创建自己的准则或禁用词列表。该工具包还包括一个模型调试工具，可让用户调查 Gemma 的行为并纠正问题。Warkentin 表示，这些模型目前最适用于英语语言相关任务，希望能与社区合作，满足英语任务以外的市场需求。开发人员可以在 Kaggle 中免费使用 Gemma，首次使用Google云的用户可以获得 300 美元的免费额度来使用模型。该公司表示，研究人员最多可申请 500000 美元的额度。虽然目前还不清楚人们对 Gemma 这样的小模型有多大需求，但其他人工智能公司也推出了重量更轻的旗舰基础模型。Meta 去年推出了 Llama 2 7B，这是 Llama 2 的最小迭代版本。 Gemini 本身也有几种重量，包括 Gemini Nano、Gemini Pro 和 Gemini Ultra，Google最近宣布推出速度更快的 Gemini 1.5，目前也是针对企业用户和开发人员。顺便说一下，Gemma 的意思是宝石。 ... PC版：手机版：

英国政府将试用人工智能工具

英国政府将试用人工智能工具英国的大臣们正在试点使用生成式人工智能来分析对政府意见征集的回应，撰写对议会问题的回答草稿。英国副首相奥利弗•道登将于周四公布一些工具，白厅核心的人工智能“精锐小组”正在试用这些工具，以期在中央部门和公共服务部门更广泛地推广这些工具。人工智能工具包括使用政府托管的 ChatGPT 版本和内部安全托管的开源人工智能模型，以起草对议员向大臣提交的问题和信息自由请求的初步答复。 ()

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人