Google将修正Gemini人工智能输出回答时的史实误差

Google将修正Gemini人工智能输出回答时的史实误差 负责监督Gemini开发的Google高级产品总监杰克-克劳奇克(Jack Krawczyk)周三写道,Gemini团队正在努力调整人工智能模型,以便生成更符合历史的准确结果。Krawczyk说:"我们知道Gemini公司提供的一些历史图像生成描述不准确,我们正在努力立即解决这个问题。"产品总监在同一篇文章中强调,"Gemini"的设计旨在"反映我们的全球用户群,我们认真对待代表性和偏见问题",这表明这些结果的产生可能是人工智能努力实现种族包容性的一部分。一些 Gemini 用户发布了截图,声称 Gemini 错误地认为美国原住民男人和印度女人代表了 1820 年代的德国夫妇、非洲裔美国人的开国元勋,亚洲和原住民士兵是 1929 年德国军队的成员,甚至还有“中世纪的英格兰国王”。Krawczyk 说:"历史背景有更多细微差别,我们将进一步调整以适应这种情况,"他补充说,非历史请求将继续产生"通用"结果。但是,如果Gemini被修改为执行更严格的历史现实主义,它就不能再被用来创造历史再现。更广泛地说,生成式人工智能工具旨在利用特定的数据集,在一定参数范围内创建内容。这些数据可能有缺陷,也可能根本不正确。众所周知,人工智能模型也会产生"幻觉",这意味着它们可能会编造虚假信息,只是为了给用户一个回应。如果人工智能不只是作为一种创造性工具来使用,而是用于教育或工作等目的,那么幻觉和不准确性就会成为一个值得关注的问题。自 2022 年 OpenAI 的 ChatGPT 等生成式人工智能工具推出以来,艺术家、记者和大学研究人员发现,人工智能模型在创建图像时可能会显示出固有的种族主义、性别歧视或其他歧视性偏见。Google在其人工智能原则中明确承认了这一问题,并表示作为一家公司,Google正努力避免在其人工智能工具中复制任何"不公平的偏见"。Gemini并不是本周唯一一个给用户带来意外结果的人工智能工具。据报道,ChatGPT 周三也出了点问题,对一些用户的询问做出了毫无意义的回答。OpenAI 表示已经"修复"了这个问题。 ... PC版: 手机版:

相关推荐

封面图片

Opera与Google达成合作 将Gemini人工智能引入其浏览器

Opera与Google达成合作 将Gemini人工智能引入其浏览器 歌剧院合作伙伴关系执行副总裁 Per Wetterdal 说:我们两家公司已经合作了 20 多年。我们非常高兴地宣布,双方将在生成式人工智能领域深化合作,进一步加强我们的浏览器人工智能服务套件。Google云北欧地区总经理伊娃-福斯(Eva Fors)在谈到此次合作时说:我们很高兴能提升与 Opera 的长期合作,为其在浏览器领域的人工智能创新提供动力。我们相信人工智能的未来将是开放的,因此我们提供对Google最好的基础设施、人工智能产品、平台和基础模型的访问权限,使企业能够利用生成式人工智能规划自己的发展方向。Google云支持的主要功能包括图像生成和语音输出。Opera One Developer 最新发布的人工智能功能包括使用顶点人工智能(Vertex AI)上的 Imagen 2 模型,并借助Google的文本到音频(text-to-audio)模型,以类似对话的方式朗读回复。最近,Opera 在其浏览器中增加了许多人工智能功能,甚至允许在电脑上下载和使用本地运行的 LLM,允许访问来自 50 多个系列的 150 多个模型,包括 Meta 的 Llama 和 Google 的 Gemma。自 2023 年 6 月 推出 Opera One 以来,Opera 一直在追求与其他浏览器的关键差异点,Opera One 对原有的 Opera 浏览器进行了大刀阔斧的改造,包括模块化设计、可对打开的标签进行分组的 Tab Islands,以及首次引入前面提到的 Aria AI。 ... PC版: 手机版:

封面图片

Google发布Gemini 1.5 Flash人工智能模型 比Gemini Pro更轻便与易于使用

Google发布Gemini 1.5 Flash人工智能模型 比Gemini Pro更轻便与易于使用 Google DeepMind 首席执行官德米斯-哈萨比斯(Demis Hassabis)在一篇博客文章中写道:"[Gemini] 1.5 Flash 擅长摘要、聊天应用、图像和视频字幕、从长文档和表格中提取数据等。"Google之所以创建Gemini 1.5 Flash,是因为开发人员需要一个比Google今年2月发布的专业版更轻便、更便宜的型号。Gemini 1.5 Pro 比该公司去年底发布的 Gemini 原型更高效、更强大。Gemini 1.5 Flash 介于 Gemini 1.5 Pro 和 Gemini 1.5 Nano 之间,是Google在本地设备上运行的最小型号。尽管重量比 Gemini Pro 轻,但功能却同样强大。Google表示,这是通过一个名为"蒸馏"的过程实现的,即把 Gemini 1.5 Pro 中最基本的知识和技能转移到更小的型号上。这意味着,Gemini 1.5 Flash 将获得与 Pro 相同的多模态功能,以及长语境窗口(人工智能模型可一次性摄取的数据量),即一百万个词元。根据Google的说法,这意味着 Gemini 1.5 Flash 将能够一次性分析 1500 页的文档或超过 30000 行的代码库。Gemini 1.5 Flash(或这些型号中的任何一款)并非真正面向消费者。相反,它是开发人员利用Google设计的技术构建自己的人工智能产品和服务的一种更快、更便宜的方式。除了推出 Gemini 1.5 Flash 之外,Google还对 Gemini 1.5 Pro 进行了升级。该公司表示,已经"增强"了该模型编写代码、推理和解析音频与图像的能力。但最大的更新还在后面Google宣布将在今年晚些时候把该模型现有的上下文窗口增加一倍,达到 200 万个词元。这将使它能够同时处理两小时的视频、22 小时的音频、6 万多行代码或 140 多万字。Gemini 1.5 Flash 和 Pro 现在都可以在Google的人工智能工作室和顶点人工智能中进行公开预览。该公司今天还发布了新版 Gemma 开放模型,名为 Gemma 2。不过,除非你是开发人员或喜欢捣鼓构建人工智能应用程序和服务的人,否则这些更新其实并不适合普通消费者。 ... PC版: 手机版:

封面图片

英国政府将试用人工智能工具

英国政府将试用人工智能工具 英国的大臣们正在试点使用生成式人工智能来分析对政府意见征集的回应,撰写对议会问题的回答草稿。英国副首相奥利弗•道登将于周四公布一些工具,白厅核心的人工智能“精锐小组”正在试用这些工具,以期在中央部门和公共服务部门更广泛地推广这些工具。人工智能工具包括使用政府托管的 ChatGPT 版本和内部安全托管的开源人工智能模型,以起草对议员向大臣提交的问题和信息自由请求的初步答复。 ()

封面图片

Google为购物功能增添更多人工智能元素

Google为购物功能增添更多人工智能元素 这项名为"风格推荐"(Style Recommendations)的最新功能可以让用户在搜索中对商品进行评分,从而了解搜索者的风格和喜好。 这有点像 Tinder,不过对象是衬衫。在找到自己喜欢的衣服后,购物者可以指定自己喜欢的品牌,这样就能立即从这些选择中找到更多服装。Google曾测试过人工智能工具,帮助人们找到更多自己喜欢的商品。11 月,该公司的"搜索生成体验"(Search Generative Experience)用户测试了一种图像生成功能,它能根据提示拼凑出夹克和其他服装。然后,人们可以根据人工智能图像找到类似的商品。该公司还测试了虚拟试穿功能,购物者可以看到品牌服装的穿着效果。这两项功能现已在 Google Shopping 上上线。Google与其他电子商务平台一道,将人工智能生成工具引入购物领域。亚马逊的购物助手"鲁弗斯"(Rufus)可以回答顾客对商品的询问,该公司还提供人工智能驱动的尺码建议。然而,人工智能驱动的购物功能仍是新生事物,可能会导致出现问题商品,有时候人工智能购物体验令人困惑,而且买到的衣服原型并不适合人类。 ... PC版: 手机版:

封面图片

Google宣布推出Gemini API,为开发者和企业提供了全新的人工智能产品。这一API将使开发者能够构建基于Gemini

Google宣布推出Gemini API,为开发者和企业提供了全新的人工智能产品。这一API将使开发者能够构建基于Gemini Pro的应用程序和解决方案,进一步推动人工智能的发展和应用。 Gemini是Google迄今为止最大、能力最强大的人工智能模型,也是Google在使人工智能更加便捷实用的道路上迈出的重要一步。Gemini分为三个版本:Ultra、Pro和Nano。目前,Gemini已经在Google的产品中得到应用,其中Gemini Nano已经在Android系统上推出,并首次应用于Pixel 8 Pro手机,而Gemini Pro则针对Bard进行了专门的优化。 现在,开发者和企业可以通过Gemini API获得Gemini Pro的使用权限,以便根据自身需求构建应用程序和解决方案。Google将根据用户的反馈进一步优化和改进Gemini Pro,以确保其能够满足各类需求。 - Gemini Pro在研究基准测试中表现优异,超过了其他同等规模模型的性能。 - 当前版本的Gemini Pro针对文本提供了32K的上下文窗口,未来版本将支持更大的上下文窗口。 - 开发者可以免费使用Gemini Pro,但有一定的使用限制,并且将来会提供具有竞争力的定价方案。 - Gemini Pro具备多种功能,包括函数调用、嵌入、语义检索、自定义知识基础和聊天功能。 - Gemini Pro支持全球180多个国家和地区的38种语言。 Gemini Pro目前支持将文本作为输入并生成文本作为输出。此外,Google还提供了专门针对Gemini Pro Vision多模态的端点,支持文本和图像作为输入,生成文本作为输出。 为了帮助开发者构建应用程序,Gemini Pro提供了多种SDK,支持在任何地方运行的应用程序开发,包括Python、Android(Kotlin)、Node.js、Swift和JavaScript。 除了Gemini API,Google还推出了Google AI Studio开发者工具,该工具是一个免费的基于Web的开发者工具,能够帮助开发者快速构建提示并获取API密钥用于应用程序开发。开发者可以使用Google帐号登录Google AI Studio,并利用免费配额进行开发,该配额允许每分钟发起60个请求,比其他免费提供的配额高出20倍。 via 匿名 标签: #Google #AI #Gemini 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

Google的下一代人工智能模型Gemini 1.5已基本准备就绪

Google的下一代人工智能模型Gemini 1.5已基本准备就绪 Gemini 1.5 有很多改进:Gemini 1.5 Pro(Google系统中的通用模型)与该公司最近才推出的高端 Gemini Ultra 能力不相上下,而且在 87% 的基准测试中,它都优于 Gemini 1.0 Pro。它采用了一种越来越常见的技术,即"专家混合"(MoE),这意味着当你发送查询时,它只运行整个模型的一部分,而不是一直处理整个模型。这种方法能让用户更快地使用模型,也能让 Google 更高效地运行模型。但是,Gemini 1.5 中的一个新功能让整个公司都特别兴奋:Gemini 1.5 有一个巨大的上下文窗口,这意味着它可以处理更大的查询,一次查看更多的信息。这个窗口高达 100 万个tokens,而 OpenAI 的 GPT-4 为 12.8 万个,目前的 Gemini Pro 为 3.2 万个。"这大约相当于是 10 或 11 个小时的视频,数万行代码"。上下文窗口意味着可以一次性向人工智能机器人询问所有内容。Google CEO皮查伊还表示,研究人员正在测试一个 1000 tokens的上下文窗口这就好比是将《权力的游戏》的整个系列同时播出,或者把整个《指环王》三部曲都放进这个上下文窗口中。这允许在查询时添加大量个人上下文和信息,就像我们极大地扩展了查询窗口一样。目前,Gemini 1.5 只能通过Google的顶点人工智能(Vertex AI)和人工智能工作室(AI Studio)提供给企业用户和开发人员。最终,它将取代Gemini 1.0,而Gemini专业版的标准版本每个人都可以在gemini.google.com和公司的App中使用的版本将是 1.5 专业版,拥有128000 个tokens的上下文窗口,而需要支付额外的费用才能获得百万级的权限。Google还在测试该模式的安全性和道德底线,尤其是新增加的上下文窗口。当全球企业都在试图制定自己的人工智能战略以及是与 OpenAI、Google还是其他公司签署开发者协议时,Google正在为打造最好的人工智能工具而展开一场激烈的竞赛。就在本周,OpenAI 公布了ChatGPT的"记忆能力",同时似乎准备进军网络搜索领域。到目前为止,Gemini 似乎给人留下了深刻印象,尤其是对于那些已经进入Google生态系统的人来说,但各方都还有很多工作要做。最终,所有这些 1.0、1.5、Pro、Ultras 和企业之争对用户来说并不重要。人们将只需要感受AI,这就像使用智能手机,而不必总是关注手机里面的处理器是怎么工作的。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人