Google将修正Gemini人工智能输出回答时的史实误差

Google将修正Gemini人工智能输出回答时的史实误差负责监督Gemini开发的Google高级产品总监杰克-克劳奇克（JackKrawczyk）周三写道，Gemini团队正在努力调整人工智能模型，以便生成更符合历史的准确结果。Krawczyk说："我们知道Gemini公司提供的一些历史图像生成描述不准确，我们正在努力立即解决这个问题。"产品总监在同一篇文章中强调，"Gemini"的设计旨在"反映我们的全球用户群，我们认真对待代表性和偏见问题"，这表明这些结果的产生可能是人工智能努力实现种族包容性的一部分。一些Gemini用户发布了截图，声称Gemini错误地认为美国原住民男人和印度女人代表了1820年代的德国夫妇、非洲裔美国人的开国元勋，亚洲和原住民士兵是1929年德国军队的成员，甚至还有“中世纪的英格兰国王”。Krawczyk说："历史背景有更多细微差别，我们将进一步调整以适应这种情况，"他补充说，非历史请求将继续产生"通用"结果。但是，如果Gemini被修改为执行更严格的历史现实主义，它就不能再被用来创造历史再现。更广泛地说，生成式人工智能工具旨在利用特定的数据集，在一定参数范围内创建内容。这些数据可能有缺陷，也可能根本不正确。众所周知，人工智能模型也会产生"幻觉"，这意味着它们可能会编造虚假信息，只是为了给用户一个回应。如果人工智能不只是作为一种创造性工具来使用，而是用于教育或工作等目的，那么幻觉和不准确性就会成为一个值得关注的问题。自2022年OpenAI的ChatGPT等生成式人工智能工具推出以来，艺术家、记者和大学研究人员发现，人工智能模型在创建图像时可能会显示出固有的种族主义、性别歧视或其他歧视性偏见。Google在其人工智能原则中明确承认了这一问题，并表示作为一家公司，Google正努力避免在其人工智能工具中复制任何"不公平的偏见"。Gemini并不是本周唯一一个给用户带来意外结果的人工智能工具。据报道，ChatGPT周三也出了点问题，对一些用户的询问做出了毫无意义的回答。OpenAI表示已经"修复"了这个问题。...PC版：https://www.cnbeta.com.tw/articles/soft/1419873.htm手机版：https://m.cnbeta.com.tw/view/1419873.htm

在Telegram中查看

相关推荐

Google发布Gemini 1.5 Flash人工智能模型比Gemini Pro更轻便与易于使用

Google发布Gemini1.5Flash人工智能模型比GeminiPro更轻便与易于使用GoogleDeepMind首席执行官德米斯-哈萨比斯（DemisHassabis）在一篇博客文章中写道："[Gemini]1.5Flash擅长摘要、聊天应用、图像和视频字幕、从长文档和表格中提取数据等。"Google之所以创建Gemini1.5Flash，是因为开发人员需要一个比Google今年2月发布的专业版更轻便、更便宜的型号。Gemini1.5Pro比该公司去年底发布的Gemini原型更高效、更强大。Gemini1.5Flash介于Gemini1.5Pro和Gemini1.5Nano之间，是Google在本地设备上运行的最小型号。尽管重量比GeminiPro轻，但功能却同样强大。Google表示，这是通过一个名为"蒸馏"的过程实现的，即把Gemini1.5Pro中最基本的知识和技能转移到更小的型号上。这意味着，Gemini1.5Flash将获得与Pro相同的多模态功能，以及长语境窗口（人工智能模型可一次性摄取的数据量），即一百万个词元。根据Google的说法，这意味着Gemini1.5Flash将能够一次性分析1500页的文档或超过30000行的代码库。Gemini1.5Flash（或这些型号中的任何一款）并非真正面向消费者。相反，它是开发人员利用Google设计的技术构建自己的人工智能产品和服务的一种更快、更便宜的方式。除了推出Gemini1.5Flash之外，Google还对Gemini1.5Pro进行了升级。该公司表示，已经"增强"了该模型编写代码、推理和解析音频与图像的能力。但最大的更新还在后面--Google宣布将在今年晚些时候把该模型现有的上下文窗口增加一倍，达到200万个词元。这将使它能够同时处理两小时的视频、22小时的音频、6万多行代码或140多万字。Gemini1.5Flash和Pro现在都可以在Google的人工智能工作室和顶点人工智能中进行公开预览。该公司今天还发布了新版Gemma开放模型，名为Gemma2。不过，除非你是开发人员或喜欢捣鼓构建人工智能应用程序和服务的人，否则这些更新其实并不适合普通消费者。...PC版：https://www.cnbeta.com.tw/articles/soft/1430899.htm手机版：https://m.cnbeta.com.tw/view/1430899.htm

Google的下一代人工智能模型Gemini 1.5已基本准备就绪

Google的下一代人工智能模型Gemini1.5已基本准备就绪Gemini1.5有很多改进：Gemini1.5Pro（Google系统中的通用模型）与该公司最近才推出的高端GeminiUltra能力不相上下，而且在87%的基准测试中，它都优于Gemini1.0Pro。它采用了一种越来越常见的技术，即"专家混合"（MoE），这意味着当你发送查询时，它只运行整个模型的一部分，而不是一直处理整个模型。这种方法能让用户更快地使用模型，也能让Google更高效地运行模型。但是，Gemini1.5中的一个新功能让整个公司都特别兴奋：Gemini1.5有一个巨大的上下文窗口，这意味着它可以处理更大的查询，一次查看更多的信息。这个窗口高达100万个tokens，而OpenAI的GPT-4为12.8万个，目前的GeminiPro为3.2万个。"这大约相当于是10或11个小时的视频，数万行代码"。上下文窗口意味着可以一次性向人工智能机器人询问所有内容。GoogleCEO皮查伊还表示，研究人员正在测试一个1000tokens的上下文窗口--这就好比是将《权力的游戏》的整个系列同时播出，或者把整个《指环王》三部曲都放进这个上下文窗口中。这允许在查询时添加大量个人上下文和信息，就像我们极大地扩展了查询窗口一样。目前，Gemini1.5只能通过Google的顶点人工智能（VertexAI）和人工智能工作室（AIStudio）提供给企业用户和开发人员。最终，它将取代Gemini1.0，而Gemini专业版的标准版本--每个人都可以在gemini.google.com和公司的App中使用的版本将是1.5专业版，拥有128000个tokens的上下文窗口，而需要支付额外的费用才能获得百万级的权限。Google还在测试该模式的安全性和道德底线，尤其是新增加的上下文窗口。当全球企业都在试图制定自己的人工智能战略--以及是与OpenAI、Google还是其他公司签署开发者协议时，Google正在为打造最好的人工智能工具而展开一场激烈的竞赛。就在本周，OpenAI公布了ChatGPT的"记忆能力"，同时似乎准备进军网络搜索领域。到目前为止，Gemini似乎给人留下了深刻印象，尤其是对于那些已经进入Google生态系统的人来说，但各方都还有很多工作要做。最终，所有这些1.0、1.5、Pro、Ultras和企业之争对用户来说并不重要。人们将只需要感受AI，这就像使用智能手机，而不必总是关注手机里面的处理器是怎么工作的。...PC版：https://www.cnbeta.com.tw/articles/soft/1418373.htm手机版：https://m.cnbeta.com.tw/view/1418373.htm

Google正在开发生活辅助人工智能可当做私人管家

Google正在开发生活辅助人工智能可当做私人管家不过，《纽约时报》通过未具名消息来源报道称，Google的人工智能团队成员目前正在开发其他工具，这些工具一旦推出，可以为用户提供个人生活建议。报道称，Google实际上正在与外部承包商ScaleAI合作，帮助测试这些个人建议工具。这篇报道举例说明了这些新的人工智能工具应该回答的文本提示类型：我有一个非常要好的朋友，今年冬天就要结婚了。她是我的大学室友，也是我婚礼上的伴娘。我非常想去参加她的婚礼为她庆祝，但找了几个月的工作，我还是没有找到工作。她要举行一个目的地婚礼，而我现在根本负担不起机票和酒店的费用。我该怎么告诉她我不能去呢？报道称，Google的人工智能工具可以针对这种特殊情况提供建议。未来，它还可以提供财务建议、帮助人们学习新技能的教程，或者提出新的健康和膳食计划。当然，人类也有可能过于依赖人工智能生活教练的回答。事实上，据报道，Google的Bard聊天机器人在该公司的人工智能安全团队成员表示担忧后，就被稍微推迟了一段时间。《纽约时报》今天报道说，2022年12月，该公司的人工智能安全专家表示，如果用户接受聊天机器人的个人建议，他们可能会有"健康和幸福感减弱"的沮丧感。报道还说，Google可能决定不发布这些个人生活建议人工智能工具。公司发言人不愿证实或否认这些工具正在开发中，但表示："孤立的评估数据样本并不能代表我们的产品路线图。"...PC版：https://www.cnbeta.com.tw/articles/soft/1377477.htm手机版：https://m.cnbeta.com.tw/view/1377477.htm

Google为购物功能增添更多人工智能元素

Google为购物功能增添更多人工智能元素这项名为"风格推荐"（StyleRecommendations）的最新功能可以让用户在搜索中对商品进行评分，从而了解搜索者的风格和喜好。这有点像Tinder，不过对象是衬衫。在找到自己喜欢的衣服后，购物者可以指定自己喜欢的品牌，这样就能立即从这些选择中找到更多服装。Google曾测试过人工智能工具，帮助人们找到更多自己喜欢的商品。11月，该公司的"搜索生成体验"（SearchGenerativeExperience）用户测试了一种图像生成功能，它能根据提示拼凑出夹克和其他服装。然后，人们可以根据人工智能图像找到类似的商品。该公司还测试了虚拟试穿功能，购物者可以看到品牌服装的穿着效果。这两项功能现已在GoogleShopping上上线。Google与其他电子商务平台一道，将人工智能生成工具引入购物领域。亚马逊的购物助手"鲁弗斯"（Rufus）可以回答顾客对商品的询问，该公司还提供人工智能驱动的尺码建议。然而，人工智能驱动的购物功能仍是新生事物，可能会导致出现问题商品，有时候人工智能购物体验令人困惑，而且买到的衣服原型并不适合人类。...PC版：https://www.cnbeta.com.tw/articles/soft/1425296.htm手机版：https://m.cnbeta.com.tw/view/1425296.htm

Google发布了一对开源人工智能模型Gemma 2B和7B 适用于较小的任务

Google发布了一对开源人工智能模型Gemma2B和7B适用于较小的任务不过，这些模型在复杂性上的不足，可能会在速度和使用成本上得到弥补。尽管规模较小，但Google声称，Gemma模型"在关键基准测试中明显超越了更大的模型"，并且"能够直接在开发人员的笔记本电脑或台式电脑上运行"。这些模型将通过Kaggle、HuggingFace、NVIDIA的NeMo和Google的VertexAI提供。Gemma进入开源生态系统的方式与Gemini的发布方式截然不同。虽然开发者可以在Gemini的基础上进行开发，但他们要么通过API，要么在Google的VertexAI平台上进行开发。Gemini被认为是一种封闭的人工智能模式。通过将Gemma开源，更多的人可以尝试使用Google的人工智能，而不是转向提供更好访问权的竞争对手。无论组织规模、用户数量和项目类型如何，这两种尺寸的模型都将获得商业许可。不过，与其他公司一样，Google通常禁止将其模型用于武器开发项目等特定任务。Gemma还将提供"负责任的人工智能工具包"，因为开放模型比Gemini等封闭系统更难设置防护措施。GoogleDeepMind产品管理总监特里斯-瓦肯汀说，"由于开放模型的固有风险，公司对Gemma进行了更广泛的重新设计"。负责任的人工智能工具包允许开发人员在项目中部署Gemma时创建自己的准则或禁用词列表。该工具包还包括一个模型调试工具，可让用户调查Gemma的行为并纠正问题。Warkentin表示，这些模型目前最适用于英语语言相关任务，希望能与社区合作，满足英语任务以外的市场需求。开发人员可以在Kaggle中免费使用Gemma，首次使用Google云的用户可以获得300美元的免费额度来使用模型。该公司表示，研究人员最多可申请500000美元的额度。虽然目前还不清楚人们对Gemma这样的小模型有多大需求，但其他人工智能公司也推出了重量更轻的旗舰基础模型。Meta去年推出了Llama27B，这是Llama2的最小迭代版本。Gemini本身也有几种重量，包括GeminiNano、GeminiPro和GeminiUltra，Google最近宣布推出速度更快的Gemini1.5，目前也是针对企业用户和开发人员。顺便说一下，Gemma的意思是宝石。...PC版：https://www.cnbeta.com.tw/articles/soft/1419813.htm手机版：https://m.cnbeta.com.tw/view/1419813.htm

英国政府将试用人工智能工具

英国政府将试用人工智能工具英国的大臣们正在试点使用生成式人工智能来分析对政府意见征集的回应，撰写对议会问题的回答草稿。英国副首相奥利弗•道登将于周四公布一些工具，白厅核心的人工智能“精锐小组”正在试用这些工具，以期在中央部门和公共服务部门更广泛地推广这些工具。人工智能工具包括使用政府托管的ChatGPT版本和内部安全托管的开源人工智能模型，以起草对议员向大臣提交的问题和信息自由请求的初步答复。——()

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人