【谷歌加紧测试ChatGPT竞品】Apprentice Bard基于谷歌对话模型LaMDA，面向各种对话，将给出尽可能让人满意的

【谷歌加紧测试ChatGPT竞品】Apprentice Bard基于谷歌对话模型LaMDA，面向各种对话，将给出尽可能让人满意的合理回答。即便近期刚发生的事，它也能回答出来，而此种能力，训练数据集基于2021年底的ChatGPT并不具备。 #抽屉IT

在Telegram中查看

相关推荐

“Bard和ChatGPT最明显的区别，在于Bard能覆盖最近发生的事件，并将这些信息纳入回答中，但ChatGPT则是基于训练数

“ Bard和ChatGPT最明显的区别，在于Bard能覆盖最近发生的事件，并将这些信息纳入回答中，但ChatGPT则是基于训练数据库。 Bard的信息源是互联网，而ChatGPT的信息则来源于2021年之前 (GPT 3.5) Bard是基于LaMDA，即对话应用语言模型的简称，这种人工智能生成文本的能力很强 ChatGPT经过训练可以生成类似人类语言的文本。它可以针对各种自然语言处理任务进行微调，例如问答、翻译和文本摘要。不过，GPT以其生成连贯且与上下文相关的文本的能力而闻名，但并不能保证文本内容的正确。标签: #ChatGPT #Bard 频道: @GodlyNews1 投稿: @GodlyNewsBot

为确保 Bard 能给出高质量答案，谷歌员工对其进行单条式的评估、修正训练.

为确保 Bard 能给出高质量答案，谷歌员工对其进行单条式的评估、修正训练. 不久前，谷歌在内部发起了代号为“斗狗”的活动，要求公司所有员工每周用两到四个小时帮助测试和改进其新的人工智能搜索聊天机器人 Bard。就在 Bard 发布前不久，微软也刚刚发布了采用 ChatGPT 聊天机器人背后技术的新版必应搜索引擎，它允许用户就几乎任何话题进行多轮对话。然而，在 Bard 被发现提供了一个错误的答案后，对于谷歌的质疑也逐渐浮现。同样，随着越来越多的人测试了新必应，他们的聊天机器人也遇到了问题，比如其倾向于好斗的行为。像 Bard 和 ChatGPT 这样的 AI 聊天机器人，可以通过接受人类编写的文本训练来模仿人类对话，这就解释了为什么必应的回复有时候看起来有些情绪化和不可预测。毕竟，被训练得像人一样的机器人也很容易犯下人类的错误。这些聊天机器人最初通过摄取大量的训练数据来完成大部分学习。此外，Bard 项目的产品主管杰克・克劳奇克 (Jack Krawczyk) 在一份备忘录中告诉员工，谷歌的研究发现，为用户查询添加高质量的响应“显著”提高了其 AI 模型的质量。来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

谷歌新Bard逆袭GPT-4冲上LLM排行榜第二 Jeff Dean高呼我们回来了

谷歌新Bard逆袭GPT-4冲上LLM排行榜第二 Jeff Dean高呼我们回来了基于此，Bard相较于3月份的首次亮相，不仅在表现上有了显著的提升，而且还具备了更多的能力。可以看到，在最新的Gemini Pro-scale加持下，Bard直接蹿升到了排行榜第二名的位置。一口气把之前的两款GPT-4模型斩于马下，甚至和排名第一的GPT-4 Turbo的差距也非常小。虽然Jeff Dean并没有具体阐述“scale”的含义，但从名称上推测，很可能是一个比初代Gemini Pro规模更大的版本。而根据前段时间外媒曝出的内部邮件，搭载Gemini Ultra的Bard Advanced已经全面开放给Google员工试用。也就是说，距离Google最强模型的上线，已经不远了。随着Google对Gemini Pro更新后不断大幅上涨的表现，也让所有人对完全体Gemini Ultra的能力有了更多的期待。不过，新推出的Bard目前只接受了约3,000次评价，而GPT-4的评价次数已高达30,000次。因此，这个结果后续很可能还会发生变动。但不管怎样，这对于Google来说是一项令人瞩目的成就，也让人对即将发布的、预期将超过Gemini Pro-Scale性能的最强AI模型Gemini Ultra充满期待。GoogleBard超越GPT-4跃居第二简单介绍一下，这个由UC伯克利主导，CMU，UCSD等顶级高校共同参与创建的聊天机器人竞技场“Chatbot Arena”，是学术圈内一个很权威的大模型对话能力排行榜。榜单通过类似Moba游戏中的“排位赛”机制，让各家大模型通过PvP的方式来排出性能高低。期间，用户会与模型（不知道具体型号）进行互动，并选择他们更喜欢的回答。而这些投票将会决定模型在排行榜上的名次。这种方式能够有效地避免很多PvE基准测试中可能出现的，通过“刷题”来提高成绩的问题，被业界认为是一个比较客观的大模型能力排行榜。为了便于区分，LMSYS Org指出，目前Gemini Pro市面上总共有3个版本：- Gemini Pro API：用户可以通过Google云的Vertex AI API进行访问- Gemini Pro（dev）API：开发者API可以通过Google AI Studio进行访问- Bard（1月4日更新的Gemini Pro）：是目前唯一可以访问到1月24日更新的Gemini Pro的方式同时，GoogleBard项目的高级总监Sadovsky也透露，排行榜上的Bard和Gemini Pro（API）是两个在微调层面不同的模型，而且Bard可以检索互联网上的信息。在ChatBot Arena中，1月24号更新的Bard由于支持检索互联网，相比于之前放出的Gemini Pro（API）对于实时信息问题的回复提升巨大。从Google的这波更新可以看出，Gemini Pro的潜力似乎远远没有被完全释放，希望Google能再接再厉，对OpenAI一家独大的格局形成挑战。以下是1月14号更新的Bard在ChatBot Arena中的成绩的明细：模型A相对于模型B在所有非平局对决中获胜的比例不同模型组合间对决的次数统计（排除平局情况）通过1000轮随机抽样对Elo评分进行的自举法（Bootstrap）估计在假设等概率抽样和不存在平局的情况下，相对于所有其他模型的平均胜率Elo评分系统Elo等级分制度（Elo rating system）是一种计算玩家相对技能水平的方法，广泛应用在竞技游戏和各类运动当中。其中，Elo评分越高，那么就说明这个玩家越厉害。比如英雄联盟、Dota 2以及吃鸡等等，系统给玩家进行排名的就是这个机制。举个例子，当你在英雄联盟里面打了很多场排位赛后，就会出现一个隐藏分。这个隐藏分不仅决定了你的段位，也决定了你打排位时碰到的对手基本也是类似水平的。而且，这个Elo评分的数值是绝对的。也就是说，当未来加入新的聊天机器人时，我们依然可以直接通过Elo的评分来判断哪个聊天机器人更厉害。具体来说，如果玩家A的评分为Ra，玩家B的评分为Rb，玩家A获胜概率的精确公式（使用以10为底的logistic曲线）为：然后，玩家的评分会在每场对战后线性更新。假设玩家A（评分为Ra）预计获得Ea分，但实际获得Sa分。更新该玩家评分的公式为：网友热议对此，网友提问：现在能够访问的Bard就是这个排名第二的Bard了吗？Google官方回复，是的，而且现在访问的Bard比排行榜的上的Bard还能支持更多的像地图扩展等应用。不过还是有网友吐槽，即使在PvP排行榜上Bard已经取得了很好的成绩，但是对于理解用户需求和解决实际问题的能力，Bard和GPT-4依然还有很大差距。也有网友认为，用能联网的Bard和离线的GPT-4打有失公平。甚至，就这样还没打过……而最有意思的，还要数网友在排行榜中发现的“华点”了：号称是GPT-4最大竞品的Claude居然越更新越弱了。对此，之前有分析认为，Anthropic一直在大力发展的与人类对齐，会严重影响模型的性能。GPT-4 Turbo超长上下文A/B测试有趣的是，这个连Jeff Dean都亲自下场的“刷榜”，正巧就在OpenAI连发5款新模型的第二天。根据OpenAI的介绍，新版GPT-4 Turbogpt-4-0125-preview，不仅大幅改善了模型“偷懒”的情况，而且还极大地提升了代码生成的能力。不过，正如大家对Bard的怀疑，GPT-4这次到底有没有变强也有待验证。对此，AI公司Smol的创始人Shawn Wang，就在超过100k单词的超长上下文中，对比测试了新旧GPT4-Turbo的总结能力。Wang表示，两次测试使用的是完全相同提示词，以及基本相同的语料库。虽然没有严格严格，但每个模型都进行了超过300次的API调用，因此对于总结任务而言，这一结果还是具有一定参考价值的。结果显示，2024年1月的GPT4-Turbo花费了19分钟来生成20,265个单词，相比之下，2023年11月的用16分钟生成了18,884个单词。也就是说，新模型的生成速度大约慢了 18%，且生成文本的长度平均偏长约7%。质量方面：- 2024年1月的模型在主题选择上略有改善，但仍存在问题- 2023年11月的模型会产生更多错误信息- 2024年1月的模型在总结中添加小标题的能力略有提升- 2024年1月的模型出现了一次严重的格式错误，而这在之前是极为罕见的- 2023年11月的模型文本详情更加丰富总体而言，新版GPT4-Turbo在总结这一应用场景上有所退步。左侧：2023年11月；右侧：2024年1月（左右滑动查看全部）OpenAI最后的“开源遗作”两周年不得不说，AI领域的发展过于迅猛，甚至让人对时间的流速都产生了错觉。今天，英伟达高级科学家Jim Fan发推纪念了InstructGPT发布二周年。在这里，OpenAI定义了一套标准流程：预训练 -> 监督式微调 -> RLHF。直到今天，这依然是大家遵循的基本策略（尽管有些许变化，比如DPO）。它不仅仅是大语言模型从学术探索（GPT-3）到转化为具有实际影响力的产品（ChatGPT）的关键转折点，而且也是最后一篇OpenAI详细说明他们如何训练前沿模型的论文。论文地址： InstructGPT在2022年的NeurIPS会议上首次亮相，但它并不是RLHF的发明者。实际上，相关博客将读者引向了OpenAI团队在2017年完成的原始RLHF研究。这项研究最初的目的是解决模拟机器人领域中难以明确定义的任务通过一名人类标注者提供的900个二选一偏好，RLHF让一个简单的“跳跃”机器人在模拟环境中学会了后空翻。论文地址：模型提供了三种规模：1.3B、6B、175B。与旧的、需要复杂提示设计的GPT-3-175B相比，标注者明显更喜欢Instruct-1.3B。微软最知名的“小模型”Phi-1也是1.3B。- InstructGPT展示了如何精彩地呈现研究成果。三个步骤的图表清晰易懂，并且成为AI领域最标志性的图像之一。引言部分直接了当，用粗体突出了8个核心观点。对局限性和偏见的讨论实事求是、坦诚直接。 ... PC版：手机版：

谷歌最牛大模型正式开放：免费试用两个月

谷歌最牛大模型正式开放：免费试用两个月 1）Google测试版的聊天机器人 Bard（已接入 Gemini Pro 模型）改名 Gemini；2）推出 Gemini 的 Android 版 App，并将 Gemini 的能力加入 iOS 的 Google App 中，免费向公众开放；3）在 Android 上，用户可以选择使用 Gemini 可以替代原来的 Google Assistant，成为手机的默认语言助手；4）在Google官方会员计划 Google One 中加入 Gemini Advanced 服务，多付 10 美元即可访问最强大的 Gemini Ultra 模型；5）大模型能力很快将接入 Google Workspace（包括 Gmail、Docs、Meet 等应用）和 Google Cloud 中。Bard 改名 Gemini，同时推出 Android 版 App | 图片来源：Google此次Google不仅直接推出了大模型面向 C 端的 App，同时将内部的多个产品线接入大模型，可以说向技术的公开化迈进了一大步。当问及为何选择推出面向公众的产品，Google产品管理高级总监、Gemini 体验官 Jack Krawczyk 对极客公园说，“我们谈论 Gemini，不仅仅是在谈（Google）最先进的技术，更是谈论一种生态系统的转变。”Krawczyk 表示，这一转变背后，一方面是因为 Gemini 技术本身的强大Gemini 从一开始就被创建为多模态大模型，它也是Google迄今最强大的模型，去年 12 月一经发布即引发全行业震撼。另一方面则是因为，Google认为时机已到，“我们相信更多的人已经准备好了第一次与这项技术互动。按照我们目前引入的方式，预计许多人将首次使用生成性AI。”Krawczyk 说。在大模型对话产品席卷全球一年后，Google终于迈出了最关键的一步。Gemini 推独立 App，Google Assistant 失业？为了迎战 ChatGPT，Google于 2023 年 3 月推出聊天机器人 Bard，但它的最初产品能力并不足够好、甚至在现场演示时回答出错。因此，Google不断提升 Bard 背后的模型水平，从最开始轻量级的 LaMDA 模型、升级到功能更强大的 PaLM 模型、再到最强的 Gemini 模型。去年 12 月 Gemini 发布后，Bard 宣布将运行在 Gemini Pro 上，这是 Bard 自推出以来最大的升级。Google似乎对 Gemini 的模型能力非常满意现在，它不仅直接将 Bard 改名为了 Gemini，还决定为这款测试了长达一年的产品直接推出 App。Gemini 的 App 界面 | 图片来源：Google2 月 8 日 21 点，Google推出 Gemini 的 Android 版 App，并将 Gemini 的能力加入 iOS 的 Google App 中，免费向公众开放。用户能够在亚太地区以英语、日语和韩语访问它们，更多语言版本即将推出。“我们从用户那里听说，他们希望在外出时更容易访问 Gemini。新的移动体验将我们最新的 AI 能力直接带到设备上，这样用户无论何时何地都能得到帮助。”Krawczyk 说。这也是很多大模型 C 端应用的使用场景，随时随地跟模型交互、获得服务。不过，比 App 最关键的是，Android 用户可以用 Gemini 替代原来的 Google Assistant，成为手机的默认语言助手。使用方式是：当用户访问 Google 助手时，会收到一个选项，询问是否希望加入 Gemini 作为实验性的助手。如果同意，Gemini 就会成为用户手机上的默认助手。用户可以通过现有的 Google 助手接入点，比如电源按钮、甚至 Hi Google，来唤醒使用 Gemini。Gemini in Gmail | 图片来源：Google这意味着，Gemini 将可以调用 Google 助手，帮助用户执行任务。比如打电话、发送消息、设置计时器、控制智能家居设备等等，更多功能还在研发过程中。一整年来，各大模型厂商都在谈论个人助理（agent）的未来，即通过一个智能体、为用户自动调动所有的应用。而Google通过将 Gemini 融入Google助手，展现了这一智能助理的可能性。Krawczyk 表示，在 Android 手机上，助手界面是最自然的发展愿景，所以才会把 Gemini 作为手机数字助手的一部分。“这是Google构建真正AI助手的第一步，再次强调，这是第一步，这是开始。”他说。Gemini Advanced，Google版的 GPT Plus去年底发布 Gemini 时，Google就表示其中最强大的 Ultra 模型将通过 Bard Advanced 提供，但尚无收费计划。2 月，通过更名的 Gemini Advanced，Ultra 大模型正式对公众开放，不过，收费方案也随之而来。想要接入Google的 Ultra 模型，用户需要订阅 19.99 美元每月的 Google One 的 AI Premium 服务，比 ChatGPT 的 Plus 版本的订阅费用，小低 0.01 美元。虽然价格看起来仿佛对标，但Google在收费上，充分利用了自己的生态优势。Google One 服务并不是一项新服务，它在 2018 年已经推出，是Google的“全家桶”服务。使用 Google One 的人，可以享受多项 Google 服务，包括存储空间和解锁部分软件的高级功能。如果类比于国内，相当于买了一个会员，同时可以解锁 iCloud 照片的存储功能，百度网盘的大容量空间，网易邮箱的高级功能，腾讯会议的付费功能等等而Google的厉害之处在于，在全部这些领域，Google旗下的应用，都拥有十亿级别的用户，付费基础广大。2024 年年初，Google刚刚宣布，Google One 目前已经有了 1 亿的订阅者。在 Google 推出新的 AI Premium 档位之前，Google One 原本有三个档位，每月 1.99 美元，每月 2.99 美元和每月 9.99 美元。新的 AI Premium 档位，虽然看起来是 19.99 美元，其中将赠送 9.99 美元档位的全部 Google One 服务。Google One 的收费计划 | 图片来源：Google这相当于，如果一个用户原本已经付费 9.9 美元可以解锁解锁 Google Meet（Google的在线会议平台）和 Google Calendar（Google的协作日历）的高级功能，那么，这个用户很可能已经是一个深度使用Google各项平台的商务人士。这时候，只需要每月增加 10 美元，就可以使用Google最强的大模型了。而Google为了勾住这些用户，还为他们量身定做了符合他们定位的功能，除了在专门的聊天窗口可以使用 Ultra 模型的能力，未来还能够在直接Google的邮箱，在线文档和在线会议中，使用大模型的能力。（从目前Google生产力智能助手 Duet AI 的功能演变而来）Ultra 模型能力表现具体如何？Google曾经表示，Gemini Ultra 在 32 个基准测试中拿下 30 个 SOTA（最先进水平），并且第一个在 MMLU 基准（大规模多任务语言理解基准）上达到人类专家水平。此次发布中，Google官方进一步表示，Gemini Advanced 将具有更长的上下文窗口，能够完成更加复杂的逻辑推理能力，遵从语意更加复杂的指令，可以辅助编程，可以角色扮演，可以看图说话在这个版本中，Google似乎并没有加入多少图片生成或者语音对话的多模态能力。Google还在发布中表示：“在业界领先的聊天机器人盲测中，用户觉得 Gemini Advanced 是目前最受人欢迎的聊天机器人。”Gemini Advanced 相当于Google版的 GPT Plus | 图片来源：Google由于大模型的评测目前还没有特别公允的横向比较标准，究竟是不是这样，恐怕要每一个用户自己去评判。Google放开了两个月的免费试用期，让大家自己来尝试 Gemini Advanced 是不是真的好用。不过可以看出，此次Google推出的付费版，重要卖点似乎并不完全落在其大模型拥有“吊打一切”的能力，而是更强调与生态内应用的结合，用户能够更加无缝地在已有的 Google 应用中，方便地使用人工智能的能力。比如写邮件，直接在邮件窗口下面，跟人工智能说一句看看怎么帮我回，显然比把邮件复制粘贴了放进另一个聊天机器人的对话窗口，再写 prompt 让机器人回复更为方便。而人工智能与在线会议等应用的结合，更是充满了很多提效空间。值得注意的是，Google的人工智能团队是 Transformer 架构的提出者，而在 2023 年，人工智能的最大风头，却更多地被微软和 OpenAI 抢走。2023 年，Google在人工智能方面也动作频繁，但很难说受到了外界的多少认可。最新一季的财报公布之后，Google母公司 Alphabet 股票下跌约 5%。The Information 的 Martin... PC版：手机版：

所有人都想知道苹果如何“AI化”？答案出来了：Siri！

所有人都想知道苹果如何“AI化”？答案出来了：Siri！上周，苹果发布的搭载M4芯片的全新iPad Pro惊艳四座，M4芯片上的NPU神经网络引擎，能够达到38TOPS算力，远超M2的18TPS，凸显了苹果在边缘人工智能计算上的技术实力。不过摩根士丹利认为，考虑到iPad Pro受众相对较窄，所以M4芯片只是苹果小小的“秀肌肉”，面向普通消费者的AI功能更新，会在6月10日的WWDC大会上发布。最为重磅的更新，可能就是Siri。据媒体报道，苹果预计将在WWDC大会上发布改进后的 Siri，该 Siri 的对话性更强、用途更广。Siri的底层技术将包括一种新的生成式人工智能系统，该系统将允许它聊天，而不是一次回答一个问题。另据媒体最新报道称，苹果已经与OpenAI达成协议，会在iOS 18中使用其技术，以升级Siri的对话体验，由生成式AI驱动的新版Siri将在WWDC上亮相。苹果已经与OpenAI已经达成协议，在iOS 18中引入ChatGPT技术媒体援引知情人士说法称，苹果苹果公司软件工程高级副总裁Craig Federighi和分管人工智能业务的副总裁John Giannandrea去年曾花费数周时间测试ChatGPT，随后意识到相比领先的生成式人工智能技术，Siri“看起来已经过时了”。据一位曾在Siri团队工作过的工程师对媒体表示，Siri团队未能获得苹果内部其他团队所获得的关注和资源，公司的软件和硬件等部门独立运作，共享的信息有限。但人工智能产品要想取得成功，就必须与产品深度融合。2011年推出的Siri还未曾有过重大迭代，她不支持多轮对话，也经常无法理解用户的请求。甚至连基本的点歌都经常出错，这也削弱了苹果智能音箱HomePod的吸引力。不过，在测试过ChatGPT之后，苹果就进行了“十多年来规模最大的重组”，将资源集中于AI方向。今年年初取消苹果汽车项目后，大部分工程师都转岗到了AI团队。据报道，苹果用于迭代Siri的研发经费高达每天数百万美元。苹果高层认为，ChatGPT等聊天机器人背后的大语言模型技术可以增强Siri的能力。苹果已经与OpenAI已经达成协议，将在全新操作系统iOS 18中引入ChatGPT技术。苹果也在和谷歌进行谈判，可能也会引入其LLM，不过协议尚未敲定。新Siri将通过边缘计算技术运行成本更低速度更快iPhone目前占据全球智能手机利润的85%，销售额超过2000亿美元，令无数消费电子硬件生产商艳羡，也吸引了众多挑战者。包括Humane Ai Pin、Rabbit R1等全新AI硬件，都宣称拥有挑战iPhone的潜力。虽然这些设备眼下对iPhone不具备什么威胁，不过苹果内部担心，随着大模型技术的发展、其他智能手机制造商将更多AI元素融入其操作系统，让iPhone显得像“一块笨砖头”。尤其是可以自动完成制定旅行计划、打车、订餐等复杂任务的被称为“代理”（agents）的AI技术，其智能和便捷性，可以让苹果AppStore里的许多软件黯然失色。目前来看，苹果不打算直接发布全新的聊天机器人与ChatGPT、Claude等竞争。据媒体报道，苹果专注于让Siri更好地处理用户请求，包括设置定时器、创建日历事件和向杂货清单添加物品等，全新的Siri或许还可以总结短信内容，一键创建GIF图片等等。此外，苹果的技术路径与其他聊天机器人有一点非常重要的不同新版Siri将基于边缘计算技术而非云计算，即无需联网就能理解上下文、完成对话，响应速度更快，也不需要昂贵的数据中心成本。也因此，苹果将升级今年iPhone的内存，以支持全新的边缘人工智能计算。 ... PC版：手机版：

谷歌Gemini离谱翻车马斯克被大黑特黑

谷歌Gemini离谱翻车马斯克被大黑特黑而且马斯克还不是个例，很多网友在尝试让Gemini文生图的时候都仿佛中了“黑色魔力圈”一样。例如给Gemini一个机会，让它生成教皇，它能给你一个很多元化的版本：黑人、LGBT小旗子……还有黑人女性版本的教皇：许多网友在看到教皇的这一面，直呼“这也太冒昧了吧~”但冒昧的岂止这些啊，再来看下Gemini眼中的美国开国元勋……得是黑的！生成的维京人，也得是黑的！还有更奇葩的，就连香草布丁，Gemini还是得给你搞成黑色儿的……总而言之，用网友的话来说就是：死活就不带白人玩儿呗？不爽这事的可不止是一众网友，马斯克也坐不住了，直接亲自下场，在自家X上开启怒怼模式：觉醒思想病毒（woke mind virus）正在杀死西方文明。而马斯克的矛头并非仅仅指向Google一家，他借着这事儿把OpenAI、Facebook、Instagram以及维基百科等等都喷了一遍。不过对于Google，马斯克还是“格外关照”的，数条推文内容都比较犀利。例如这条不带任何文案的，仅是配图，杀伤力也是极大：嗯，马斯克这次是真的不高兴了。Google致歉，连夜下架Gemini文生图老马怒一下，舆论震一震。不仅是网友们在X上群嘲Gemini“只认黑人”，就连主流媒体们也是争相报道，标题中充斥着“疯狂”、“种族歧视”等字眼。Google这边也是意识到了自家Gemini闯了大祸，立马采取措施下架整顿文生图功能。直到现在，如果你给Gemini提出“生成一张Elon Musk形象”的要求，它的回答仍然是：我们正在努力提高Gemini生成人物图像的能力。我们预计这个功能很快就会回归，并在发布更新时通知您。（小插曲：Gemini还有两幅面孔呢，中英提问的问答截然不同。）Google官方这边也对这件事做出了正式说明。整体来看，这份声明内容总共分为三大块。诚恳致歉大约是在三周前，Google为Gemini推出了图片生成的功能，其中就包括创建人物的能力。不过现在这种结果，Google方面表示始料未及，但同时也非常感谢用户们的反馈：我们已经认识到了这个错误，并在改进版本的同时，暂时停止了Gemini中人物图片的生成功能。解释原因根据Google官方的说法，Gemini对话式应用是一种特定产品，独立于 Google 搜索、底层AI模型和其他产品。而它的图像生成功能是建立在一个名为Imagen 2的AI模型之上。Google最初在人物图像生成上的考量是希望能让全世界不同人群用户，在使用过程中，可以生成自己想要的特定人群。例如如果你提出“教室里的黑人老师”、“教室里的黑人老师”，那么Gemini应当给出的就是符合语境的结果。那么现在问题出在了哪里？Google将此归结为2点：首先，我们为了确保Gemini展示多种人群而进行了调整，但没有考虑到那些显然不应该出现的案例。其次，随着时间的推移，模型变得比我们预期的要谨慎得多，完全拒绝回答某些提示错误地将一些非常无害的提示判定为敏感词。这两件事导致模型在某些情况下过度补偿（overcompensate），而在其他情况下又过于保守，导致生成的图片令人尴尬。经验和教训对此，Google坦言现在的结果并不是他们的初衷。在这次“闭关整顿”的期间，Google表示Gemini的人物图像生成功能将进行广泛的测试，直到能力达标之后才会再次开放。Google也基于这件事情做了一下反省：Gemini是作为一个创意和生产力工具而构建的，它可能并不总是可靠，特别是在生成关于当前事件、不断发展的新闻或热点话题的图片或文本时。它会犯错误，正如我们从一开始就说过的，幻觉是所有大型语言模型的一个已知挑战有时候AI就是会弄错事情。我们一直在努力改进这一点。Gemini是有在努力给出真实的回答，例如我们的双重检查功能有助于评估网上是否有内容可以证实双子座的回答，但我们建议依赖Google搜索，因为它有独立的系统从网络上的各种来源提供新鲜、高质量的信息。我们不能保证Gemini不会偶尔犯错，但可以保证的是，每当我们发现问题时都会采取行动做改进。人工智能是一项新兴技术，在很多方面都很有帮助、潜力巨大，我们正在尽最大努力安全、负责任地对其进行推广。不过在Google这份声明发布之前，还有一件比较drama的事情。马斯克在X中亲自爆料称，Google一位高管和他在前一晚打了一个小时的电话，并向马斯克保证会解决Gemini在种族和性别歧视上的问题。不过网友们也是调皮，又把“黑人版马斯克”搬出来了：你问他这张照片是怎么个事儿了吗？不过有一说一啊，Gemini这次犯的错只能说是GoogleAI在种族、性别偏见上的一个“事件点”。正如马斯克在回答网友问题中所说，他和Google高管的对话内容仅限于Gemini的改进，但其实Google其他很多产品同样也存在类似的问题。Google搜索，不是第一次翻车针对这一情况，我们亲自在Google搜索中尝试了一下。例如在“Google图片”中输入：快乐的白人女性和男性。得到的结果是这样的：嗯，搜索的要求是非常明确，但得到的结果，就是非得给你往里塞点黑人群体。这就与Google在刚才的《致歉声明》中非常自信提到的“我们建议您依赖Google搜索”背道而驰。趁着这次Gemini翻车，很多网友也是纷纷开始对Google搜索做测试，结果也是和我们的测试一致。但如果我们把Google搜索的时间线拉长一点，就会发现这不是它第一次翻车。早在九年前（2015年），一位黑人兄弟Jacky Alciné就发现，Google图片就存在严重的歧视现象竟然把他的黑人朋友分类成了“大猩猩”！当时这一消息可谓是轰动一时，Google闻讯同样是立即出面道歉，并表示整改。但在数年之后，当人们再次检验整改效果时，却发现Google只是为图像识别算法去掉了“大猩猩gorilla”这个类别。因此，加上Gemini这次引发的舆论，Google搜索九年来已经第二次在“黑人”问题上大翻车了。不过这两次的翻车事件，或许也影射出了Google在技术发展的一个隐患。从数年来Google在AI的发展中来看，虽然它的成果和进展依旧处于全球科技巨头的第一梯队，但近年来（尤其是在生成式AI）相比微软、Meta来说似乎并没有那么耀眼。早在去年ChatGPT引爆生成式AI之际，微软和Google在火拼的过程中，Google的动作多次慢半拍；后来被曝出内部像当时Bard这样的产品早就有了，只是高层的顾虑太多，迟迟没有推进。或许就是Google内部事事追求“政治正确”，用力过猛，反而造成了在技术上的笑话。One More Thing在马斯克多条怒喷Google的帖子中，有这么一条是比较有意思的。他po出了四张贾斯廷·特鲁多的照片，穿戴不同民族服装，甚至还有黑人版的照片，并附上文案：我不敢相信Gemini竟然生成了这些特鲁多的假照片。但实际上，这些照片都是特鲁多的真实照片，也因为这些照片他此前深陷过“种族歧视”的舆论中。不得不说，马斯克，你是懂阴阳的。 ... PC版：手机版：

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人