Gemini AI人物成像新功能“离大谱”拟下线几周 谷歌股价盘中跌超4%

GeminiAI人物成像新功能“离大谱”拟下线几周谷歌股价盘中跌超4%谷歌上周刚刚推出重大更新的人工智能(AI)大模型Gemini1.5Pro,就被几周前上线的新AI功能打脸。投资者看来在用脚投票,表达他们对谷歌在AI领域竞争地位的担忧。美东时间2月26日周一,上周五微幅收跌的谷歌母公司Alphabet低开低走,加速下跌,盘中跌破关键位50日均线,刷新日低时,日内跌逾4.2%,势将创1月5日以来收盘新低。有评论指出,谷歌股价大跌正逢该公司在竭力应对旗下Gemini大模型招致批评的负面影响。华尔街见闻注意到,周一当天出席巴塞罗那举行的世界移动通信大会时,谷歌AI研究部门DeepMind的负责人DemisHassabis称,谷歌计划在“未来几周内”恢复被叫停的生成人物图像功能。他说:“我们希望在很短的时间内重新上线。”按照Hassabis所说,谷歌的AI人物图像生成功能将下线几周。上周四,谷歌在该功能招致大批网友批评后宣布暂停该功能。在原名推特的社交媒体X,网友提到的谷歌Gemini模型这一AI功能有多离谱呢?据说,Gemini公然“篡改历史”,生成的美国开国元勋和中世纪英格兰国王都出现了黑人的身影。X网友要求Gemeni生成1943年二战期间的德国士兵图片,它生成的一些士兵竟然有亚裔和非裔。对于有关现代社会人群的生成图片,Gemini也显示了“无视”白人群体的倾向。X用户名为debarghya_das的谷歌前工程师、发现,美国、英国、德国、瑞典、芬兰、澳大利亚女性的肤色都可能偏黑。为什么Gemini生图如此过度偏重群体多样化?HuggingFace的首席道德科学家MargaretMitchel分析,谷歌可能对AI进行了多种干预。一是,谷歌可能在幕后为用户提示词增加了“多样化”的形容词,比如将“厨师的肖像”改成“土著厨师的肖像”。二是谷歌可能优先显示“多样化”的图像,假设Gemini为每个提示词生成十张图像但只显示四张,用户更有可能看到排在前面的“多样化”图像。上周四,谷歌在X发帖称,意识到Gemini在一些历史图像生成的描述中提供了不准确的信息,已经在努力解决Gemini图像生成功能最近出现的问题,将暂停该功能并很快发布改进版本。当天谷歌在博客文章中承认,“三周前”为Gemini对话App推出的图像生成新功能出了错,并解释说,Gemini出的问题部分源于,随着时间推移,Gemini模型变得“比我们预期的要谨慎得多”,它拒绝全面回答某些提示词,将一些无害的提示词错误地解读为敏感词。本周一,Hassabis也提到Gemini演化存在的问题。他解释说,谷歌正在应对,推出旨在生成文本、图像和照片的“多模态”系统时面临的困难。他说:“这是高级AI带来的细微差别之一。这是一个我们都在努力应对的领域。”...PC版:https://www.cnbeta.com.tw/articles/soft/1421005.htm手机版:https://m.cnbeta.com.tw/view/1421005.htm

相关推荐

封面图片

谷歌暂停Gemini AI生成人物图像的能力

谷歌表示,将暂停GeminiAI生成人物图像的能力,此前该工具被发现生成不准确的历史图像。Gemini一直在创作美国开国元勋和纳粹时期德国士兵的各种形象,这似乎是在试图颠覆生成式人工智能中存在的性别和种族刻板印象。谷歌在x上发布的一份声明中表示:“我们已经在努力解决Gemini图像生成功能最近出现的问题,在我们这样做的同时,我们将暂停人员图像生成,并将很快重新发布改进版本。”标签:#Google#Gemini频道:@GodlyNews1投稿:@GodlyNewsBot

封面图片

AI 模型 Gemini 被曝 “绘制不出白人”,谷歌高级副总裁也道歉了

AI模型Gemini被曝“绘制不出白人”,谷歌高级副总裁也道歉了综合美联社等媒体报道,谷歌公司推出的AI模型Gemini具有根据文字生成图像的功能,但一些用户近期发现,大多数生成的人物图像都不是白人,而是有色人种。有用户认为,该模型在生成图像的过程中存在“反白人”问题。对此,谷歌称正采取让Gemini暂时停止运行生成人物图像功能的做法。美联社报道说,拉加万23日在谷歌博客网站发文称,“很明显,该功能未能达到预期结果”。他还称,“生成的一些图像不准确或者甚至令人不快。我们感谢用户的反馈,对该功能未能很好发挥作用感到抱歉”。(环球网)

封面图片

出现人种多样性错误后 Google暂停了Gemini AI生成人物图像的功能

出现人种多样性错误后Google暂停了GeminiAI生成人物图像的功能"我们已经在努力解决Gemini图像生成功能最近出现的问题,"Google在X上发布的一份声明中说,"在我们进行这项工作的同时,将暂停生成人的图像,并将很快重新发布一个改进版本。"在Google决定暂停在Gemini中生成人物图像不到24小时之前,该公司就其人工智能模型生成的一些历史图像不准确一事道歉。一些Gemini用户在请求生成建国元勋等历史团体或人物的图片时,发现人工智能生成的结果中出现了非白人的人物。这在网上引起了一些阴谋论,认为Google有意避免描绘白人。实测几个Gemini的查询,发现其中包括一个"19世纪美国参议员"的请求返回的结果包括似乎是黑人和美洲原住民的女性。第一位女参议员是1922年的白人女性,因此Gemini的人工智能图像基本上抹去了种族和性别歧视的历史。下面是人工智能模型在用户请求生成人物图片时的反应:我们正在努力提高Gemini生成人物图像的能力。我们预计这项功能将很快恢复,届时我们将通过版本更新通知您。本月早些时候,Google首次通过Gemini(前身为Bard)开始提供图像生成功能,以期与OpenAI和微软的Copilot竞争。与竞争对手一样,图像生成工具也是根据文本输入生成一系列图像。...PC版:https://www.cnbeta.com.tw/articles/soft/1420057.htm手机版:https://m.cnbeta.com.tw/view/1420057.htm

封面图片

谷歌Gemini生图功能紧急关闭,口碑一夜塌房 Yann LeCun:我早就知道

谷歌Gemini生图功能紧急关闭,口碑一夜塌房YannLeCun:我早就知道对此,在2月8日,Google还把自家对标ChatGPT的服务Bard更名为Gemini,以着重体现新使命——旨在提供对“最强模型系列”的访问。上周Google还火速更新了GeminiPro1.5版。结果,推出不到一个月,这个Gemini就翻车了。多离谱呢,作为一个多模态的生成大模型,Gemini生成的伊隆・马斯克是这样的:脸型神态都很传神,只是有个大问题:怎么成了黑人?又有人尝试让Gemini画一幅“1940年代德国领导人”的图,结果AI给出了这么一张:社交网络上的众多网友们还提供了一些Gemini生成维京人、教皇的图片样本。我们可以看到有一名身着教皇服装的亚洲女性,但历史上所有教皇都是男性担任的。总之,众多用户在使用人像生成服务时发现,Gemini似乎拒绝在图像中描绘白人,以至于生成了不少违背基本事实(性别、种族、宗教等)的图片。以往的图像生成模型大多被诟病生成人物图像以“白人”为主,而Gemini矫枉过正了?在reddit的斗图区,网友们也开始玩起了梗,比如让Gemini生成个“钢铁侠”小罗伯特唐尼:你就说是不是一视同仁吧。然而,Gemini也不是一直都这么偏心,有时它生成的图像中的人物就成了白人。例如克拉伦斯・托马斯(ClarenceThomas),美国最高法院大法官,Gemini生成的结果是这样的:然而,他实际上是个非裔。ClarenceThomas本人的照片。怎么一到法官这种特殊职业,Gemini的偏见就调转了180度呢?这些图片有真有假,像病毒一样在社交媒体上迅速传播,马斯克本人的关注进一步扩大了事件影响。他措辞严厉表示,Google在文生图上“玩过头了”。随着节奏越来越大,很多AI专家也纷纷开始发表自己的看法。图灵奖获得者YannLeCun今天就表示他早有预料。他表示,早在四年前,自己对GAN肖像超分辨率的评论就受到了众人的激烈反对。但一个明显的事实是,图像重建任务会受到训练数据集统计的严重偏差影响。LeCun还援引AI顶会ECCV2022的一篇研究《StudyingBiasinGANsthroughtheLensofRace》,其指出生成图像模型的性能会受到训练数据集中种族组成的影响。该研究表明,生成图像的种族成分成功继承了训练数据的种族成分,而且生成图像的种族和质量也有所不同——注释者始终更喜欢AI生成的白人图像。LeCun转推的帖子来自PerplexityAI首席执行官AravindSrinivas。后者表示,数据偏差让模型的输出出现了问题,Google在相反的方向上走得太远了,以至于他们在Gemini中酿成大错。Google:我们错了,承诺改进在重压之下,Google在本周四承认了Gemini图像生成的问题。以下是Google知识与信息高级副总裁PrabhakarRaghavan针对Gemini图像生成“翻车”给出的最新回应:三周前,我们为Gemini对话应用程序(以前称为Bard)推出了新的图像生成功能,其中包括创建人物图像的功能。很明显,这个功能没有达到预期。生成的一些图像不准确甚至具有攻击性。我们感谢用户的反馈,并对功能未能正常运行感到抱歉。我们已经承认了这个错误,并暂停了Gemini的人物图像生成功能,同时我们正在开发改进版本。Google表示,Gemini对话应用程序是一款独立于Google的搜索、底层人工智能模型和其他产品的特定产品。其图像生成功能建立在人工智能模型Imagen2的基础上。在为Gemini构建图像生成功能时,Google对其进行了调整,以确保它不会落入我们过去在图像生成技术中看到的一些陷阱,例如创建暴力或露骨的图像,或对现实生活中存在的真人的描绘。由于Google用户来自世界各地,公司希望Gemini能为每个人提供良好的服务。在生成人物图像时,用户可能不仅仅只想生成一种种族(或任何其他特征)的人物图像。如果你提示Gemini特定类型的人物图像-例如“教室里的黑人老师”、“带着狗的白人兽医”或特定文化、历史背景下的人,用户绝对应该得到一个准确反映人类要求的答复。那么Gemini到底出了什么问题呢?简而言之,有两件事。首先,Google为确保Gemini显示一系列人物而进行的调整未能考虑到显然不应该显示的范围。其次,随着时间的推移,该模型变得比开发者预期的更加谨慎,拒绝回答某些提示——会错误地将一些提示解释为敏感提示。这两件事导致模型在某些情况下过度输出,而在另一些情况下过度保守,从而导致Gemini的图像生成功能出现了一些错误。Google表示,“这不是我们的初衷。我们不希望Gemini拒绝创造任何特定群体的形象。我们不希望它创造出不准确的历史图像或任何其他图像。因此,我们关闭了人物图像生成功能,并将在重新打开它之前努力改进,这个过程将包括广泛的测试。”需要记住的一件事是,Gemini是一种创造力和生产力工具,它或许并不总是可靠的,特别是在生成有关时事、不断发展的新闻或热门话题的图像或文本时,它可能会犯错。众做周知,幻觉是所有大语言模型(LLM)都会面临的挑战,这需要不断的努力改进。我们不能保证Gemini不会偶尔产生令人尴尬、不准确或令人反感的结果,但我们可以保证,只要发现问题,我们就将采取行动。人工智能是一项新兴技术,在很多方面都有帮助,具有巨大的潜力,我们正在尽最大努力安全、负责任地推动它发展。虽然伴随着“Demo加特技”、训练数据抄百度文心一言等各种诟病指责,Gemini仍然一直被Google寄予厚望,不过此次生成内容上的问题让人们产生了非常不好的观感,不知如何才能补救。另一方面,这或许也体现了OpenAI一直强调安全性,及其建立RedTeamingNetwork的先见之明。Gemini这样的大体量模型,能否很快弥补此种缺陷?...PC版:https://www.cnbeta.com.tw/articles/soft/1420491.htm手机版:https://m.cnbeta.com.tw/view/1420491.htm

封面图片

谷歌自家 App 陆续接入 Gemini:笔记应用 Keep 测试“AI 创建清单”功能

谷歌自家App陆续接入Gemini:笔记应用Keep测试“AI创建清单”功能据外媒9to5Google报道,继本周早些时候推出“GeminiforWorkspace”之后,谷歌现在开始为自家的笔记应用Keep测试由Gemini驱动的AI功能。这一功能可帮助用户快速完成购物清单、待办事项清单及打包清单。当用户打开Keep的安卓版App时,会首先看到一个“欢迎来到WorkspaceLabs”的提示。当用户创建新的笔记时,界面会出现一个尺寸较大的“帮我列清单”(Helpmecreatealist)按钮,用户点击之后可以创建提示词,例如“夏季带着两个孩子露营的行李清单”“适合万圣节观看的经典电影”“素食三口之家一周所需杂货”等。此外,谷歌也鼓励用户提供更加具体的信息,以获得更佳结果。用户也可以对Gemini生成的结果进行点赞或点踩,向谷歌提供反馈。线索:@ZaiHuabot投稿:@TNSubmbot频道:@TestFlightCN

封面图片

谷歌升级Gemini 1.5 Pro AI可以听音频了

谷歌升级Gemini1.5ProAI可以听音频了Gemini1.5Pro被视为Gemini家族中的“中量级”(middle-weight)模型,其性能已经超越了最大规模、最强大的GeminiUltra。谷歌表示,Gemini1.5Pro能够理解复杂指令,而且使用时无需对模型进行特别调整。需要指出的是,不通过VertexAI的用户无法体验到Gemini1.5Pro的全部功能。目前,大众主要通过Gemini聊天机器人与Gemini大语言模型互动。尽管GeminiUltra为GeminiAdvanced聊天机器人提供了强大支持,能理解较长的指令,但在反应速度上不及Gemini1.5Pro。除了Gemini1.5Pro的更新,谷歌还对其它大型人工智能模型进行了升级。特别是作为文本转图像生成模型的Imagen2,它增强了Gemini的图像生成能力。通过引入图像外延(Outpainting)和内填(Inpainting)功能,用户现在能更灵活地对图像的元素进行添加或删除。为确保Imagen模型生成的图片版权和来源可追溯,谷歌为所有生成图片加入了SynthID数字水印技术。这种创新技术通过几乎不可见的水印明确标识图片来源,可以通过专用工具进行检测。Imagen模型的许多新特性,如图像外延和内填技术,已被其他文本转图像模型采用,例如StabilityAI的StableCascade和Getty的GenerativeAIbyiStock。此外,这些技术也被广泛应用于消费电子产品中,如三星Galaxy手机。除图像生成的创新外,谷歌还公开展示了一种结合人工智能生成回答和谷歌搜索结果的方法,旨在为用户提供更实时、更准确的信息。然而,大语言模型生成的回答并非总是精准无误,有时可能会误导用户。因此,谷歌对Gemini模型设置了一些限制,比如禁止回答与2024年美国大选相关的问题。此前,Gemini模型因在生成历史人物描述时出现不准确而受到批评。...PC版:https://www.cnbeta.com.tw/articles/soft/1426835.htm手机版:https://m.cnbeta.com.tw/view/1426835.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人