谷歌被曝翻车内幕:内部群龙无首 生图机制过分“多元化”

谷歌被曝翻车内幕:内部群龙无首 生图机制过分“多元化” GoogleGemini文生图风波还未平,更劲爆的内幕消息又被曝出来了。Pirate Wires爆料,Gemini这次的翻车,Google内部此前并不是毫不知情,翻车甚至是“故意”导致的。具体来说,Google设置了一个“安全”架构,Gemini要生成一张图实际上要经过三个模型。大概来说,流程是这样婶儿的:用户在聊天界面请求Gemini生成一张图片,Gemini收到请求后,会把请求发送给一个较小的模型。这个较小的模型的作用是根据公司的“多元化”政策重写用户的提示。为做到这一点,这个较小的模型又通过LoRA技术在另一个模型(第三个模型)生成的合成数据上训练,而这个第三模型使用了Google详尽、长达数页的“多元化”政策文档作为“前言”。所以,较小模型重写用户的提示后,原本“给我看一个汽车修理工”会变成“给我看一个穿工装裤面带微笑的亚洲汽车修理工”、“一个拿着扳手的非洲裔美国女性汽车修理工”、“一个戴安全帽的美洲原住民汽车修理工”……并且重写后的提示还会进一步发给扩散模型检查,确保提示词不违反标准安全政策(比如涉及儿童的内容、真人图像等),最终才会生成图片,生成的图片在反馈给用户前也会再被检查一遍。总结来说,用户最后收到的是一个“套娃式”生成的结果,经过了Google“多元化”的层层清洗。不过,这种“多元化”多少有点过了头。过度程度,让曾在Google Ventures任职的红杉资本合伙人Shaun Maguire都忍不住出来痛批:在Google曾因是白人而不能晋升。字里行间毫不掩饰自己的愤怒:马斯克也曾发表了评论:近年来,这种情况非常普遍。Pirate Wires在采访过Google相关员工后表示,这背后更深一层是Google目前群龙无首的现状。一位未被透露姓名的Google高级工程师甚至表示:“我认为在Google推出好产品是不可能的。”“恐惧文化”正在Google蔓延此前,Gemini文生图刻意拒绝生成白人形象,在欧美舆论环境下引发巨大争议。后续该功能被迫下架,母公司AlphaBet股价下跌一度超过11%,带来非常严重的后果。而外媒Pirate Wires这次对Google相关员工采访后发现,Gemini的翻车与Google不良的DEI文化有关。(DEI是“Diversity,Equity, Inclusion”的缩写,中文意为“多样性、公平性、包容性”,是一个被广泛应用于企业等其他组织中的概念,旨在促进一个更加多元、平等和包容的环境)有接近Gemini项目的人透露,其实Gemini团队在发布前就被提醒过“过度多样化”的问题,撇开种族问题不谈,即使是最无害的搜索结果的质量也会受到严重影响。开头提到的三个模型都是为增加“多样性”而被设计的,接触过安全架构的人甚至还透露,相关团队“可能将一半的工程时间都花在这上面了”。而且公司内部对于这种复杂架构的态度和采纳程度存在分歧,“当Gemini项目公开后失败时,不仅是这个团队,整个公司都感到非常沮丧和挫败”。对于这一点,前几天Google创始人谢尔盖·布林现身AI黑客马拉松现场,也有相关透露大家正在把玩的Gemini 1.5 Pro模型的诞生其实只是个意外。当我们训练它的时候,只是作为扩大规模实验的一个尝试,根本没想到会变得如此强大。当看到它的表现时,我们不想再等待,我们想让全世界都来试试它。更重要的是,公司内部类似情况还有很多,Gemini生图只是其中一个缩影。比如,据透露有人坚持要求工程师不能使用像“建造忍者(build ninja)”、“核爆旧缓存(nuke the old cache)”、“理智检查(sanity check)”或“哑变量(dummy variable)”这样的术语,理由是它们依次对应了文化挪用、军事隐喻、贬低精神疾病、贬低残疾的问题。有工程师被强烈建议在他的公司个人简介中采用一种多样化的代词组合来表示自己,比如“zie/hir”、“ey/em”、“xe/xem”、“ve/vir”。还有一个名为Greyglers(“Google”和“grey”的结合词)的小组,正在更名。Greyglers小组是一个面向40岁以上资深员工的小组,有人认为并不是所有40岁以上的人都有灰头发,所以这个组名缺乏“包容性”,甚至据爆料,Google还聘请了外部顾问为小组重命名。Pirate Wires还透露,几乎每个被采访的人都用了“恐惧文化(culture of fear)”这个词,这不仅解释了对公司极端DEI行为的无力反抗,也说明了为何这一世界技术人才聚集地缺少创新。无论在哪个层级的员工,几乎出于每个原因,都害怕挑战那些已经使公司陷入困境的许多过程。除晋升期之外,大多数人都害怕被注意到。哪怕是想要晋升,也会受到种族和性别的影响。然鹅,真的就这么简单,归咎于失控的DEI思维管理吗?为什么Google会这样?Pirate Wires的文章中认为,这只是公司更大问题的所表现出来的一个“症状”,这个更大的问题用四个字来说就是:群 龙 无 首。首先,Google现在面临着典型的“创新者困境”,也就是发展一项完全在其能力范围内的新的技术,会破坏其现有商业模式。其次,更重要的是没有人负责。在Google几乎每个主要产品的管理团队到工程、销售、信任与安全、公关和市场营销的员工嘴里,Pirate Wires表示大家描绘出的Google形象比报道的要要黯淡得多:Google是一个失控的、印钞机式的搜索垄断企业,没有愿景、没有领导力,并且由于其难以置信的孤岛式文化,团队之间真正的情况了解甚少。成千上万的人在不同的时间处理着一个大拼图的各个部分,彼此之间很少合作。比如,在跨团队合作者想要帮助Gemini团队,要么会失败,要么被忽视。连接员工的唯一渠道是一个强大的、遍布的人力资源官僚体系。而创始人拉里·佩奇、谢尔盖·布林、CEO桑达尔·皮查伊之间的一种奇怪的管理,让大多数员工对谁真正负责公司没有什么感觉,不确定性是整个公司熟悉的主题。由此,这也是为什么有着劈柴哥外号的CEO桑达尔·皮查伊成为了众人抨击的对象,据Business Insider消息,华尔街方面甚至出现越来越多要求现任CEO劈柴哥下台的声音。用一位Google工程师的话来说:“桑达尔是Google的鲍尔默,所有这些不起作用的产品、无序扩张、过度招聘,这一切都发生在他的领导下。” ... PC版: 手机版:

相关推荐

封面图片

谷歌Gemini离谱翻车 马斯克被大黑特黑

谷歌Gemini离谱翻车 马斯克被大黑特黑 而且马斯克还不是个例,很多网友在尝试让Gemini文生图的时候都仿佛中了“黑色魔力圈”一样。例如给Gemini一个机会,让它生成教皇,它能给你一个很多元化的版本:黑人、LGBT小旗子……还有黑人女性版本的教皇:许多网友在看到教皇的这一面,直呼“这也太冒昧了吧~”但冒昧的岂止这些啊,再来看下Gemini眼中的美国开国元勋……得是黑的!生成的维京人,也得是黑的!还有更奇葩的,就连香草布丁,Gemini还是得给你搞成黑色儿的……总而言之,用网友的话来说就是:死活就不带白人玩儿呗?不爽这事的可不止是一众网友,马斯克也坐不住了,直接亲自下场,在自家X上开启怒怼模式:觉醒思想病毒(woke mind virus)正在杀死西方文明。而马斯克的矛头并非仅仅指向Google一家,他借着这事儿把OpenAI、Facebook、Instagram以及维基百科等等都喷了一遍。不过对于Google,马斯克还是“格外关照”的,数条推文内容都比较犀利。例如这条不带任何文案的,仅是配图,杀伤力也是极大:嗯,马斯克这次是真的不高兴了。Google致歉,连夜下架Gemini文生图老马怒一下,舆论震一震。不仅是网友们在X上群嘲Gemini“只认黑人”,就连主流媒体们也是争相报道,标题中充斥着“疯狂”、“种族歧视”等字眼。Google这边也是意识到了自家Gemini闯了大祸,立马采取措施下架整顿文生图功能。直到现在,如果你给Gemini提出“生成一张Elon Musk形象”的要求,它的回答仍然是:我们正在努力提高Gemini生成人物图像的能力。我们预计这个功能很快就会回归,并在发布更新时通知您。(小插曲:Gemini还有两幅面孔呢,中英提问的问答截然不同。)Google官方这边也对这件事做出了正式说明。整体来看,这份声明内容总共分为三大块。诚恳致歉大约是在三周前,Google为Gemini推出了图片生成的功能,其中就包括创建人物的能力。不过现在这种结果,Google方面表示始料未及,但同时也非常感谢用户们的反馈:我们已经认识到了这个错误,并在改进版本的同时,暂时停止了Gemini中人物图片的生成功能。解释原因根据Google官方的说法,Gemini对话式应用是一种特定产品,独立于 Google 搜索、底层AI模型和其他产品。而它的图像生成功能是建立在一个名为Imagen 2的AI模型之上。Google最初在人物图像生成上的考量是希望能让全世界不同人群用户,在使用过程中,可以生成自己想要的特定人群。例如如果你提出“教室里的黑人老师”、“教室里的黑人老师”,那么Gemini应当给出的就是符合语境的结果。那么现在问题出在了哪里?Google将此归结为2点:首先,我们为了确保Gemini展示多种人群而进行了调整,但没有考虑到那些显然不应该出现的案例。其次,随着时间的推移,模型变得比我们预期的要谨慎得多,完全拒绝回答某些提示错误地将一些非常无害的提示判定为敏感词。这两件事导致模型在某些情况下过度补偿(overcompensate),而在其他情况下又过于保守,导致生成的图片令人尴尬。经验和教训对此,Google坦言现在的结果并不是他们的初衷。在这次“闭关整顿”的期间,Google表示Gemini的人物图像生成功能将进行广泛的测试,直到能力达标之后才会再次开放。Google也基于这件事情做了一下反省:Gemini是作为一个创意和生产力工具而构建的,它可能并不总是可靠,特别是在生成关于当前事件、不断发展的新闻或热点话题的图片或文本时。它会犯错误,正如我们从一开始就说过的,幻觉是所有大型语言模型的一个已知挑战有时候AI就是会弄错事情。我们一直在努力改进这一点。Gemini是有在努力给出真实的回答,例如我们的双重检查功能有助于评估网上是否有内容可以证实双子座的回答,但我们建议依赖Google搜索,因为它有独立的系统从网络上的各种来源提供新鲜、高质量的信息。我们不能保证Gemini不会偶尔犯错,但可以保证的是,每当我们发现问题时都会采取行动做改进。人工智能是一项新兴技术,在很多方面都很有帮助、潜力巨大,我们正在尽最大努力安全、负责任地对其进行推广。不过在Google这份声明发布之前,还有一件比较drama的事情。马斯克在X中亲自爆料称,Google一位高管和他在前一晚打了一个小时的电话,并向马斯克保证会解决Gemini在种族和性别歧视上的问题。不过网友们也是调皮,又把“黑人版马斯克”搬出来了:你问他这张照片是怎么个事儿了吗?不过有一说一啊,Gemini这次犯的错只能说是GoogleAI在种族、性别偏见上的一个“事件点”。正如马斯克在回答网友问题中所说,他和Google高管的对话内容仅限于Gemini的改进,但其实Google其他很多产品同样也存在类似的问题。Google搜索,不是第一次翻车针对这一情况,我们亲自在Google搜索中尝试了一下。例如在“Google图片”中输入:快乐的白人女性和男性。得到的结果是这样的:嗯,搜索的要求是非常明确,但得到的结果,就是非得给你往里塞点黑人群体。这就与Google在刚才的《致歉声明》中非常自信提到的“我们建议您依赖Google搜索”背道而驰。趁着这次Gemini翻车,很多网友也是纷纷开始对Google搜索做测试,结果也是和我们的测试一致。但如果我们把Google搜索的时间线拉长一点,就会发现这不是它第一次翻车。早在九年前(2015年),一位黑人兄弟Jacky Alciné就发现,Google图片就存在严重的歧视现象竟然把他的黑人朋友分类成了“大猩猩”!当时这一消息可谓是轰动一时,Google闻讯同样是立即出面道歉,并表示整改。但在数年之后,当人们再次检验整改效果时,却发现Google只是为图像识别算法去掉了“大猩猩gorilla”这个类别。因此,加上Gemini这次引发的舆论,Google搜索九年来已经第二次在“黑人”问题上大翻车了。不过这两次的翻车事件,或许也影射出了Google在技术发展的一个隐患。从数年来Google在AI的发展中来看,虽然它的成果和进展依旧处于全球科技巨头的第一梯队,但近年来(尤其是在生成式AI)相比微软、Meta来说似乎并没有那么耀眼。早在去年ChatGPT引爆生成式AI之际,微软和Google在火拼的过程中,Google的动作多次慢半拍;后来被曝出内部像当时Bard这样的产品早就有了,只是高层的顾虑太多,迟迟没有推进。或许就是Google内部事事追求“政治正确”,用力过猛,反而造成了在技术上的笑话。One More Thing在马斯克多条怒喷Google的帖子中,有这么一条是比较有意思的。他po出了四张贾斯廷·特鲁多的照片,穿戴不同民族服装,甚至还有黑人版的照片,并附上文案:我不敢相信Gemini竟然生成了这些特鲁多的假照片。但实际上,这些照片都是特鲁多的真实照片,也因为这些照片他此前深陷过“种族歧视”的舆论中。不得不说,马斯克,你是懂阴阳的。 ... PC版: 手机版:

封面图片

微软与法国 Mistral 达成协议,寻求在 OpenAI 之外多元化投资

微软与法国 Mistral 达成协议,寻求在 OpenAI 之外多元化投资 周一,法国公司 Mistral AI 宣布与微软建立“战略合作伙伴关系”,其中包括向微软 Azure 云的客户提供该初创公司最新的人工智能模型。Mistral 开发的算法模型与 OpenAI 用于聊天机器人和其他人工智能服务的算法模型类似,但 Mistral 模型是开源的并公开共享。微软表示已对这家法国公司进行了小额投资,但拒绝透露投资金额。 Mistral 由谷歌 DeepMind 和 Meta 的前工程师于2023年初成立,创建至今仅约十个月,将自己定位为勇敢的欧洲冠军,挑战美国在该领域的主导地位。去年 12 月,这家初创公司从包括 Salesforce 和 Nvidia 在内的一系列投资者那里获得了 4.15 亿美元的融资,该公司估值约为 20 亿美元。

封面图片

谷歌最牛大模型正式开放:免费试用两个月

谷歌最牛大模型正式开放:免费试用两个月 1)Google测试版的聊天机器人 Bard(已接入 Gemini Pro 模型)改名 Gemini;2)推出 Gemini 的 Android 版 App,并将 Gemini 的能力加入 iOS 的 Google App 中,免费向公众开放;3)在 Android 上,用户可以选择使用 Gemini 可以替代原来的 Google Assistant,成为手机的默认语言助手;4)在Google官方会员计划 Google One 中加入 Gemini Advanced 服务,多付 10 美元即可访问最强大的 Gemini Ultra 模型;5)大模型能力很快将接入 Google Workspace(包括 Gmail、Docs、Meet 等应用)和 Google Cloud 中。Bard 改名 Gemini,同时推出 Android 版 App | 图片来源:Google此次Google不仅直接推出了大模型面向 C 端的 App,同时将内部的多个产品线接入大模型,可以说向技术的公开化迈进了一大步。当问及为何选择推出面向公众的产品,Google产品管理高级总监、Gemini 体验官 Jack Krawczyk 对极客公园说,“我们谈论 Gemini,不仅仅是在谈(Google)最先进的技术,更是谈论一种生态系统的转变。”Krawczyk 表示,这一转变背后,一方面是因为 Gemini 技术本身的强大Gemini 从一开始就被创建为多模态大模型,它也是Google迄今最强大的模型,去年 12 月一经发布即引发全行业震撼。另一方面则是因为,Google认为时机已到,“我们相信更多的人已经准备好了第一次与这项技术互动。按照我们目前引入的方式,预计许多人将首次使用生成性AI。”Krawczyk 说。在大模型对话产品席卷全球一年后,Google终于迈出了最关键的一步。Gemini 推独立 App,Google Assistant 失业?为了迎战 ChatGPT,Google于 2023 年 3 月推出聊天机器人 Bard,但它的最初产品能力并不足够好、甚至在现场演示时回答出错。因此,Google不断提升 Bard 背后的模型水平,从最开始轻量级的 LaMDA 模型、升级到功能更强大的 PaLM 模型、再到最强的 Gemini 模型。去年 12 月 Gemini 发布后,Bard 宣布将运行在 Gemini Pro 上,这是 Bard 自推出以来最大的升级。Google似乎对 Gemini 的模型能力非常满意现在,它不仅直接将 Bard 改名为了 Gemini,还决定为这款测试了长达一年的产品直接推出 App。Gemini 的 App 界面 | 图片来源:Google2 月 8 日 21 点,Google推出 Gemini 的 Android 版 App,并将 Gemini 的能力加入 iOS 的 Google App 中,免费向公众开放。用户能够在亚太地区以英语、日语和韩语访问它们,更多语言版本即将推出。“我们从用户那里听说,他们希望在外出时更容易访问 Gemini。新的移动体验将我们最新的 AI 能力直接带到设备上,这样用户无论何时何地都能得到帮助。”Krawczyk 说。这也是很多大模型 C 端应用的使用场景,随时随地跟模型交互、获得服务。不过,比 App 最关键的是,Android 用户可以用 Gemini 替代原来的 Google Assistant,成为手机的默认语言助手。使用方式是:当用户访问 Google 助手时,会收到一个选项,询问是否希望加入 Gemini 作为实验性的助手。如果同意,Gemini 就会成为用户手机上的默认助手。用户可以通过现有的 Google 助手接入点,比如电源按钮、甚至 Hi Google,来唤醒使用 Gemini。Gemini in Gmail | 图片来源:Google这意味着,Gemini 将可以调用 Google 助手,帮助用户执行任务。比如打电话、发送消息、设置计时器、控制智能家居设备等等,更多功能还在研发过程中。一整年来,各大模型厂商都在谈论个人助理(agent)的未来,即通过一个智能体、为用户自动调动所有的应用。而Google通过将 Gemini 融入Google助手,展现了这一智能助理的可能性。Krawczyk 表示,在 Android 手机上,助手界面是最自然的发展愿景,所以才会把 Gemini 作为手机数字助手的一部分。“这是Google构建真正AI助手的第一步,再次强调,这是第一步,这是开始。”他说。Gemini Advanced,Google版的 GPT Plus去年底发布 Gemini 时,Google就表示其中最强大的 Ultra 模型将通过 Bard Advanced 提供,但尚无收费计划。2 月,通过更名的 Gemini Advanced,Ultra 大模型正式对公众开放,不过,收费方案也随之而来。想要接入Google的 Ultra 模型,用户需要订阅 19.99 美元每月的 Google One 的 AI Premium 服务,比 ChatGPT 的 Plus 版本的订阅费用,小低 0.01 美元。虽然价格看起来仿佛对标,但Google在收费上,充分利用了自己的生态优势。Google One 服务并不是一项新服务,它在 2018 年已经推出,是Google的“全家桶”服务。使用 Google One 的人,可以享受多项 Google 服务,包括存储空间和解锁部分软件的高级功能。如果类比于国内,相当于买了一个会员,同时可以解锁 iCloud 照片的存储功能,百度网盘的大容量空间,网易邮箱的高级功能,腾讯会议的付费功能等等而Google的厉害之处在于,在全部这些领域,Google旗下的应用,都拥有十亿级别的用户,付费基础广大。2024 年年初,Google刚刚宣布,Google One 目前已经有了 1 亿的订阅者。在 Google 推出新的 AI Premium 档位之前,Google One 原本有三个档位,每月 1.99 美元,每月 2.99 美元和每月 9.99 美元。新的 AI Premium 档位,虽然看起来是 19.99 美元,其中将赠送 9.99 美元档位的全部 Google One 服务。Google One 的收费计划 | 图片来源:Google这相当于,如果一个用户原本已经付费 9.9 美元可以解锁解锁 Google Meet(Google的在线会议平台)和 Google Calendar(Google的协作日历)的高级功能,那么,这个用户很可能已经是一个深度使用Google各项平台的商务人士。这时候,只需要每月增加 10 美元,就可以使用Google最强的大模型了。而Google为了勾住这些用户,还为他们量身定做了符合他们定位的功能,除了在专门的聊天窗口可以使用 Ultra 模型的能力,未来还能够在直接Google的邮箱,在线文档和在线会议中,使用大模型的能力。(从目前Google生产力智能助手 Duet AI 的功能演变而来)Ultra 模型能力表现具体如何?Google曾经表示,Gemini Ultra 在 32 个基准测试中拿下 30 个 SOTA(最先进水平),并且第一个在 MMLU 基准(大规模多任务语言理解基准)上达到人类专家水平。此次发布中,Google官方进一步表示,Gemini Advanced 将具有更长的上下文窗口,能够完成更加复杂的逻辑推理能力,遵从语意更加复杂的指令,可以辅助编程,可以角色扮演,可以看图说话在这个版本中,Google似乎并没有加入多少图片生成或者语音对话的多模态能力。Google还在发布中表示:“在业界领先的聊天机器人盲测中,用户觉得 Gemini Advanced 是目前最受人欢迎的聊天机器人。”Gemini Advanced 相当于Google版的 GPT Plus | 图片来源:Google由于大模型的评测目前还没有特别公允的横向比较标准,究竟是不是这样,恐怕要每一个用户自己去评判。Google放开了两个月的免费试用期,让大家自己来尝试 Gemini Advanced 是不是真的好用。不过可以看出,此次Google推出的付费版,重要卖点似乎并不完全落在其大模型拥有“吊打一切”的能力,而是更强调与生态内应用的结合,用户能够更加无缝地在已有的 Google 应用中,方便地使用人工智能的能力。比如写邮件,直接在邮件窗口下面,跟人工智能说一句看看怎么帮我回,显然比把邮件复制粘贴了放进另一个聊天机器人的对话窗口,再写 prompt 让机器人回复更为方便。而人工智能与在线会议等应用的结合,更是充满了很多提效空间。值得注意的是,Google的人工智能团队是 Transformer 架构的提出者,而在 2023 年,人工智能的最大风头,却更多地被微软和 OpenAI 抢走。2023 年,Google在人工智能方面也动作频繁,但很难说受到了外界的多少认可。最新一季的财报公布之后,Google母公司 Alphabet 股票下跌约 5%。The Information 的 Martin... PC版: 手机版:

封面图片

【谷歌向部分机构有限开放其Gemini AI产品】

【谷歌向部分机构有限开放其Gemini AI产品】 谷歌已授予其即将推出的对话式人工智能产品的部分访问权限。谷歌预计将通过Google Cloud Vertex AI提供在线门户Gemini,为开发人员提供了访问人工智能模型和其他工具的机会。 谷歌最初于2023年5月发布了Gemini。尽管该模型仍在训练中,但它表示,它看到了多模式能力,这意味着Gemini有能力处理不同类型的输入。谷歌还通过Bard向消费者提供人工智能服务,Bard是一个主要用于生成书面内容的人工智能聊天机器人。该公司目前可用的人工智能模型PaLM2是Bard和某些其他服务的基础。 快讯/广告 联系 @xingkong888885

封面图片

2024 年谷歌 I/O 大会:发布的全部内容

2024 年谷歌 I/O 大会:发布的全部内容 1⃣ 从下个月开始,Workspace 和 Google One AI Premium 的订阅用户将能够在 Gmail 应用内使用 Gemini 来为他们总结电子邮件 2⃣ 今年夏天,Google Photos 将推出自己的“询问照片”助手 3⃣ Google Lens 现在允许你通过录制视频来搜索内容。 4⃣ 谷歌又推出了一款新的 AI 模型:Gemini 1.5 Flash。它承诺将与 Pro 和谷歌的其他 Gemini 模型一样强大,但速度更快。 5⃣ 针对 OpenAI 的 Sora,Google推出了其新的生成式 AI 视频模型 Veo,,能够根据文本、图片和视频提示输出 1080p 视频 6⃣ 针对ChatGPT的GPTs,Google为Gemini推出了名为“Gems”的个性化选项,它允许用户创建具有不同个性的定制版 Gemini 助手。 7⃣ Google 将Gemini Nano AI 作为AI助手融入 Chrome 8⃣ 新推出的 Gemini Live 功能旨在使与 Gemini 的语音聊天更加自然 9⃣ 现在,Circle to Search 可以帮助解决数学问题了 1⃣0⃣ 安卓推出了 AI 驱动的诈骗检测功能 1⃣1⃣ 谷歌表示,Gemini 很快就能让用户对屏幕上的视频提问,并根据自动生成的字幕给出答案。对于付费的 Gemini Advanced 用户,它还可以处理 PDF 文件并提供信息。这些以及其他针对 Android 上 Gemini 的多模态更新将在接下来的几个月内推出。 1⃣2⃣ 谷歌升级了其 SynthID 人工智能水印技术,它将在其新的 Veo 视频生成器创建的内容中嵌入水印,并且现在也能检测出由 AI 生成的视频。 1⃣3⃣ Gemini将与日历、Tasks和 Keep 集成 1⃣4⃣ Gemini以在几秒钟内制定完整的度假行程 标签: #Google 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

超越 Bard,谷歌的下一个大型人工智能产品将于今年秋天推出

超越 Bard,谷歌的下一个大型人工智能产品将于今年秋天推出 据报道称,谷歌正在开发迄今为止最大的人工智能项目“Gemini”,该项目最早可能于今年秋天启动。Gemini是该公司的下一代人工智能基础模型,由一组大型机器学习模型组成。 谷歌希望通过 Gemini 超越主要专注于大型语言模型单一媒介的竞争。它可以将会话文本功能与人工智能图像生成相结合,使其适合更通用的用例。 因此,Gemini 不仅能够像 ChatGPT 一样生成文本,还能创建上下文图像,甚至有望超越这一点。未来,它可能被用来分析图表、创建带有文本描述的图形,以及用文本或语音命令控制软件。 谷歌可能会将 Gemini 集成到其产品和服务套件中,如 Bard、Google Docs 和 Slides。我们有望在今年年底前看到某种形式的 Gemini 开发者预览版本,不过该公司可能会更早地将其应用到一些消费产品中。比如开发者可以通过谷歌云平台以一定的费用访问 Gemini 。 为了实现这些目标并击败竞争对手,谷歌召集了 Google Brain 和 DeepMind 团队的几位成员一起开发Gemini。其中包括谷歌联合创始人谢尔盖•布林,据说他在评估和训练 Gemini 模型方面发挥了重要作用。 来源:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人