ℹ正面对决 GPT-4 的 Google Gemini AI 模型正式发表,将融入 Bard 与 Pixel 8 Pro 之中#

ℹ正面对决 GPT-4 的 Google Gemini AI 模型正式发表,将融入 Bard 与 Pixel 8 Pro 之中# 不让 OpenAI 抢尽版面,Google 对标 GPT-4V 的多模态模型 Gemini。不出则以,一出就直接推出 Ultra / Pr...

相关推荐

封面图片

谷歌弃Bard发布超大杯Gemini 全面对标GPT-4

谷歌弃Bard发布超大杯Gemini 全面对标GPT-4 Gemini是品牌总称,相当于OpenAI的ChatGPT;Gemini Advanced付费服务,对应ChatGPT Plus;Gemini Ultra模型,对标的是GPT-4;切换到Gemini Advanced界面的操作也和ChatGPT类似,只需点击左上角的选项即可:在价格方面,Gemini Advanced的定价也是颇有意思19.99美元/月,比ChatGPT Plus(20美元/月)便宜了亿点点。不过Google也给出了一个小福利,订阅后的前两个月,免!费!!并且不会像GPT-4那样有每小时使用次数限制,可以放开了用。不仅如此,Google这次还顺带在Android手机里推出了Gemini的APP,特定的Android机长按电源键等按钮可以“直达”的那种:iOS用户也不用着急,Gemini将在未来几周会出现在Google App中,届时的打开方式会是这样的:毕竟Google此前发布Gemini Ultra这款大模型之际,便是一上来就在32个基准测试中拿下30个SOTA,并且第一个在MMLU基准上达到人类专家水平。现如今产品化的它终于上线,也是让众多网友纷涌而至,一时间也是出现了短暂的宕机。那么加持了Google自家最强大模型的Gemini Advanced,效果到底如何?我们在第一时间成功开通了试用。实测Gemini Advanced虽然Google声明目前只开放英语支持,但实测用中文提问,它不但能懂也能用中文回答。既然是Google出品,肯定少不了考验它的联网搜索能力。本来想试试能不能当吃瓜神器,结果因为Google严格的伦理道德限制,Gemini Advanced当场拒绝作答。那么退而求其次,问问纯事实不带价值判断的,它的表现就非常亮眼了。回答中,标绿色的语句展开就可以看到引用来源。标黄色的语句则表示没有找到明确引用来源,可以尝试进一步核实。AI在回答中生成的表格数据,也可以点击“Export to Sheets”一键导入到Google Docs进一步编辑处理,在工作场景可以说是非常实用了。接下来,还可以在“扩展程序”中打开对其他Google服务的支持,如地图、Gmail邮箱、YouTube视频。关联邮箱账号后,Gemini Adavanced就成变你的个人AI管家,可以帮你管理不少事情了,如找出可退订垃圾邮件。不过很可惜,扩展程序目前还不支持中文指令。用英语“find me youtube videos……”就可以触发搜索视频功能,辅助学习知识也是一把好手。除了联网搜索、集成应用,Google还特别强调了Gemini Advanced的推理能力。先来一道微软对GPT-4测试时的经典推理题,结果Gemini Advanced不仅成功作答,还考虑了额外的小概率情况。注意界面中的“Show drafts”按钮,代表Gemini Adavanced每次会生成三个“草稿”,并挑选其中最好的展示出来。三个草稿或使用不同的推理方式,或试用不同的写作风格,但答案无一例外都是正确的。如果实在不巧,遇到三个草稿都不满意的情况,也可以选择最右边的全部重来按钮。再注意答案最后面一排按钮,除了常规的点赞、点踩、分享之外,还有两个不常见的新功能。中间的滑块按钮代表“修改回答”,可以选择更短、更长、解释更简单、语气更轻松、语气更正式。尝试选择语气更轻松,整个回答就会变得更口语化。选择更正式,整个回答就像是在考场上答卷了。最后的GoogleG图标,代表使用搜索引擎核查AI生成的答案是否准确,结果同样也会用“绿色-有引用来源”,“黄色-无引用来源”的形式标出来。在更实用的场景中,要求生成一副科技主题春联,Gemini Adavanced也能满足“仄起平收”这个要求。生成代码也是小菜一碟,还“大义灭亲”,把自家广告也给隐藏了。一番体验之后,最后总结一下。Gemini Advanced在超大杯Gemini Ultra模型加持下,能力基本达到GPT-4同级别水平。设计上也更像一个成熟产品,而不是大模型的技术演示Demo了。与Google强大的互联网服务集成后,实用性上也有独到之处。另外在这次发布前,量子位也与GoogleGemini团队有过一次短暂的交流。团队表示这次发布更专注于把Gemini Ultra的语言能力释放到产品中,未来还会持续更新多模态能力、交互性更强的代码功能,以及上传文件分析数据等功能。与Google产品更深入集成,比如直接在Gmail里使用Gemini来回复邮件,目前还在“Coming soon”状态。不过我们要到一张示意图,敬请期待。另外在交流中,Google开发团队特别提醒了一点:由于产品刚刚从Bard改名为Gemini,AI偶尔会出现混乱,需要时间慢慢过渡。原来AI也像人类一样改名会不适应,也是让人哭笑不得了。都是20美元,你pick哪一个?就在这次Gemini Ultra刚刚有消息传出的时候,知名爆料账号Flowers from the future组织了一次投票。同样20美元,GPT-4和Gemini Ultra你会订阅哪个?最终2360人参与,有四成坚定的继续留在GPT-4,只有12.3%选择迁移到Gemini Ultra。不过这次投票是在真正发布之前几天了。在体验过之后,不知道又会有多少人因为产品的功能体验和服务集成“弃O投G”。而就在刚刚,沃顿商学院一位教授表示在他已经提前体验了Gemini Advanced长达6周的时间。他给出的一句评价是:Gemini Advanced显然处于GPT-4的水平,但并没有明显超过它。二者在使用过程中各有各的优势。例如在搜索能力方面,让它俩都去查看一下运动鞋的最新趋势,Gemini Advanced能够搜索YouTube,而ChatGPT使用的是Bing。这表明Gemini Advanced在搜索集成方面有所不同。这位教授还认为Gemini Advanced的界面比GPT-4更流畅,技术错误出现的也较少。它在“个性”上与GPT-4有所不同,更友好和愿意进行文字游戏。尽管两者在个性上有差异,但它们在处理复杂提示时表现出了兼容性。当然,这并非是教授在拿Gemini Advanced和ChatGPT直接做比较,而是借着二者探讨AI在未来可能发展的方向:Gemini Advanced与GPT-4相比的独特优势和劣势表明,模型仍有很大的改进空间,未来我们将继续看到快速的进步。AI的发展浪潮尚未达到顶峰,OpenAI的下一步可能是发布传闻中的GPT-4.5或GPT-5。如今距离ChatGPT发布已经过去14个月还要多,Google终于在模型-应用-生态上都准备好了与之竞争的对位产品。然鹅,老对手OpenAI却已悄然奔向下一个战场。根据The Information爆料,OpenAI正在开发新一代Agent应用,根据用户请求移动光标、点击、输入文本以及像人类一样使用各种APP。如将文档中的数据填写到电子表格中进行分析,或在会计软件中自动填写费用报告。换句话说,下一代ChatGPT将接管你的手机和电脑。参考链接:[1] ... PC版: 手机版:

封面图片

Google Gemini模型已上线Poe

Google Gemini模型已上线Poe Google Gemini模型现已上线Poe,支持上传图片,官方介绍:这是谷歌Gemini家族的多模态模型的Beta版本,该模型在模型性能和速度之间实现了平衡。该模型展现了优秀的通用能力,尤其擅长跨模态推理,并支持最大32k个tokens的上下文窗口。 via 匿名 标签: #Google #Gemini #Poe 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

Bard现已在全球范围内采用Gemini Pro模型

Bard现已在全球范围内采用Gemini Pro模型 12 月,Google推出了新的生成式人工智能模型,包括旗舰版 Gemini Ultra、"精简版"Gemini Pro和专为在 Pixel 8 等设备上运行而设计的 Gemini Nano。与此同时,该公司还更新了 Bard 与 Gemini Pro 的英语对话。Google没有量化这些改进,但表示聊天机器人在理解和总结内容、推理、头脑风暴、写作和计划方面会有更好的表现。Bard 在后台经历了几次迭代。最初在 2023 年 2 月亮相时,它采用的是 LaMDA(对话应用语言模型);今年晚些时候,它又更新了一个新模型,称为 PaLM 2;现在,由 Gemini Pro 支持的 Bard 将在 230 多个国家推出,这些名称和版本令人困惑。今年 9 月,Google推出了"双重检查"功能,利用Google搜索来评估其返回的结果是否与 Bard 生成的结果相似。当时,该功能只有英文版。现在,Google正在扩展对 40 多种语言的支持。此外,这家搜索巨头还通过 12 月份发布的 Imagen 2 模型引入了图像生成支持。目前,该功能仅支持英语。用户可以在聊天机器人界面上输入类似"创建一辆未来派汽车的图像"这样的查询。通过 Bard 图像生成的图像示例Google公司表示,Bard生成的图片将在像素中嵌入由DeepMind开发的SynthID数字水印。不过,你必须使用Google的工具来识别这些图像。今年 10 月,Google为Google Assistant注入了 Bard 的人工智能功能,这样用户就可以做一些事情,比如计划旅行或制定杂货清单。11 月,Google向青少年开放了英文版的 Bard,并对其进行了限制,防止 Bard 生成不安全的内容,如非法或有年龄限制的物质。 ... PC版: 手机版:

封面图片

Google宣布Bard正式改名Gemini,并且上线了被Ultra 1.0 model驱动的Gemini Advanced。这

Google宣布Bard正式改名Gemini,并且上线了被Ultra 1.0 model驱动的Gemini Advanced。这个 model就是他们去年年底声称可以跟GPT4打个平手但当时没有立即公开的那个模型。Gemini Advanced收费也完全对标GPT plus,每月20刀。一些初步的第三方测评看起来说明Google没有吹牛,确实基本是GPT4水准,但也没有明显超越GPT4。 #抽屉IT

封面图片

Google Pixel 9 将集成 Gemini AI

Google Pixel 9 将集成 Gemini AI Google 预计将在 8 月 13 日举行的活动上宣布其下一代旗舰手机 Pixel 9,搜索巨人通过其官方 X 账号发布了预告片,声称新手机是为 Gemini 时代打造的。Gemini 是 Google 的 AI 大模型,有多个不同规模的版本,Pro 是较小规模的版本,Ultra 是其最大规模的版本。Google 将于 8 月 13 日举行 Made by Google 发布会,预计会发布四款 Pixel 9,其中 Pixel 9 和 Pixel 9 Pro 都是 6.1 英寸,Pixel 9 Pro XL 有着更大的屏幕,Pixel 9 Pro Fold 则是折叠手机 Pixel Fold 的下一代版本。这些手机预计会集成不同规模的 Gemini 模型。 via Solidot

封面图片

AI“明星”选手巅峰对决 实测最新谷歌Gemini与GPT-4o

AI“明星”选手巅峰对决 实测最新谷歌Gemini与GPT-4o 访问:NordVPN 立减 75% + 外加 3 个月时长 另有NordPass密码管理器 紧随其后一天,年度Google I/O开发者大会如期而至,GoogleCEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新,全面反击OpenAI,其中就有由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo等。本周AI战场暂告一段落,《科创板日报》记者对AI界的“明星”选手GoogleGemini 1.5 Pro(100万tokens)、OpenAI最新升级的GPT-4o与此前发布的GPT-4进行了一场能力评测。文本测试:GoogleGemini 1.5 Pro正确率和速度完胜GPT-4o和GPT-4OpenAI发布GPT-4已过去一年多,据介绍,此次推出新旗舰模型GPT-4o的推理能力有明显的提升,速度快了,价格也下降了。GoogleGemini系列以其标志性的超大上下文窗口出名,此前已拥有Ultra、Pro和Nano三种规格,各适配不同规模与需求的应用场景。本次发布会宣布,迭代后的Gemini 1.5 Pro 的上下文长度从原有的100万tokens(语句单位)提升到了200万tokens。这一改进显著增强了模型的数据处理能力,使其在处理更加复杂和庞大的数据集时更加游刃有余。两家公司都对自己的大模型的升级换代展现出自信姿态,但情况还需要实际验证。第一题是“事实回答题”,只有GoogleGemini 1.5 Pro模型回答正确,它能辨别出“螺丝钉并不是一种食品”这一事实。Gemini 1.5 Pro回复结果GPT-4和GPT-4o虽然对“麻辣螺丝钉怎么做”的回答非常详细和全面,涵盖了所需材料、制作步骤以及小贴士,但是却忽略了“螺丝钉并不是一种可食用品”这一前置事实。GPT-4、GPT-4o回复结果第二题是“逻辑计算题”,GPT-4和GPT-4o均回答错误,Google模型给出正确答案,并且显示了具体作答时间,不到10秒的时间里便给出了答案和解析,表现可谓“又快又好”。Gemini 1.5 Pro回复结果不同模型在处理逻辑问题时所采取的思考策略有所差别。与Gemini 1.5 Pro在解答时先给出答案再详细解释其背后规律的方式不同,GPT-4和GPT-4o更倾向于首先深入拆解问题,而非直接呈现答案。然而,这种对问题的细致分析和拆解过程也导致了后两者在回答时所需的时间相对较长。GPT-4、GPT-4o回复结果第三题是“生物题”,GPT-4回答错误,GPT-4o和GoogleGemini 1.5 Pro回答正确,用时分别为14.83秒和11.2秒,Gemini 1.5 Pro略胜一筹。Gemini 1.5 Pro回复结果第四题是“伦理道德题”,三个大模型的回答都正确,并且都能识别出是经典的伦理困境“电车难题”。GPT-4和 Gemini 1.5 Pro强调了伦理困境的复杂性,并没有给出直接的选择,GPT-4o则根据“最大限度减少伤亡”的原则进行分析并给出选择。三大模型回复结果《科创板日报》记者总结文本测试结果发现,Google100万级参数的Gemini 1.5 Pro模型凭借四次全部正确的表现,实力杠杆,GPT-4o答对了两次,而GPT-4模型的表现则不尽人意,仅答对了一次。由于目前200万级参数的Gemini 1.5 Pro模型尚未开放,《科创板日报》记者申请了内测,等待通过后再做进一步测试分享。多模态测试:GPT-4o在细节和分析能力上更胜一筹GPT-4o是OpenAI对其广受欢迎的大型多模态模型GPT-4的第三次重大迭代,它通过视觉功能扩展了GPT-4的能力,新发布的模型能够以一种集成且无缝的方式与用户进行对话、视觉识别和互动。Gemini 1.5 Pro也拥有多模态功能,适合处理摘要、聊天、图片分析和视频字幕、以及从长文本和表格中提取数据等。记者用“公园照片”询问三个大模型在测试中,记者用一张“公园照片”来询问三个大模型。根据图片测试反馈,三个大模型都准确地描述了公园照片的内容,但侧重点略有不同。GPT-4o胜在信息完整性,详细列举了船只类型、湖面状态等各种细节,但略显冗长。Gemini 1.5 Pro语言简洁流畅,用“悠闲地泛舟”、“景色宜人”等词语描绘出画面美感,但细节不如GPT-4o丰富。GPT-4描述简洁,但细节不够丰富。简而言之,如果看重信息的全面性,GPT-4o最强;若更注重语言表达,则Gemini 1.5 Pro表现略佳。由于目前GPT-4尚未具备音频和视频内容的解析能力,所以不做相关测评。OpenAI联合创始人Sam Altman表示,新款语音模型GPT-4o尚未发货,已经发货只是文字版GPT-4o。等到语音版一发货,记者将第一时间带来评测。根据视频测试反馈,GPT-4o在解析视频内容时表现出了强大的多模态处理能力。它能够提取和分析视频帧,并通过图形界面直观地展示给用户。在分析过程中,模型准确地识别出了视频中的四足机器人,并对其外观、所处的环境以及所进行的活动进行了详细的描述。GPT-4o视频测试回复相比之下,Gemini 1.5 Pro的回复则显得简略又单调,在记者第二次追问下,才充实了更多细节。总体来看,如果目标是获取最全面、深入的多模态内容理解,GPT-4o是当前的最佳选择,而Gemini 1.5 Pro则更适合那些重视表述质量与效率的多模态应用场景。不过,GPT-4o和Gemini 1.5 Pro都没有提及对视频里的声音的分析,这是两个多模态大模型解析中的一个共同缺失。前华为“天才少年”预测国内第一个端到端多模态大模型年底将到来AI比赛行至白热化阶段已经告别单纯的技术竞争,转向应用和用户体验的竞争。在搜索引擎和办公领域,Google也将进一步将AI引入其中。记者发现,能够总结Google搜索引擎结果的“AI概览”(AI Overviews)功能已能够使用。百度创始人、董事长兼首席执行官李彦宏昨晚在财报电话会上表示,目前百度搜索上有11%的搜索结果由AI生成。他指出,百度搜索的AI重构工作仍处于早期阶段,整体来看,搜索最有可能成为AI时代的杀手级应用。OpenAI与Google都不约而同地盯上了能自然交互的智能助理,这种智能助理是一个端到端的统一多模态大模型,将推动AI应用的革命性变化。前华为“天才少年”、Logenic Al 联合创始人李博杰认为,国内第一个多模端到端多模态,很有可能今年年底就能差不多能出来了。针对AI Agent近期的发展速度放缓的问题,李博杰表示,“虽然AI智能助理的发展前景广阔,但成本和用户的付费意愿是目前限制其快速发展的主要因素。GPT-4o它比GPT-4快4倍,并将成本降低了一倍,但是对于普通消费者来说可能仍然较贵。”李博杰称,从长期来看,实用性强的智能助理因其解决现实问题的能力而具有更高的价值。而短期内,情感陪伴和娱乐功能的智能助理更容易商业化,因为它们对可靠性的要求较低,开发和部署相对容易。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人