谷歌一雪前耻,全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化 - IT之家

None

相关推荐

封面图片

谷歌IO重磅发布:全新Bard紧逼ChatGPT,AI全家桶火线更新 #抽屉IT

封面图片

微软深夜放炸弹!GPT-4 Office 全家桶发布,10亿打工人被革命

微软深夜放炸弹!GPT-4 Office 全家桶发布,10亿打工人被革命 ============= 请 ‘tnt 生不逢时’,‘秒杀文心一言’的评论有序进场 Microsoft 365 Copilot

封面图片

谷歌不服输:大模型PaLM2剑指GPT-4,Bard会写20种代码,推出办公助手“Duet AI” #抽屉IT

封面图片

谷歌弃Bard发布超大杯Gemini 全面对标GPT-4

谷歌弃Bard发布超大杯Gemini 全面对标GPT-4 Gemini是品牌总称,相当于OpenAI的ChatGPT;Gemini Advanced付费服务,对应ChatGPT Plus;Gemini Ultra模型,对标的是GPT-4;切换到Gemini Advanced界面的操作也和ChatGPT类似,只需点击左上角的选项即可:在价格方面,Gemini Advanced的定价也是颇有意思19.99美元/月,比ChatGPT Plus(20美元/月)便宜了亿点点。不过Google也给出了一个小福利,订阅后的前两个月,免!费!!并且不会像GPT-4那样有每小时使用次数限制,可以放开了用。不仅如此,Google这次还顺带在Android手机里推出了Gemini的APP,特定的Android机长按电源键等按钮可以“直达”的那种:iOS用户也不用着急,Gemini将在未来几周会出现在Google App中,届时的打开方式会是这样的:毕竟Google此前发布Gemini Ultra这款大模型之际,便是一上来就在32个基准测试中拿下30个SOTA,并且第一个在MMLU基准上达到人类专家水平。现如今产品化的它终于上线,也是让众多网友纷涌而至,一时间也是出现了短暂的宕机。那么加持了Google自家最强大模型的Gemini Advanced,效果到底如何?我们在第一时间成功开通了试用。实测Gemini Advanced虽然Google声明目前只开放英语支持,但实测用中文提问,它不但能懂也能用中文回答。既然是Google出品,肯定少不了考验它的联网搜索能力。本来想试试能不能当吃瓜神器,结果因为Google严格的伦理道德限制,Gemini Advanced当场拒绝作答。那么退而求其次,问问纯事实不带价值判断的,它的表现就非常亮眼了。回答中,标绿色的语句展开就可以看到引用来源。标黄色的语句则表示没有找到明确引用来源,可以尝试进一步核实。AI在回答中生成的表格数据,也可以点击“Export to Sheets”一键导入到Google Docs进一步编辑处理,在工作场景可以说是非常实用了。接下来,还可以在“扩展程序”中打开对其他Google服务的支持,如地图、Gmail邮箱、YouTube视频。关联邮箱账号后,Gemini Adavanced就成变你的个人AI管家,可以帮你管理不少事情了,如找出可退订垃圾邮件。不过很可惜,扩展程序目前还不支持中文指令。用英语“find me youtube videos……”就可以触发搜索视频功能,辅助学习知识也是一把好手。除了联网搜索、集成应用,Google还特别强调了Gemini Advanced的推理能力。先来一道微软对GPT-4测试时的经典推理题,结果Gemini Advanced不仅成功作答,还考虑了额外的小概率情况。注意界面中的“Show drafts”按钮,代表Gemini Adavanced每次会生成三个“草稿”,并挑选其中最好的展示出来。三个草稿或使用不同的推理方式,或试用不同的写作风格,但答案无一例外都是正确的。如果实在不巧,遇到三个草稿都不满意的情况,也可以选择最右边的全部重来按钮。再注意答案最后面一排按钮,除了常规的点赞、点踩、分享之外,还有两个不常见的新功能。中间的滑块按钮代表“修改回答”,可以选择更短、更长、解释更简单、语气更轻松、语气更正式。尝试选择语气更轻松,整个回答就会变得更口语化。选择更正式,整个回答就像是在考场上答卷了。最后的GoogleG图标,代表使用搜索引擎核查AI生成的答案是否准确,结果同样也会用“绿色-有引用来源”,“黄色-无引用来源”的形式标出来。在更实用的场景中,要求生成一副科技主题春联,Gemini Adavanced也能满足“仄起平收”这个要求。生成代码也是小菜一碟,还“大义灭亲”,把自家广告也给隐藏了。一番体验之后,最后总结一下。Gemini Advanced在超大杯Gemini Ultra模型加持下,能力基本达到GPT-4同级别水平。设计上也更像一个成熟产品,而不是大模型的技术演示Demo了。与Google强大的互联网服务集成后,实用性上也有独到之处。另外在这次发布前,量子位也与GoogleGemini团队有过一次短暂的交流。团队表示这次发布更专注于把Gemini Ultra的语言能力释放到产品中,未来还会持续更新多模态能力、交互性更强的代码功能,以及上传文件分析数据等功能。与Google产品更深入集成,比如直接在Gmail里使用Gemini来回复邮件,目前还在“Coming soon”状态。不过我们要到一张示意图,敬请期待。另外在交流中,Google开发团队特别提醒了一点:由于产品刚刚从Bard改名为Gemini,AI偶尔会出现混乱,需要时间慢慢过渡。原来AI也像人类一样改名会不适应,也是让人哭笑不得了。都是20美元,你pick哪一个?就在这次Gemini Ultra刚刚有消息传出的时候,知名爆料账号Flowers from the future组织了一次投票。同样20美元,GPT-4和Gemini Ultra你会订阅哪个?最终2360人参与,有四成坚定的继续留在GPT-4,只有12.3%选择迁移到Gemini Ultra。不过这次投票是在真正发布之前几天了。在体验过之后,不知道又会有多少人因为产品的功能体验和服务集成“弃O投G”。而就在刚刚,沃顿商学院一位教授表示在他已经提前体验了Gemini Advanced长达6周的时间。他给出的一句评价是:Gemini Advanced显然处于GPT-4的水平,但并没有明显超过它。二者在使用过程中各有各的优势。例如在搜索能力方面,让它俩都去查看一下运动鞋的最新趋势,Gemini Advanced能够搜索YouTube,而ChatGPT使用的是Bing。这表明Gemini Advanced在搜索集成方面有所不同。这位教授还认为Gemini Advanced的界面比GPT-4更流畅,技术错误出现的也较少。它在“个性”上与GPT-4有所不同,更友好和愿意进行文字游戏。尽管两者在个性上有差异,但它们在处理复杂提示时表现出了兼容性。当然,这并非是教授在拿Gemini Advanced和ChatGPT直接做比较,而是借着二者探讨AI在未来可能发展的方向:Gemini Advanced与GPT-4相比的独特优势和劣势表明,模型仍有很大的改进空间,未来我们将继续看到快速的进步。AI的发展浪潮尚未达到顶峰,OpenAI的下一步可能是发布传闻中的GPT-4.5或GPT-5。如今距离ChatGPT发布已经过去14个月还要多,Google终于在模型-应用-生态上都准备好了与之竞争的对位产品。然鹅,老对手OpenAI却已悄然奔向下一个战场。根据The Information爆料,OpenAI正在开发新一代Agent应用,根据用户请求移动光标、点击、输入文本以及像人类一样使用各种APP。如将文档中的数据填写到电子表格中进行分析,或在会计软件中自动填写费用报告。换句话说,下一代ChatGPT将接管你的手机和电脑。参考链接:[1] ... PC版: 手机版:

封面图片

OpenAI 公司在中国申请注册 GPT-4 商标 - IT之家

封面图片

LLM排行榜更新:谷歌Bard超过GPT-4 中国玩家未进前十

LLM排行榜更新:谷歌Bard超过GPT-4 中国玩家未进前十 排行榜介绍这个LLMs 排行榜(Chatbot Arena基准平台)是由 UC伯克利研究人员主导的LMSYS (Large Model Systems Organization)组织发起的。通过在LLMs 间进行随机匿名的 1V1 battle 方式,并基于 Elo 评级系统得出排名。如下图所示,你可以随便问一个问题,左侧是模型A的回答,右侧是模型B的回答。然后你可以给这两个模型的回答打分,一共有四个选项“A更好;B更好;A和B一样好;A和B一样差”,如果一轮聊天判断不出来,你可以继续聊天,直到选出你认为更好的,但如果在聊天过程中暴露了大模型的身份,则投票将不被计算在内。下图显示了模型A在对战模型B时获胜几率(不包含平局 )的比例分布图:下图显示了每种模型组合的battle次数(无平局))下图显示了单个模型相对于所有其他模型的平均胜率:OpenAI霸榜,中国玩家未进前十下图是该榜单目前排名的 Top 10,可以看出GPT-系列模型还是占据绝对优势的(前四名中占据了其三),而 Anthropic旗下的 Claude 系列模型则是在前十中占据了三席。号称是欧洲版OpenAI的 Mistral公司,这次也有两个模型进入前十。另外请看上图最右侧一列,排名 Top 10的模型中,有9家都是闭源的私有模型,这说明开源模型还是有一段路要走。遗憾的是中国玩家的大语言模型没有进入前十。其中排名最高的是李开复创业公司零一万物旗下的 Yi-34B-Chat模型,位居13名。其次是阿里旗下的 通义千问 Qwen-14B-chat模型,排名36:再之后是清华教授唐杰创业公司智谱AI旗下的ChatGLM系列模型:需要说明三点:1、有很多中国大厂研发的模型可能没有参与到该榜单排名;2、该榜单是面向全球公众的,所以选择用英文来聊天的用户要远比中文多,这可能对中国玩家研发的大语言模型不利;3、该榜单仅仅统计了20w用户的随机提问和聊天,代表了用户和LLMs聊天的真实评价,但由于用户的提问和专业程度参差不齐,所以评价具有一定的主观性。最后我们说回Google,在裁员和科学家离职创业的内忧外患之际(详情请移步Google危机大爆发!科学家纷纷离职创业、员工裁员不断...),Google24年究竟能不能完成“帝国反击战”呢?让我们拭目以待吧! ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人