摸底谷歌Gemini：CMU全面测评，Gemini Pro不敌GPT 3.5 Turbo #抽屉IT

BAI Chat基于GPT3.5 API构建，版本为gpt-3.5-turbo

BAI Chat 基于GPT3.5 API构建，版本为gpt-3.5-turbo 尚未遇到任何限制，直接输入即可进行对话点击体验 @littleb_gptBOT 频道 @WidgetChannel 投稿 @WidgetPlusBot

谷歌弃Bard发布超大杯Gemini 全面对标GPT-4

谷歌弃Bard发布超大杯Gemini 全面对标GPT-4 Gemini是品牌总称，相当于OpenAI的ChatGPT；Gemini Advanced付费服务，对应ChatGPT Plus；Gemini Ultra模型，对标的是GPT-4；切换到Gemini Advanced界面的操作也和ChatGPT类似，只需点击左上角的选项即可：在价格方面，Gemini Advanced的定价也是颇有意思19.99美元/月，比ChatGPT Plus（20美元/月）便宜了亿点点。不过Google也给出了一个小福利，订阅后的前两个月，免！费！！并且不会像GPT-4那样有每小时使用次数限制，可以放开了用。不仅如此，Google这次还顺带在Android手机里推出了Gemini的APP，特定的Android机长按电源键等按钮可以“直达”的那种：iOS用户也不用着急，Gemini将在未来几周会出现在Google App中，届时的打开方式会是这样的：毕竟Google此前发布Gemini Ultra这款大模型之际，便是一上来就在32个基准测试中拿下30个SOTA，并且第一个在MMLU基准上达到人类专家水平。现如今产品化的它终于上线，也是让众多网友纷涌而至，一时间也是出现了短暂的宕机。那么加持了Google自家最强大模型的Gemini Advanced，效果到底如何？我们在第一时间成功开通了试用。实测Gemini Advanced虽然Google声明目前只开放英语支持，但实测用中文提问，它不但能懂也能用中文回答。既然是Google出品，肯定少不了考验它的联网搜索能力。本来想试试能不能当吃瓜神器，结果因为Google严格的伦理道德限制，Gemini Advanced当场拒绝作答。那么退而求其次，问问纯事实不带价值判断的，它的表现就非常亮眼了。回答中，标绿色的语句展开就可以看到引用来源。标黄色的语句则表示没有找到明确引用来源，可以尝试进一步核实。AI在回答中生成的表格数据，也可以点击“Export to Sheets”一键导入到Google Docs进一步编辑处理，在工作场景可以说是非常实用了。接下来，还可以在“扩展程序”中打开对其他Google服务的支持，如地图、Gmail邮箱、YouTube视频。关联邮箱账号后，Gemini Adavanced就成变你的个人AI管家，可以帮你管理不少事情了，如找出可退订垃圾邮件。不过很可惜，扩展程序目前还不支持中文指令。用英语“find me youtube videos……”就可以触发搜索视频功能，辅助学习知识也是一把好手。除了联网搜索、集成应用，Google还特别强调了Gemini Advanced的推理能力。先来一道微软对GPT-4测试时的经典推理题，结果Gemini Advanced不仅成功作答，还考虑了额外的小概率情况。注意界面中的“Show drafts”按钮，代表Gemini Adavanced每次会生成三个“草稿”，并挑选其中最好的展示出来。三个草稿或使用不同的推理方式，或试用不同的写作风格，但答案无一例外都是正确的。如果实在不巧，遇到三个草稿都不满意的情况，也可以选择最右边的全部重来按钮。再注意答案最后面一排按钮，除了常规的点赞、点踩、分享之外，还有两个不常见的新功能。中间的滑块按钮代表“修改回答”，可以选择更短、更长、解释更简单、语气更轻松、语气更正式。尝试选择语气更轻松，整个回答就会变得更口语化。选择更正式，整个回答就像是在考场上答卷了。最后的GoogleG图标，代表使用搜索引擎核查AI生成的答案是否准确，结果同样也会用“绿色-有引用来源”，“黄色-无引用来源”的形式标出来。在更实用的场景中，要求生成一副科技主题春联，Gemini Adavanced也能满足“仄起平收”这个要求。生成代码也是小菜一碟，还“大义灭亲”，把自家广告也给隐藏了。一番体验之后，最后总结一下。Gemini Advanced在超大杯Gemini Ultra模型加持下，能力基本达到GPT-4同级别水平。设计上也更像一个成熟产品，而不是大模型的技术演示Demo了。与Google强大的互联网服务集成后，实用性上也有独到之处。另外在这次发布前，量子位也与GoogleGemini团队有过一次短暂的交流。团队表示这次发布更专注于把Gemini Ultra的语言能力释放到产品中，未来还会持续更新多模态能力、交互性更强的代码功能，以及上传文件分析数据等功能。与Google产品更深入集成，比如直接在Gmail里使用Gemini来回复邮件，目前还在“Coming soon”状态。不过我们要到一张示意图，敬请期待。另外在交流中，Google开发团队特别提醒了一点：由于产品刚刚从Bard改名为Gemini，AI偶尔会出现混乱，需要时间慢慢过渡。原来AI也像人类一样改名会不适应，也是让人哭笑不得了。都是20美元，你pick哪一个？就在这次Gemini Ultra刚刚有消息传出的时候，知名爆料账号Flowers from the future组织了一次投票。同样20美元，GPT-4和Gemini Ultra你会订阅哪个？最终2360人参与，有四成坚定的继续留在GPT-4，只有12.3%选择迁移到Gemini Ultra。不过这次投票是在真正发布之前几天了。在体验过之后，不知道又会有多少人因为产品的功能体验和服务集成“弃O投G”。而就在刚刚，沃顿商学院一位教授表示在他已经提前体验了Gemini Advanced长达6周的时间。他给出的一句评价是：Gemini Advanced显然处于GPT-4的水平，但并没有明显超过它。二者在使用过程中各有各的优势。例如在搜索能力方面，让它俩都去查看一下运动鞋的最新趋势，Gemini Advanced能够搜索YouTube，而ChatGPT使用的是Bing。这表明Gemini Advanced在搜索集成方面有所不同。这位教授还认为Gemini Advanced的界面比GPT-4更流畅，技术错误出现的也较少。它在“个性”上与GPT-4有所不同，更友好和愿意进行文字游戏。尽管两者在个性上有差异，但它们在处理复杂提示时表现出了兼容性。当然，这并非是教授在拿Gemini Advanced和ChatGPT直接做比较，而是借着二者探讨AI在未来可能发展的方向：Gemini Advanced与GPT-4相比的独特优势和劣势表明，模型仍有很大的改进空间，未来我们将继续看到快速的进步。AI的发展浪潮尚未达到顶峰，OpenAI的下一步可能是发布传闻中的GPT-4.5或GPT-5。如今距离ChatGPT发布已经过去14个月还要多，Google终于在模型-应用-生态上都准备好了与之竞争的对位产品。然鹅，老对手OpenAI却已悄然奔向下一个战场。根据The Information爆料，OpenAI正在开发新一代Agent应用，根据用户请求移动光标、点击、输入文本以及像人类一样使用各种APP。如将文档中的数据填写到电子表格中进行分析，或在会计软件中自动填写费用报告。换句话说，下一代ChatGPT将接管你的手机和电脑。参考链接：[1] ... PC版：手机版：

OpenAI宣布GPT-3.5 Turbo降价还治好了GPT-4 Turbo的＂懒病＂

OpenAI宣布GPT-3.5 Turbo降价还治好了GPT-4 Turbo的＂懒病＂ OpenAI这次更新中，特别提到了它们的GPT-4Turbo和GPT-3.5 Turbo两大模型。它们都是大型多模式模型，可以理解和生成自然语言或代码。在新版本中，它们迎来了诸多增强功能，包括更精准的指令跟随、支持JSON模式、更多可复现的输出，以及并行函数调用的优化。此外，该公司还推出了全新的16k版本GPT-3.5 Turbo，这一版本在处理超长输入和输出时，相比标准的4k版本展现出了更为出色的性能。对于众多用户而言，GPT-3.5 Turbo并不陌生。作为大多数人通过ChatGPT进行互动的背后支持模型，它几乎已经成为了行业内的金标准。面对其他聊天机器人，如果用户发现其回答质量不及ChatGPT，那么继续使用后者无疑成为了最佳选择。在API领域，GPT-3.5 Turbo同样表现不俗。在执行各类任务时，它不仅能够提供比GPT-4更低的成本，还能保证更快的执行速度。因此，对于那些付费用户来说，此次输入价格下调50%、输出价格下调25%无疑是一大利好。具体来说，新的输入价格定格在每千个代币0.0005美元，而输出价格则为每千个代币0.0015美元。在处理文本密集型应用（如整篇论文或书籍的分析）时，这些代币的累积费用往往相当可观。而且随着开源大模型开始发力，OpenAI需要确保其客户不会离开。因此，这一价格调整无疑将为用户带来真正的实惠。当然，这也是模型精简和基础设施改进的结果。在GPT-3.5 Turbo上，OpenAI还悄然推出了代号为GPT-3.5 Turbo 0125的新模型版本。虽然该公司并未大肆宣扬，但这一版本显然包含了一系列“各种改进”。不过，相较于最新版本GPT-3.5 Turbo 0613，这一更新似乎并未带来公司认为值得特别提及的重大突破。在GPT-4 Turbo上，OpenAI同样有所动作。一个新的API使用预览模型GPT-4 Turbo 0125应运而生。这个模型成功解决了GPT-4 Turbo过去存在的一个老问题，即模型在面对某些任务时可能出现的“懒惰”情况。此外，GPT-4 Turbo 0125在代码生成等任务方面的表现也较之前的预览模型有了显著提升。目前，GPT-4 Turbo 0125仍处于预览模式阶段。不过，具有视觉效果的GPT-4 Turbo（即GPT-4 V）有望在“未来几个月内”与广大用户正式见面。在嵌入模型方面，OpenAI同样带来了令人振奋的消息。该公司推出了全新的text-embeddings-3-small和text-embeddings-3-large模型，它们相较于上一代的text-embeddings-ada-002展现出了更为强大的性能和更为亲民的价格。这些新模型能够创建多达3072维度的嵌入空间，从而捕获更多的语义信息并提高下游任务的准确性。在性能测试中，新模型将多语言检索（MIRACL）常用基准的平均分数从31.4%提升至54.9%，而在英语任务（MTEB）常用基准上的平均分数也从61.0%提升至64.6%。更值得一提的是，与text-embeddings-ada-002相比，text-embeddings-3-small的价格降到1/5，这无疑为开发人员带来了更为经济实惠的选择。此外，OpenAI还发布了一个全新版本的免费文本审核API。这一API能够检测文本是否包含敏感或不安全的内容，并且新版本还扩展了支持的语言和领域范围，同时为其预测提供了更为详尽的解释。 ... PC版：手机版：

近日，OpenAI 宣布 GPT-3.5-turbo、GPT-4 以及 GPT-4-turbo-preview 等均指向最新模型

近日，OpenAI 宣布 GPT-3.5-turbo、GPT-4 以及 GPT-4-turbo-preview 等均指向最新模型版本，训练数据至 2023 年 12 月。 via 匿名标签: #OpenAI 频道: @GodlyNews1 投稿: @GodlyNewsBot

优等生归来，谷歌最强大模型Gemini能否打败GPT4？ #抽屉IT

OpenAI发布新嵌入模型，降低GPT-3.5 Turbo价格 |

OpenAI发布新嵌入模型，降低GPT-3.5 Turbo价格 | OpenAI发布了新的嵌入模型和API更新，包括两个新的嵌入模型、更新的GPT-4 Turbo预览模型、更新的GPT-3.5 Turbo模型和更新的文本审核模型。新的嵌入模型包括一个小型高效的text-embedding-3-small模型和一个大型高性能的text-embedding-3-large模型，允许开发者在使用嵌入时权衡性能和成本，特别是可以通过减少嵌入的维数(即从序列的末尾移除一些数字)来实现。这些模型能够创建最多3072维的嵌入。 OpenAI表示，发送到OpenAI API的数据默认不会被用来训练或改进OpenAI模型。