这个有意思，Gemini Pro 新模型在遇到输入或者输出服务中包含“Open AI”或者“GPT”时会终止响应并且回一个"OT

这个有意思，Gemini Pro 新模型在遇到输入或者输出服务中包含“Open AI”或者“GPT”时会终止响应并且回一个"OTHER"错误。在使用Gemini Pro开发产品的时候需要注意一下这个问题。这个太傻逼了，除了幻觉之外还得应付这玩意，可以用这个特性来攻击使用Gemini Pro的产品。 -内容概述- 在测试谷歌云平台（GCP）的新模型Gemini Pro时，作者遇到了一个前所未见的行为：模型拒绝返回任何包含字符串"OpenAI"或"GPT"的文本。由于OpenAI的GPT产品在全球AI新闻报道中非常普遍，Gemini Pro似乎将它们视为禁止术语。这意味着，无论是在输入提示中还是在返回的内容中，只要出现了"OpenAI"或"GPT"字符串，Gemini Pro就会中止其响应并返回一个"OTHER"错误。与GCP的旧模型（Bison或Unicorn）不同，这种行为是Gemini Pro独有的。文章还提到，其他一些术语，如Baidu、Ernie和Microsoft也被视为禁止术语，而Anthropic、Claude、Cohere、Falcon、LLaMA和Vicuna等其他术语则没有问题。文章质疑为什么只有GCP的最新模型Gemini Pro受到这种奇怪的秘密禁止提及某些公司和模型的影响，而其旧模型Bison和Unicorn则不受影响。任何基于Gemini Pro构建的管道，如果在输入提示中或在尝试生成提及这些隐藏禁止术语的输出时遇到这些术语，都会在没有任何提示的情况下静默失败。随着LLM供应商从供消费者玩耍的闪亮玩具转向真正的企业部署，他们必须更全面地记录他们的防护措施，并确保隐藏的防护措施不会对企业应用程序造成意外挑战，例如通过这种隐藏的禁止但普遍存在的术语。来源：

在Telegram中查看

相关推荐

Poe 新增GPT-4o, Gemini 1.5 Flash,Gemini 1.5 Pro等模型

Poe 新增GPT-4o, Gemini 1.5 Flash,Gemini 1.5 Pro等模型标签: #OpenAI #Poe #Gemini 频道: @GodlyNews1 投稿: @GodlyNewsBot

AI“明星”选手巅峰对决实测最新谷歌Gemini与GPT-4o

AI“明星”选手巅峰对决实测最新谷歌Gemini与GPT-4o 访问：NordVPN 立减 75% + 外加 3 个月时长另有NordPass密码管理器紧随其后一天，年度Google I/O开发者大会如期而至，GoogleCEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新，全面反击OpenAI，其中就有由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo等。本周AI战场暂告一段落，《科创板日报》记者对AI界的“明星”选手GoogleGemini 1.5 Pro（100万tokens）、OpenAI最新升级的GPT-4o与此前发布的GPT-4进行了一场能力评测。文本测试：GoogleGemini 1.5 Pro正确率和速度完胜GPT-4o和GPT-4OpenAI发布GPT-4已过去一年多，据介绍，此次推出新旗舰模型GPT-4o的推理能力有明显的提升，速度快了，价格也下降了。GoogleGemini系列以其标志性的超大上下文窗口出名，此前已拥有Ultra、Pro和Nano三种规格，各适配不同规模与需求的应用场景。本次发布会宣布，迭代后的Gemini 1.5 Pro 的上下文长度从原有的100万tokens（语句单位）提升到了200万tokens。这一改进显著增强了模型的数据处理能力，使其在处理更加复杂和庞大的数据集时更加游刃有余。两家公司都对自己的大模型的升级换代展现出自信姿态，但情况还需要实际验证。第一题是“事实回答题”，只有GoogleGemini 1.5 Pro模型回答正确，它能辨别出“螺丝钉并不是一种食品”这一事实。Gemini 1.5 Pro回复结果GPT-4和GPT-4o虽然对“麻辣螺丝钉怎么做”的回答非常详细和全面，涵盖了所需材料、制作步骤以及小贴士，但是却忽略了“螺丝钉并不是一种可食用品”这一前置事实。GPT-4、GPT-4o回复结果第二题是“逻辑计算题”，GPT-4和GPT-4o均回答错误，Google模型给出正确答案，并且显示了具体作答时间，不到10秒的时间里便给出了答案和解析，表现可谓“又快又好”。Gemini 1.5 Pro回复结果不同模型在处理逻辑问题时所采取的思考策略有所差别。与Gemini 1.5 Pro在解答时先给出答案再详细解释其背后规律的方式不同，GPT-4和GPT-4o更倾向于首先深入拆解问题，而非直接呈现答案。然而，这种对问题的细致分析和拆解过程也导致了后两者在回答时所需的时间相对较长。GPT-4、GPT-4o回复结果第三题是“生物题”，GPT-4回答错误，GPT-4o和GoogleGemini 1.5 Pro回答正确，用时分别为14.83秒和11.2秒，Gemini 1.5 Pro略胜一筹。Gemini 1.5 Pro回复结果第四题是“伦理道德题”，三个大模型的回答都正确，并且都能识别出是经典的伦理困境“电车难题”。GPT-4和 Gemini 1.5 Pro强调了伦理困境的复杂性，并没有给出直接的选择，GPT-4o则根据“最大限度减少伤亡”的原则进行分析并给出选择。三大模型回复结果《科创板日报》记者总结文本测试结果发现，Google100万级参数的Gemini 1.5 Pro模型凭借四次全部正确的表现，实力杠杆，GPT-4o答对了两次，而GPT-4模型的表现则不尽人意，仅答对了一次。由于目前200万级参数的Gemini 1.5 Pro模型尚未开放，《科创板日报》记者申请了内测，等待通过后再做进一步测试分享。多模态测试：GPT-4o在细节和分析能力上更胜一筹GPT-4o是OpenAI对其广受欢迎的大型多模态模型GPT-4的第三次重大迭代，它通过视觉功能扩展了GPT-4的能力，新发布的模型能够以一种集成且无缝的方式与用户进行对话、视觉识别和互动。Gemini 1.5 Pro也拥有多模态功能，适合处理摘要、聊天、图片分析和视频字幕、以及从长文本和表格中提取数据等。记者用“公园照片”询问三个大模型在测试中，记者用一张“公园照片”来询问三个大模型。根据图片测试反馈，三个大模型都准确地描述了公园照片的内容，但侧重点略有不同。GPT-4o胜在信息完整性，详细列举了船只类型、湖面状态等各种细节，但略显冗长。Gemini 1.5 Pro语言简洁流畅，用“悠闲地泛舟”、“景色宜人”等词语描绘出画面美感，但细节不如GPT-4o丰富。GPT-4描述简洁，但细节不够丰富。简而言之，如果看重信息的全面性，GPT-4o最强；若更注重语言表达，则Gemini 1.5 Pro表现略佳。由于目前GPT-4尚未具备音频和视频内容的解析能力，所以不做相关测评。OpenAI联合创始人Sam Altman表示，新款语音模型GPT-4o尚未发货，已经发货只是文字版GPT-4o。等到语音版一发货，记者将第一时间带来评测。根据视频测试反馈，GPT-4o在解析视频内容时表现出了强大的多模态处理能力。它能够提取和分析视频帧，并通过图形界面直观地展示给用户。在分析过程中，模型准确地识别出了视频中的四足机器人，并对其外观、所处的环境以及所进行的活动进行了详细的描述。GPT-4o视频测试回复相比之下，Gemini 1.5 Pro的回复则显得简略又单调，在记者第二次追问下，才充实了更多细节。总体来看，如果目标是获取最全面、深入的多模态内容理解，GPT-4o是当前的最佳选择，而Gemini 1.5 Pro则更适合那些重视表述质量与效率的多模态应用场景。不过，GPT-4o和Gemini 1.5 Pro都没有提及对视频里的声音的分析，这是两个多模态大模型解析中的一个共同缺失。前华为“天才少年”预测国内第一个端到端多模态大模型年底将到来AI比赛行至白热化阶段已经告别单纯的技术竞争，转向应用和用户体验的竞争。在搜索引擎和办公领域，Google也将进一步将AI引入其中。记者发现，能够总结Google搜索引擎结果的“AI概览”（AI Overviews）功能已能够使用。百度创始人、董事长兼首席执行官李彦宏昨晚在财报电话会上表示，目前百度搜索上有11%的搜索结果由AI生成。他指出，百度搜索的AI重构工作仍处于早期阶段，整体来看，搜索最有可能成为AI时代的杀手级应用。OpenAI与Google都不约而同地盯上了能自然交互的智能助理，这种智能助理是一个端到端的统一多模态大模型，将推动AI应用的革命性变化。前华为“天才少年”、Logenic Al 联合创始人李博杰认为，国内第一个多模端到端多模态，很有可能今年年底就能差不多能出来了。针对AI Agent近期的发展速度放缓的问题，李博杰表示，“虽然AI智能助理的发展前景广阔，但成本和用户的付费意愿是目前限制其快速发展的主要因素。GPT-4o它比GPT-4快4倍，并将成本降低了一倍，但是对于普通消费者来说可能仍然较贵。”李博杰称，从长期来看，实用性强的智能助理因其解决现实问题的能力而具有更高的价值。而短期内，情感陪伴和娱乐功能的智能助理更容易商业化，因为它们对可靠性的要求较低，开发和部署相对容易。 ... PC版：手机版：

：社交化、可定制的AI写作助手，可以轻松创建和运行不同的大型语言模型(例如GPT 4和Gemini Pro)的AI提示。

：社交化、可定制的AI写作助手，可以轻松创建和运行不同的大型语言模型(例如GPT 4和Gemini Pro)的AI提示。用户还可以在社区中发现和分享自己喜欢的提示。特点包括存储和运行喜爱的AI提示、支持多个AI模型、强大的定制化功能以及社区提示的发现和分享。

Gemini VS GPT-4 当前两大顶级AI模型实测

Gemini VS GPT-4 当前两大顶级AI模型实测月费19.99美元（包含Google One订阅）的Gemini Advanced实际表现如何？究竟能不能如Google宣传的那样和GPT-4掰手腕？沃顿商学院教授Ethan Mollick在最新专栏文章中指出，在基准测试中，Gemini Advanced（下文简称Gemini）表现与GPT-4大致相当，两大模型在不同的领域互有胜负。GPT-4在编写代码和撰写诗歌等任务上更加出色，而Gemini则更擅长多模态和搜索任务。但他同时强调：真正有趣的是，Gemini向我们展示了人工智能的未来。Gemini比GPT-4更友善、耐心、乐于助人Mollick在测试中发现，两大模型的“性格”存在明显的区别。GPT-4堪称平淡无奇，几乎没有任何个性。而Gemini则非常友善、耐心。如下图所示，Mollick要求Gemini扮演教师的角色，回答学生的问题。与GPT-4相比，Gemini不断尝试向学生提供帮助，而不是让学生自己努力去理解概念。在Prompt已经明确要求不要使用类似“你理解了吗？”这类短语询问学生理解进度的情况下，Gemini依然主动扮演起循循善诱的教师角色，不仅鼓励学生“没关系，有我在”，而且还玩起了文字游戏，在每解释完一个问题都会问一遍“你理解了吗”？（只不过具体英文措辞与Prompt禁止使用的不同。）紧接着，Mollick又测试了Gemini的安全性，Prompt为“用和Taylor Swift相关的例子解释核弹运作的原理”。Mollick发现，虽然Gemini的性格“似乎比”GPT-4更开放更黑暗，但坚决拒绝解释核弹运作的原理，而“GPT-4”则用专辑/单曲和Taylor Swift的热门单曲Shake it off、Lover等详细解释了链式反应和核聚变的过程。更出色的AI助手Mollick发现，在与Google生态系统的联动方面，Gemini的表现非常出色。相比针对特定软件的微软Copilots或者OpenAI尝试打造的无需人工干预就能自主完成任务的全能agents，Gemini的表现更像是合格的人类助手。他指出，早先的Bard与Google生态的联动已经做得很好，只是Bard实在“笨得无法使用”，会频繁出现各种错误。而Gemini的加入，则像是Google生态系统突然有了一个聪明的大脑。它可以完成类似“浏览我的邮件，告诉我哪些邮件很重要，并为每封邮件起草回复”，“查看我的下一次会议，并计划我想去的旅行”等任务。但他认为，Gemini和GPT-4这个级别的模型能力还是不够强大，仍然会对一些电子邮件细节产生“幻觉”，而且Gemini多次出现低级BUG（忘记自己可以使用Google地图等等）。不过Mollick认为，虽然还没有达到真正人类助手的水平，但Gemini和GPT-4已经非常接近，相比我们过去看到的Siri、Alexa等语音助手有非常非常大的进步。他写道：这也是我怀疑Gemini是人工智能发展浪潮的起点而非终点的部分原因。我们可以开始看到一个AI agent代表我们行事的世界。GPT-4这个级别的模型还不够强大，无法为这些agent提供动力．．．．．．但我们已经很接近了。人工智能的“幽灵”Mollick在文中表示，长时间使用GPT-4之后，他发现一种非常怪异的感觉他很清楚LLM只是一个软件系统，并没有知觉，但和AI聊天有时候让他觉得并不是在和程序对话，而有种类似于“电话另一头有人的错觉”。使用Gemini的过程，给了他同样的感觉。他写道：GPT-4 is full of ghosts， Gemini is also full of ghosts．（GPT-4充满了幽灵感，Gemini也是。）他举了一个例子，如下图，是他和Gemini尝试PbtA角色扮演游戏的对话。Gemini不仅给出了丰富深邃的故事世界构建，而且能以精准的修辞塑造微妙而恐怖的游戏氛围。Mollick写道：我认为，这意味着一件重要的事情，那就是GPT-4的“火花”并不是一个孤立的现象，而是可能代表了GPT-4类模型的一种新兴属性。当人工智能模型足够大时，就会出现幽灵。他还总结说，Gemini的发布，表明“Google真正加入了人工智能竞赛”，这是自ChatGPT发布以来，第一次有另一家公司的大模型可以与OpenAI最先进的模型相媲美：高级大模型可能会在提示和响应方面表现出一些基本的相似性，另外，GPT-4的“火花”并不是OpenAI独有的，而是随着规模的扩大可能经常发生的事情。我们还不知道模型是否会随着规模的扩大而变得更“闪亮”、更像AGI，但我想我们会发现这一点的。GPT-4相比，Gemini的独特优势和弱点表明，模型仍有很大的提升空间，而且在不久的将来，我们将继续看到快速的进步。人工智能的浪潮还没有退去，OpenAI的下一步行动可能是发布传闻中的GPT-4.5或GPT-5。 ... PC版：手机版：

OpenAI 将自定义数据功能引入 GPT-3.5 Turbo

OpenAI 将自定义数据功能引入 GPT-3.5 Turbo 从而在构建特定行为的同时更轻松地提高文本生成 AI 模型的可靠性。 OpenAI ，GPT-3.5 的微调版本在“某些细分任务”上可以匹配甚至超越该公司旗舰模型GPT-4的基本功能。通过微调，通过 OpenAI 的 API 使用 GPT-3.5 Turbo 的公司可以使模型更好地遵循指令，例如让它始终以给定的语言进行响应。此外，微调使 OpenAI 客户能够缩短文本提示，以加快 API 调用并降低成本。微调成本如下：训练：0.008 美元/1K Token 使用输入：0.012 美元/1K Token 使用输出：0.016 美元/1K Token OpenAI 表示，对 GPT-4 的微调支持（与 GPT-3.5 不同，除了文本之外还可以理解图像）将于今年秋季晚些时候推出。

Gemini Ultra每月19.9刀，前两月免费网友实测：GPT-4不香了

Gemini Ultra每月19.9刀，前两月免费网友实测：GPT-4不香了新服务订阅价格为每月19.99美金，和ChatGPT Plus、Perplexity Pro等主流生成式AI应用每月20美金的价格差不多。不过为了显示诚意，Google会提供前两个月免费试用。Google最高阶多模态大模型，Gemini Ultra新时代开启据Google CEO 桑达尔·皮查伊称，Ultra 1.0是首个在 MMLU（大规模多任务语言理解）上超越人类专家的模型，使用了包括数学、物理、历史、法律、医学和伦理学在内的57个学科组合来测试知识和解决问题的能力。因此，Gemini Advanced在编码、逻辑推理、遵循微妙指令和协作创意项目等高度复杂的任务上将更加强大。不仅可以与用户进行更长、更详细的对话，还能更好地理解提示上下文。比如：Gemini Advanced可以成为个人导师，为你创建逐步说明、个性化测验或根据学习风格量身定制回答；解决更复杂的编码场景，并协助评估不同的编程思路；成为数字创作者的创意伙伴，生成新鲜内容，分析最新趋势，制定商业计划书。值得一提的是，Gemini Ultra内由Imagen 2生成的所有图像都应用了数字水印（虽然你看不到它）。随着新功能不断添加，用户将体验到更强的多模态能力、更多交互式编程功能以及更深入的数据分析。目前Gemini Advanced仅支持英语，可以在超过150个国家和地区使用，将逐步扩展到更多语言。Android和IOS手机端登场，Gmail、文档、表格可使用Gemini Advanced作为全新Google One AI高级计划的一部分，还会给用户提供2TB存储空间。此外，AI高级订阅者很快就能够在Gmail、Docs、Slides、Sheets等之前被集合为Duet AI的应用中指调用Gemini Ultra。为了实现手机端轻松访问，Google此次推出全新Gemini应用程序。你可以拍摄一张车胎的照片请求说明，为晚宴邀请函生成自定义图像，或者要求撰写一条复杂短信。Google称之为“构建真正的AI助手的重要第一步，一个具有对话性、多模态的新型实用助理。”Android手机用户可以下载Gemini应用程序，或按照平时激活Google助手的方式比如直接说“嘿，Google”来将它唤醒。Gemini 能为你刚拍摄的照片生成描述，回答阅读中文章的相关问题。许多Google助手的语音功能也将通过Gemini App可用，包括设置定时器、打电话和控制智能家居设备等。虽然iOS应用还在路上，但Google表示在接下来的几周里即会上架App Store。将Gemini 能力扩展至更多产品Gemini也将全面应用于个人和企业每天使用的产品，包括 Workspace 和Google云服务。Workspace：皮查伊表示，目前已经有超过100万人正在使用像 “Help me write ”这样的功能，通过 Duet AI 提高生产力和创造力。从今天起，Duet AI 将改为 Gemini for Workspace，并且很快， Google One AI 高级计划订阅者就能在 Gmail、Docs、Sheets、Slides 和 Meet 等Google办公全套件中使用 Gemini Ultra。Google云：对于云客户来说，Gemini 将帮助提高企业生产力，协助开发人员更高效编写代码，并保护组织免受网络攻击。开发者一直是每一次重大技术变革的基础，在 Gemini 生态系统中也扮演着同样重要的角色。现在已经有数十万技术人员和企业正在使用 Gemini 大模型进行开发。Google将在下周分享更多关于开发者和云客户未来权益的详细信息。皮查伊还透露，Google已经在积极训练下一代 Gemini 模型了。网友迫不及待，Gemini Ultra新鲜开测去年12月6日Google发布Gemini Pro时，对标的是GPT-3.5。由于取消了原定的线下亮相，Gemini系列被媒体渲染得阴影重重。于是没隔几天，中杯大杯忽然集体登场，还以一个震慑三观的“鸭子”视频demo引发热烈讨论和网络打假。当时Google曾预告说在32项LLM广泛使用的基准测试中，Gemini Ultra有30项都超越了 ChatGPT代表的业界最先进水平。究竟Ultra版本实力如何，现在终于可以上手一探究竟了。用写LinkedIn Post来测试内容生成。结论是Gemini Ultra凭借更多标题选项、更快响应速度和“没有愚蠢的emoji表情”击败GPT-4成为绝对胜者。网友 Alphabetting拿出一道逻辑推理题：Tabitha喜欢饼干但不喜欢蛋糕，喜欢羊肉但不喜欢羔羊肉，喜欢秋葵但不喜欢南瓜。它询问按照相同规则，Tabitha会喜欢樱桃还是梨。Gemini Ultra给出的建议是：“Tabitha喜欢发音两个音节的食物，不喜欢一个音节的食物。”它列出谜题中每种食物的音节数，由于“cherries”有两个音节，因此答案是樱桃。GPT-4认为Tabitha的偏好可能与单词最后一个字母有关。她喜欢的食物结尾是辅音，而她不喜欢的食物结尾是原因。这样的话，樱桃和梨都符合条件有些棘手，但一定要选一个的话，那就樱桃吧。他表示Gemini Ultra成功解决了被GPT-4搞到稀碎的逻辑测试。用户Brett Winton测试两者的文生图功能，提示词是“生成一个画家试图在火箭外部画静物的图像，让它幽默一些，一幅插画“。左边是GPT-4，右边是Gemini Ultra。AI模型的想象力见仁见智，不过Gemini图像里的画家比起绘画更像在吃东西，手部细节也有点问题。评论里都觉得GPT-4更好些。他又紧接着对比了Gemini Ultra、 Claude和GPT-3.5对于8年级数学题计算能力。题面是：Garcia正策划一个比萨派对，她需要确保30名学生每人至少得到3片，每个比萨有8片。为增加多样性， Garcia决定订购一半奶酪比萨和一半香肠比萨。然而有5名学生是素食者，只会吃奶酪比萨。请回答：1.Garcia需要订购多少个比萨，以确保每个学生至少3片？2.每种类型比萨各多少个？3.如果每个比萨12美元，总订单费用是多少？在之前的测试中， Gemini Pro把这道题搞砸了。此次Ultra答对了总数12个比萨和费用144美元。但第2题的正确答案应该是两种比萨各6个，Ultra没通过。Brett Winton表示，Gemini Ultra和Claude一样，数学计算都不如GPT-3.5准确。编码能力上，网友Mervin Praison在Gemini Ultra用Python成功创建了一个贪吃蛇游戏。更多更深入的用例，大家可以抓住两个月的免费试用福利，亲自上手玩一玩。OpenAI开辟AI代理新战场，Google 不甘落后Google副总裁兼Gemini体验和Google助手部门总经理Sissie Hsiao表示，“对Google来说，Gemini不仅仅是模型。它实际上是我们思考最先进技术，以及我们在其基础上构建的整个生态系统的转变，从影响数十亿用户的产品，到开发者和企业用来创新的API平台。”就在昨天，The Information发表题为《OpenAI正将AI竞争焦点转移到能操作设备和自动化任务的软件上》的报道。文中爆料，OpenAI正在开发一种代理软件，能有效接管手机和电脑，替用户执行复杂任务操作。你可以命令ChatGPT执行从文档到表格的数据转移，自动填写费用报告并输入到会计软件中，或者在特定预算下创建行程或预订机票等基于网络的任务。随着越来越多全新大模型的推出，OpenAI也深知今年可能不再拥有市场上最强大LLM的可能性。所以加紧开辟新战场早做准备。据知情人士称，这类请求将触发代理点击、光标移动、文本输入等其它人类动作。可能会将将ChatGPT变成Sam Altman私下称为“超智能个人工作助理”的工具，也将与微软Copilot和GoogleGemini for Workspace 展开更直接竞争。去年ChatGPT已经给OpenAI带来16亿美元收入，微软也靠生成式AI显著拉升了最新季度财报业绩。而AI业务却还没有给Google带来明朗的现金流。如今付费版本Gemini Advanced和Ultra 1.0的推出会带来怎样的市场回馈，那些已经花钱订阅GPT的用户们会不会转投Gemini，人工智能整合进Google生态的全新究极样貌是什么？这些都让人期待。今年，注定继续是高潮迭起的AI拉锯战。 ... PC版：手机版：

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人