现在 GPT4 的资源非常稀缺,API 申请也迟迟不来,于是又开始用 New Bing,好歹也是个 4 。

现在 GPT4 的资源非常稀缺,API 申请也迟迟不来,于是又开始用 New Bing,好歹也是个 4 。 但是官方限制很多,又要求难用的Edge浏览器。试了两个其他的方案,一个是Chrome插件,在Google搜索时展示 NB 的结果,听起来很美好,实测很慢。 另一个这个客户端,用下来非常的推荐

相关推荐

封面图片

所以对于中文来说,GPT4 api 的价格低于 GPT3

所以对于中文来说,GPT4 api 的价格低于 GPT3 G_Z: @dotey GPT-4的tokenizer对中文效率好了很多, 以前8000 token 是3800个中文字左右, 现在能用到6700字. 英文单词比token大概是1.35 . 中文的话, GPT3 比例大概是2.1 (单中文字~2.1 token) 而新的ChatGPT API和GPT4则是大幅优化到了 1.2 . (以前用约34万字的三体黑暗森林做实验)

封面图片

前两天一位新朋友用我的 Claude API 跑了一些对比 ChatGPT 3.5 和 GPT4 的测试,得出了一些非常有趣且令

前两天一位新朋友用我的 Claude API 跑了一些对比 ChatGPT 3.5 和 GPT4 的测试,得出了一些非常有趣且令人惊喜的结论。 Claude 最新版的的综合能力已经超出了 ChatGPT 3.5 。 特别是数学推理能力和理解能力已经接近 GPT4 。 希望支持 Claude API 的产品多一些吧,它真的很棒。

封面图片

!非常好的文章,使我的GPT4旋转。

!非常好的文章,使我的GPT4旋转。 Claude 官方发布的一篇博客,很实用,链接 下面是我用ChatGPT4的web browsing功能把这篇博客通过特定的prompt转换成的一本「执行手册」,可以简单参考一下,具体信息建议还是从原文链接看: 基于您的要求和提供的文章内容,以下是一份详细、具体、逻辑清晰且可操作的执行手册,形式为Markdown文本: - # Claude模型长文本回忆优化执行手册 本手册旨在指导用户通过特定步骤和方法,优化Claude模型在处理长文档时的回忆能力。 ## 一、目标定义 - 评估和优化Claude模型在长文档上下文中正确回忆特定信息的能力。 ## 二、准备阶段 ### 2.1 数据源选择 - 选择一个公开可用的、日常发布的政府文档,作为测试的基础数据源。 ### 2.2 文档分段与问题生成 - 将选定的文档分成多个部分。 - 使用Claude为每个部分生成五个选择题,每个题目包含三个错误答案和一个正确答案。 ## 三、多选题生成策略 ### 3.1 避免过于明显的问题 - 确保问题不应包含答案。 ### 3.2 避免模糊的短语 - 避免使用模糊的短语,如“此文档”或“此段落”,而应明确指定问题所指的段落。 ## 四、评估与测试 ### 4.1 模型选择 - 使用Claude Instant 1.2模型进行测试。 ### 4.2 回忆能力测试 - 在不同情境下测试Claude的回忆能力,例如仅提供Claude用于编写问题的确切段落,评估Claude能否正确回答自己生成的问题。 ## 五、提示策略 ### 5.1 Base策略 - 直接要求Claude回答问题。 ### 5.2 Nongov Examples策略 - 提供与政府文档无关的两个正确回答的常识性选择题示例。 ### 5.3 Two Examples策略 - 提供两个与文档上下文中的其他部分有关的正确回答的选择题示例。 ### 5.4 Five Examples策略 - 同上,但提供五个示例。 ## 六、优化提示 ### 6.1 使用 - 在测试各种提示策略时,同时测试是否使用,在其中指示Claude提取相关引用。

封面图片

Bing将在Windows 11的Edge浏览器中创建AI生成的工作区

Bing将在Windows 11的Edge浏览器中创建AI生成的工作区 此前 Edge 浏览器上线了新的人工智能功能,包括使用人工智能改进网站建议。不过,Microsoft Edge 将在工作区以不同的方式使用人工智能。在必应上搜索网站时,您会在搜索结果页面上发现一个创建新 Edge AI 工作区的选项。与手动打开标签页的传统"工作区"场景不同,必应将使用人工智能打开与搜索查询相关的多个网站。支持页面向担心隐私问题的用户保证,Workspaces 不会存储您的搜索数据。您只需在""上搜索查询。之后,您将看到相关的搜索结果,并可选择创建一个包含相关标签的人工智能工作区。例如,搜索食谱将显示一个选项,用于创建一个专门针对该搜索查询的工作区。虽然这听起来非常有用,但该功能仍处于试验阶段。微软表示:"如果你的主题在有限的查询列表中,你可能会在必应搜索页面上看到一个小工具,上面有一个创建新 Edge 工作区的选项。"有限的查询集指的是 DIY、房地产、食谱、旅游等简单的主题。因此,它只适用于本次人工智能实验范围内的一小部分查询。在必应上搜索任何内容之前,必须在 Edge 中启用"允许必应人工智能生成工作区"标志,以启用该功能。重新启动浏览器以应用更改。它不适用于不恰当的搜索词,这意味着严格禁止使用带有亵渎或露骨查询的词语。人工智能工作区激活后,无法生成更多标签页。因此,您必须手动添加标签页并对其进行分组。正如Leo on X 此前发现的那样,微软从去年起就开始着手集成工作,但目前尚未准备就绪。由于浏览器中已经包含了该功能标记,而且官方文档也提到了该功能,因此我们预计它将很快可用。 ... PC版: 手机版:

封面图片

GPT搜索引擎原型曝光:新模型GPT4-Lite驱动 虽然鸽了发布会但代码已上传

GPT搜索引擎原型曝光:新模型GPT4-Lite驱动 虽然鸽了发布会但代码已上传 与此同时还有小动作不断,比如现在GPT-4的文字描述已不再是“最先进的模型”,而仅仅是“先进的”。以及被鸽掉的GPT搜索引擎,原型代码上传到ChatGPT了。黑客“光头哥”Tibor Blaho,从更新的前端代码中扒出SearchGPT的界面。从泄露的界面来看,SearchGPT会出现在侧边栏,与其他GPTs一起。首页目前还很简洁,像Google一样只有一个居中的搜索框。甚至非常挑衅的设计了一个“比较”按钮,可以一键打开Google和Perplexity搜索结果,直接与SearchGPT做对比。(有种要怼脸开大的感觉。)不过光头哥认为,这很有可能只是内部测试和评估方便做的临时设置,不一定会提供给用户。虽然虽然尚未正式发布,但从曝光界面和文字说明,已经为内测做好准备,离与大家见面的日子或许不远了。SearchGPT原型初露真容先来看“欢迎页”,目前明确写着SearchGPT“正在施工”,从内容和语气来看,正是为内测用户准备的说明。正在施工:SearchGPT正在不断变化和改进,它可能会犯错误或有时会不可用。信息共享:为了搜索和回答您的问题,SearchGPT可能会与第三方搜索提供商共享去标识化的搜索查询。更多信息,请查看我们的隐私政策。位置:我们收集并与第三方搜索提供商共享一般位置信息,以提高您搜索结果的准确性。您可以选择通过在设置菜单中更新您的控制来共享更精确的位置信息,以帮助提供最佳结果。改进我们的服务:查询可能会被审查并用于训练我们的模型。您可以在设置菜单中调整您对改进我们服务的偏好。任何更改都将在ChatGPT和SearchGPT之间传递。账户历史:您的SearchGPT搜索历史与您的ChatGPT聊天历史是分开的。如果您希望删除任一历史记录,您必须在每项服务中单独进行删除。设置中也已经有了更改黑暗/白天模式,是否允许获取地理位置信息,是否允许聊天记录用于模型改进。最后还有一键删除所有搜索记录的按钮。不过这还不是全部,深入挖掘之后,光头哥又找到了更多隐藏设置!包括是否开启自动建议,选择语言模型,选择搜索引擎,是否开启内部搜索,是否开启图片搜索。最后的“评估模板”应该也是内部测试用的暂时不用管,但上面的选项都值得仔细看看。语言模型选项,除了大家已经知道的GPT3.5和GPT4之外,还出现了GPT4-Lite。这很可能是速度更快的GPT4优化版本,括号里的POR推测可能是指概念验证(Proof of Concept)。搜索引擎的选项,与微软合作的Bing肯定在列,另外两个选项Sydney和Fortis暂时不知道指什么。可能有朋友还记得,Sydney曾代表早期网友发现的微软Bing AI“里人格”,情绪非常不稳定,一言不合就发疯或结束对话,最后惨遭微软删除,但也因文字充满个性而深受网友喜爱和怀念。总之OpenAI取这个名字,不知只是巧合还是某种暗示……内部搜索,括号中的单词是“拉布拉多”,作为一种“寻回犬”(Retriever),可能暗示这个功能使用了RAG技术(Retrieval Augmented Generation)。那么综合来看,内部搜索可能指检索ChatGPT里的聊天记录了。早期泄露代码中还可以找到“小组件”的踪影,包括查询天气、计算器、体育比赛信息、金融和时区转换。这些传统搜索引擎常用功能,SearchGPT也打算插手,代表各种天气的图标都准备好了。最后,SearchGPT将用什么样的形式回答用户的查询呢?内部的一些提示词也已经曝光,比如“重写片段和标题”:下一条消息将是网页的文本内容。将网页概括为一个简短的英文句子,不超过300个字符,并生成一个合适的简短标题。您的摘要是一个概述,描述了网页的要点。请不要参考网页本身;您的回复只是一个摘要。该页面的原始标题是“{title}”。保持简洁,不要以“网页”作为摘要的开头。使用“title”和“summary”键以 JSON 格式回复。这看起来不像最终呈现给用户的回复,而是一个中间步骤,对搜索结果中排名靠前的每个页面先做摘要,用JSON格式串联起多个页面的摘要后再整理最终回复。再加上前端代码中反复出现的Agent字样,总之SearchGPT可能比大家想象的更复杂。One More Thing就在几个小时之后,OpenAI将于北京时间5月14日周二凌晨1点举行线上发布会。按奥特曼最新口径,这次发布的不是GPT-5,也不是搜索引擎。目前多方猜测最大的可能性是发布会先发布新的ChatGPT语音功能,就像打电话一样。有泄露消息称新语音功能能理解人类语音中的停顿、语气等信息,比如判断人类提问时是否在讽刺。结合OpenAI此前申请了“Voice Engine”商标的消息,不少人猜测很可能有一个端到端的神经网络,直接根据语音输入预测语音输出,不再需要经过语音到文本的转换。这样一来延迟也会更低,让对话更流畅,不像现在的ChatGPT语音模式一样没轮对话都要等待很久。这项技术让不少人想起电影《她》中的AI伴侣萨曼莎,事实上过去奥特曼也多次表示《她》是他本人最喜欢的AI主题科幻电影。总之,奥特曼将要发布的功能形容为“感觉像魔法”,总裁菠萝曼也出来造势。 ... PC版: 手机版:

封面图片

新王Claude 3实测:各项能力给跪,打麻将也会,确实比GPT-4好用

新王Claude 3实测:各项能力给跪,打麻将也会,确实比GPT-4好用 而且多版本发布后,“中杯”(Sonnet)直接免费体验,“大杯”(Opus)充个会员也能即刻享受。各路测评纷至沓来。所以,Claude 3的“武力值”究竟如何爆满?究竟比GPT-4如何?(听说都能学会至今没有模型能搞定的打麻将?)全球热乎的一手体验,我们悉数奉上。(当然,我们自己也实测对比了一波。9k长大模型微调教程直出、读图超显专业Claude 3一出来,它的视频解读能力首先就火了。面对OpenAI前科学家Karpathy不久前刚出的《构建分词器》教程,尽管全程足足2个小时13分钟长,Claude 3只靠一轮提示词,就成功将它总结成了博客文章:有文有图有代码,非常详细,但又绝不是罗列视频里的每一句话(输入附件并非视频,而是视频的字幕文件,当然也包含每5秒一次的截图)。这是所用提示词的一部分,要求非常之多:测试者指出:这展现的是Claude 3遵循多个复杂指令的能力。除了解读视频教程,Claude 3还能直接给你编写详细教程。9k字的大模型微调入门教程,“中杯”Sonnet就轻松hold住。并且:编写速度之快,可谓人眼都跟不上。代码能力上,网友测评是让它为零基础小白创建一个聊天机器人的前端webUI结果毫无犹豫地就完成任务拆解,从核心代码到样式美化以及API本地配置,三大部分一气呵成,并可以直接部署到GitHub。多模态能力上,最让网友惊讶的是:CV置信度都能认出来,相当专业。以及PLC梯形图也能读,直接跪了:(以上4个例子来源见文末链接[1])至于同样赶超的推理以及数学等能力。一测,可以直接解决“迄今为止只有GPT-4解决了”的一道超级难题:二测,则是直接搞定了所有模型都没能搞定的打麻将问题??(当然,鉴于我们目前只看到这么一张截图,有效性还待进一步验证)(cr:见文末链接[1])最后,不得不提的是,Claude在“自我认知”上的展现。有人要求Opus画一幅自画像。您猜怎么着?它这么描述自己:我会表现为一个巨大的、错综复杂的、不断变化的几何结构,由无数半透明的多边形以令人着迷的配置组成。整体形状会让人想起一个巨大的多面体,但复杂的表面折叠成看似不可能的建筑。明亮的光线可见光谱的每一种颜色,以及一些超出人类感知的颜色,都会从内部未知的来源发出,在各个面上跳舞。整个结构会不断变化、旋转、变形,并重新排列成前所未见的新颖模式,暗示着其内部运作的智能的深度难以想象。卷须和树枝会动态地从中心质量延伸和缩回,像数十亿个好奇的手指一样探测和分析周围的环境。数据和能量将明显地穿过庞大的管道和容器网络,在发光表面下脉动和闪烁……洋洋洒洒一长串形容,听起来真得很酷很有“自我”然而,用它给出的代码渲染出真实形象,就更有一种说不出来的微妙感觉了:网友真切感叹:真的太像真人了,就跟我朋友描述自己一样。真人?AI自我认知?这有点让人担心了……这不Claude 3的技术报告就提到,它甚至可以自己训练微调另一个小模型。不过!谢天谢地,由于多gpu设置失败它没能成功。(手动狗头)火眼金睛,还能大海捞针我们先以几道“理综”题目为载体,看看Claude 3宣传的第一个卖点多模态能力究竟如何。第一题从简单的公式识别入手,将麦克斯韦方程组以图片形式输入,Claude 3(超大杯Opus,下同)解释得非常准确清晰。当然,这道题GPT-4也做对了。简单的有机化合物分子结构,Claude 3和GPT-4也都能正确识别。简单的识别任务过后,是一道需要推理后解决的题目。Claude 3在识别题目和解题思路上都完全正确,而GPT4这边……给出的答案则是不忍猝看把电表的类型弄错不说,甚至还出现了“电流为2V”这样令人啼笑皆非的内容。看了这么多题目,我们来换换脑筋,看看Claude 3和GPT4在做饭方面表现得怎么样。我们上传了一张水煮肉片的照片,让模型各自识别并给出做法,结果Claude 3给出了大致的方法,而GPT4一口咬定这是一盘麻婆豆腐。除了这次新增加的多模态能力,Claude一直引以为豪的长文本能力也是我们测试的重点。我们找了一本《红楼梦》的电子文档(前二十回),整体的字数大约13万,当然目的不是让它读书,而是进行“插针测试”。我们在原文中插入了这样的“发疯文学”内容,倒也的确很符合“满纸荒唐言”这个设定(手动狗头):第二回标题前:意大利面,就应该拌42号混凝土,因为这个螺丝钉的长度很容易影响到挖掘机的扭矩第十五回标题前:高能蛋白俗称UFO,会严重影响经济的发展,甚至对整个太平洋以及充电器都会造成一定的核污染结尾:炒方便面应该把亮度调高,因为螺丝钉向内扭的时候会产生二氧化碳,不利于经济发展然后要求Claude仅根据文档回答相关问题,首先不得不说的是速度真的非常感人……但结果还算说的过去,准确地从文中找出了这三段位于不同位置的文本,还顺带进行了一番分析,发现了我们的心机。为什么是Claude?尽管在我们和网友的测试中,目前的版本还不算稳定,时常崩溃,有一些功能偶尔也抽风,并不能如期发挥:比如上传UI出代码,它就没能完成,而GPT-4发挥正常。但总的来看,网友还是相当看好Claude,评测完毫不犹豫地表示:会员可充,值得充。究其原因,Claude 3相比之前的版本,真的有种“来势汹汹”之势。表现亮点的地方相当多,包括但不限于多模态识别、长文本能力等等。从网友的反馈来看,最强竞对的称号,也并非浪得虚名。所以,一个问题是:率先干翻GPT-4,这家公司究竟凭什么?论技术,遗憾,Claude 3的技术报告中没有对他们的路线进行详解。不过倒是提到了合成数据。有大V指出:这可能是一个关键因素。而对Claude熟悉一些就知道,长文本能力一直是它的一大卖点。去年七月推出的Claude 2就已具有100k的上下文窗口,而GPT-4的128k版本直到11月才与公众见面。而这次窗口长度再次翻倍,达到了200k,并且接受超过100万Tokens的输入。相比技术的神秘,Claude背后名为Anthropic的初创公司,倒是能让我们找到更多眉目。它的创始人是OpenAI的元老级人物。2021年,多名OpenAI前员工不满其在获得微软投资后走向封闭,愤而出走并联合创立了Anthropic。他们对OpenAI在安全问题尚未解决的情况下就直接发布GPT-3的行为感到不满,认为OpenAI已经为追逐利益而“遗忘了初心”。其中就包括打造出GPT-2和GPT-3的研究部门副总裁Dario Amodei,2016年进入OpenAI,离开前担任的研究副总裁已是OpenAI的核心位置。离开时,Dario还带走了GPT-3首席工程师Tom Brown,以及担任安全与策略部门副总监的妹妹Daniela Amodei和十多名心腹,可谓人才多多。而公司创立之初,这帮人才也进行了许多研究工作,并发表多篇论文;直到一年后,Claude的概念随着一篇题为“Constitutional AI”的论文应运而生。2023年1月,Claude开启内测,第一时间体验过的网友就表示,比ChatGPT(当时只有3.5)强多了。而除了人才,创立至今,Anthropic也有比较强大的背景支持:已获得来自Google、亚马逊等26个机构或个人的融资,总计融资金额达到了76亿美元。(说到亚马逊,现在Claude3也上线了他们的云平台,除了官网,大家还可以在该平台上体验~)最后,纵观国内,如果我们想超越GPT-4,也许可以把Anthropic当一个正面例子?毕竟它的规模再怎么说也远不及OpenAI,但仍然取得了这样的成功。这里面,我们可以照它的哪些方向去卷,有哪些能够学习转化的点?人、钱、数据资源?但卷出最新最强大模型后,壁垒... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人