Anthropic的Claude为快速改进的AI应用增添了一个"评估"方式

Anthropic的Claude为快速改进的AI应用增添了一个"评估"方式 当要求语言模型执行某些任务时,它们的容错率很高,但有时对提示语措辞的微小改动也会导致结果的巨大改进。通常情况下,用户必须自己斟酌措辞,或聘请一名提示工程师来完成这项工作,但这项新功能提供的快速反馈可以让你更轻松地找到改进之处。这些功能位于 Anthropic Console 的新"评估"标签下。控制台是这家初创公司为开发人员提供的测试厨房,旨在吸引那些希望使用Claude打造产品的企业。其中一项功能是Anthropic的内置提示生成器,它利用Anthropic自己的提示工程技术,通过对任务的简短描述,生成更长、更充实的提示。Anthropic 的工具可能无法完全取代提示工程师,但该公司表示,它将帮助新用户,并为有经验的提示工程师节省时间。在"评估"中,开发人员可以测试其人工智能应用程序的提示在一系列场景中的有效性。开发人员可以将现实世界中的例子上传到测试套件中,或者让Claude生成一系列人工智能生成的测试案例。然后,开发人员可以并排比较各种提示的有效性,并对样本答案进行五级评分。输入生成的数据提示,找出好的和坏的反应。在 Anthropic 博客文章中的一个例子中,一位开发人员发现他们的应用程序在多个测试用例中给出的答案太短。开发人员能够调整提示符中的一行,使答案变长,并同时应用于所有测试用例。这可以为开发人员节省大量的时间和精力,尤其是那些几乎没有提示工程经验的开发人员。Anthropic 首席执行官兼联合创始人达里奥-阿莫德伊(Dario Amodei)在今年早些时候接受Google云计算大会(Google Cloud Next)采访时表示,及时工程是企业广泛采用生成式人工智能的最重要因素之一。"这听起来很简单,但与及时工程人员交谈30分钟,往往就能让应用程序正常运行,而以前却不行。" ... PC版: 手机版:

相关推荐

封面图片

Anthropic发布其最强大AI模型Claude 3.5

Anthropic发布其最强大AI模型Claude 3.5 今年3月,Anthropic推出了Claude 3系列模型。随后,OpenAI在5月份推出了GPT-4o。Anthropic今日表示,Claude 3.5 Sonnet比之前的主打模型Claude 3 Opus速度更快,也是Anthropic新的Claude 3.5家族的第一款模型。目前,Claude 3.5 Sonnet已在公司网站Claude.ai和Claude iPhone应用程序中免费提供。Claude Pro和Team的订阅者也可以接入最新的模型。此外,它还通过Anthropic API、Amazon Bedrock和谷歌云的Vertex AI提供。Anthropic在一篇博客文章中称:“它在把握细微差别、幽默和复杂指示方面有显著进步,在以自然、合理的语气撰写高质量内容方面也十分出色。此外,它还可以编写、编辑和执行代码。”在发布新模型的同时,Anthropic还在Claude.ai上引入“Artifacts”,这是一个新功能,可以扩展用户与Claude的交互方式。当用户要求Claude生成代码片段、文本文档或网站设计等内容时,这些Artifacts会出现在他们对话旁边的专用窗口中。这创建了一个动态工作区,用户可以在其中实时查看、编辑和构建Claude的创作,并将AI生成的内容无缝地集成到他们的项目和工作流中。如今,随着Anthropic和OpenAI等初创企业在生成式AI领域的崛起,它们已经与谷歌、亚马逊、微软和Meta等科技巨头并驾齐驱,成为AI军备竞赛的一部分。据预计,该市场的规模在未来十年内将突破1万亿美元。                                     ... PC版: 手机版:

封面图片

Anthropic发布了Claude AI模型的iOS移动应用

Anthropic发布了Claude AI模型的iOS移动应用 Anthropic公司的产品经理斯科特-怀特(Scott White)说,许多Claude用户一直通过移动网络访问人工智能模型,这促使Anthropic公司推出了Claude.ai的应用版本。不过,Anthropic 的移动应用推出得有点晚。OpenAI的ChatGPT等竞争对手已经有一个运行多年的移动应用,而Google的Gemini可以在iPhone用户的Google应用和自己的Android应用中找到。人工智能搜索平台 Perplexity 也有一个移动应用。Claude 应用程序将免费提供给 Claude 人工智能模型的所有用户,包括免费用户、Claude Pro 用户和新的 Claude Team 计划。Anthropic公司表示,该公司本月还将推出"团队计划",为一个至少5人的小组提供Claude模型的访问权限,每个席位每月30美元。当使用该计划的用户开始在 Claude 上构建模型时,他们可以与其他用户分享。Pro计划于 9 月份首次推出,仅面向个人,每月 20 美元。团队计划的用户可以使用Pro套餐的所有功能。与Pro版用户相比,它可以在Claude模型上进行更多的聊天查询,而Pro版用户的聊天次数已经是免费用户的五倍。团队计划还提供更大的上下文窗口,这意味着人们可以要求Claude聊天机器人分析长篇文档,并保持复杂的来回对话。该公司表示,它还能为团体提供更多的管理控制。用户可以在应用程序上切换Pro版订阅或团队计划,尤其适合那些希望在工作和个人生活中使用 Claude 的用户。Anthropic于今年 3 月发布了Claude 3 系列机型。它有三种尺寸:中型的 Claude Sonnet、最大的 Claude Opus 和公司最小的 Claude Haiku。去年 9 月,亚马逊向 Anthropic投资 40 亿美元。 ... PC版: 手机版:

封面图片

Anthropic 发布了更强大的 Claude 3 AI 模型

Anthropic 发布了更强大的 Claude 3 AI 模型 当地时间3月4日,由谷歌和亚马逊共同投资的人工智能初创公司 Anthropic 宣布推出 Claude 3 人工智能模型系列。该系列包括三个版本:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus,每个后续模型都提供越来越强大的性能。目前 Claude 3 系列可支持处理 200k tokens 的上下文。其中 Opus 和 Sonnet 现已可在和 Claude API 中使用,Haiku 即将推出。据该初创公司称,该系列中功能最强大的 Claude 3 Opus 在各种基准测试中均优于竞争对手 OpenAI 的 AI 模型 GPT-4 和谷歌的 Gemini 1.0 Ultra。

封面图片

OPENAI 的竞争对手 Anthropic 刚刚发布了新模型 Claude 2.1

OPENAI 的竞争对手 Anthropic 刚刚发布了新模型 Claude 2.1 就在 OpenAI 陷入危机之际,Anthropic 推出了一款新的模型。Anthropic 是一家由谷歌支持的人工智能初创公司,由前 OpenAI 工程师创立。 Anthropic 公司宣布,其聊天机器人 Claude 2.1 的最新更新可以为专业级用户一次消化多达 20 万个 tokens,据称相当于 500 多页的材料。 该公司还表示,Claude 产生幻觉或撒谎的频率只有以前的一半,而且它还能通过可定制的工具完成搜索网页或使用计算器等操作。 聊天机器人现在还支持自定义、持续性的指令,并有一个新的测试窗口用于尝试提示。 、

封面图片

Anthropic发布了Claude 3模型,当然,从测试结果来看比GPT-4强很多。

Anthropic发布了Claude 3模型,当然,从测试结果来看比GPT-4强很多。 该系列包括三种最先进的型号(按功能升序排列):Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。支持100万Token上下文。 你现在可以在Claude开通Claude Pro使用最强大的Claude 3 Opus模型。 详细介绍: Haiku是市场上智能类别中最快速、最具成本效益的模型。它可以在不到三秒的时间内阅读一篇arXiv上信息密集、数据丰富的研究论文(约10,000个标记),包括图表和图形。 对于绝大多数工作负载,Sonnet比Claude 2和Claude 2.1快2倍,并具有更高水平的智能。它擅长需要快速响应的任务,如知识检索或销售自动化。 Claude 3型号具有与其他领先型号相媲美的复杂视觉能力。它们可以处理各种视觉格式,包括照片、图表、图形和技术图解。 Opus、Sonnet和Haiku更不太可能拒绝回答接近系统底线的提示,相比以往的模型,克劳德3模型表现出更加细致的请求理解,识别真实伤害,并且拒绝回答无害提示的频率大大降低。 与Claude 2.1相比,Opus在这些具有挑战性的开放性问题上的准确性(或正确答案)实现了两倍的改进,同时也展现出了降低的错误答案水平。 所有三个模型都能够接受超过100万个标记的输入,可能会向需要增强处理能力的特定客户提供这一功能。 Claude 3模型更擅长遵循复杂的多步指令。它们特别擅长遵循品牌语调和响应指南,并开发用户可以信任的客户体验。此外,Claude 3模型更擅长生成流行的结构化输出,如JSON格式。 Opus和Sonnet现已可在API中使用,该API现已普遍可用,使开发人员能够立即注册并开始使用这些模型。Haiku将很快可用。 详细信息:

封面图片

Anthropic 发布 Claude 2,一个更强大的人工智能聊天机器人

Anthropic 发布 Claude 2,一个更强大的人工智能聊天机器人 在 Anthropic 公司推出其 ChatGPT 竞争对手 Claude 仅5个月后,该公司又推出了更新版,承诺提供更长的答案、更详细的推理、支持PDF文件上传以及总体上更好的表现。 更新版本 Claude 2 现已可供美国和英国用户使用。它现在可以处理多达 100,000 个tokens,即大约 75,000 个单词,或者用户可以让 Claude 消化和分析的几百页文档,大大高于之前版本的 9,000 个token限制。在人工智能中,tokens是你的输入提示被分解成的碎片,以便模型可以更容易地处理它们,因此 Claude 有能力“消化”用户数据。 这种能力的增强也将转化为更长、更细致的响应。该公司宣布, Claude 2 甚至能够生成“最多数千个tokens”的短篇小说。其编码能力也有所提高,在Codex HumanEval基准测试中的得分从 56% 上升至 71.2%。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人