传奇兄妹挑战奥特曼全球最强AI大模型一夜易主

传奇兄妹挑战奥特曼全球最强AI大模型一夜易主此次Claude3一次性发了三个模型：Claude3Haiku、Claude3Sonnet与Claude3Opus，能力从低到高，能让客户有更多选择。为了更直观地看不同模型的特点，官方贴出了Claude3模型与多个能力基准相当的的同行模型的比较：从这个对比上可以看到Claude在多项AI系统常用评估标准能力中的领先。三个模型中最强的Opus，所有能力皆表现优异，尤其是在研究生级别专家推理（GPQA）、数学、编码等赛道，算得上遥遥领先，完全碾压GPT-4，以及Gemini1.0Ultra。不过，在关注技术领先性之外，此次Claude3的发布还有哪些值得思考的亮点？01出走OpenAI的分歧者Anthropic再次重点强调了Claude大模型的安全性，这也是Anthropic的价值观。提到这一点，就不得不说Anthopic的创立。Anthropic的创始人DarioAmodei和DanielaAmodei兄妹俩，二人原本都是OpenAI的员工。在OpenAI刚刚成立时，原来在Stripe担任CTO的GregBrockman加入OpenAI后，先是从Google将Dario挖了过来负责AI安全，随着OpenAI的发展，Dario一路做到OpenAI研究副总裁的位置。接着Brockman将妹妹Daniela也从Stripe挖到了OpenAI，Daniela同样也是做到了OpenAI安全和政策副总裁的位置。兄妹俩是西方社会非常典型的理想主义者，尤其是妹妹，一直关注穷人、腐败、地球环境等等全球议题。他们加入OpenAI的原因，除了Brockman的原因，最重要的是，当初OpenAI的定位是开源的非营利机构，目标是要为人类构建安全的AGI。不过，随着马斯克的离开和随后微软的加入，OpenAI的定位和价值观都开始发生变化。Dario和Daniela，以及OpenAI的很多员工开始与Altman的理念发生分歧，后来兄妹俩，加上曾在OpenAI负责GPT-3模型的TomBrown一共7个人从OpenAI离开，并在2021年1月成立了Anthropic。Anthropic的意思是“与人类有关的”，从名字就可以看到Anthropic的目标和愿景。Amodei兄妹一直强调，他们的团队有着高度一致的AI安全愿景，创始团队七个人的共同特点是重视AI安全，包括语言模型的可解释性、可控可靠，想让模型更安全，更符合人类价值观，目标是“建立有用、诚实和无害的系统”。这些话术听上去并不陌生，因为这就是OpenAI最初广为人知的愿景的2.0版。但在卖身微软后，商业变成了OpenAI的第一要义，加上对于AI风险不加节制的态度，和宫斗后组织结构上的巨大变化，也让OpenAI和Altman的形象逐渐变得负面。虽然Anthropic的成立时间要比OpenAI晚很多，但Claude的发布时间并不比ChatGPT晚多少，甚至开发完成的时间比ChatGPT更早。根据外媒的报道，Claude之所以没有在第一时间对外发布的最重要原因，是因为Amodei兄妹担心安全问题，认为还需要时日，确保模型安全后，才能真正向世人发布。这也给了ChatGPT和OpenAI率先引发全球关注的机会。不管怎样，目前Claude已经成长为ChatGPT最大的对手，即便是Google，以及作为OpenAI发起人马斯克的大模型，与GPT4和Claude3还是有一段距离的。02安全对策：宪法AI技术从成立之初，Anthropic就有专门的AI安全团队，专门负责降低虚假信息、生物安全滥用、选举干预、隐私等方面的风险，尽可能增强安全性的透明度。Amodei兄妹曾经提到现有的大型语言模型“会说一些可怕、有偏见或不好的话”，比如教用户自杀或杀人，种族主义或性别歧视等等，AI安全研究需要降低甚至排除它们做坏事的可能性。为此，他们在Claude训练中引入了一种叫做“宪法AI（ConstitutionalAI，CAI）”的技术。根据Anthropic的官方解释，在训练过程中，研究人员会定义一些符合人类公序良俗的原则来约束系统的行为，如不得产生威胁人身安全的内容，不得违反隐私或造成伤害等。这些原则包括联合国人权宣言、Apple服务条款的一部分、Anthropic的AI研究实验室原则等等。确保为大模型提供正确的价值观。当然，和世界上任何一种号称要秉持公序良俗的大模型价值观一样，这些原则的选择完全是主观的，并且一定会受到训练它的研究人员的影响。Anthropic也承认这一点，但也表示绝对的公平、正确的价值观肯定是不存在的，只能是尽可能纳入更多元的文化和价值观。该技术的关键在于，研究人员会先训练一个价值观正确的AI，再用它监督训练其他AI，通过AI模型之间的互动与反馈来优化系统，而不是人与模型的互动。该方法被称为基于AI反馈的强化学习（ReinforcementLearningfromAIFeedback，RLAIF），理论上对人类更加可靠与透明。该技术一定程度上牺牲了语言生成的自由度，但理念无疑却是比较受欢迎的，毕竟如今全球对AI的警惕也是越来越高，以马斯克为首的很多人都要求政府严格监管AI，而且这种趋势也正在逐渐形成，各种法规也在陆续出台。值得注意的是，RLAIF在提高大模型安全性的同时，其实还解决了生成式AI互动中的拒绝或回避的问题。在RLAIF之前，行业训练生成式AI的方法都是“基于人类反馈的强化学习”（ReinforcementLearningfromHumanFeedback，RLHF），也就是我们熟知的外包人工给AI做人工筛选、标识、排序等等。但这种人工训练也会产生很多问题，比如人类普遍缺乏积极处理负面要求的能力，这就会导致AI在面对很多负面的问题，和人类的反馈一样，会说，我不知道，我不理解，或者干脆拒绝回答。这也引发一个新问题，不能给出答案意味着没有用，但若是给出答案，又意味着有害，价值观不正确。这也是Anthropic提出RLAIF，并在此基础上训练出“宪法AI”的缘由。在此次Claude3发布时，Anthropic解释说，此前Claude模型经常因为理解不到位，而不必要地拒绝回答。而这一次的Claude3系列，已经在这方面取得了显著改进。在面对可能触及系统安全边界的询问时，大大减少了拒绝回应的情况。如图所示，Claude3模型对请求表现出更细致的理解，能够识别真正的危害，并且因为对上下文理解的增强，拒绝回答无害的提示的频率要要少得多。03OpenAI会收复失地吗作为成立不过两年多的初创公司，眼下无论是规模、估值、收益等等方面，Anthropic都完全无法与OpenAI相提并论。不过，AI安全和人类的利益作为最大的亮点和卖点，这或许会帮Anthropic走出一条与OpenAI不一样的路。虽然短期内难以全面超越OpenAI，但Anthropic的目标并不小，不包括前几轮的投资在内，Anthropic计划在未来筹集50亿美元，以与OpenAI竞争，并进入十几个行业。Anthropic的投资人团队非常强大，包括Skype联合创始人JaanTallinn、Google、Salesforce、Zoom、SK和其他投资方。其中Google用3亿美元换取了该公司10%的股份。这种关系被很多人看作最初微软和OpenAI之间的合作关系，即微软出资，用来支持OpenAI的研究。后来的事情大家也都清楚了，如马斯克的诉状中所说，GPT4本质已经变成微软的产品，OpenAI已经变成了微软的闭源子公司，OpenAI在开发且不断完善AGI以最大化微软的利润，而不是造福人类。不过目前Google与Anthropic的关系，仍仅限于Google是Anthropic的技术支持和资金提供方，而且双方在大模型领域还是竞争对手。至于未来是否会朝微软和OpenAI的方向发生变化，一切都很难料。Claude3发布后，立刻吸引了全球的关注，并被称行业称作“全球最强AI模型”，一夜之间就取代了GPT4的位置。有人在狂欢，为AI技术的飞速进步欢欣鼓舞；也有人为AI领域出现了另一个价值观正确、能制衡OpenAI的巨头而欣慰；当然，更多人将目光投向OpenAI，并且对GPT5寄予了很大的希望，认为GPT5极有可能收复失地，在大语言模型主战场扳回一局。GPT5到底能有多强大？去年Altman在公开的演讲中，提到OpenAI已经开发出了比GPT4更强大、更难以想象的东西，远超人们的期待...PC版：https://www.cnbeta.com.tw/articles/soft/1422484.htm手机版：https://m.cnbeta.com.tw/view/1422484.htm

在Telegram中查看

相关推荐

Anthropic 发布最新 AI 模型 Claude 3.5

Anthropic发布最新AI模型Claude3.5OpenAI竞争对手Anthropic周四发布了其最新的AI模型Claude3.5Sonnet。今年3月，Anthropic推出了Claude3系列模型。随后，OpenAI在5月份推出了GPT-4o。Anthropic表示，Claude3.5Sonnet比之前的主打模型Claude3Opus速度更快，也是Anthropic新的Claude3.5家族的第一款模型。

全球最强大模型一夜易主 GPT-4被全面超越

全球最强大模型一夜易主GPT-4被全面超越几项数学类评测都是用0-shot超越GPT-4的4-8shot。除此之外，此前就以长下文窗口见长的Claude，此次全系列大模型可提供200K上下文窗口，并且接受超过100万Tokens输入。Gemini1.5Pro：嗯？目前可以免费体验第二强Sonnet，Opus最强版供ClaudePro付费用户使用，但大模型竞技场也可以白嫖。于是乎，网友们已经开始疯玩上了。（Doge）另外，Opus和Sonnet也开放API访问，开发者可以立即使用。有人直接艾特奥特曼：好了，你现在可以发布GPT-5了。不过奥特曼可能还在烦马斯克的诉讼……最新最强大模型发布此次Claude3家族共有三个型号：小杯Haiku、中杯Sonnet以及大杯Opus，成本和性能依次递增。首先，在性能参数上，Claude3全系多方面全面提升。其中Opus在MMLU、GPQA、GSM8K等评估基准上领先于其他所有模型：还有在视觉能力上，它能可以处理各种视觉格式，包括照片、图表、图形和技术图表。对于这样性能结果，有专业人士表达了自己的看法。比如爱丁堡大学博士生、中文大模型知识评估基准C–Eval提出者之一符尧就表示，像MMLU/GSM8K/HumanEval这些基准，已经严重饱和：所有模型的表现都相同。他认为，真正区分模型性能基准的是MATHandGPQA。另外，在拒绝回答人类问题方面，Claude3也前进了一大步，拒绝回答的可能性显著降低在上下文以及记忆能力上，他们用大海捞针（NeedleInAHaystack，NIAH）来评估衡量大模型从大量数据中准确召回信息的能力。结果Claude3Opus不仅实现了近乎完美的召回率，超过99%的准确率。而且在某些情况下，它甚至能识别出“针“句似乎是人为插入原文的，从而识别出评估本身的局限性。还在生物知识、网络相关知识等方面取得了进步，但出于负责任的考虑，仍处于AI安全级别2（ASL-2）。其次，在响应时间上，Claude3大幅缩短，做到近乎实时。官方介绍，即将发布的小杯Haiku能够在三秒内阅读并理解带有图表的长度约10ktoken的arXiv论文。而中杯Sonnet能够在智能水平更高的基础上，速度比Claude2和Claude2.1快2倍，尤其擅长知识检索或自动化销售等需快速响应的任务。大杯Opus的智能水平最高，但速度不减，与Claude2和Claude2.1近似。官方对三款型号的模型也有清晰的定位。大杯Opus：比别家模型更智能。适用于复杂的任务自动化、研发和制定策略；中杯Sonnet：比其他同类模型更实惠。更适合规模化。适用于数据处理、RAG、在中等复杂度工作流程中节省时间；小杯Haiku：比同类模型更快速、实惠。适用于与用户实时互动，以及在简单工作流程中节省成本；在价格方面，最便宜的小杯定价0.25美元/1Mtokens输入，最贵的大杯定价75美元/1Mtokens输入对比GPT-4Turbo，大杯价格确实高出不少，也能体现AnthropicAI对这款模型非常有信心。第一手实测反馈既如此，那就先免费来尝尝鲜~目前官方页面已经更新，Claude展现了“理解和处理图像”这一功能，包括推荐风格改进、从图像中提取文本、将UI转换为前端代码、理解复杂的方程、转录手写笔记等。即使是模糊不清的有年代感的手记文档，也能准确OCR识别：底下写着：你正在使用他们第二大智能模型Claude3Sonnet。然鹅，可能是人太多的原因，尝试了几次都显示“Failed”不过，网友们也已经po出了一些测试效果，比如让Sonnet解谜题。为其提供一些示例，要求它找出数字之间的关系，比如“1Dimitris2Q3”，意思是3是1和2相加的结果。结果Sonnet成功解出-1.1加8等于6.9，所以“X”的值应该是6.9：还有网友发现Sonnet现在也可以读取ASCII码了，直呼：这是GPT-4++的水平了。在编程任务上，谁写的代码好先不说，Claude3至少不会像GPT-4一样偷懒。还有体验到了Opus的玩家，在线给模型挖坑，可opus硬是完美躲避不上当：初看这效果，感觉还行。这时候应该艾特OpenAI：GPT-5在哪里？好了，感兴趣的朋友，可以戳下方链接体验啦~https://claude.ai/参考链接：[1]https://www.anthropic.com/news/claude-3-family[2]https://twitter.com/AnthropicAI/status/1764653830468428150/photo/1...PC版：https://www.cnbeta.com.tw/articles/soft/1422389.htm手机版：https://m.cnbeta.com.tw/view/1422389.htm

OpenAI竞争对手Anthropic发布最新AI模型Claude 3.5

OpenAI竞争对手Anthropic发布最新AI模型Claude3.5PANews6月21日消息，据新浪科技科技报道，OpenAI竞争对手Anthropic周四发布了其最新的AI模型Claude3.5Sonnet。今年3月，Anthropic推出了Claude3系列模型。随后，OpenAI在5月份推出了GPT-4o。Anthropic表示，Claude3.5Sonnet比之前的主打模型Claude3Opus速度更快，也是Anthropic新的Claude3.5家族的第一款模型。https://www.panewslab.com/zh/sqarticledetails/dj2x74c0.html

Anthropic发布其最强大AI模型Claude 3.5

Anthropic发布其最强大AI模型Claude3.5今年3月，Anthropic推出了Claude3系列模型。随后，OpenAI在5月份推出了GPT-4o。Anthropic今日表示，Claude3.5Sonnet比之前的主打模型Claude3Opus速度更快，也是Anthropic新的Claude3.5家族的第一款模型。目前，Claude3.5Sonnet已在公司网站Claude.ai和ClaudeiPhone应用程序中免费提供。ClaudePro和Team的订阅者也可以接入最新的模型。此外，它还通过AnthropicAPI、AmazonBedrock和谷歌云的VertexAI提供。Anthropic在一篇博客文章中称：“它在把握细微差别、幽默和复杂指示方面有显著进步，在以自然、合理的语气撰写高质量内容方面也十分出色。此外，它还可以编写、编辑和执行代码。”在发布新模型的同时，Anthropic还在Claude.ai上引入“Artifacts”，这是一个新功能，可以扩展用户与Claude的交互方式。当用户要求Claude生成代码片段、文本文档或网站设计等内容时，这些Artifacts会出现在他们对话旁边的专用窗口中。这创建了一个动态工作区，用户可以在其中实时查看、编辑和构建Claude的创作，并将AI生成的内容无缝地集成到他们的项目和工作流中。如今，随着Anthropic和OpenAI等初创企业在生成式AI领域的崛起，它们已经与谷歌、亚马逊、微软和Meta等科技巨头并驾齐驱，成为AI军备竞赛的一部分。据预计，该市场的规模在未来十年内将突破1万亿美元。 ...PC版：https://www.cnbeta.com.tw/articles/soft/1435501.htm手机版：https://m.cnbeta.com.tw/view/1435501.htm

Anthropic 发布了更强大的 Claude 3 AI 模型

Anthropic发布了更强大的Claude3AI模型当地时间3月4日，由谷歌和亚马逊共同投资的人工智能初创公司Anthropic宣布推出Claude3人工智能模型系列。该系列包括三个版本：Claude3Haiku、Claude3Sonnet和Claude3Opus，每个后续模型都提供越来越强大的性能。目前Claude3系列可支持处理200ktokens的上下文。其中Opus和Sonnet现已可在claude.ai和ClaudeAPI中使用，Haiku即将推出。据该初创公司称，该系列中功能最强大的Claude3Opus在各种基准测试中均优于竞争对手OpenAI的AI模型GPT-4和谷歌的Gemini1.0Ultra。——

uckDuckGo AI Chat

网站名称：DuckDuckGoAIChat网站功能：AI聊天网站简介：DuckDuckGo提供的匿名访问的AI模型。包括GPT-3.5、Claude3、开源的Llama3和Mixtral3。用户的聊天内容不会被用于AI训练。可以选择不同的AI模型进行聊天，每个模型的响应不同。提供的模型包括OpenAI的GPT-3.5Turbo、Anthropic的Claude3Haiku、MetaLlama3和MistralAI的Mixtral8x7B。网站链接：

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人