Claude 已经接近 GPT4

Claude 已经接近 GPT4 ChatGPT 3.5 很快就要被开源超过了 : Announcing the Week 2 update for the Chatbot Arena leaderboard! We've added some new models that are showcasing strong performance. Currently, @OpenAI's GPT-4 and @AnthropicAI's Claude lead the pack, with open-source models in hot pursuit. More findings:

相关推荐

封面图片

最近在试着用 Claude2 配合 GPT4 写代码

最近在试着用 Claude2 配合 GPT4 写代码 Claude2 像是一个研发高 P,超长的上下文让它能把整个项目吞进去,你只要提需求,他给你提供代码的设计方法,该弄几个类,变量怎么传递之类的,但你真让这位高 P 自己写代码,就会发现他大概是带团队太久,动手能力已经退化了,经常会出一些低级错误 GPT4 比较像是应届生,代码工整,一半以上的可以一次跑通,但是应届生的脑容量比较有限,不能理解太长的上下文,喂代码的时候必须要把在哪儿改,改什么都说清楚 让两个 AI 配合的结果,就是提需求给 Claude,让高 P 把需求翻译成生成代码的 Prompt ,然后复习粘贴给小弟干活儿,完美

封面图片

超越GPT-4 Claude 3超大杯成新王

超越GPT-4 Claude 3超大杯成新王 而且不仅仅是Claude 3的超大杯Opus成功登顶,藐视众生,Claude 3家族的整体表现都非常亮眼。大杯Claude 3 Sonnet排到了第4,就连最小的Claude 3 HaiKu都达到了GPT-4水平!那么相比于基准测试跑分,这个榜单的权威性如何?Chatbot Arena(聊天机器人竞技场),由伯克利团队开发,每个模型在榜单上的得分,完全取决于真实人类用户的使用体验。我们来看一下打分规则:用户同时向两个匿名模型(比如ChatGPT、Claude、Llama)提出任何相同的问题,然后根据回答投票给表现更好的模型;如果一次回答不能确定,用户可以继续聊天,直到确定获胜者;如果在对话中透露了模型的身份,则不会计算投票。Chatbot Arena平台收集了超过40万人的投票,来计算出这个大模型的等级分排行榜,最终找出谁是冠军。显然,这回Claude 3赢麻了。我们来看一下真实的战况:在所有非平局对战中, A对B获胜的比例:模型之间的对战次数(无平局):GPT-4终于被干掉了,对此,有网友开始恶搞:刚在当地超市看到Sam Altman,他一脸震惊地看着手机。几秒钟后,他真的倒下了,开始剧烈颤抖。经过2分钟的摇晃和尖叫,一群人围绕着他试图帮助他。但令人惊讶的是,他在2分钟后停止了颤抖和尖叫,站起来,拿起手机开始拨打一个号码。“准备释放......”咱也不知道Altman要放的是不是GPT-5。网友表示,Claude确实要比GPT勤奋得多:GPT-4-Turbo非常懒惰。在任何编码任务中,它都会跳过部分代码,并表示“你自己知道要放什么”,而Opus可以毫无遗漏地输出整个代码。就连Claude-2也通过自己的勤奋和耐心感动了这位网友。更有比较务实的网友指出,Haiku的排名更为重要,因为它是第一个可以以极低成本即时运行的LLM,并且具有足够高的智能来提供实时客户服务。盲生你发现了华点!Claude 3 Haiku不仅与原始版本的GPT-4表现一样好,关键是相当便宜,在一些平台你甚至可以免费使用。大家于是纷纷夸起了Claude 3 Haiku:智能相当于GPT-4,价格比GPT-3.5便宜,而且据说模型可能只有20B大小。有网友表示,OpenAI不行啦,现在Anthropic才是老大,一时间,平台内外充满了快活的空气。ChatGPT 一年零增长回过头来再看ChatGPT这边,从最初的高光、王者,到现在不能说泯然众人吧,反正多少有点寒酸了。最近,有关统计平台曝出:ChatGPT在过去一年中居然零增长!最近一段时间,ChatGPT一直被指责懒惰、系统提示臃肿,而另一方面竞争也愈演愈烈Claude 3和Gemini Pro 1.5现在都提供了比GPT-4多8倍的上下文长度和更好的recall能力。对于几乎每个ChatGPT用例,现在都有大量垂直化的AI初创公司,致力于满足用户的需求,而不是满足于现有的ChatGPT界面和捆绑工具它们有更好的UI选项(例如IDE和图像/文档编辑器)、更好的原生集成(例如用于cron重复操作)、更好的隐私/企业保护(例如用于医疗保健和金融),更细粒度的控制(GPT的默认RAG是幼稚且不可配置的)。以下是一些网友列举了相关垂直领域的产品,以及公司的融资情况:从某种意义上说,OpenAI的B2B和B2C部分相互竞争,这在某种程度上是良性竞争OpenAI可以使用来自ChatGPT的RLHF数据进行训练。而新的GPT商店可以看作是,OpenAI为了抓住这些垂直化需求的尝试。与其离开平台,到处支付20美元/月,为什么不留在ChatGPT内部而只需要支付一次,让OpenAI将理论上的收入分配给GPT创作者?对此,大部分创作者也很明智,一般只向ChatGPT发布精简版的应用,作为自己主要平台的一个渠道。在游戏机业务中,众所周知,购买决策往往是由平台独占游戏驱动的。从某种意义上说,ChatGPT的未来会以平台专属模型为特色。所以,当Sora甚至是GPT-5公开发布时,一定会率先登陆自家的平台,也许那将是下一轮ChatGPT的增长点。 ... PC版: 手机版:

封面图片

GitHub19k星项目:无需注册,免费使用GPT4,GPT3.5,Claude等AI模型。ForeFront还支持不同的助手,

GitHub19k星项目:无需注册,免费使用GPT4,GPT3.5,Claude等AI模型。ForeFront还支持不同的助手,比如毕加索,托尼斯塔克,爱因斯坦等等 目前OpenAI已经发了警告邮件要求开发者撤下此系统,否则开发者将面临法律诉讼。

封面图片

花了跨度2周、总体接近6~8个小时,和 ChatGPT/Claude/GPT4 一起写了一篇探讨 ChatGPT 类型的 LLM

花了跨度2周、总体接近6~8个小时,和 ChatGPT/Claude/GPT4 一起写了一篇探讨 ChatGPT 类型的 LLM AI 和人类关系的文章,但是只修改了3/4部分,所以不能发出来。 开始有点理解当年看香蕉写书的时候“写了但是不能发”的心情和状态了。

封面图片

Claude 3 对比 GPT 4 的优势

Claude 3 对比 GPT 4 的优势 1⃣ 更高的智能水平:Claude 3 的旗舰模型 Opus 在多个领域超越了 GPT-4 和谷歌的 Gemini 1.0 Ultra,包括本科和研究生水平的知识、数学和复杂任务理解。 2⃣ 更快的响应速度:Claude 3 可以在实时聊天、自动补全和数据提取等任务中提供几乎即时的响应。其中,Haiku 是市场上智能类别最快且性价比最高的模型,可以在不到三秒的时间内阅读一篇带有图表和图形的 arXiv 论文。 3⃣ 强大的图像处理能力:Claude 3 具备与其他领先模型相当的图像处理能力,可以处理各种视觉格式,包括照片、图表、图形和技术图解。 4⃣ 减少不必要的拒绝:相较于之前的模型,Claude 3 的模型(Opus、Sonnet 和 Haiku)更少地拒绝回答接近系统边界的提示,表现出更加细致的请求理解和更好的拒绝策略。

封面图片

Claude 2 is here!

Claude 2 is here! Hi there, The wait is over! Our latest model, Claude 2, is now available through our API. Read more here. We’ve heard from users that Claude 2 is easy to converse with, better at explaining its thinking, much less likely to produce harmful outputs, and has a longer memory. We’ve also made significant improvements on coding, math, and reasoning compared to our previous models. Access the new model As an API user, you can continue using Console as your workstation for optimizing prompts, managing your keys, and accessing developer resources. You're able to call Claude 2 and benefit from its performance improvements today. As an AI enthusiast, anyone in the US and UK can now use the public-facing chat experience at claude.ai as their day-to-day AI assistant. Join our Discord community We’ve also just launched our official Anthropic Discord server where you can chat about Claude 2, discover resources for building with our API, explore prompt ideas, provide feedback including new feature requests, and showcase your project. Accept your invite here! What builders are saying AI content creation platform Jasper has already integrated Claude 2 to help its customers break through writer's block and adapt content to different formats and languages. "We are really happy to be among the first to offer Claude 2 to our customers, bringing enhanced semantics, up-to-date knowledge training, improved reasoning for complex prompts, and the ability to effortlessly remix existing content with a 3X larger context window," said Greg Larson, VP of engineering at Jasper. "We are proud to help our customers stay ahead of the curve through partnerships like this one with Anthropic." AI coding platform Sourcegraph has paired Claude 2 with its code graph to power the AI assistant, Cody. The assistant answers technical questions, and generates code within its text editor. “When it comes to AI coding, devs need fast and reliable access to context about their unique codebase and a powerful LLM with a large context window and strong general reasoning capabilities,” says Quinn Slack, CEO & Co-founder of Sourcegraph. “The slowest and most frustrating parts of the dev workflow are becoming faster and more enjoyable. Thanks to Claude 2, Cody’s helping more devs build more software that pushes the world forward.” We can’t wait to see what you build with our latest model! Warmly, The Anthropic Team

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人