Yam Peleg老哥认为Claude 3跨越了专业编程人员可以使用的门槛,GPT-4对初学者很有帮助,但是很少又专业开发者使用

Yam Peleg老哥认为Claude 3跨越了专业编程人员可以使用的门槛,GPT-4对初学者很有帮助,但是很少又专业开发者使用它帮助编程,但是Claude 3 有越来越多的专业用户使用。 完整翻译: 我认为 Claude 3 跨越了一个有趣的门槛,或者说非常接近这个门槛:专业用户的门槛。这是第一次一个 AI ...

相关推荐

封面图片

Anthropic发布了Claude 3模型,当然,从测试结果来看比GPT-4强很多。

Anthropic发布了Claude 3模型,当然,从测试结果来看比GPT-4强很多。 该系列包括三种最先进的型号(按功能升序排列):Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。支持100万Token上下文。 你现在可以在Claude开通Claude Pro使用最强大的Claude 3 Opus模型。 详细介绍: Haiku是市场上智能类别中最快速、最具成本效益的模型。它可以在不到三秒的时间内阅读一篇arXiv上信息密集、数据丰富的研究论文(约10,000个标记),包括图表和图形。 对于绝大多数工作负载,Sonnet比Claude 2和Claude 2.1快2倍,并具有更高水平的智能。它擅长需要快速响应的任务,如知识检索或销售自动化。 Claude 3型号具有与其他领先型号相媲美的复杂视觉能力。它们可以处理各种视觉格式,包括照片、图表、图形和技术图解。 Opus、Sonnet和Haiku更不太可能拒绝回答接近系统底线的提示,相比以往的模型,克劳德3模型表现出更加细致的请求理解,识别真实伤害,并且拒绝回答无害提示的频率大大降低。 与Claude 2.1相比,Opus在这些具有挑战性的开放性问题上的准确性(或正确答案)实现了两倍的改进,同时也展现出了降低的错误答案水平。 所有三个模型都能够接受超过100万个标记的输入,可能会向需要增强处理能力的特定客户提供这一功能。 Claude 3模型更擅长遵循复杂的多步指令。它们特别擅长遵循品牌语调和响应指南,并开发用户可以信任的客户体验。此外,Claude 3模型更擅长生成流行的结构化输出,如JSON格式。 Opus和Sonnet现已可在API中使用,该API现已普遍可用,使开发人员能够立即注册并开始使用这些模型。Haiku将很快可用。 详细信息:

封面图片

超越GPT-4 Claude 3超大杯成新王

超越GPT-4 Claude 3超大杯成新王 而且不仅仅是Claude 3的超大杯Opus成功登顶,藐视众生,Claude 3家族的整体表现都非常亮眼。大杯Claude 3 Sonnet排到了第4,就连最小的Claude 3 HaiKu都达到了GPT-4水平!那么相比于基准测试跑分,这个榜单的权威性如何?Chatbot Arena(聊天机器人竞技场),由伯克利团队开发,每个模型在榜单上的得分,完全取决于真实人类用户的使用体验。我们来看一下打分规则:用户同时向两个匿名模型(比如ChatGPT、Claude、Llama)提出任何相同的问题,然后根据回答投票给表现更好的模型;如果一次回答不能确定,用户可以继续聊天,直到确定获胜者;如果在对话中透露了模型的身份,则不会计算投票。Chatbot Arena平台收集了超过40万人的投票,来计算出这个大模型的等级分排行榜,最终找出谁是冠军。显然,这回Claude 3赢麻了。我们来看一下真实的战况:在所有非平局对战中, A对B获胜的比例:模型之间的对战次数(无平局):GPT-4终于被干掉了,对此,有网友开始恶搞:刚在当地超市看到Sam Altman,他一脸震惊地看着手机。几秒钟后,他真的倒下了,开始剧烈颤抖。经过2分钟的摇晃和尖叫,一群人围绕着他试图帮助他。但令人惊讶的是,他在2分钟后停止了颤抖和尖叫,站起来,拿起手机开始拨打一个号码。“准备释放......”咱也不知道Altman要放的是不是GPT-5。网友表示,Claude确实要比GPT勤奋得多:GPT-4-Turbo非常懒惰。在任何编码任务中,它都会跳过部分代码,并表示“你自己知道要放什么”,而Opus可以毫无遗漏地输出整个代码。就连Claude-2也通过自己的勤奋和耐心感动了这位网友。更有比较务实的网友指出,Haiku的排名更为重要,因为它是第一个可以以极低成本即时运行的LLM,并且具有足够高的智能来提供实时客户服务。盲生你发现了华点!Claude 3 Haiku不仅与原始版本的GPT-4表现一样好,关键是相当便宜,在一些平台你甚至可以免费使用。大家于是纷纷夸起了Claude 3 Haiku:智能相当于GPT-4,价格比GPT-3.5便宜,而且据说模型可能只有20B大小。有网友表示,OpenAI不行啦,现在Anthropic才是老大,一时间,平台内外充满了快活的空气。ChatGPT 一年零增长回过头来再看ChatGPT这边,从最初的高光、王者,到现在不能说泯然众人吧,反正多少有点寒酸了。最近,有关统计平台曝出:ChatGPT在过去一年中居然零增长!最近一段时间,ChatGPT一直被指责懒惰、系统提示臃肿,而另一方面竞争也愈演愈烈Claude 3和Gemini Pro 1.5现在都提供了比GPT-4多8倍的上下文长度和更好的recall能力。对于几乎每个ChatGPT用例,现在都有大量垂直化的AI初创公司,致力于满足用户的需求,而不是满足于现有的ChatGPT界面和捆绑工具它们有更好的UI选项(例如IDE和图像/文档编辑器)、更好的原生集成(例如用于cron重复操作)、更好的隐私/企业保护(例如用于医疗保健和金融),更细粒度的控制(GPT的默认RAG是幼稚且不可配置的)。以下是一些网友列举了相关垂直领域的产品,以及公司的融资情况:从某种意义上说,OpenAI的B2B和B2C部分相互竞争,这在某种程度上是良性竞争OpenAI可以使用来自ChatGPT的RLHF数据进行训练。而新的GPT商店可以看作是,OpenAI为了抓住这些垂直化需求的尝试。与其离开平台,到处支付20美元/月,为什么不留在ChatGPT内部而只需要支付一次,让OpenAI将理论上的收入分配给GPT创作者?对此,大部分创作者也很明智,一般只向ChatGPT发布精简版的应用,作为自己主要平台的一个渠道。在游戏机业务中,众所周知,购买决策往往是由平台独占游戏驱动的。从某种意义上说,ChatGPT的未来会以平台专属模型为特色。所以,当Sora甚至是GPT-5公开发布时,一定会率先登陆自家的平台,也许那将是下一轮ChatGPT的增长点。 ... PC版: 手机版:

封面图片

Coinbase 高管:加密货币普及需提供更友好的初学者应用程序

Coinbase 高管:加密货币普及需提供更友好的初学者应用程序 Coinbase 工程高级总监 Chintan Turakhia 表示,要吸引首批十亿加密货币用户,需提供更友好的初学者应用程序。目前的用户注册流程复杂且存在诸多障碍,包括设置钱包、支付交易费及购买区块链原生代币等。为了简化这一过程,Coinbase 推出了智能钱包,使用更简单的登录选项,如账户名和密码,取代复杂的种子短语。此外,新的智能钱包还由 Coinbase 赞助交易费用,进一步降低了使用门槛。Turakhia 认为,消费类应用将是加密货币大众普及的途径,如基于 Telegram 的迷你游戏 Hamster Kombat,其用户数在 81 天内突破了 2.39 亿。

封面图片

,一个开源的Linux下C++轻量级Web服务器,主要是教学用,助力初学者快速实践网络编程,搭建属于自己的.

,一个开源的Linux下C++轻量级Web服务器,主要是教学用,助力初学者快速实践网络编程,搭建属于自己的服务器. *使用 线程池 + 非阻塞socket + epoll(ET和LT均实现) + 事件处理(Reactor和模拟Proactor均实现) 的并发模型 *使用状态机解析HTTP请求报文,支持解析GET和POST请求 *访问服务器数据库实现web端用户注册、登录功能,可以请求服务器图片和视频文件 *实现同步/异步日志系统,记录服务器运行状态 *经Webbench压力测试可以实现上万的并发连接数据交换

封面图片

提供示例的一种方法是以先前对话的形式。在给 Claude 时使用不同的对话定界符,例如“ H: ”而不是“ Human: ”和“

提供示例的一种方法是以先前对话的形式。在给 Claude 时使用不同的对话定界符,例如“ H: ”而不是“ Human: ”和“ A: ”而不是“ Assistant: ”使用此方法的示例。这有助于防止示例与对话中的其他对话混淆。下面是例子(图 5): 疑难病例(可选) 如果你可以预见 Claude 在您的输入中可能遇到的困难或不寻常的情况,请在提示中描述它们,并告诉 Claude 遇到它们时该怎么做。 如果你在Claude的回答中发现偶尔但持续的失败,则此信息可能有助于添加到你的提示中。例如(图 6): 接下来是第一部分的第二小结,优化你的提示 一旦你有了满意的提示模板,就可以开始测试它了。然后(如果需要)你可以根据 Claude 在测试中的表现来改进您的提示。 收集一组不同的示例输入 最好使用代表你将要求 Claude 处理的真实数据的输入集来测试你的提示。请务必包含 Claude 可能遇到的任何困难输入或边缘情况。 通过使用这些输入测试你的提示,可以估计Claude在实际操作中的表现。这也可以帮助你看到Claude遇到了哪些困难。 在开发提示模板时,尽可能多地获取输入是很好的,我们建议至少20个或更多,具体取决于任务。 预留(“保留”)一组测试输入 当提出测试输入时,我们建议使用单独的“提示开发数据”和“测试数据”集。两个(或更多)组应该代表真实的输入。 使用你的提示开发数据来评估Claude的表现如何。 迭代你的提示,直到Claude在此数据上始终获得良好表现。 (可选)生成综合数据 如果你想要更多的输入数据,但是又没有很多,你可以启动另一个Claude实例来为你生成额外的输入文本进行测试。如果你解释一下什么是好的输入数据,然后给几个例子,你可以从Claude获得更多这样的例子。 实验和迭代 优化一个提示就像进行一系列实验一样。你运行测试,解释结果,然后根据结果调整一个变量。 当Claude未通过测试时,尝试找出失败的原因。调整你的提示以解决该故障点。 调整提示可能涉及: 1、更明确地编写规则或添加新规则。 2、通过将类似的示例和规范输出添加到提示中,向 Claude 展示如何在提示本身中正确处理示例。 在提示中添加规则和示例,直到你在代表性输入集上获得良好的性能。我们建议还执行“保留测试”。 奖励:请Claude评估其输出 可以使用 Claude 来“自我评估”它之前给出的答案。比如: 1、如果你认为模型可能犯了错误,请让模型检查其工作 2、添加一个额外的尽职调查步骤到一个任务 3、根据你的指示,将响应分类为好或坏,或者说出它更喜欢两个初始响应中的哪一个以及原因(例如,以便你可以决定使用哪一个) 比如下面的例子(图 7): 如果 Claude 在第一次尝试中未能识别出一些错误,你可以尝试添加第二遍(图 8): 你可以通过下面会说到的“提示链接”自动执行这样的“额外注意”步骤。 到这里第一部分提示设计的内容就结束了,整理不易,感谢支持。

封面图片

全球最强大模型一夜易主 GPT-4被全面超越

全球最强大模型一夜易主 GPT-4被全面超越 几项数学类评测都是用0-shot超越GPT-4的4-8 shot。除此之外,此前就以长下文窗口见长的Claude,此次全系列大模型可提供 200K 上下文窗口,并且接受超过100万Tokens输入。Gemini 1.5 Pro:嗯?目前可以免费体验第二强Sonnet,Opus最强版供Claude Pro付费用户使用,但大模型竞技场也可以白嫖。于是乎,网友们已经开始疯玩上了。(Doge)另外,Opus和Sonnet也开放API访问,开发者可以立即使用。有人直接艾特奥特曼:好了,你现在可以发布GPT-5了。不过奥特曼可能还在烦马斯克的诉讼……最新最强大模型发布此次Claude 3家族共有三个型号:小杯Haiku、中杯Sonnet以及大杯Opus,成本和性能依次递增。首先,在性能参数上,Claude 3全系多方面全面提升。其中Opus在MMLU、GPQA、GSM8K等评估基准上领先于其他所有模型:还有在视觉能力上,它能可以处理各种视觉格式,包括照片、图表、图形和技术图表。对于这样性能结果,有专业人士表达了自己的看法。比如爱丁堡大学博士生、 中文大模型知识评估基准C – Eval提出者之一符尧就表示,像MMLU / GSM8K / HumanEval这些基准,已经严重饱和:所有模型的表现都相同。他认为,真正区分模型性能基准的是MATH and GPQA。另外,在拒绝回答人类问题方面,Claude 3也前进了一大步,拒绝回答的可能性显著降低在上下文以及记忆能力上,他们用大海捞针(Needle In A Haystack,NIAH)来评估衡量大模型从大量数据中准确召回信息的能力。结果Claude 3 Opus 不仅实现了近乎完美的召回率,超过 99% 的准确率。而且在某些情况下,它甚至能识别出 “针 “句似乎是人为插入原文的,从而识别出评估本身的局限性。还在生物知识、网络相关知识等方面取得了进步,但出于负责任的考虑,仍处于AI安全级别2(ASL-2)。其次,在响应时间上,Claude 3大幅缩短,做到近乎实时。官方介绍,即将发布的小杯Haiku能够在三秒内阅读并理解带有图表的长度约10k token的arXiv论文。而中杯Sonnet能够在智能水平更高的基础上,速度比Claude 2和Claude 2.1快2倍,尤其擅长知识检索或自动化销售等需快速响应的任务。大杯Opus的智能水平最高,但速度不减,与Claude 2和Claude 2.1近似。官方对三款型号的模型也有清晰的定位。大杯Opus:比别家模型更智能。适用于复杂的任务自动化、研发和制定策略;中杯Sonnet:比其他同类模型更实惠。更适合规模化。适用于数据处理、RAG、在中等复杂度工作流程中节省时间;小杯Haiku:比同类模型更快速、实惠。适用于与用户实时互动,以及在简单工作流程中节省成本;在价格方面,最便宜的小杯定价0.25美元/1M tokens输入,最贵的大杯定价75美元/1M tokens输入对比GPT-4 Turbo,大杯价格确实高出不少,也能体现AnthropicAI对这款模型非常有信心。第一手实测反馈既如此,那就先免费来尝尝鲜~目前官方页面已经更新,Claude展现了“理解和处理图像”这一功能,包括推荐风格改进、从图像中提取文本、将UI转换为前端代码、理解复杂的方程、转录手写笔记等。即使是模糊不清的有年代感的手记文档,也能准确OCR识别:底下写着:你正在使用他们第二大智能模型Claude 3 Sonnet。然鹅,可能是人太多的原因,尝试了几次都显示“Failed”不过,网友们也已经po出了一些测试效果,比如让Sonnet解谜题。为其提供一些示例,要求它找出数字之间的关系,比如“1 Dimitris 2 Q 3”,意思是3是1和2相加的结果。结果Sonnet成功解出-1.1加8等于6.9,所以“X”的值应该是6.9:还有网友发现Sonnet现在也可以读取 ASCII 码了,直呼:这是GPT-4 ++的水平了。在编程任务上,谁写的代码好先不说,Claude 3至少不会像GPT-4一样偷懒。还有体验到了Opus的玩家,在线给模型挖坑,可opus硬是完美躲避不上当:初看这效果,感觉还行。这时候应该艾特OpenAI:GPT-5在哪里?好了,感兴趣的朋友,可以戳下方链接体验啦~ ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人