AI 也玩裙带关系？当上评委后狂为自己人加分

AI也玩裙带关系？当上评委后狂为自己人加分LMSYS提出了一个全新的AI考试，其中使用了两大冠军模型GPT-4Turbo和Claude3Opus作为考官，结果发现它们的"裙带关系"实在难以忽视......当GPT-4作为评审时，OpenAI系列模型呈现集体上大分的景象；而换Claude3上位后画风180°大转弯，OpenAI家族落马的同时Anthropic鸡犬飞升。研究员还发现两位AI考官的裁判风格截然不同，Claude3不愿意给出苛刻的分数，它特别犹豫宣称谁比谁"明显更好"。相比之下，当GPT-4识别出影响答案的错误时，它会给出明显较低的分数来惩罚考生。Claude3也发现了这些错误，但它倾向于将之视为小问题，并在评分时宽大处理。价值判断也是，像在编码问题上，Claude3会选择最具教育价值的回答，提供简单的结构而不依赖外部库。然而GPT-4会优先考虑最实用的答案，无论其对用户的教育价值如何。关注频道@TestFlightCN

在Telegram中查看

相关推荐

中信证券：Anthropic 推出 Claude3 全面超越 GPT-4，仍持续看好 AI 算力层面

中信证券：Anthropic推出Claude3全面超越GPT-4，仍持续看好AI算力层面中信证券研报指出，北京时间3月4日晚，Anthropic，一家获得谷歌和亚马逊投资的初创公司，宣布发布其最新的通用大语言模型Claude3。Claude3Opus标志着模型能力的实质性飞跃，实现了在全方位能力上对GPT-4的超越，尽管优势微弱，但其成就不容小觑，使其成为全球唯一能与GPT-4匹敌的模型。投资层面来看，Claude3对于视频多模态的重视亦强调今年多模态将会是发展的重心。具体而言应用层面，随着底层模型算法能力提升，应用端场景有望实现0到1的突破，软件、互联网有望率先受益。除去应用端的投资机会，硬件端的需求也必然会随着多模态的技术进步而不断提高，我们仍然持续看好AI算力层面，尤其是得益于商业端成熟而带来的更多的AI推理侧算力的机会。

Anthropic 发布了更强大的 Claude 3 AI 模型

Anthropic发布了更强大的Claude3AI模型当地时间3月4日，由谷歌和亚马逊共同投资的人工智能初创公司Anthropic宣布推出Claude3人工智能模型系列。该系列包括三个版本：Claude3Haiku、Claude3Sonnet和Claude3Opus，每个后续模型都提供越来越强大的性能。目前Claude3系列可支持处理200ktokens的上下文。其中Opus和Sonnet现已可在claude.ai和ClaudeAPI中使用，Haiku即将推出。据该初创公司称，该系列中功能最强大的Claude3Opus在各种基准测试中均优于竞争对手OpenAI的AI模型GPT-4和谷歌的Gemini1.0Ultra。——

lobalGPT

网站名称：GlobalGPT网站功能：聚合AI网站简介：一个聚合了多款AI模型的工具。包含GPT-3.5、GPT-4、Claude3Opus、Claude3Sonnet、DALLE-3、Midjourney。GPT-3.5可以无限免费使用。GPT-4可以试用，1美金差不多10万字。自己去搞GPT4或Claude3容易被封，这样聚合使用还是很安全方便的。网站链接：

4月2日，亚马逊云科技（AWS在中国的名称）在北京举办生成式AI沟通会，重点展示了一个月前发布的Claude3系列大模型。根据母

4月2日，亚马逊云科技（AWS在中国的名称）在北京举办生成式AI沟通会，重点展示了一个月前发布的Claude3系列大模型。根据母公司Anthropic的数据，Claude3Opus在十多项常用模型能力评估数据集上，得分全超过GPT-4。一位亚马逊云科技人士表示，AWS并没有在中国境内的服务器上部署Claude3。和微软Azure一样，中国公司可以通过AWS全球提供的Bedrock服务，申请调用在其他地区部署的Claude3模型，完成计算。上述亚马逊云科技的人士说，Claude3系列模型发布后，他们收到了大量中国公司的合作需求。（晚点LatePost）

uckDuckGo AI Chat

网站名称：DuckDuckGoAIChat网站功能：AI聊天网站简介：DuckDuckGo提供的匿名访问的AI模型。包括GPT-3.5、Claude3、开源的Llama3和Mixtral3。用户的聊天内容不会被用于AI训练。可以选择不同的AI模型进行聊天，每个模型的响应不同。提供的模型包括OpenAI的GPT-3.5Turbo、Anthropic的Claude3Haiku、MetaLlama3和MistralAI的Mixtral8x7B。网站链接：

Anthropic 发布最新 AI 模型 Claude 3.5

Anthropic发布最新AI模型Claude3.5OpenAI竞争对手Anthropic周四发布了其最新的AI模型Claude3.5Sonnet。今年3月，Anthropic推出了Claude3系列模型。随后，OpenAI在5月份推出了GPT-4o。Anthropic表示，Claude3.5Sonnet比之前的主打模型Claude3Opus速度更快，也是Anthropic新的Claude3.5家族的第一款模型。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人