AI 也玩裙带关系?当上评委后狂为自己人加分

AI也玩裙带关系?当上评委后狂为自己人加分LMSYS提出了一个全新的AI考试,其中使用了两大冠军模型GPT-4Turbo和Claude3Opus作为考官,结果发现它们的"裙带关系"实在难以忽视......当GPT-4作为评审时,OpenAI系列模型呈现集体上大分的景象;而换Claude3上位后画风180°大转弯,OpenAI家族落马的同时Anthropic鸡犬飞升。研究员还发现两位AI考官的裁判风格截然不同,Claude3不愿意给出苛刻的分数,它特别犹豫宣称谁比谁"明显更好"。相比之下,当GPT-4识别出影响答案的错误时,它会给出明显较低的分数来惩罚考生。Claude3也发现了这些错误,但它倾向于将之视为小问题,并在评分时宽大处理。价值判断也是,像在编码问题上,Claude3会选择最具教育价值的回答,提供简单的结构而不依赖外部库。然而GPT-4会优先考虑最实用的答案,无论其对用户的教育价值如何。关注频道@TestFlightCN

相关推荐

封面图片

中信证券:Anthropic 推出 Claude3 全面超越 GPT-4,仍持续看好 AI 算力层面

中信证券:Anthropic推出Claude3全面超越GPT-4,仍持续看好AI算力层面中信证券研报指出,北京时间3月4日晚,Anthropic,一家获得谷歌和亚马逊投资的初创公司,宣布发布其最新的通用大语言模型Claude3。Claude3Opus标志着模型能力的实质性飞跃,实现了在全方位能力上对GPT-4的超越,尽管优势微弱,但其成就不容小觑,使其成为全球唯一能与GPT-4匹敌的模型。投资层面来看,Claude3对于视频多模态的重视亦强调今年多模态将会是发展的重心。具体而言应用层面,随着底层模型算法能力提升,应用端场景有望实现0到1的突破,软件、互联网有望率先受益。除去应用端的投资机会,硬件端的需求也必然会随着多模态的技术进步而不断提高,我们仍然持续看好AI算力层面,尤其是得益于商业端成熟而带来的更多的AI推理侧算力的机会。

封面图片

Anthropic 发布了更强大的 Claude 3 AI 模型

Anthropic发布了更强大的Claude3AI模型当地时间3月4日,由谷歌和亚马逊共同投资的人工智能初创公司Anthropic宣布推出Claude3人工智能模型系列。该系列包括三个版本:Claude3Haiku、Claude3Sonnet和Claude3Opus,每个后续模型都提供越来越强大的性能。目前Claude3系列可支持处理200ktokens的上下文。其中Opus和Sonnet现已可在claude.ai和ClaudeAPI中使用,Haiku即将推出。据该初创公司称,该系列中功能最强大的Claude3Opus在各种基准测试中均优于竞争对手OpenAI的AI模型GPT-4和谷歌的Gemini1.0Ultra。——

封面图片

lobalGPT

网站名称:GlobalGPT网站功能:聚合AI网站简介:一个聚合了多款AI模型的工具。包含GPT-3.5、GPT-4、Claude3Opus、Claude3Sonnet、DALLE-3、Midjourney。GPT-3.5可以无限免费使用。GPT-4可以试用,1美金差不多10万字。自己去搞GPT4或Claude3容易被封,这样聚合使用还是很安全方便的。网站链接:

封面图片

4月2日,亚马逊云科技(AWS在中国的名称)在北京举办生成式AI沟通会,重点展示了一个月前发布的Claude3系列大模型。根据母

4月2日,亚马逊云科技(AWS在中国的名称)在北京举办生成式AI沟通会,重点展示了一个月前发布的Claude3系列大模型。根据母公司Anthropic的数据,Claude3Opus在十多项常用模型能力评估数据集上,得分全超过GPT-4。一位亚马逊云科技人士表示,AWS并没有在中国境内的服务器上部署Claude3。和微软Azure一样,中国公司可以通过AWS全球提供的Bedrock服务,申请调用在其他地区部署的Claude3模型,完成计算。上述亚马逊云科技的人士说,Claude3系列模型发布后,他们收到了大量中国公司的合作需求。(晚点LatePost)

封面图片

uckDuckGo AI Chat

网站名称:DuckDuckGoAIChat网站功能:AI聊天网站简介:DuckDuckGo提供的匿名访问的AI模型。包括GPT-3.5、Claude3、开源的Llama3和Mixtral3。用户的聊天内容不会被用于AI训练。可以选择不同的AI模型进行聊天,每个模型的响应不同。提供的模型包括OpenAI的GPT-3.5Turbo、Anthropic的Claude3Haiku、MetaLlama3和MistralAI的Mixtral8x7B。网站链接:

封面图片

Anthropic 发布最新 AI 模型 Claude 3.5

Anthropic发布最新AI模型Claude3.5OpenAI竞争对手Anthropic周四发布了其最新的AI模型Claude3.5Sonnet。今年3月,Anthropic推出了Claude3系列模型。随后,OpenAI在5月份推出了GPT-4o。Anthropic表示,Claude3.5Sonnet比之前的主打模型Claude3Opus速度更快,也是Anthropic新的Claude3.5家族的第一款模型。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人