这个Thread论证了的是GPT4 的逻辑推理能力相对 ChatGPT3.5 有 5%到 30%的提升,但怀疑这是测试集被学习了

这个Thread论证了的是GPT4 的逻辑推理能力相对 ChatGPT3.5 有 5%到 30%的提升,但怀疑这是测试集被学习了,在增加问题难度之后,提升效果只有 3% 得出的结论是GPT4提升源于学了更多的模式而已。 虽然看起来没毛病,但是如果真的这么简单就好了。 Subbarao Kambhampati (కంభంపాటి సుబ్బారావు): Afraid of #GPT4 going rogue and killing y'all? Worry not. Planning has got your back. You can ask it to solve any simple few step classical planning problem and snuff that "AGI spark" well and good. Let me explain.. 1/

相关推荐

封面图片

这个Thread论证了的是GPT4 的逻辑推理能力相对 ChatGPT3.5 有 5%到 30%的提升,但怀疑这是测试集被学习了

这个Thread论证了的是GPT4 的逻辑推理能力相对 ChatGPT3.5 有 5%到 30%的提升,但怀疑这是测试集被学习了,在增加问题难度之后,提升效果只有 3% 得出的结论是GPT4提升源于学了更多的模式而已。 虽然看起来没毛病,但是如果真的这么简单就好了。

封面图片

根据 Meta 自有模型和GPT4的打分比较。

根据 Meta 自有模型和GPT4的打分比较。 通过自有模型打分,Llama2在v3的时候就打赢了ChatGPT3.5 v5 的时候胜率接近 70%,都没用到 PPO v5 加了PPO之后进一步拔高了上限,到达 75% 左右。 通过GPT4打分的话,在v5才超过 ChatGPT 3.5

封面图片

和 @PepsinY 昨晚做非完备逻辑推理测试,Claude+和GPT4是唯二的能猜到凶手的模型,谷歌的用英文测了不行,完全不理

和 @PepsinY 昨晚做非完备逻辑推理测试,Claude+和GPT4是唯二的能猜到凶手的模型,谷歌的用英文测了不行,完全不理解要干嘛。 至于 Claude+和GPT4谁强呢?还是 GPT4,因为删除最后半句话后只有GPT4还能猜出凶手。

封面图片

ChatGPT3.5 国内今年是可能做出来的。

ChatGPT3.5 国内今年是可能做出来的。 GPT4 国内今年没可能,明年感觉也难。 GPT5 已经训练了半年,训练完加上半年安全测试,明年也该出来了。 到时候就是国外 5 vs 国内3.5。 生产力的碾压。

封面图片

一觉醒来,GPT4 出来了!总结要点:

一觉醒来,GPT4 出来了!总结要点: -提升专业学术能力,各类考试超过90%的人类 -真正的多模态,可以把纸笔画的原型直接写出网页代码。读论文时可以知道插图含意。 -英文准确度提升,70%到85.5% -中文准确度提升,达到 GPT3.5 的英文水平。 目前限量供应中,只有 ChatGPT Plus 和 Poe 订阅可以体验。

封面图片

GitHub19k星项目:无需注册,免费使用GPT4,GPT3.5,Claude等AI模型。ForeFront还支持不同的助手,

GitHub19k星项目:无需注册,免费使用GPT4,GPT3.5,Claude等AI模型。ForeFront还支持不同的助手,比如毕加索,托尼斯塔克,爱因斯坦等等 目前OpenAI已经发了警告邮件要求开发者撤下此系统,否则开发者将面临法律诉讼。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人