这个Thread论证了的是GPT4 的逻辑推理能力相对 ChatGPT3.5 有 5%到 30%的提升,但怀疑这是测试集被学习了

这个Thread论证了的是GPT4 的逻辑推理能力相对 ChatGPT3.5 有 5%到 30%的提升,但怀疑这是测试集被学习了,在增加问题难度之后,提升效果只有 3% 得出的结论是GPT4提升源于学了更多的模式而已。 虽然看起来没毛病,但是如果真的这么简单就好了。 Subbarao Kambhampati (కంభంపాటి సుబ్బారావు): Afraid of #GPT4 going rogue and killing y'all? Worry not. Planning has got your back. You can ask it to solve any simple few step classical planning problem and snuff that "AGI spark" well and good. Let me explain.. 1/

相关推荐

封面图片

这个Thread论证了的是GPT4 的逻辑推理能力相对 ChatGPT3.5 有 5%到 30%的提升,但怀疑这是测试集被学习了

这个Thread论证了的是GPT4 的逻辑推理能力相对 ChatGPT3.5 有 5%到 30%的提升,但怀疑这是测试集被学习了,在增加问题难度之后,提升效果只有 3% 得出的结论是GPT4提升源于学了更多的模式而已。 虽然看起来没毛病,但是如果真的这么简单就好了。

封面图片

根据 Meta 自有模型和GPT4的打分比较。

根据 Meta 自有模型和GPT4的打分比较。 通过自有模型打分,Llama2在v3的时候就打赢了ChatGPT3.5 v5 的时候胜率接近 70%,都没用到 PPO v5 加了PPO之后进一步拔高了上限,到达 75% 左右。 通过GPT4打分的话,在v5才超过 ChatGPT 3.5

封面图片

chatGPT好像爆出bug了,用这个链接可以白嫖 gpt4,免费账号就能,阿喵我测试了下,通过正常进去的提问,他说是chatG

chatGPT好像爆出bug了,用这个链接可以白嫖 gpt4,免费账号就能,阿喵我测试了下,通过正常进去的提问,他说是chatGPT3.5,而且无法区分周树人和鲁迅。通过下面的链接问他是chatGPT3.5还是4,结果说是4。图是我通过下面的链接打开chatGPT。 #chatGPT 链接: 频道 | 网站 | 群聊 | 投稿

封面图片

和 @PepsinY 昨晚做非完备逻辑推理测试,Claude+和GPT4是唯二的能猜到凶手的模型,谷歌的用英文测了不行,完全不理

和 @PepsinY 昨晚做非完备逻辑推理测试,Claude+和GPT4是唯二的能猜到凶手的模型,谷歌的用英文测了不行,完全不理解要干嘛。 至于 Claude+和GPT4谁强呢?还是 GPT4,因为删除最后半句话后只有GPT4还能猜出凶手。

封面图片

ChatGPT3.5 国内今年是可能做出来的。

ChatGPT3.5 国内今年是可能做出来的。 GPT4 国内今年没可能,明年感觉也难。 GPT5 已经训练了半年,训练完加上半年安全测试,明年也该出来了。 到时候就是国外 5 vs 国内3.5。 生产力的碾压。

封面图片

一觉醒来,GPT4 出来了!总结要点:

一觉醒来,GPT4 出来了!总结要点: -提升专业学术能力,各类考试超过90%的人类 -真正的多模态,可以把纸笔画的原型直接写出网页代码。读论文时可以知道插图含意。 -英文准确度提升,70%到85.5% -中文准确度提升,达到 GPT3.5 的英文水平。 目前限量供应中,只有 ChatGPT Plus 和 Poe 订阅可以体验。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人