这个Thread论证了的是GPT4 的逻辑推理能力相对 ChatGPT3.5 有 5%到 30%的提升，但怀疑这是测试集被学习了

这个Thread论证了的是GPT4 的逻辑推理能力相对 ChatGPT3.5 有 5%到 30%的提升，但怀疑这是测试集被学习了，在增加问题难度之后，提升效果只有 3% 得出的结论是GPT4提升源于学了更多的模式而已。虽然看起来没毛病，但是如果真的这么简单就好了。 Subbarao Kambhampati (కంభంపాటి సుబ్బారావు): Afraid of #GPT4 going rogue and killing y'all? Worry not. Planning has got your back. You can ask it to solve any simple few step classical planning problem and snuff that "AGI spark" well and good. Let me explain.. 1/

在Telegram中查看

相关推荐

这个Thread论证了的是GPT4 的逻辑推理能力相对 ChatGPT3.5 有 5%到 30%的提升，但怀疑这是测试集被学习了

这个Thread论证了的是GPT4 的逻辑推理能力相对 ChatGPT3.5 有 5%到 30%的提升，但怀疑这是测试集被学习了，在增加问题难度之后，提升效果只有 3% 得出的结论是GPT4提升源于学了更多的模式而已。虽然看起来没毛病，但是如果真的这么简单就好了。

和 @PepsinY 昨晚做非完备逻辑推理测试，Claude+和GPT4是唯二的能猜到凶手的模型，谷歌的用英文测了不行，完全不理

和 @PepsinY 昨晚做非完备逻辑推理测试，Claude+和GPT4是唯二的能猜到凶手的模型，谷歌的用英文测了不行，完全不理解要干嘛。至于 Claude+和GPT4谁强呢？还是 GPT4，因为删除最后半句话后只有GPT4还能猜出凶手。

GPT4 的四个能力示例

GPT4 的四个能力示例 - 画小人，对人体的结构理解和视觉能力 - 文字解谜，对空间的感知能力 - 对话分析，对人类对话的深度理解能力 - 代码解释，用自然语言推导代码运行结果读过《千脑智能》的朋友应该还记得，人类的大脑里有一个世界模型，并在此模型内进行预测，而GPT4里也初步展现出“世界模型”。要注意，这只是没有经过视觉训练的GPT4的早期版本。 GPT4 多模态版本的真正的实力，除了 OpenAI 还没人知道。

根据 Meta 自有模型和GPT4的打分比较。

根据 Meta 自有模型和GPT4的打分比较。通过自有模型打分，Llama2在v3的时候就打赢了ChatGPT3.5 v5 的时候胜率接近 70%，都没用到 PPO v5 加了PPO之后进一步拔高了上限，到达 75% 左右。通过GPT4打分的话，在v5才超过 ChatGPT 3.5

ChatGPT3.5 国内今年是可能做出来的。

ChatGPT3.5 国内今年是可能做出来的。 GPT4 国内今年没可能，明年感觉也难。 GPT5 已经训练了半年，训练完加上半年安全测试，明年也该出来了。到时候就是国外 5 vs 国内3.5。生产力的碾压。

一觉醒来，GPT4 出来了！总结要点：

一觉醒来，GPT4 出来了！总结要点： -提升专业学术能力，各类考试超过90%的人类 -真正的多模态，可以把纸笔画的原型直接写出网页代码。读论文时可以知道插图含意。 -英文准确度提升，70%到85.5% -中文准确度提升，达到 GPT3.5 的英文水平。目前限量供应中，只有 ChatGPT Plus 和 Poe 订阅可以体验。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人