所以对于中文来说，GPT4 api 的价格低于 GPT3

GPT-4 发布

GPT-4发布GPT-4实现了以下几个方面的飞跃式提升：强大的识图能力；文字输入限制提升至2.5万字；回答准确性显著提高；能够生成歌词、创意文本，实现风格变化。如果要从挑出一段精华，大概是下面摘出来的这两分钟时间，演示的是：1.在草稿本上用纸笔画出一个非常粗糙的草图2.拍照告诉GPT我要做一个网站长这样，给我生成网站代码3.网站(确切的说是1个页面)做完，总共历时十秒钟左右#视频()来自：雷锋频道：@kejiqu群组：@kejiquchat投稿：@kejiqubot

李彦宏：文心大模型4.0在中文上已经超过了GPT4

百度创始人李彦宏在3月9日表示，在中文上，文心大模型4.0已经超过了GPT-4。他以写诗为例，称像文心大模型等大模型都能写，但GPT不行。“比如写一首诗，很多大模型都能写，但如果我要求写一首《沁园春》词牌的词，那GPT就完全搞蒙了，它不知道第一句话是4个字还是5个字。”过去一年，文心一言用户数量已突破1亿，文心大模型已升级至4.0版本，经过重构的百度文库等AI原生应用也实现了各类数据指标的提升。via匿名标签:#百度#文心一言频道:@GodlyNews1投稿:@GodlyNewsBot

最近在试着用 Claude2 配合 GPT4 写代码

最近在试着用Claude2配合GPT4写代码Claude2像是一个研发高P，超长的上下文让它能把整个项目吞进去，你只要提需求，他给你提供代码的设计方法，该弄几个类，变量怎么传递之类的，但你真让这位高P自己写代码，就会发现他大概是带团队太久，动手能力已经退化了，经常会出一些低级错误GPT4比较像是应届生，代码工整，一半以上的可以一次跑通，但是应届生的脑容量比较有限，不能理解太长的上下文，喂代码的时候必须要把在哪儿改，改什么都说清楚让两个AI配合的结果，就是提需求给Claude，让高P把需求翻译成生成代码的Prompt，然后复习粘贴给小弟干活儿，完美

OpenAI 于 5 月 13 日发布 GPT-4o 后，一些中文用户发现其 token 库中充满了垃圾词汇。普林斯顿大学博士生

OpenAI于5月13日发布GPT-4o后，一些中文用户发现其token库中充满了垃圾词汇。普林斯顿大学博士生蔡天乐（音）分析了最长的100个中文token，发现大部分与赌博或色情有关，只有少数是常用词。大型语言模型通过分词解析文本。GPT-4o的新分词工具在处理多语言任务上优于前代产品，但其中文token库因数据清理不足而被污染。这导致GPT-4o的大语言模型无法正确解析这些词汇，并可能被用来绕过OpenAI的安全措施。前代的GPT-3.5和GPT-4则没有这种问题。这些无效数据主要来源于垃圾和色情网站，这些网站通过劫持无关内容来提升搜索引擎排名，从而污染了GPT-4o的训练数据。目前尚不清楚其他语言是否受影响，但有用户报告韩语token库也有类似问题。（，竹新社）

OpenAI于5月13日发布GPT-4o后，一些中文用户发现其token库中充满了垃圾词汇。普林斯顿大学博士生蔡天乐（音）分析了

OpenAI于5月13日发布GPT-4o后，一些中文用户发现其token库中充满了垃圾词汇。普林斯顿大学博士生蔡天乐（音）分析了最长的100个中文token，发现大部分与赌博或色情有关，只有少数是常用词。大型语言模型通过分词解析文本。GPT-4o的新分词工具在处理多语言任务上优于前代产品，但其中文token库因数据清理不足而被污染。这导致GPT-4o的大语言模型无法正确解析这些词汇，并可能被用来绕过OpenAI的安全措施。前代的GPT-3.5和GPT-4则没有这种问题。这些无效数据主要来源于垃圾和色情网站，这些网站通过劫持无关内容来提升搜索引擎排名，从而污染了GPT-4o的训练数据。目前尚不清楚其他语言是否受影响，但有用户报告韩语token库也有类似问题。（）

李彦宏：文心大模型4.0在中文上已经超过了GPT-4