所以对于中文来说,GPT4 api 的价格低于 GPT3

所以对于中文来说,GPT4api的价格低于GPT3G_Z: @doteyGPT-4的tokenizer对中文效率好了很多,以前8000token是3800个中文字左右,现在能用到6700字.英文单词比token大概是1.35.中文的话,GPT3比例大概是2.1(单中文字~2.1token)而新的ChatGPTAPI和GPT4则是大幅优化到了1.2.(以前用约34万字的三体黑暗森林做实验)

相关推荐

封面图片

GPT-4 发布

GPT-4发布GPT-4实现了以下几个方面的飞跃式提升:强大的识图能力;文字输入限制提升至2.5万字;回答准确性显著提高;能够生成歌词、创意文本,实现风格变化。如果要从挑出一段精华,大概是下面摘出来的这两分钟时间,演示的是:1.在草稿本上用纸笔画出一个非常粗糙的草图2.拍照告诉GPT我要做一个网站长这样,给我生成网站代码3.网站(确切的说是1个页面)做完,总共历时十秒钟左右#视频()来自:雷锋频道:@kejiqu群组:@kejiquchat投稿:@kejiqubot

封面图片

李彦宏:文心大模型4.0在中文上已经超过了GPT4

百度创始人李彦宏在3月9日表示,在中文上,文心大模型4.0已经超过了GPT-4。他以写诗为例,称像文心大模型等大模型都能写,但GPT不行。“比如写一首诗,很多大模型都能写,但如果我要求写一首《沁园春》词牌的词,那GPT就完全搞蒙了,它不知道第一句话是4个字还是5个字。”过去一年,文心一言用户数量已突破1亿,文心大模型已升级至4.0版本,经过重构的百度文库等AI原生应用也实现了各类数据指标的提升。via匿名标签:#百度#文心一言频道:@GodlyNews1投稿:@GodlyNewsBot

封面图片

最近在试着用 Claude2 配合 GPT4 写代码

最近在试着用Claude2配合GPT4写代码Claude2像是一个研发高P,超长的上下文让它能把整个项目吞进去,你只要提需求,他给你提供代码的设计方法,该弄几个类,变量怎么传递之类的,但你真让这位高P自己写代码,就会发现他大概是带团队太久,动手能力已经退化了,经常会出一些低级错误GPT4比较像是应届生,代码工整,一半以上的可以一次跑通,但是应届生的脑容量比较有限,不能理解太长的上下文,喂代码的时候必须要把在哪儿改,改什么都说清楚让两个AI配合的结果,就是提需求给Claude,让高P把需求翻译成生成代码的Prompt,然后复习粘贴给小弟干活儿,完美

封面图片

OpenAI 于 5 月 13 日发布 GPT-4o 后,一些中文用户发现其 token 库中充满了垃圾词汇。普林斯顿大学博士生

OpenAI于5月13日发布GPT-4o后,一些中文用户发现其token库中充满了垃圾词汇。普林斯顿大学博士生蔡天乐(音)分析了最长的100个中文token,发现大部分与赌博或色情有关,只有少数是常用词。大型语言模型通过分词解析文本。GPT-4o的新分词工具在处理多语言任务上优于前代产品,但其中文token库因数据清理不足而被污染。这导致GPT-4o的大语言模型无法正确解析这些词汇,并可能被用来绕过OpenAI的安全措施。前代的GPT-3.5和GPT-4则没有这种问题。这些无效数据主要来源于垃圾和色情网站,这些网站通过劫持无关内容来提升搜索引擎排名,从而污染了GPT-4o的训练数据。目前尚不清楚其他语言是否受影响,但有用户报告韩语token库也有类似问题。(,竹新社)

封面图片

OpenAI于5月13日发布GPT-4o后,一些中文用户发现其token库中充满了垃圾词汇。普林斯顿大学博士生蔡天乐(音)分析了

OpenAI于5月13日发布GPT-4o后,一些中文用户发现其token库中充满了垃圾词汇。普林斯顿大学博士生蔡天乐(音)分析了最长的100个中文token,发现大部分与赌博或色情有关,只有少数是常用词。大型语言模型通过分词解析文本。GPT-4o的新分词工具在处理多语言任务上优于前代产品,但其中文token库因数据清理不足而被污染。这导致GPT-4o的大语言模型无法正确解析这些词汇,并可能被用来绕过OpenAI的安全措施。前代的GPT-3.5和GPT-4则没有这种问题。这些无效数据主要来源于垃圾和色情网站,这些网站通过劫持无关内容来提升搜索引擎排名,从而污染了GPT-4o的训练数据。目前尚不清楚其他语言是否受影响,但有用户报告韩语token库也有类似问题。()

封面图片

李彦宏:文心大模型4.0在中文上已经超过了GPT-4

李彦宏:文心大模型4.0在中文上已经超过了GPT-4百度创始人李彦宏在3月9日表示,在中文上,文心大模型4.0已经超过了GPT-4。他以写诗为例,称像文心大模型等大模型都能写,但GPT不行。“比如写一首诗,很多大模型都能写,但如果我要求写一首《沁园春》词牌的词,那GPT就完全搞蒙了,它不知道第一句话是4个字还是5个字。”过去一年,文心一言用户数量已突破1亿,文心大模型已升级至4.0版本,经过重构的百度文库等AI原生应用也实现了各类数据指标的提升。(全天候科技)线索:@ZaiHuabot投稿:@TNSubmbot频道:@TestFlightCN

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人