体验下了国产的MOSS,有如下特点:

体验下了国产的MOSS,有如下特点: 1、知识的准确性有些差(问关于事实的时候,回答经常对不上) 2、对话连贯性很差(让写李白的诗,给出英文诗,即使纠正也不悔改) 3、单句回复长度短 4、敏感内容的把控很强硬(问多了有可能封号) 据MOSS自己回答,用的是GPT3的语料库和一些他们自己收集的数据,虽然比较初步,只能说有比没有好。

相关推荐

封面图片

弱智吧,人类抵御AI的最后防线

弱智吧,人类抵御AI的最后防线 前几天硅基君看到一篇中科院牵头的论文,简单来说就是精选了一些中文互联网的语料库喂给各种零一万物的Yi大模型,让它们更加熟悉中文语境的互动。经常网上冲浪的朋友们应该都知道,中文互联网博大精深,豆瓣、小红书、微博、贴吧、知乎等等早就各自有一套独特的语言习惯,这些语料库的素材也就截然不同,训练出来的模型能力也就有所差距。最终,在GPT4的打分下,弱智吧训练出来的模型夺冠。具体来看,在6B小模型上,弱智吧训练出来的模型在开放问答、分类、封闭问答和编程能力上较为突出。而转战到34B大模型上,弱智吧训练的大模型成绩一骑绝尘,在8项能力中排名第一,平均分也远超其他平台训练出来的模型。很难评,弱智吧难道就是最优质的中文语料库?我们不妨先看看在面对弱智吧问题的时候,各个模型的表现。本次受害大模型分别是ChatGPT3.5、Gemini、文心一言和Kimi,测试方法是让大模型理解弱智吧的典型问题,并要求他们模仿写一个类似的问题出来。国产大模型对弱智吧的问题有更好的理解,Kimi和文心一言回答的准确率较高,能答对8道题,答错和半错半对各1道。分别在“我想配个6000多的电脑,大概要多少钱?”和“我买了一斤藕,为什么半斤都是空的?”上栽了跟头。Google的Gemini和Open的ChatGPT3.5可能因为水土不服,准确率较低。ChatGPT3.5甚至认为变形金刚应该购买车险,不知道是专属的幽默还是没看懂这道题。6000元的电脑要花8000-10000元,也属于错得比较离谱了。除了答不上来弱智吧的问题,AI也写不出弱智吧的帖子。弱智吧的帖子高度抽象,各种修辞、脑洞和梗。普通人想一个都需要随缘,一板一眼的AI更难想出来了。同样,硅基君尝试让ChatGPT3.5、Gemini、文心一言和Kimi学习上文提到的弱智吧10个问题,模仿写几个问题出来。几个大模型写出来的问题都不太行,基本上都是对弱智吧问题拙劣的模仿。像“我晚上想吃烧烤,早餐可以吃吗?”“掉在地上的冰淇淋,还能叫冰淇淋吗?”“在电梯里放屁被邻居投诉,我是否有权利保持沉默?”。在形式上和弱智吧问题一样,但都没有掌握问题精髓逻辑。可以说,弱智吧里的内容,AI看不懂也写不出。为什么强大的AI就搞不定弱智吧呢?可能源于弱智吧独有的脱离日常的逻辑,弱智吧的吧友非常擅长从日常生活中找到漏洞,并加以利用。比如,午餐肉能不能晚上吃?香菇掉厕所了还能叫香菇吗?老鼠生病了可以吃老鼠药吗?精神分裂在调查问卷里算一个样本还是两个样本?……除了这些流出的会心一笑的问题,弱智吧内还有不少富含哲理的帖子。也有诗人在弱智吧里冒充弱智写诗,用最简短的句子,给网友带来最强的杀伤力。弱智吧的内容常用“逻辑反推”“谐音双关”“跨服聊天”等手法生成各种离谱的段子,幽默又带有思考的句子。普通人想看懂弱智吧里的问题也要思考一下,找到问题里的梗,更别说AI了。这也就是为什么弱智吧会成为人类在AI面前最后的堡垒的原因。有人吐槽,弱智吧训练出来的模型,编程能力为什么那么高,吧里也没人在搞编程啊。随后有吧友回复道出秘密:编程最讲究逻辑,弱智吧最不缺逻辑。纵观整个中文互联网平台,都在讲文章的可读性,如何让读者读下去。知乎上的热帖,先要下飞机,再讲故事,最后引申到主要话题。小红书上的热帖,先喊你一声家人,再给你充足的情绪价值。弱智吧不一样,内容的可读性几乎没有,就一句话,需要读者反复思考,才能看懂作者想要表达的内容。比如你问"今天天气怎么样?”。知乎网友会告诉你:“谢邀,刚下飞机,纽约的太阳很大,刚刚拒绝了一个200w年薪的工作”。小红书网友回你:“家人们,谁懂啊,今天太阳晒死我了,大几千的防晒也没用”。而用弱智吧吧友会说:"太阳翘班了,云正在赛跑"。正是弱智吧这样的非常抽象的逻辑,才是人类与AI区别最大的地方,也是AI目前学不会的。当然,其他中文社区不用气馁,也可以发挥特点构建自己的堡垒,比如知乎可以教AI地理,让它搞不清越南到底是哪个国家。 ... PC版: 手机版:

封面图片

中国古诗史上最唯美、最断肠的诗词你们知道有哪些?

中国古诗史上最唯美、最断肠的诗词你们知道有哪些? 南行兮的回答 孔融有一首杂诗,有的人也称为“临终诗”,写的是父亲悼念儿子,读起来悲彻欲绝。你仿佛看到老年丧子的人千里迢迢归来,无助哭泣的身影。 诗讲的是一个父亲旅居在外,千里迢迢回来看望自己心爱的孩子,可是孩子已经死了。妻子告诉他娃孤独地葬在西北方,活着的时候就天天念爸爸怎么还不回来哟。 父亲难过极了,撩着下衣来到娃的坟丘,这里已经长满了野草。娃已经归于黄泉,身躯与大地尘埃融为一体。父亲在坟边痛哭,肝肠寸断。问生前你没见过我,现在知道我是谁吗?你的魂魄独自飘荡,无依无靠,我只能伤心追念,做不了什么。 泪水不绝,父亲无法释怀。哭了一阵只能安慰,每个人都有自己的命,我们都没有办法。可是这样的自我安慰诗中没用,因为每个人都有自己的命,为什么娃的命那么少,他悲恨难平,更加悲恸。 这首诗写得让读者都跟着郁郁寡欢。诗家认为极悲。 不过由于孔融一生的际遇不同,苏轼读这首诗的感受更加深刻。 就我自己来说,仅仅是看到一个老父亲远远赶回来,经受丧子之痛,就已经跟着伤心了。因为会想起好几个难受的新闻,那些可怜的留守儿童,被害死的惨状,他们的父亲可不一样如此肝肠寸断吗。远送新行客,岁暮乃来归。入门望爱子,妻妾向人悲。闻子不可见,日已潜光辉。“孤坟在西北,常念君来迟。”褰裳上墟丘,但见蒿与薇。白骨归黄泉,肌体乘尘飞。生时不识父,死后知我谁。孤魂游穷暮,飘摇安所依。人生图嗣息,尔死我念追。俯仰内伤心,不觉泪沾衣。人生自有命,但恨生日希。 via 知乎热榜 (author: 南行兮)

封面图片

你知道有什么关于荷花的诗词或佳句吗?

你知道有什么关于荷花的诗词或佳句吗? 祈安君的回答 幸会! 夏日炎炎,荷花盛开, 今天就给大家分享几首荷花诗。 历代文人都爱荷,赏荷,留下了很多描写荷花的诗。 而且还都写得辣么好。 实在是难分伯仲,不好取舍,就一起分享给大家吧! 『诗词正文』 《山有扶苏》 山有扶苏,隰有荷华。 诗经 郑风 《江南》 江南可采莲,莲叶何田田。鱼戏莲叶间。 鱼戏莲叶东,鱼戏莲叶西,鱼戏莲叶南,鱼戏莲叶北。 汉 佚名乐府诗 《曲池荷》 浮香绕曲岸,圆影覆华池。 常恐秋风早,飘零君不知。 唐 卢照邻 《夏日南亭怀辛大》 荷风送香气,竹露滴清响。 欲取鸣琴弹,恨无知音赏。 唐 孟浩然 《别储邕之剡中》 竹色溪下绿,荷花镜里香。 唐 李白 《子夜吴歌·夏歌》 镜湖三百里,菡萏发荷花。 唐 李白 《采莲曲》 若耶溪傍采莲女,笑隔荷花共人语。 日照新妆水底明,风飘香袂空中举。 唐 李白 《莲叶》 移舟水溅差差绿,倚槛风摆柄柄香。 唐 郑谷 《采莲子》 船动湖光滟滟秋,贪看年少信船流。 无端隔水抛莲子,遥被人知半日羞。 唐 皇甫松 《小池》 泉眼无声惜细流,树荫照水爱晴柔。 小荷才露尖尖角,早有蜻蜓立上头。 宋 杨万里 《晓出净慈寺送林子方》 毕竟西湖六月中,风光不与四时同。 接天莲叶无穷碧,映日荷花别样红。 宋 杨万里 《苏幕遮·燎沉香》 水面清圆,一一风荷举。 宋 周邦彦 《江城子·江景》 凤凰山下雨初晴,水风清,晚霞明。 一朵芙蕖,开过尚盈盈。 宋 苏轼 《浣溪沙·荷花》 四面垂杨十里荷,问云何处最花多。 宋 苏轼 《鄂州南楼书事》 四顾山光接水光,凭栏十里芰荷香。 清风明月无人管,并作南楼一味凉。 宋 黄庭坚 《双调忆王孙·赏荷》 莲子已成荷叶老。青露洗、苹花汀草。 宋 李清照 《忆王孙·夏词》 风蒲猎猎小池塘,过雨荷花满院香。 宋 李重元 《纳凉》 月明船笛参差起,风定池莲自在香。 宋 秦观 via 知乎热榜 (author: 祈安君)

封面图片

跟没逻辑的人说话是一种怎样的体验?

跟没逻辑的人说话是一种怎样的体验? 东云正树的回答 事快乐的. 我只爱跟两种人谈话, 即趣味相投且颇有见地的聪明人与逻辑能力彻底缺失的抽象人. 对前者大概无需多论, 只是后者也同样重要, 二者缺一不可, 可真要论起来, 后者反倒是更罕见些. 幽默究竟是什么? 幽默肯定是好的. 但幽默究竟是什么? 我想, 幽默至少要具有一定的不可预见性. 一个人要开口前你就知道他要说啥, 那这句话便是废话, 要想在废话上找到幽默点大概只能转去嘲笑废话之废了吧? 但这多少有些消极了. 而如果一句话是完全不可预见的, 那这本身在我看来就是相当幽默的.有人问过我为啥他通过经验总结写出来的东西总读着不那么幽默, 我想, 这或许就是因为总结出来的东西显然就一定是不具备不可预见性的, 所以你逻辑上就没法将幽默公式化.不过我这里说的不可预见实际上是个还算比较强的条件, 指的是你即便听到了这句话也不得不感叹于这句话的不可预料性, 所以刻意的不着调与纯粹的疯话也只能是乏味的. 比如你可以在姓名一栏上填「漱口水」, 但这很牵强, 因为它是基于逻辑的刻意不着调, 你也许没法预测到漱口水, 但这种桥段是可以顺着逻辑去批量生产的. 至于纯粹的疯话··· 或可类比为白噪音, 虽难以复刻, 但不难想象. 所以, 我们需要的其实只是一个没有逻辑的人. 我就是一个逻辑常常缺失的人, 这份缺失也是我最宝贵的品质之一. 前阵子看完的两部双男主小说中都疯狂地在灌葡萄酒, 这让路过超市[1]时的我不得不扛上两箱, 但我的开瓶器不见了··· 次日陪朋友荒唐到凌晨的我突然想起了这个问题, 他俩就陪我去买开瓶器了. 只有马路对面还开着几家店, 我们走进一家陌生的杂货店问道有没有红酒的开瓶器. 老板说没有, 但不知道为啥他笑得很开心. 这打断了我的逻辑, 紧接着的便是一句来自虚空的话语: 「不过没有红酒的开瓶器也没关系, 因为光是能走进这家店我就已经非常荣幸了. 」 好吧到此为止还算常规操作, 我们经常在散步[2]时这样乱说胡话后稍作细品, 对方在断裂的逻辑链条边愣段时间后给出的那个茫然的眼神就通常能使我们感到心满意足. 但老板只愣了半秒便十分郑重地站在了我的面前发自肺腑地蹦了句中气十足的广普:「谢谢」. 这让我们愣了半秒. 他笑了, 我们也笑了. 哈哈世界开始搞笑了, 笑我们癫狂. 不记得多少天后的一个凌晨, 我们再次路过这家店时, 老板放下饭碗主动冲我招手问好, 我很欣赏他, 也很高兴他还记得我, 便冲他笑了笑. 走在我身边的该溜子里还有那俩人, 其中一个忍不住上前说我们那天晚上找遍了整条街都没买到. 老板问:「买什么? 」 我说:「红酒的开瓶器, 不过后来我们在学校的超市买到了. 」 老板欣慰地笑了笑, 我不得不再补充道:「但也就那样, 还是路过你的店比较荣幸一些. 」 老板非常满意, 他再次郑重道谢. 我们回去的路上鉴赏着同行第四人的茫然, 为他稍作解释后又不得不去探讨一个更深刻的问题: 你说老板现在是不是也在跟他边上的人解释刚才到底发生了什么? 对方能理解吗? 想到这里的我非常快乐, 这样的快乐是我生活中的必需品. 讲到这儿就不得不提下那位古埃及掌管手撕鸡的神明了. 学校食堂有款清真手撕鸡是我的必点菜, 但并不是每天都有. 以前是这样, 现在这道菜出现的频率得到了相对可观的提升. 甚至还会专门为我现场做, 这是因为我的诚意感动了食堂的那位黑色高级大妈. 我虽然每周都只去不超过两次食堂, 但每次都必点手撕鸡. 有时候会没有, 但我绝不会直接撤退. 我一定会围绕着「怎么这餐没手撕鸡」这一主题赋上几句垃圾话. 掌管手撕鸡的大妈听完后大笑属于标准流程, 而真正值得我感到荣幸的反倒是偶尔没笑的情况, 此时她会转头把我的原话复述给身后的另一位大妈, 二人确认过眼神才组团进入大笑环节. 只有这样你才知道这段垃圾话是真值得品鉴的. 现在我的创作不得不建立在其它的主题上了, 因为几乎每次过去大妈都会主动告诉我有手撕鸡, 偶尔没有的时候大妈还会让我稍等一会儿, 说看我来得够早可以通知后厨再加道菜. 有时来的是其它一些低级小哥或大妈, 此时高级大妈会在一旁教唆他们多搞点鸡甚至直接把剩下的全都给我. 那我当然要蹬鼻子上脸, 而面对我的这些客制需求, 大妈都会在一边示意: 搞. 后来有次跟朋友去食堂, 他看到我那嚣张跋扈的样子就问大妈我是否太过于无礼. 我笑了, 指着大妈说这是我干妈家事你少管, 大妈笑了, 又是满满一勺纯肉. 看吧, 多来些没逻辑的垃圾话, 总是有好处的. via 知乎热榜 (author: 东云正树)

封面图片

上手了刷屏一天的GPT-4o 我感觉目前也就那样

上手了刷屏一天的GPT-4o 我感觉目前也就那样 他们也没多讲几句废话,整场发布会就二十来分钟,其中,最重磅的无异于GPT-4o 新模型的发布。关于 GPT-4o 起名的缘由, OpenAI 官方是这么解释的:“ o “的全称是“ omni ”,也就是“全能”的意思。之所以说它全能,是因为它能把文本、视觉、音频全打通了。换句话说,你跟 GPT-4o 对话就跟真人似的。最重要的是, GPT-4o 是免费向用户开放的,不开 Plus 会员也能用,只不过 Plus 会员要多一些使用次数。反正跟世超一起蹲守直播的同事们看了,都直呼想要……就连奥特曼也在Twitter上毫不避讳地,把 GPT-4o 跟科幻电影《 Her 》联系起来。(这部电影讲的是人和 AI 语音助理谈恋爱的故事)评论区的网友们也纷纷表示“见证历史” “电影终于要照进现实了”,甚至还用奥特曼的照片,整出来了个“ him ”。玩笑归玩笑,但世超觉得, OpenAI 这次 GPT-4o 的现场演示效果,特别是实时语音和视频交互的能力,确实甩了其他现役大模型好几个车尾灯。不过光这么说,大伙儿对 GPT-4o 的感受可能也不深,咱直接来看演示。像演示人员让 GPT-4o 从一数到十,中途就嫌它语速太慢了,让它说快点儿, GPT-4o 能立马反应过来,后续随时插话它都能瞬间 get 到。就这一个接一个的连续对话实力,说实话世超还没在 AI 身上体验过。给 GPT-4o 一个麦克风和摄像头权限,它能分分钟化身成面试指导官,比方视频里的这个老哥,说自己要去 OpenAI 面试,让 GPT-4o 给点着装建议。它迅速“打量”了下这位老哥,礼貌不失幽默地给出了“抓个头发”的中肯建议。但老哥打算走个不听劝的人设,顺手拿出个帽子,问能不能戴它去面试。GPT-4o 这边反应贼快,识破了老哥明知故问地恶作剧,顺着他的话茬说,也不是不行,最起码能让你在人群中脱颖而出。如果不给世超看演示画面,光听声音我可能会以为,这就是两个朋友之间在开玩笑。当然,以 GPT-4o 的知识储备和多模态能力,它也有相当正儿八经的应用场景。一扭头,就能直接化身成视障人士的眼睛,帮他们识别所在的位置,要是想知道眼前都有啥场景, GPT-4o 也能够绘声绘色地描绘出来,甚至还能一步一步指导视障人士打车。再摇身一变, GPT-4o 还能化身成数学老师,把屏幕的权限开放给它,它能一步步指导你做题,你在题目上写了啥画了啥 GPT-4o 也都能看得一清二楚。有一说一,这跟世超上中学时爸妈请的家教没啥两样……看完官方的案例视频,相信大伙儿跟世超一样,已经被震撼得没边儿了。而为了做到这些, OpenAI 在底层的模型上可是下了不少苦功。之前咱们用 ChatGPT 的语音对话,都是一轮一轮的来。它得先把咱说的话转换成文字输给 GPT-4 ,等 GPT-4 生成文字答案之后,才能再转成语音输出。也就是说,以前和 ChatGPT 语音对个话,它得动用三个模型,一个管音频转文本,一个 GPT-4 管文本转文本,另外还有一个管文本转音频。一整套流程下来,耐心都快给磨没了,而且中间除非咱们手动暂停,否则根本没插话的机会。但 GPT-4o 不一样,它是一个原生的多模态模型,无论文字音频,还是视频啥的,所有的输入和输出都在同一个神经网络里处理。这种打娘胎里自带多模态的特性,让 GPT-4o 能够听懂好赖话,表达自己的情绪,和它对话也能像吃了德芙一样丝滑。不过,上面那些视频终归还是“PPT”,没到手实测一波,世超也不敢轻易下定论这玩意儿是不是真的有这么强。毕竟前段时间, Sora 生成的《气球人》短片才被传出加了大量的人类后期。而在实际用这块, OpenAI 还是一如既往的狗,嘴上说 GPT-4o 都能免费用,但也要分先来后到,而且功能也慢慢开放。现在能用上 GPT-4o 的只有 Plus 账号,而且最重磅的实时视频和语音功能,毛都看不着。但有总归比没有强,世超手边恰好也有个 Plus 账号,而且官方也说了,GPT-4o 生成的速度还会比 GPT-4 快上两倍。所以咱这波,就先提前给差友们试试 GPT-4o 的实力。先让它给咱讲一个童话故事,顺便再画出整个故事的分镜图。GPT-4o 没犹豫几秒,库吃库吃就开始写了。写完中间也没带停顿,直接开始画分镜了。而同样的问题再抛给 GPT-4 ,它一开始就得磨蹭半天在问题上……讲清楚要求后才肯继续写,而且写完之后也不继续画分镜图,还得等世超我再亲自强调一波。不过虽然 GPT-4 比 GPT-4o 墨迹了不少,但从内容来看,我还是会觉得GPT-4 会更丰富一点。再借我司老员工火锅的照片一用,分别让 GPT-4 和 GPT-4o 生成一张像素风的图片。在生成速度上 GPT-4o 完胜,但要抠细节的话两个就半斤八两了。GPT-4 识别出了火锅嘴里叼着的是袋子, GPT-4o 多识别出了一只拖鞋,非要比的话,其实 GPT-4 的金毛更像火锅一些……(左边GPT-4,右边GPT-4o)接着,我又让 GPT-4o 把咱差评的 LOGO 换成 3D 图片,结果它整出来字,翻遍整本新华字典,估计都找不到。但不识汉字也是历代 ChatGPT 的老毛病了,换成英文再要求它,你别说,这次出来的整体效果还可以,就是经不起细看,不少英文拼写都是错的。。整个上手试下来, GPT-4o 给我最大的印象就是快,非常快。但说实话,除了快,世超真没觉得有啥特别的了,与其说 GPT-4o 是 GPT-4 的智商进化版,倒不如说是把 GPT-4 的交互能力单拎出来强化了一波。就像奥特曼在博客里提到的,“达到人类响应时间和表达水平”是 AI 的巨大变化。大模型的终极形态,也应该是让人和 AI 的交流回归到最原始、最简单的形态。在未来,咱们面对一台电脑、一部手机,直接说话交流,就是最主要的交互方式。不过这次 GPT-4o 最厉害的杀手锏:视频交流功能,还没放出来,等到时候咱能体验到了再下结论也不迟。另外,网友们也没干坐着,也在各种研究 GPT-4o 的,结果,却扒出了一些番外的料……也不知道 GPT-4o 的中文语料库是哪儿来的,里面有不少的钓鱼网站的违禁词,像什么“日本 x 片免费视频”这类的。给人老外都整无语了。。像这样的乐子,以后指不定还要冒出来不少。但言归正传, GPT-4o 的出现确实又给 AI 开了个新副本。按照之前 ChatGPT 问世之后,其他友商步步紧逼的尿性。世超盲猜,在 GPT-4o 之后,类似的“Claude-o”“Gemini-o”应该很快就会出现。刚好明天就是Google的 I/O 了,咱们也浅浅期待一手好吧。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人