腾讯终究还是出了大模型 测了下感觉还行
腾讯终究还是出了大模型测了下感觉还行这次,知危编辑部也想办法获得了混元大模型的体验资格,下面就带大家看看混元的能力。首先是常规的对话,我们先看看多轮对话:以上内容仅能展示连续对话,内容真实性无法验证正常的问题是可以一直聊下去的(与其他同行相同,混元也有最大连续对话数的限制),回答的内容也尚可,并且它会知道哪些信息可以说、哪些信息不可以说。下面我们看看它提供方案的能力:策略上没有什么太大的问题,考虑得相对周到,还是有一定参考价值的。再让它生成一个演讲稿:觉得有些太正式官方了,让他调整了一下:混元的表现尚可,还是可以起到启发或者生产力工具的作用的。下面我们再看看它的语义理解能力:当我们要求进一步解释时,混元应对的也比较好:除了常规的对话,混元还给出了比较丰富的“特调”应用,叫作“灵感发现”,囊括了各个场景下的诸多功能:我们测试了一下社群营销文案,刚好最近中秋节要到了,看到一些社群在发月饼团购文案,就让混元也试了一下。作为对比,我们先找了一下盒马社群关于月饼的社群营销文案看看大概什么样:混元的表现如下:感觉味儿还是对的,随便修修改改就能用。除此之外,还有专门的代码模式和代码解释器。我们先让混元生成了一段2048游戏的代码:然后再把它生成的代码扔进它的代码解释器功能里,它解释的还行:好了,编辑部的测试大概就是这么多,总地感觉下来,混元的水平跟国内一线大厂持平,说不上惊艳,但也没掉队,执行各种不同领域任务时的表现在GPT-3.5水平上下浮动。自打8月15日《生成式人工智能服务管理暂行办法》开始施行后,行业开始有了明晰的规范,已经有一批大厂的大模型获得了全量面向公众开放的资格。这意味着行业迎来了一个成熟的时机:数量不设限的用户可以更好地给大模型提供训练资料,让大模型更快成长。所以,腾讯大模型的发布,极有可能是看中了这一点。如此一来,最后一个一线大厂也加入了通用大模型的“大乱斗”中。希望未来某一天,它们能卷出点让人眼前一亮的东西。...PC版:https://www.cnbeta.com.tw/articles/soft/1382317.htm手机版:https://m.cnbeta.com.tw/view/1382317.htm