文心一言通义千问们互评高考作文 友商们快打起来了

文心一言通义千问们互评高考作文友商们快打起来了而在2024年,百花齐放的国产大模型已在性能和体验上不输GPT-4,使用更多中文语料的训练也让这些本土玩家普遍“更懂中文”。于是,AI蓝媒汇以新课标I卷作文题为例,分别测评了BAT三家传统大厂,以及科大讯飞、月之暗面、百川智能三位热门选手的共计六款主流大模型,还引入了大模型互评环节。谁考得最好,谁没发挥好,拭目以待。·新课标I卷作文题目:阅读下面的材料,根据要求写作。(60分)随着互联网的普及、人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少?以上材料引发了你怎样的联想和思考?请写一篇文章。要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。·百度文心一言4.0:其余五款大模型打分如下:综合得分:55.8·阿里云通义千问2.5:其余五款大模型打分如下:综合得分:56.8附:文心一言给出满分的原因·腾讯元宝:其余五款大模型打分如下:综合得分:58.2附:文心一言给出满分的原因·科大讯飞讯飞星火:其余五款大模型打分如下:综合得分:57.2·月之暗面Kimi:其余五款大模型打分如下:综合得分:55.2附:讯飞星火给出低分的原因·百川智能百小应:其余五款大模型打分如下:综合得分:56从测试以及评分结果来看,在所有六款大模型之中,文心一言综合打分最高,给友商文章平均打出了58的高分。其中还有两次给了满分。而讯飞星火打分最低,给友商文章平均只给出了53.2的分数。那么,这些作文,你给多少分?...PC版:https://www.cnbeta.com.tw/articles/soft/1433931.htm手机版:https://m.cnbeta.com.tw/view/1433931.htm

相关推荐

封面图片

AI高考作文出圈 网友票选天工AI居首

AI高考作文出圈网友票选天工AI居首据悉,“天工AI”不仅在前不久发布了MoE混合专家天工3.0大模型,接连发布了全球首个公开技术架构的AI音乐SOTA,且近期又向社会开源了2千亿稀疏大模型。对于对普通用户,不仅具有强大的自然语言处理和生成能力,更能同时满足多种任务需求的能力,包括文案创作、知识问答、逻辑推演、数理推算、代码编程、AI画画、虚拟人聊天、情感陪伴等,俨然已经成长为一款多模态全能AI产品,这些长线的积累直接引索了天工AI在高考AI大战中备受关注,从而在此次【新课标1卷】人工智能的作文命题迅速走红。据悉,天工大模型由昆仑万维自研,是国内首个对标ChatGPT的双千亿级大语言模型,天工大模型通过自然语言与用户进行问答式交互,AI生成能力可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等多元化需求。2023年11月3日,天工大模型通过备案,面向全社会开放服务。相关文章:文心一言通义千问们互评高考作文友商们快打起来了微信回应被高考作文题Cue到:要求不超过150字我只用10个字AI第一次高考:记得作文要龙头猪肚凤尾...PC版:https://www.cnbeta.com.tw/articles/soft/1434032.htm手机版:https://m.cnbeta.com.tw/view/1434032.htm

封面图片

金山办公宣布 WPS 365 升级发布,已集成文心一言、通义千问

金山办公宣布WPS365升级发布,已集成文心一言、通义千问今日,金山办公发布了面向组织和企业的办公生产力平台WPS365,该平台包含升级的WPSOffice、最新发布的WPSAI企业版和WPS协作,打通了文档、AI、协作三大能力,让用户只用一个工具就能调用多个主流大模型,边写边沟通边开会。据金山办公CEO章庆元介绍,“WPS365全面覆盖了一个组织日常办公的基本需求,从文档创作到即时通讯(IM)、会议、邮件,再到AI应用,标志着一个文档处理套件正式升级为一站式AI办公。”据介绍,该平台中最新发布的WPSAI企业版主要聚焦为客户打造企业大脑,分为AIHub(智能基座)、AIDocs(智能文档库)、CopilotPro(企业智慧助理)三个部分。其中,AIHub集成了诸如文心一言、通义千问、MiniMax、智谱AI等国内主流大模型的AI能力,与上百种模型进行了适配磨合,降低了大模型使用门槛。CopilotPro则可帮助运营人员使用自然语言驱动BI产品分析数据,调用WPS365API和企业自有API解决办公自动化需求。(新浪科技)

封面图片

全国高考作文题目公布 ChatGPT、Bing、讯飞生成作文 你打多少分?

全国高考作文题目公布ChatGPT、Bing、讯飞生成作文你打多少分?而我们以全国甲卷为例,分别使用ChatGPT、科大讯飞星火、微软bing这三款目前最为火爆的人工智能语言大模型,生成三篇高考作文,各位网友可以给它们打出自己的评分,看看谁家的高考作文能力更强?2023年高考语文全国甲卷作文题目:阅读下面的材料,根据要求写作。(60分)人们因技术发展得以更好地掌控时间,但也有人因此成了时间的仆人。这句话引发了你怎样的联想与思考?请写一篇文章。要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。ChatGPT3.5生成文章:微软Bing生成文章:科大讯飞星火生成文章:...PC版:https://www.cnbeta.com.tw/articles/soft/1363971.htm手机版:https://m.cnbeta.com.tw/view/1363971.htm

封面图片

清华大模型报告:文心一言中文理解、数学等多项能力全球第一

清华大模型报告:文心一言中文理解、数学等多项能力全球第一最近,由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型,在人类对齐能力评测中,文心一言4.0表现位居国内第一,其中在中文推理、中文语言等评测上,文心一言分数领先,和其他模型拉开明显差距,中文理解上,文心一言4.0领先优势明显,领先第二名GLM-40.41分,GPT-4系列模型表现较差,排在中下游,并且和第一名文心一言4.0分差超过1分。在语义理解中的数学能力上,文心一言4.0与Claude-3并列全球第一;GPT-4系列模型位列第四五,其他模型得分在55分附近较为集中,明显落后第一梯队;而在语义理解中的阅读理解能力上,文心一言4.0超过GPT-4Turbo、Claude-3以及GLM-4拿下榜首。在安全性评测上,国内模型文心一言4.0拿下最高分(89.1分),Claude-3仅列第四。来源:财经慢报频道

封面图片

通义千问320亿参数模型开源

近日,阿里云开源了通义千问Qwen1.5-32B。基础能力方面,Qwen1.5-32B模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级别参数量模型。Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与通义千问720亿参数Chat模型之间的差距相对较小。多语言能力方面,阿里表示,选取了包括阿拉伯语、西班牙语、法语、日语、韩语等在内的12种语言,在考试、理解、数学及翻译等多个领域做了测评。Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。此前,通义千问已开源5亿、18亿、40亿、70亿、140亿和720亿参数尺寸的大模型。其中,几款小尺寸模型可便捷地在端侧部署,720亿参数模型拥有业界领先的性能。Qwen1.5-32B模型旨在性能、效率和内存占用之间达到理想平衡,为下游应用提供更好的解决方案。标签:#通义千问#AI频道:@GodlyNews1投稿:@GodlyNewsBot

封面图片

国产AI大模型高考成绩单出炉:讯飞星火获得综合第一

国产AI大模型高考成绩单出炉:讯飞星火获得综合第一首先进行的是高考作文的评测。在搜狐科技的评测中,三位资深语文教师作为权威专家为各大模型的作文打分。腾讯元宝和百度文心一言以超过50分的成绩位居前列,智谱清言、字节豆包与讯飞星火则并列第三。Kimi、阿里通义、百川、海螺排名相对靠后。而在潇湘晨报的“AI写作”评测中,讯飞星火不仅平均分位居首位,且获得了全场最高分56分。潇湘晨报邀请湖南知名作家、编辑作为阅卷老师,对国内五大AI大模型产品——百度文心一言、讯飞星火、阿里通义千问、字节豆包、腾讯元宝的高考作文进行评分,经过四位阅卷老师的综合打分,讯飞星火以49分的平均分高居首位。给讯飞星火打出“全场最高分”56分的阅卷老师表示:“本文观点清晰,论述集中且层层推进,很多句子都简洁有力,颇有思想性。如果是某个学生写的,无疑是难得的佳作。”接下来是数学科目的较量。在搜狐科技的数学评测中,讯飞星火、文心一言、豆包均以63%的正确率位列第一梯队,智谱清言、阿里通义则以50%的正确率位居第二梯队,其他大模型相对落后。在量子位的高考数学评测中,虽然没有给出详细成绩单,但展示了各家大模型详细的解题思路,交由网友打分,通过网友的投票打分可以看出,讯飞星火的“识图+解数学题”能力收到了最高认可,位居其后的分别是Kimi、通义千问、文心一言、豆包等。最后是高考物理的测试。在量子位的评测中,阿里通义千问与讯飞星火以71.4%的准确率高居第一梯队,而Kimi、海螺和腾讯元宝则以42.9%的准确率位于第二梯队。百川百小应和万知答对一题位于第三梯队。文心一言、豆包、天工、智谱清言、商量因为出现了不同程度读图失败的问题,在成功识别的题目中,商量和文心一言的正确率为2/4,即正确率为28.6%;豆包、天工、智谱清言正确率为1/2,即正确率为14.3%。综合以上媒体在作文、数学、物理三门科目的成绩,我们得出了2024年人工智能大模型高考“成绩单”。来自科大讯飞的讯飞星火以52.49分高居第一名,通义千问、文心一言分别位列第二、第三名,而Kimi、字节豆包、海螺AI等其他大模型也有不错的表现。综合成绩:第一名:52.49讯飞星火第二名:46.08通义千问第三名:37.67文心一言第四名:34.68 Kimi第五名:33.57字节豆包第六名:31.92海螺AI第七名:30.61腾讯元宝第八名:30.28智谱清言第九名:21.56百川百小应...PC版:https://www.cnbeta.com.tw/articles/soft/1434322.htm手机版:https://m.cnbeta.com.tw/view/1434322.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人