一键重返高考 基于百度文心大模型的高考AI模拟卷发布

一键重返高考基于百度文心大模型的高考AI模拟卷发布据介绍,双方请到了学科名师进行指导,语言理解与生成技术应用文心大模型能力,学习了近十年的高考考点、题型等内容,智能生成“高考AI模拟卷”。根据官方说法,此次高考AI模拟卷意在助力考生在高考前再次查漏补缺,巩固要点。据快科技测试,高考AI模拟卷分为语文、数学、英语三科,语文题型包括现代文阅读、古代文阅读、语言文字运用和写作,支持整套模拟卷下载。感兴趣的网友可以点此“一键重返高考”,如果家中有高考生,也可以在闲暇之余体验一下。当然了,这些模拟卷均为AI生成,内容仅供参考,实际复习、模拟考还是要以书本、正规出版社考卷为主。...PC版:https://www.cnbeta.com.tw/articles/soft/1360367.htm手机版:https://m.cnbeta.com.tw/view/1360367.htm

相关推荐

封面图片

首个AI高考全卷评测结果发布:最高分303 数学全员不及格

首个AI高考全卷评测结果发布:最高分303数学全员不及格语数外三科加起来的满分为420分,此次高考测试结果显示,阿里通义千问2-72B排名第一,为303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能实验室的书生·浦语2.0排名第三,三个大模型的得分率均超过70%。来自法国大模型初创公司的Mistral排名末尾。此次测试的模型分别来自阿里巴巴、零一万物、智谱AI、上海人工智能实验室、法国Mistral的开源模型,以及来自OpenAI的闭源模型GPT-4o。实验室表示,因无法确定闭源模型的更新时间,为公平起见,此次评测没有纳入商用闭源模型,仅引入GPT-4o作为评测参考。这次选择参与高考的“考生”均在高考前(2024年4月-6月)开源,避免了“刷题风险”。从结果来看,大模型的语文、英语考试水平普遍不错,但数学都不及格,最高分也只有75分,来自书生·浦语2.0,其次是GPT-4o,得分73分。语文最高分是通义千问,英语最高分是GPT-4o。在数学方面大模型还有很大的提升空间。数学关乎复杂推理相关能力,这是大模型普遍面临的难题,也是大模型在金融、工业等要求可靠的场景落地需要的关键能力。上海人工智能实验室领军科学家林达华此前在采访中对第一财经介绍,复杂推理关系到落地应用时大模型的可靠性,例如在金融这样的场景下不能在数字上有差错,会对数学上的可靠性有较高的要求。另外随着大模型进入商用,若要分析一家公司的财报,甚至是工业领域要去分析一些技术文档,这时数学方面的计算能力就会成为一个壁垒。“现在很多大模型的应用场景是客服、聊天等等,在聊天场景一本正经胡说八道影响不太大,但它很难在非常严肃的商业场合去落地。”林达华此前表示。对于此次测试细节,上海人工智能实验室介绍,评测采用全国新课标I卷,“语数外”三科全卷测试,包括客观题与主观题。成绩由具备高考评卷经验的老师匿名人工判分,阅卷开始前,阅卷教师未被告知答卷均由模型生成,使阅卷教师完全以面对真实考生的标准评判回答效果。值得注意的是,大模型犯错误的方式和人类考生有差异,从实践上来看阅卷老师们不完全适应给大模型评分,因此存在有题目误判的可能。实验室表示,每个题目都邀请了至少三位老师评阅取均分,团队对分差较大的题目还进行了再次审核,贴近高考真实阅卷标准。实验室表示,在打分前,老师们并未被告知答案由大模型生成,但由于有的模型会存在完全不理解题意导致乱答、重复生成、回答更像解析而非解答的问题,老师们在阅卷过程中基本都会和团队确认这些情况是否是正常情况,团队会要求老师将离谱的错误直接视为答题错误,解析类型的回答以是否包含正确解题过程作为唯一准则。在完成所有大模型答卷的评卷工作后,阅卷教师被告知所评“考生”的真实身份为大模型。研究人员同时邀请各科教师对大模型表现进行了整体分析,为模型能力提升策略提供参考。语文方面,老师们认为,模型的现代文阅读理解能力普遍较强,但是不同模型的文言文阅读理解能力差距较大。大模型作文更像问答题,虽然有针对性但缺乏修饰,几乎不存在人类考生都会使用举例论证、引用论证、名人名言和人物素材等手法。多数模型无法理解“本体”“喻体”“暗喻”等语文概念。语言中的一些“潜台词”,大模型尚无法完全理解。在数学试卷上,老师们发现,大模型的主观题回答相对凌乱,且过程具有迷惑性,甚至出现过程错误但得到正确答案的情况。大模型的公式记忆能力较强,但是无法在解题过程中灵活引用。英语则整体表现良好,但部分模型由于不适应题型,在七选五、完形填空等题型得分率较低。大模型英语作文普遍存在因超出字数限制而扣分的情况,而人类考生多因为字数不够扣分。此外,一些老师提出,由于全部回答没有卷面,所以在作文的评判上会存在1-2分的误差。...PC版:https://www.cnbeta.com.tw/articles/soft/1435334.htm手机版:https://m.cnbeta.com.tw/view/1435334.htm

封面图片

出分了!首个AI高考全卷评测结果发布

出分了!首个AI高考全卷评测结果发布2024年全国高考甫一结束,司南评测体系OpenCompass选取6个开源模型及GPT-4o进行高考“语数外”全卷能力测试。评测采用全国新课标I卷,参与评测的所有开源模型,开源时间均早于高考,确保评测“闭卷”性。同时,成绩由具有高考评卷经验的教师人工评判,更加接近真实阅卷标准。首个大模型高考全卷评测结果显示,Qwen2-72B、GPT-4o及书生·浦语2.0文曲星(InternLM2-20B-WQX)成为本次大模型高考的前三甲,得分率均超过70%。大部分模型“考生”语文、英语科目表现良好,但在数学方面还有很大的提升空间。其中,InternLM2-20B-WQX取得了数学单科的最高分,超越包括GPT-4o在内的所有模型。关注频道@ZaiHuaPd频道爆料@ZaiHuabot

封面图片

《30天搞定高中文言文》精准攻克高言文

名称:《30天搞定高中文言文》精准攻克高中文言文描述:专为高考生提分的文言文备考书。1天考纲,9天断句、实词、虚词,15天归纳分析、翻译、写作,5天模拟训练。30天真题加模拟,方法加口诀,分题型突破重难点,一网打尽易错点,最后考前模拟题全复盘,文言文阅读考场拿高分!提供PDF、azw3、mobi、epub格式。链接:https://pan.quark.cn/s/af5fb59551b6大小:8.5MB标签:#高中#学习#图书#30天搞定高中文言文#quark频道:@yunpanshare群组:@yunpangroup

封面图片

百度文心一言插件商城上线 一键安装搞定PPT生成、音视频提取

百度文心一言插件商城上线一键安装搞定PPT生成、音视频提取文心一言插件商城显示,目前已经上线的插件包括PPT生成器、说图解画、E言易图、AI视频助理、思维导图等。其中,AI视频助理能够快速理解视频内容,一键总结提纲摘要;思维导图则能随时在线生成、编辑、导出思维导图,通过AI帮你拓展灵感思路。据了解,文心一言插件商城可在文心一言首页中找到“选择插件”,再点击“插件商城”即可打开。页面支持查看或安装已上架插件,且支持对已安装的插件管理。据百度官方介绍,文心一言自8月31日面向全社会开放至今,用户规模达到7000万,场景4300个,应用2492个。目前,文心一言的基础模型已迭代到文心大模型4.0,让理解、生成、逻辑、记忆四大能力显著提升。其中理解和生成能力的提升幅度相近,而逻辑和记忆能力的提升则更大,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。...PC版:https://www.cnbeta.com.tw/articles/soft/1404313.htm手机版:https://m.cnbeta.com.tw/view/1404313.htm

封面图片

微信输入法:加入“一键AI问答”功能 基于混元大模型

微信输入法:加入“一键AI问答”功能基于混元大模型点击右下角“复制为图片”提示自动生成图片,保存使用,让AI帮帮聊。目前,该功能已经在Win端、Mac端上线,微信官方表示,移动端也在路上了。...PC版:https://www.cnbeta.com.tw/articles/soft/1436152.htm手机版:https://m.cnbeta.com.tw/view/1436152.htm

封面图片

Baidu Comate:百度基于文心大模型推出的智能代码助手

Comate支持C/C++、Java、Python、Go、JavaScript、TypeScript等100+主流编程语言。同时也支持像VSCode、IntelliJIDEA、GoLand、PyCharm、WebStorm、CLion、AndroidStudio等在内的诸多主流IDE,其以插件的形式存在,一键安装,即装即用,并且使用的过程中也没有切换成本。支持对话问答、代码生成、代码解释、代码优化标签:#百度#Comate频道:@GodlyNews1投稿:@Godlynewsbot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人