同济校长郑庆华:大模型已成当前人工智能巅峰 但存四大缺陷

同济校长郑庆华:大模型已成当前人工智能巅峰但存四大缺陷郑庆华认为,大模型已经成为当前人工智能的巅峰,大模型之所以强,是依托了大数据、大算力和强算法,但是也面临着若干缺陷。缺陷一是过度消耗数据和算力。大模型的参数量已达到万亿级别,训练数据规模和算力消耗与参数规模成正比。缺陷二是灾难性遗忘。在新任务上训练会损害之前任务的性能;在问题求解阶段,无法记住处理过的数据或场景,比如在无人驾驶中,人脑对路况有记忆,但自动驾驶每次都要重新计算,并为此消耗了大量能量。缺陷三是黑盒模型逻辑推理能力弱,大模型缺乏“分而治之”能力,在处理需要逻辑、数值推理等复杂问题时表现不佳,无法举一反三、触类旁通。缺陷四是大模型不知道自己错了,也不知道为啥错,更做不到知错就改。

相关推荐

封面图片

【同济大学校长郑庆华:当前AI技术面临三大挑战】

【同济大学校长郑庆华:当前AI技术面临三大挑战】由中国人工智能学会主办的“人工智能大模型技术高峰论坛”主论坛在杭州萧山启幕。论坛上,同济大学校长郑庆华在谈AI未来研究方向时指出,当前,Al技术还不适应边界不确定性、博弈强对抗性、响应高实时性、环境高复杂性、信息不完整性等场景,而这正是从弱Al向强AI和超Al发展进阶的引航。同时,郑庆华指出,目前,我们面临三个挑战。挑战一在于,在常识性、隐匿性、抽象性知识的获取上,当前的方法面临难以挖掘隐匿性强、抽象性强知识的局限;挑战二在于记忆性、认知型知识的融合,而当前的方法面临感知力强但认知能力弱、计算成本高的局限;挑战三在于可解释的知识推理,当前方法局限于因果推断难,反事实推理能力弱,可解释性差等问题。

封面图片

中信建投:国内大模型应用元年已至

中信建投:国内大模型应用元年已至中信建投研报指出,当前国内大模型能力逐步提升,中文领域处理和部分特性如长文本处理等有对齐和领先优势。随着Kimi热度提升,国内多家大模型厂商加入长文本能力竞争,产业C端落地加速。模型迭代和推理需求提升,促进底层算力基础设施需求释放,利好算力产业链;模型参数量起来,对于高质量的数据需求增加,数据丰富对模型效果有较大影响。建议关注:1)AI应用:重点关注涉及长文本处理;2)算力产业链,预期算力短期仍将处于需求大于供给的状态;3)数据产业链,高质量合规数据的提供商有望持续受益模型迭代,建议关注相关标的。

封面图片

百度智能云部署大模型至五象云谷智算中心 智算云 + AI 应用加速落地

百度智能云部署大模型至五象云谷智算中心智算云+AI应用加速落地据润建股份消息,近日,润建股份与百度智能云再次紧密合作,正式部署百度大模型到五象云谷智算中心。双方将围绕大模型商业应用在城市管理、教育、能源等领域展开全面合作,共同促进智算云+AI应用的加速落地,润建股份智算中心将为AI大模型应用提供算力支持。五象云谷云智算中心是面向国内及东盟国家客户提供数据服务、算力服务的高等级数据中心。在五象云谷基础上,公司进一步打造润建智能算力中心,为客户提供AI大模型训练、推理算力、图形渲染算力服务。

封面图片

通义大模型落地手机芯片

通义大模型落地手机芯片阿里云与知名半导体公司MediaTek联合宣布,通义千问18亿、40亿参数大模型已成功部署进天玑9300移动平台,可离线流畅运行即时且精准的多轮AI对话应用,连续推理功耗增量不到3W,实现手机AI体验的大幅提升。这是通义大模型首次完成芯片级的软硬适配,仅依靠终端算力便能拥有极佳的推理性能及功耗表现,标志着Model-on-Chip(片上大模型)的探索正式从验证走向商业化落地新阶段。

封面图片

国家数据局:中国 10 亿参数规模以上大模型数量已超 100 个

国家数据局:中国10亿参数规模以上大模型数量已超100个中国发展高层论坛2024年年会昨天(3月25日)落下帷幕。国家数据局局长刘烈宏昨天(25日)表示,生成式人工智能的快速发展对算力提出了更高、更迫切的需求,全国一体化算力体系建设的必要性愈益突出。中国10亿参数规模以上的大模型数量已超100个,行业大模型深度赋能电子信息、医疗、交通等领域,形成上百种应用模式,赋能千行百业。(央视新闻)

封面图片

3月21日,百度智能云召开千帆产品发布会,发布包括ERNIESpeed、ERNIELite、ERNIETiny在内的三款轻量级大

3月21日,百度智能云召开千帆产品发布会,发布包括ERNIESpeed、ERNIELite、ERNIETiny在内的三款轻量级大模型。相比千亿级别参数的大模型,轻量级大模型的参数量更小,更便于客户针对特定使用场景进行模型精调,更容易达成使用效果预期,同时节约更多成本开销。ERNIESpeed、ERNIELite、ERNIETiny,参数量由大到小,分别适用于在特定场景作为基座模型进行精调,兼顾模型效果与推理性能并搭载低算力AI加速卡进行推理,适配极致低成本和低延迟应用。此外,百度智能云ModelBuilder还基于百度自身业务沉淀,推出了ERNIECharacter和ERNIEFunctions两款垂直场景大模型,分别适配客户在角色扮演类应用场景(如游戏NPC、客服对话等)、工具调用场景(对话中使用外部工具、调用业务函数等)中的不同使用需求。企业无需再额外精调,可直接应用专有模型来开发智能助理。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人