北大卢菁:1. 训练起来大模型和训练出有通用能力的模型完全是两码事。

北大卢菁: 1. 训练起来大模型和训练出有通用能力的模型完全是两码事。 目前国内大模型只能说训练起来了,但是远无技术壁垒,这是大厂本就应该具备的能力,并不值得骄傲。 2. 具备通用能力的大模型,入门参数量可能不是GPT3.5的175B,可能是GPT4的1.8T。而且这仅仅是必要条件,大规模的高质量语料也许才是现阶段除OpenAI以外其他企业真正的瓶颈所在。 3. 如果瓶颈真的在语料,我很悲观这会成为比芯片更大的壁垒。 因为人类最高质量的语料是书籍和论文,而真正高质量的书籍和论文掌握在西方世界手里。 4. 现阶段,最关键的是把智能做上去。诸如长文本建模,性能优化,应用场景这些一点都不关键。至少对有出息企业来说是这样,如果只是想做做应用就另当别论了。 5. 拿Llama2 Finetune刷榜意义不大,在特定数据集上刷得比GPT-4高并不能说明任何问题。 国内厂商最搞笑的是把C-eval的数据丢进训练集里面,然后再在C-eval上刷榜,各种吊打GPT,这种行为跟芯片造假的性质差不多,让国人认不清差距,以为GPT-4根本没有什么壁垒,国内厂商已经很接近了。 事实是,如果GPT4是100分的话,国产的大模型能拿个10分已经烧高香了。 6. 知识能力可能不是个事,GPT4除了四则运算会犯傻逼错误之外,很少犯傻逼错误。而且推理能力比其他模型要强太多太多,我想其中可能有特别的建模方式,不清楚是不是RLHF带来的收益。 7. 数学能力不是做算术,也不是做高考题。而是有数学直觉,推导,证明的能力。目前我只在GPT4上看到了拥有数学直觉,但证明的能力还很欠缺。 8. 流量不是大模型要考虑的事情,大模型要解决的是人类面临的难题, 比如解决人类还没解决的科学问题去扩展人类的智能; 帮助企业做商业计划优化市场经济;帮助社会建立更健全体系等等,达到千金一Token的效果。否则只是陪用户聊天,ROI很难做正。 9. 在国内做LLM其实竞争不大,因为大家做事都太急太糙,目前看来大家都没太大出息。 预计两年内不会有太好的成果,而我也非常期待被打脸。 10. 两个东西需要重新思考:在过去做不Work的想法,也许在大模型下可以重新尝试,说不定就Work了;在小模型下做Work的想法,也许在一定规模之后就不再Work了。 原因很简单,过去不Work的做法也许只是模型能力不够无法按照我们的预期去拟合;

相关推荐

封面图片

《卢菁博士AI大模型微调实战训练营》|简介:卢菁博士的AI大模型微调实战训练营,专注于AI大模型的微调技术,通过实战项目让学员掌

《卢菁博士AI大模型微调实战训练营》|简介:卢菁博士的AI大模型微调实战训练营,专注于AI大模型的微调技术,通过实战项目让学员掌握模型微调的方法和技巧,提高模型在特定任务上的性能,满足不同应用场景需求|标签:#卢菁博士AI训练营#AI大模型微调#实战技术训练| 文件大小 NG |链接:

封面图片

支付宝发布多模态医疗大模型

支付宝发布多模态医疗大模型 7 月 5 日,在 2024 世界人工智能大会 “可信大模型论坛” 上,支付宝发布多模态医疗大模型,同时推出包括医疗可信一体机、可信云等解决方案。据悉,支付宝医疗大模型经过半年多测试后推出,是国内首批多模态医疗大模型之一。蚂蚁集团大模型应用部总经理顾进杰介绍称,蚂蚁百灵大模型具备原生多模态能力,可直接理解并训练音频、视频、图、文等多模态数据。支付宝医疗大模型以此为基座模型,添加了百亿级中英文图文、千亿级医疗文本语料及千万级医疗知识图谱,中英文医疗考试、基准测试达到或超过 GPT4 水准。

封面图片

【国家发改委:支持开展通用人工智能大模型和垂直领域人工智能大模型训练】

【国家发改委:支持开展通用人工智能大模型和垂直领域人工智能大模型训练】 12 月 15 日,国家发改委就《“数据要素 ×”三年行动计划(2024-2026 年)(征求意见稿)》向社会公开征求意见。意见稿提出,以科学数据支持大模型开发,深入挖掘包含科技文献在内的各类科学数据,通过细粒度的知识抽取,构建科学知识资源底座,建设高质量语料库和基础科学数据集,支持开展通用人工智能大模型和垂直领域人工智能大模型训练。探索科研新范式,面向新范式需求迫切的重点科研领域,充分依托各类数据库与知识库,推进跨机构、跨学科、跨领域协同创新,发现新规律,创造新知识,加速科学研究范式变革。 快讯/广告 联系 @xingkong888885

封面图片

7 月 5 日,在 2024 世界人工智能大会,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。基于蚂蚁百灵的

7 月 5 日,在 2024 世界人工智能大会,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。基于蚂蚁百灵的多模态能力,该模型可实现直接理解并训练音频、视频、图、文等多模态数据。测试期间,对诊疗报告、医学药品、毛发状况等识别准确率达 90% 以上,中英文医疗考试、基准测试达到或超过 GPT4 水准。

封面图片

支付宝发布多模态医疗大模型

支付宝发布多模态医疗大模型 7 月 5 日,在 2024 世界人工智能大会,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。基于蚂蚁百灵的多模态能力,该模型可实现直接理解并训练音频、视频、图、文等多模态数据。测试期间,对诊疗报告、医学药品、毛发状况等识别准确率达 90% 以上,中英文医疗考试、基准测试达到或超过 GPT4 水准。会上,支付宝还推出了与大模型配套的可信一体机与云解决方案,并与全国 20 家头部三甲医院、医疗管理机构,联合发起 AI 医疗共建计划,探索大模型创新应用。

封面图片

《卢菁博士AI大模型微调实战训练营 》 | 简介:如果你希望深入了解卢菁博士AI大模型微调实战训练营,这门课程将带你进入一个充满

《卢菁博士AI大模型微调实战训练营 》 | 简介:如果你希望深入了解卢菁博士AI大模型微调实战训练营,这门课程将带你进入一个充满创意与实用技巧的世界。从基础到高阶,每一部分都细致入微,帮助你掌握行业内的最新技术与方法。课程设计紧贴实际应用,学员不仅能学到理论,还能掌握解决实际问题的能力,提升自己的工作效率和创作水平。不管是初学者还是有一定经验的学员,都可以在这里找到提升的空间。 | 标签:#卢菁博士AI大模型微调实战训练营 #课程 | 文件大小:NG | 链接:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人