近日,在一篇由多位作者署名的论文《MM1:Methods,Analysis&InsightsfromMultimodalLLMP

近日,在一篇由多位作者署名的论文《MM1:Methods,Analysis&InsightsfromMultimodalLLMPre-training》中,苹果正式公布自家的多模态大模型研究成果——这是一个具有高达300亿(其他为30亿、70亿)的多模态模型系列,它由密集模型和混合专家(MoE)变体组成,不仅在预训练指标中实现SOTA,在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。MM1多模态大模型拥有图像识别和自然语言推理能力。(IT之家)

相关推荐

封面图片

【#苹果推出300亿参数MM1多模态大模型,可识别图像推理自然语言】近日,在一篇由多位作者署名的论文《MM1:Methods,A

【#苹果推出300亿参数MM1多模态大模型,可识别图像推理自然语言】近日,在一篇由多位作者署名的论文《MM1:Methods,Analysis&InsightsfromMultimodalLLMPre-training》中,苹果正式公布自家的多模态大模型研究成果——这是一个具有高达300亿(其他为30亿、70亿)的多模态模型系列,它由密集模型和混合专家(MoE)变体组成,不仅在预训练指标中实现SOTA,在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。MM1多模态大模型拥有图像识别和自然语言推理能力。(IT之家)

封面图片

苹果推出 300 亿参数 MM1 多模态 AI 大模型,可识别图像推理自然语言

苹果公司旗下研究团队近日在 ArXiv 中公布了一篇名为《MM1:Methods, Analysis&InsightsfromMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供 30亿、70亿、300亿三种参数规模,拥有图像识别和自然语推理能力。苹果研究团队相关论文主要是利用MM1 模型做实验,通过控制各种变量,找出影响模型效果的关键因素。研究表明,图像分辨率和图像标记数量对模型性能影响较大,视觉语言连接器对模型的影响较小,不同类型的预训练数据对模型的性能有不同的影响。据介绍,研究团队首先在模型架构决策和预训练数据上进行小规模消融实验。之后利用混合专家(MixtureofExperts)架构及一种名为Top-2Gating的方法构建了MM1模型,号称不仅在预训练指标中实现了最好的性能表现,在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。研究人员对“MM1”模型进行了测试,号称 MM1-3B-Chat 和 MM1-7B-Chat 优于市面上绝大多数相同规模的模型。MM1-3B-Chat 和 MM1-7B-Chat 在 VQAv2、TextVQA、ScienceQA、MMBench、MMMU 和MathVista中表现尤为突出,但是整体表现不如谷歌的Gemini和OpenAI的GPT-4V。ArXiv论文地址:https://arxiv.org/pdf/2403.09611.pdfvia匿名标签:#Apple#AI#MM1频道:@GodlyNews1投稿:@GodlyNewsBot

封面图片

Apple发布大模型论文:多模式LLM预培训的方法、分析和见解

Apple发布大模型论文:多模式LLM预培训的方法、分析和见解2024年3月14日,苹果公司发布了自家的大型多模态基础模型MM1,该模型拥有高达300亿参数,并采用混合专家(MoE)架构。超过半数的论文作者是华人。MM1模型在多模态任务上显示出强大的性能,尤其是在少样本学习和上下文预测方面。研究团队通过对不同架构组件和数据选择的深入分析,提出了几条关键的设计准则。他们发现,图像分辨率、视觉编码器损失和容量,以及预训练数据的类型对模型性能有显著影响。MM1模型的开发,标志着苹果在生成式人工智能领域的重要进展。线索:@ZaiHuabot投稿:@TNSubmbot频道:@TestFlightCN

封面图片

苹果推出300亿参数多模态大模型 全面转向生成式AI

苹果推出300亿参数多模态大模型全面转向生成式AI就在近日,苹果公司研发团队发布了一篇论文《MM1:Methods,Analysis&InsightsfromMultimodalLLMPre-training》,首次公布了多模态大模型MM1,展示了该公司在AI方面的进展与实力。据悉,MM1最高参数量为300亿,该模型支持增强的上下文学习和多图像推理,在一些多模态基准测试中有较好表现。研究人员使用这些模型进行实验,找出影响大模型表现的关键因素。有趣的是,图像分辨率和图像标签数量比视觉语言连接器的影响更大,不同的预训练数据集会显著影响模型的有效性。MM1的独特之处在于其庞大的规模和架构创新,包括密集的模型和混合专家模型。这些模型证明了研究人员方法的有效性,将大规模预训练与战略性数据选择相结合,以增强模型的学习能力。研发团队称,MM1不仅在预训练指标中是“最先进的”,并且在一系列已建立的多模态基准测试中,经过微调后也保持了“有竞争力的”性能。MM1可以支持增强的上下文学习和多图像推理,使得少数样本的思维链提示成为可能。然而,目前MM1的整体性能还没有完全超过谷歌的Gemini和OpenAI的GPT-4,虽然MM1可能还不是绝对的领导者,但它仍然是苹果在AI方面的一次重大飞跃。与此同时,苹果公司还出手收购了AI初创公司DarwinAI。DarwinAI以创建更小、更快的AI系统见长,这是实现设备上高效处理的关键因素。收购完成后,DarwinAI的网站和社交媒体账户已悄然下线。据悉,数十名DarwinAI员工已经加入了苹果的AI部门,作为交易的一部分,滑铁卢大学的AI研究员AlexanderWong已加入苹果,担任AI团队的总监。...PC版:https://www.cnbeta.com.tw/articles/soft/1424021.htm手机版:https://m.cnbeta.com.tw/view/1424021.htm

封面图片

多项大模型、智能硬件等产品技术在 2024GDC 大会全球首发

多项大模型、智能硬件等产品技术在2024GDC大会全球首发在“2024全球开发者先锋大会”(GDC)开幕式上,多项最新大模型、数据及大模型驱动的智能硬件全球首发,包括:上海人工智能实验室发布新一代高质量大模型训练数据集万卷2.0;商汤科技发布了国内首款金融大模型检索问答一体机;阶跃星辰发布了Step系列通用大模型,包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型以及Step-2万亿参数MoE语言大模型预览版;财跃星辰发布国内首个千亿参数多模态金融大模型;元始智能超越Transformer,RWKV第6代架构最新模型开源;幂方科技发布外脑穿戴——大模型驱动的智能硬件。(科创板日报)

封面图片

一篇论文引发辉瑞股价直线拉升 GLP-1赛道有望迎来强劲新药

一篇论文引发辉瑞股价直线拉升GLP-1赛道有望迎来强劲新药(来源:JAMA)需要说明的是,相关结果曾在去年的医学会议中展示过,但经过同行评审的论文直到周一才在《美国医学会杂志》上刊登。即便如此,资本市场依然给予热烈反应,2100亿美元市值的辉瑞直线拉涨近4%。近半年来,辉瑞股价一直受到疫苗销售收入下滑的拖累。(辉瑞分钟线图,来源:TradingView)根据完整公开的二期试验数据,总共有411名二型糖尿病患者入组,每天服用两粒Danuglipron或安慰剂。2.5毫克至120毫克的版本均显示出血糖下降的效果,但论减重,120毫克版本的受试者在服用16周后平均减掉10磅(4.6千克)的体重。作为目前已经上市的爆品,诺和诺德的Ozempic此前在三期试验数据中报告称,1mg注射版本的药物在30周后平均减重9.9磅。患者需要每周进行一次注射。(来源:JAMA)这一数据也展现GLP-1类疗法的提升潜力——在更短的时间内起效,而且不需要注射给药。从作用原理上来看,这些药物模仿肠道中产生的GLP-1激素,向大脑发出已经“吃饱”的信号。同时由于这款药物能鼓动胰脏生产更多的胰岛素,对于二型糖尿病患者控制血糖也有裨益。近几年来,随着一众好莱坞明星、社交媒体网红,以及知名科技富豪马斯克都在使用这款药物,以至于诺和诺德不得不控制接纳新患者,以保证治疗中的患者不断药。持续的热度也推动诺和诺德股价走强,过去3年时间翻了足足4倍,市值也达到3800亿美元。(诺和诺德周线图,来源:TradingView)股价反应的正是这款药物的无限“钱景”。根据美国国立卫生研究院的统计,该国每5个成年人中就有两人超重,同时每11个成年人中就有1人严重肥胖。GLP-1药物的诞生,也令“药物减肥”重新走上了台面。不过许多卫生专家也提出警告称,许多媒体将这类药物吹捧成“减重神药”,背后也隐含着将减重理想化的风险,恐进一步推动错误且危险的饮食文化。与许多减重措施类似,许多使用GLP-1药物的患者也报告停药后体重“不受控反弹”的情况。对此,医药公司也搬出了减肥界老生常谈的常识。诺和诺德全球药物发现高级副总裁KarinConde-Knape表示,停药后的反弹也取决于个人,如果患者保持(服药时)相同的摄入量和运动量,那么体重也能维持,但如果患者开始“吃得更多”,体重控制不住也在情理之中。根据既往对于减肥药的研究,绝大多数患者因服药掉的秤会在5年内长回来,其中2-3年就会胖回来一半。而有些人最终也会变得更胖。Conde-Knape在今年3月提及,现有的试验也显示使用Ozempic的患者会出现类似的体重反弹。...PC版:https://www.cnbeta.com.tw/articles/soft/1361081.htm手机版:https://m.cnbeta.com.tw/view/1361081.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人