近日，在一篇由多位作者署名的论文《MM1:Methods,Analysis&InsightsfromMultimodalLLMP

近日，在一篇由多位作者署名的论文《MM1:Methods,Analysis&InsightsfromMultimodalLLMPre-training》中，苹果正式公布自家的多模态大模型研究成果——这是一个具有高达300亿（其他为30亿、70亿）的多模态模型系列，它由密集模型和混合专家（MoE）变体组成，不仅在预训练指标中实现SOTA，在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。MM1多模态大模型拥有图像识别和自然语言推理能力。（IT之家）

在Telegram中查看

相关推荐

【#苹果推出300亿参数MM1多模态大模型，可识别图像推理自然语言】近日，在一篇由多位作者署名的论文《MM1:Methods,A

【#苹果推出300亿参数MM1多模态大模型，可识别图像推理自然语言】近日，在一篇由多位作者署名的论文《MM1:Methods,Analysis&InsightsfromMultimodalLLMPre-training》中，苹果正式公布自家的多模态大模型研究成果——这是一个具有高达300亿（其他为30亿、70亿）的多模态模型系列，它由密集模型和混合专家（MoE）变体组成，不仅在预训练指标中实现SOTA，在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。MM1多模态大模型拥有图像识别和自然语言推理能力。（IT之家）

苹果推出 300 亿参数 MM1 多模态 AI 大模型，可识别图像推理自然语言

苹果公司旗下研究团队近日在 ArXiv 中公布了一篇名为《MM1：Methods， Analysis&InsightsfromMultimodalLLMPre-training》的论文，其中介绍了一款“MM1”多模态大模型，该模型提供 30亿、70亿、300亿三种参数规模，拥有图像识别和自然语推理能力。苹果研究团队相关论文主要是利用MM1 模型做实验，通过控制各种变量，找出影响模型效果的关键因素。研究表明，图像分辨率和图像标记数量对模型性能影响较大，视觉语言连接器对模型的影响较小，不同类型的预训练数据对模型的性能有不同的影响。据介绍，研究团队首先在模型架构决策和预训练数据上进行小规模消融实验。之后利用混合专家（MixtureofExperts）架构及一种名为Top-2Gating的方法构建了MM1模型，号称不仅在预训练指标中实现了最好的性能表现，在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。研究人员对“MM1”模型进行了测试，号称 MM1-3B-Chat 和 MM1-7B-Chat 优于市面上绝大多数相同规模的模型。MM1-3B-Chat 和 MM1-7B-Chat 在 VQAv2、TextVQA、ScienceQA、MMBench、MMMU 和MathVista中表现尤为突出，但是整体表现不如谷歌的Gemini和OpenAI的GPT-4V。ArXiv论文地址：https://arxiv.org/pdf/2403.09611.pdfvia匿名标签:#Apple#AI#MM1频道:@GodlyNews1投稿:@GodlyNewsBot

Apple发布大模型论文：多模式LLM预培训的方法、分析和见解

Apple发布大模型论文：多模式LLM预培训的方法、分析和见解2024年3月14日，苹果公司发布了自家的大型多模态基础模型MM1，该模型拥有高达300亿参数，并采用混合专家（MoE）架构。超过半数的论文作者是华人。MM1模型在多模态任务上显示出强大的性能，尤其是在少样本学习和上下文预测方面。研究团队通过对不同架构组件和数据选择的深入分析，提出了几条关键的设计准则。他们发现，图像分辨率、视觉编码器损失和容量，以及预训练数据的类型对模型性能有显著影响。MM1模型的开发，标志着苹果在生成式人工智能领域的重要进展。线索：@ZaiHuabot投稿：@TNSubmbot频道：@TestFlightCN

苹果推出300亿参数多模态大模型全面转向生成式AI

苹果推出300亿参数多模态大模型全面转向生成式AI就在近日，苹果公司研发团队发布了一篇论文《MM1：Methods，Analysis&InsightsfromMultimodalLLMPre-training》，首次公布了多模态大模型MM1，展示了该公司在AI方面的进展与实力。据悉，MM1最高参数量为300亿，该模型支持增强的上下文学习和多图像推理，在一些多模态基准测试中有较好表现。研究人员使用这些模型进行实验，找出影响大模型表现的关键因素。有趣的是，图像分辨率和图像标签数量比视觉语言连接器的影响更大，不同的预训练数据集会显著影响模型的有效性。MM1的独特之处在于其庞大的规模和架构创新，包括密集的模型和混合专家模型。这些模型证明了研究人员方法的有效性，将大规模预训练与战略性数据选择相结合，以增强模型的学习能力。研发团队称，MM1不仅在预训练指标中是“最先进的”，并且在一系列已建立的多模态基准测试中，经过微调后也保持了“有竞争力的”性能。MM1可以支持增强的上下文学习和多图像推理，使得少数样本的思维链提示成为可能。然而，目前MM1的整体性能还没有完全超过谷歌的Gemini和OpenAI的GPT-4，虽然MM1可能还不是绝对的领导者，但它仍然是苹果在AI方面的一次重大飞跃。与此同时，苹果公司还出手收购了AI初创公司DarwinAI。DarwinAI以创建更小、更快的AI系统见长，这是实现设备上高效处理的关键因素。收购完成后，DarwinAI的网站和社交媒体账户已悄然下线。据悉，数十名DarwinAI员工已经加入了苹果的AI部门，作为交易的一部分，滑铁卢大学的AI研究员AlexanderWong已加入苹果，担任AI团队的总监。...PC版：https://www.cnbeta.com.tw/articles/soft/1424021.htm手机版：https://m.cnbeta.com.tw/view/1424021.htm

多项大模型、智能硬件等产品技术在 2024GDC 大会全球首发

多项大模型、智能硬件等产品技术在2024GDC大会全球首发在“2024全球开发者先锋大会”（GDC）开幕式上，多项最新大模型、数据及大模型驱动的智能硬件全球首发，包括：上海人工智能实验室发布新一代高质量大模型训练数据集万卷2.0；商汤科技发布了国内首款金融大模型检索问答一体机；阶跃星辰发布了Step系列通用大模型，包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型以及Step-2万亿参数MoE语言大模型预览版；财跃星辰发布国内首个千亿参数多模态金融大模型；元始智能超越Transformer，RWKV第6代架构最新模型开源；幂方科技发布外脑穿戴——大模型驱动的智能硬件。（科创板日报）

一篇论文引发辉瑞股价直线拉升 GLP-1赛道有望迎来强劲新药

一篇论文引发辉瑞股价直线拉升GLP-1赛道有望迎来强劲新药（来源：JAMA）需要说明的是，相关结果曾在去年的医学会议中展示过，但经过同行评审的论文直到周一才在《美国医学会杂志》上刊登。即便如此，资本市场依然给予热烈反应，2100亿美元市值的辉瑞直线拉涨近4%。近半年来，辉瑞股价一直受到疫苗销售收入下滑的拖累。（辉瑞分钟线图，来源：TradingView）根据完整公开的二期试验数据，总共有411名二型糖尿病患者入组，每天服用两粒Danuglipron或安慰剂。2.5毫克至120毫克的版本均显示出血糖下降的效果，但论减重，120毫克版本的受试者在服用16周后平均减掉10磅（4.6千克）的体重。作为目前已经上市的爆品，诺和诺德的Ozempic此前在三期试验数据中报告称，1mg注射版本的药物在30周后平均减重9.9磅。患者需要每周进行一次注射。（来源：JAMA）这一数据也展现GLP-1类疗法的提升潜力——在更短的时间内起效，而且不需要注射给药。从作用原理上来看，这些药物模仿肠道中产生的GLP-1激素，向大脑发出已经“吃饱”的信号。同时由于这款药物能鼓动胰脏生产更多的胰岛素，对于二型糖尿病患者控制血糖也有裨益。近几年来，随着一众好莱坞明星、社交媒体网红，以及知名科技富豪马斯克都在使用这款药物，以至于诺和诺德不得不控制接纳新患者，以保证治疗中的患者不断药。持续的热度也推动诺和诺德股价走强，过去3年时间翻了足足4倍，市值也达到3800亿美元。（诺和诺德周线图，来源：TradingView）股价反应的正是这款药物的无限“钱景”。根据美国国立卫生研究院的统计，该国每5个成年人中就有两人超重，同时每11个成年人中就有1人严重肥胖。GLP-1药物的诞生，也令“药物减肥”重新走上了台面。不过许多卫生专家也提出警告称，许多媒体将这类药物吹捧成“减重神药”，背后也隐含着将减重理想化的风险，恐进一步推动错误且危险的饮食文化。与许多减重措施类似，许多使用GLP-1药物的患者也报告停药后体重“不受控反弹”的情况。对此，医药公司也搬出了减肥界老生常谈的常识。诺和诺德全球药物发现高级副总裁KarinConde-Knape表示，停药后的反弹也取决于个人，如果患者保持（服药时）相同的摄入量和运动量，那么体重也能维持，但如果患者开始“吃得更多”，体重控制不住也在情理之中。根据既往对于减肥药的研究，绝大多数患者因服药掉的秤会在5年内长回来，其中2-3年就会胖回来一半。而有些人最终也会变得更胖。Conde-Knape在今年3月提及，现有的试验也显示使用Ozempic的患者会出现类似的体重反弹。...PC版：https://www.cnbeta.com.tw/articles/soft/1361081.htm手机版：https://m.cnbeta.com.tw/view/1361081.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人