LLM竞争白热化了，Inflection发布Inflection-2.5模型，他们称这是世界上最好的语言模型，Inflectio

LLM竞争白热化了，Inflection发布Inflection-2.5模型，他们称这是世界上最好的语言模型，Inflection-2.5 现已向所有 Pi 用户开放。 Inflection-2.5 接近 GPT-4 的性能，但仅使用了 40% 的计算量用于训练。我们在编码和数学等智商领域取得了特别的进步。 Pi 现在还融入了世界一流的实时网络搜索功能，以确保用户获得高质量的突发新闻和最新信息。 Inflection-1 使用的训练 FLOP 约为 GPT-4 的 4%，平均而言，在各种 IQ 导向的任务中，其表现约为 GPT-4 水平的 72%。现在为 Pi 提供支持的 Inflection-2.5，尽管只使用了 40% 的训练 FLOP，但其平均性能却达到了 GPT-4 的 94% 以上。详细信息：

在Telegram中查看

相关推荐

Pi AI从 LLM升级到Inflection-2.5 使其变得聪明而富有同情心

Pi AI从 LLM升级到Inflection-2.5 使其变得聪明而富有同情心 Inflection AI 表示，在这次更新中，它在编码和数学等领域取得了长足进步，从而在行业基准测试中取得了更好的成绩。这次更新还让 Pi 具备了实时网络搜索的能力，因此它可以获得最新的信息。该公司表示，更新已经向用户推出，这使得用户情绪、参与度和留存率都得到了改善。对于没有尝试过它的人来说，它很像 ChatGPT，甚至支持语音通话；不想使用该应用的人也可以通过 WhatsApp、Instagram、Messenger 和 Telegram 与人工智能聊天。在 MMLU、GPQA、BIG-Bench-Hard、Mathematics、Coding 和 Common Sense 基准测试中，Inflection-2.5 稍微落后于 GPT-4，但也只是稍稍落后，而与 Inflection-1 相比则取得了长足进步。您可以查看下面的结果：Inflection AI 表示，尽管此次更新提高了智商，但其 LLM 的情商仍然很高，因此非常友好和平易近人。该公司还表示，它采用了非凡的安全标准。继Claude 3 系列模型 Haiku、Sonnet 和 Opus 发布之后，Inflection-2.5 也紧随其后发布。这些模型与 OpenAI 的 GPT-4 不相上下，甚至更胜一筹。Google最新的 Gemini 型号也具有类似的性能。据称，Meta 正在准备在七月左右发布 Llama 3 LLM，它也很可能与 GPT-4 不相上下。由于大多数竞争对手都在追赶 GPT-4，OpenAI 可能会感到压力，不得不发布其模型的更新；GPT-4 于 2023 年 3 月 14 日发布。了解更多： ... PC版：手机版：

近日，由 DeepMind 联合创始人 Mustafa Suleyman 和 LinkedIn 联合创始人 Reid Hoffm

近日，由 DeepMind 联合创始人 Mustafa Suleyman 和 LinkedIn 联合创始人 Reid Hoffman 创立的位于帕洛阿尔托的初创公司 Inflection AI 宣布了一个名为 Inflection-2.5 的新模型。Inflection-2.5 的性能显着优于该公司最初的 Inflection-1，并且几乎与 OpenAI 的 GPT-4 模型相匹配。此外，与 GPT-4 一样，该模型还集成了实时网络搜索功能，为用户提供最新的时事信息。鉴于该公司已将 Pi 助手定位为每个人的人工智能，这将是一次重大升级。就基准测试性能而言，升级后的模型比 Inflection 1 全面改进，并接近 GPT-4，尽管仍然落后。目前，Pi 聊天机器人可在 Android、iOS、Web 和桌面应用程序上使用。 Pi 使用地址： via 匿名标签: #Inflection #AI 频道: @GodlyNews1 投稿: @GodlyNewsBot

OpenAI强敌出手：Inflection-2.5 训练计算量仅40%、性能直逼GPT-4

OpenAI强敌出手：Inflection-2.5 训练计算量仅40%、性能直逼GPT-4 让Pi聊天机器人比较Inflection-2.5与GPT-4试用直通车：https:// 1.5 Pro、Claude 3 Opus，以及最新登场的Infection-2.5。这意味着GPT-4独霸时代已经过去，大模型王者之战还有很多可能。在这场激烈的战事中，Inflection AI既年轻又锋芒毕露，成立刚满两年，由前DeepMind首席科学家Karén Simonyan、LinkedIn联合创始人Reid Hoffman、DeepMind联合创始人Mustafa Suleyman共同创办，2023年6月获得英伟达、微软等参投的13亿美元融资，估值达40亿美元（折合约287亿人民币），是当前全球第四大生成式AI独角兽。它是OpenAI的大语言模型劲敌之一，以“为每个人创造一个个性化的AI”为使命，2023年5月推出了一款具有同理心、乐于助人和安全的个性化AI聊天助手Pi，11月推出基础模型Inflection-2。与此同时，Inflection AI正在构建由22000万块H100 GPU组成的世界最大AI计算集群。现在，Inflection AI进一步给Pi加料新升级的Inflection-2.5有“世界级的智商”、“独特的善良”、“好奇的个性”，并具备4个主要亮点：1、在关键基准测试中与GPT-4并驾齐驱，并且使用40%的计算量来训练，与其他顶级基础模型相比训练效率优势显著。2、在编程、数学等STEM（科学、技术、工程、数学）领域进步显著。3、“世界级”实时网络搜索功能：确保用户能获得高质量、最新的新闻和信息，增强用户体验和交互的即时性。4、广泛可用性+显著满意度：对所有Pi用户开放，支持多平台访问，对用户情绪、参与度和留存率产生显著影响，加速了有机用户增长。继Anthropic后，又一家初创公司推出了性能强大、能与GPT-4一较高下的大语言模型，并在优化模型训练方法上大秀肌肉。这展现了创业团队在大模型竞赛中的潜力和冲劲，随着大模型性能不断升级，如何用更少计算资源训出更强模型，将是接下来产学界都重点探索的方向。01.用40%的计算量，训练出接近GPT-4的性能Inflection-1用了GPT-4训练FLOPs的约4%，在不同的智商导向任务中，平均性能达到GPT-4水平的大约72%。Inflection-2.5用了GPT-4训练FLOPs的40%，在不同的智商导向任务中，平均性能达到GPT-4的94%以上。Inflection-2.5在MMLU基准测试上的成绩相较Inflection-1进步明显，略低于GPT-4。MMLU基准测试衡量了从高中到专业难度的各种任务的性能。Inflection AI还根据GPQA钻石基准进行评估，这是一个极难的专家级基准。其测试还包括两种不同的STEM（科学、技术、工程、数学）考试的结果：匈牙利数学考试和物理GRE（物理研究生入学考试）的表现。在BIG-Bench-Hard（大语言模型难以解决的BIG-Bench问题的子集）上，Inflection-2.5性能比Inflection-1提高10%以上，接近GPT-4。在MT-Bench上评估模型后，Inflection AI意识到，在推理、数学、编程类别中，有很大一部分（接近25%）的示例具有不正确的参考解决方案或具有错误前提的问题。因此Inflection AI更正了这些示例，并发布了该版本的数据集。在评估这两个子集时，Inflection AI发现在正确修正的版本中，其模型更符合他们基于其他基准的期望。与Inflection-1相比，Inflection-2.5在数学和编程性能方面有了显著进步。下表是在MBPP+和HumanEval+两个编程基准上的评测结果对比。在HellaSwag和ARC-C常识和科学基准测试上进行评估，Inflection-2.5同样表现强劲。02.特别致谢微软Azure和CoreWeave，正构建世界最大AI集群上面所有的评估都是用现在为Pi提供动力的模型Inflection-2.5完成的，但是Inflection AI注意到，受web检索的影响（没有使用web检索的基准测试），少量提示词的结构以及其他生产端差异，用户体验可能会略有不同。这家独角兽企业还专门致谢了为其提供算力资源的合作伙伴Azure和CoreWeave。Azure是微软云计算服务，CoreWeave则是去年凭借英伟达的支持坐拥数万块芯片狂揽算力大单的GPU云服务黑马。2023年初，CoreWeave找到Inflection并为其提供几千张H100 GPU。英伟达看中了这个组合的巨大潜力，先后向两家公司投资数亿美元，抬高了Coreweave的H100供货优先级。2023年6月，Inflection AI宣布与将与合作伙伴CoreWeave、英伟达一起，构建世界上最大的AI集群，包含22000个H100 GPU。CoreWeave-Infection AI超算的信息推测（图源：The Next Platform）就在宣布最大AI集群的一个月前，Inflection AI推出Pi聊天机器人，向OpenAI正式下战书。不同于ChatGPT等产品的“生产力工具”定位，Pi想做“个人AI”，成为用户24小时在线的数字朋友，更注重为用户带来友好、丰富的社交互动体验。Pi能记住与跨平台登录用户的100次对话，支持网页、APP、短信、社交平台等设备交互。相比其他AI聊天机器人，Pi可能在文本生成、代码生成等能力上不算出众，但在安全、同理心等特性上独树一帜。这也是为什么这家创企刚创办就从微软等公司处筹集2.25亿美元，一年后又拿到微软、英伟达、微软联合创始人比尔·盖茨、Alphabet前CEO Eric Schmidt等的13亿美元融资，飞速成为全球最大的生成式AI独角兽之一。截至2023年年底，Inflection AI估值约为40亿美元，是全球第四大生成式AI独角兽，仅次于OpenAI、Anthropic、Character.AI。03.联创团队有钱有技术：曾创办DeepMind，曾投资OpenAI2022年3月成立的年轻AI团队，能赢得微软和英伟达两大巨头的青睐，与其创始团队密不可分。Inflection AI联合创始人Reid Hoffman被称作“硅谷人脉王”，是硅谷最有名的天使投资人之一，他是全球最大专业社交网站LinkedIn的联合创始人，以及风险投资机构Greylock Partners的合伙人，曾是OpenAI的创始投资者。截至2023年5月，Reid Hoffman和Greylock Partners已投资至少37家AI公司。左为Mustafa Suleyman，右为Reid Hoffman（图源：福布斯、Business Insider）另一位联合创始人Mustafa Suleyman，2009年与几位合伙人共同创立DeepMind，并将研究重点放到AI在医疗健康和气候变化中的应用，但连年亏损压得Suleyman喘不过气。2014年，Google抛出橄榄枝，6亿美元将DeepMind收入麾下。背靠金主的DeepMind终于可以没有资金之忧地继续从事前沿研究，然而5年后，Suleyman却选择离开DeepMind，加入Google并担任AI产品管理和AI政策副总裁。背后原因，据说是由于一些同事曾抱怨他在工作上骚扰和欺凌同事。Suleyman也曾坦言，作为DeepMind联合创始人，他对员工的要求过于苛刻，有时他的管理风格并不具有建设性。2022年，他离开Google，创办Inflection AI并担任CEO，“希望与有远见和无所畏惧的创始人在一起”。第三位联合创始人是前DeepMind首席科学家Karén Simonyan，现任Inflection AI首席科学家。他是同代中成就突出的深度学习研究者之一，其出版物（包括5篇在学术顶级期刊Nature和Science上的论文）吸引了超过18万次引用。Karén Simonyan部分高引用量学术成果Karén Simonyan在牛津大学完成了博士学位和博士后学位，期间设计了VGGNet图像处理框架并在赢得了知名的ImageNet挑战赛。随后他创办Vision Factory AI公司，将VGGNet商业化。这家公司很快就被DeepMind收购，karsamyn的身份则变成了DeepMind首席科学家。任职DeepMind首席科学家期间，karsamyn建立并领导了大规模深度学习团队，开发了基于真实世界数据的大型AI模型。他在AlphaZero、AlphaFold、WaveNet、BigGAN和Flamingo等AI突破中均发挥了关键作用。04.结语：团队不到50人，Pi每日聊天消息数超40亿据外媒Axios援引Suleyman的话，当前Inflection AI团队拥有70名员工。据Inflection AI透露，其100万日活跃用户和600万月活跃用户与Pi聊天机器人往来了超过40亿条消息。与Pi的平均谈话时间为33分钟，每天有1/10的谈话时间超过1小时。在任何一周与Pi交谈的用户中，约... PC版：手机版：

阿里云发布通义千问2.5 称性能赶超 GPT-4

阿里云发布通义千问2.5 称性能赶超 GPT-4 阿里云9日正式发布通义千问2.5。阿里云方面表示，该模型性能全面赶超 GPT-4 Turbo。阿里云表示，与通义千问2.1版本相比，通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%；与 GPT-4 相比，中文语境下，通义千问2.5文本理解、文本生成、知识问答及生活建议、闲聊及对话、安全风险等多项能力赶超 GPT-4。阿里云称，在权威基准 OpenCompass 上，通义千问2.5得分追平 GPT-4 Turbo，是中国国产大模型首次在该基准取得该项成绩。

LLaV：一个拥有类似 GPT-4 的大语言+视觉模型

LLaV：一个拥有类似 GPT-4 的大语言+视觉模型 “使用机器生成的指令跟踪数据对大型语言模型 (LLM) 进行指令调优提高了新任务的零样本能力，但这一想法在多模式领域的探索较少。所以，我们开始尝试使用纯语言 GPT-4 生成多模态语言图像指令跟踪数据。通过对此类生成的数据进行指令调整，并推出了 LLaVA：大型语言和视觉助手。这是一种端到端训练的大型多模态模型，连接视觉编码器和 LLM 以实现通用视觉和语言理解。早期实验表明，LLaVA 展示了令人印象深刻的多模型聊天能力，有时在看不见的图像 / 指令上表现出多模态 GPT-4 的行为，并且与合成多模态指令跟随数据集上的 GPT-4 相比，相对分数达到了 85.1%。当在 Science QA 上进行微调时，LLaVA 和 GPT-4 的协同作用达到了 92.53%，这个准确率颇高。因此，我们在 GitHub 正式开放 GPT-4 生成的视觉指令调整数据、模型和代码库。” |||||

OpenAI 正式公布人工智能语言模型 GPT-4

OpenAI 正式公布人工智能语言模型 GPT-4 3月15日早间，人工智能初创公司 OpenAI 正式公布最新一代人工智能语言模型 GPT-4。它是 OpenAI 在放大深度学习方面的努力的最新里程碑，是一个大型多模态模型，可接受图像和文本输入，发出文本输出。 GPT-4 对月订阅费20美元 ChatGPT Plus 用户开放使用，同时也会纳入到微软的 Bing 聊天机器人中。相关链接： - OpenAI-GPT-4 https://openai.com/research/gpt-4 - GPT-4 Developer Livestream http://www.youtube.com/watch?v=outcGtbnMuQ - ChatGPT Plus 访问 GPT-4 https://chat.openai.com - GPT-4 API 候补名单申请 https://openai.com/waitlist/gpt-4-api - 优先获得 API 权限的方法 https://github.com/openai/evals

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人