月之暗面回应大模型称9.11大于9.9:边界案例有助于我们增加对大模型能力边界的了解

月之暗面回应大模型称9.11大于9.9:边界案例有助于我们增加对大模型能力边界的了解针对之前“大模型测不出9.11和9.9哪个大”这一热门议题,月之暗面回应表示:“其实我们人类对大模型的能力探索——无论是大模型能做到什么,还是大模型做不到什么——都还处于非常早期的阶段。我们非常期待用户在使用中能够发现和报告更多的边界案例(CornerCase),不管是最近的‘9.9和9.11哪个大、13.8和13.11哪个大’,还是之前的‘strawberry有几个r’,这些边界案例的发现,有助于我们增加对大模型能力边界的了解。”不过,另有企业内部人员表示,“在一些场景,9.11确实比9.9大,版本号9.11是比9.9大,日期9.11是比9.9大,章节9.11章节也比9.9大……”该人士指出,“大模型学到的更多是上述这样的内容,之前也没人类来这么问他,所以他就没有跟人类的需求对齐,下一步对齐一下就好了。”关注频道@ZaiHuaPd投稿爆料@ZaiHuabot

相关推荐

封面图片

大模型集体“失智”:9.11 和 9.9 哪个大,几乎全翻车了

大模型集体“失智”:9.11和9.9哪个大,几乎全翻车了近日,有博主在使用GPT-4o时偶然发现,当提问:9.11and9.9——whichisbigger?GPT-4o竟毫不犹豫回答前者更大。面对这一常识性“错误”,他不死心地又去问了其他大模型,结果几乎全军覆没。而在国内大模型上,Kimi、ChatGLM、文心一言等也都是回答前者更大。不过由于百度给出了分析过程,让我们得以解惑。原来大模型把9.11拆分为9、小数点和11,11自然是比9要大。不过也有网友认为,像版本号、书籍目录等,9.11比9.9要大,AI可能混淆了这部分数据。关注频道@ZaiHuaPd频道爆料@ZaiHuabot

封面图片

DeepMind最新AlphaFold模型有助于新药研发

DeepMind最新AlphaFold模型有助于新药研发实验室的工作仍在继续。今天,DeepMind透露,最新版本的AlphaFold(AlphaFold2的后继者)可以对蛋白质数据库(世界上最大的生物分子开放获取数据库)中的几乎所有分子生成预测。据DeepMind博客上的一篇文章称,专注于药物发现的DeepMind衍生公司IsomorphicLabs已经将新的AlphaFold模型应用于治疗药物设计,帮助表征对治疗疾病很重要的不同类型的分子结构。新的AlphaFold的功能超出了蛋白质预测的范围。DeepMind声称,该模型还可以准确预测配体的结构-与“受体”蛋白结合并导致细胞通讯方式发生变化的分子)以及核酸(包含关键遗传信息的分子)和翻译后修饰(化学修饰)的结构。蛋白质产生后发生的变化。DeepMind指出,预测蛋白质配体结构可以成为药物发现的有用工具,因为它可以帮助科学家识别和设计可能成为药物的新分子。目前,药物研究人员使用称为“对接方法”的计算机模拟来确定蛋白质和配体如何相互作用。对接方法需要指定参考蛋白质结构以及该结构上配体结合的建议位置。然而,使用最新的AlphaFold,无需使用参考蛋白质结构或建议位置。该模型可以预测以前尚未“结构表征”的蛋白质,同时模拟蛋白质和核酸如何与其他分子相互作用——DeepMind表示,目前的对接方法无法实现这种建模水平。DeepMind在博文中写道:“早期分析还表明,我们的模型在一些与药物发现相关的蛋白质结构预测问题(例如抗体结合)上远远优于(上一代)AlphaFold。我们的模型在性能上的巨大飞跃表明人工智能具有极大增强对构成人体的分子机器的科学理解的潜力。”不过,最新的AlphaFold并不完美。DeepMind和IsomorphicLabs的研究人员在一份详细介绍该系统优势和局限性的白皮书中透露,该系统无法达到预测RNA分子(人体内携带制造蛋白质指令的分子)结构的一流方法。毫无疑问,DeepMind和IsomorphicLabs都在努力解决这个问题。...PC版:https://www.cnbeta.com.tw/articles/soft/1393483.htm手机版:https://m.cnbeta.com.tw/view/1393483.htm

封面图片

【Poly Network生态核心贡献者:建立统一的跨链安全模型有助于我们系统化理解互操作风险】

【PolyNetwork生态核心贡献者:建立统一的跨链安全模型有助于我们系统化理解互操作风险】4月15日消息,在2023香港Web3嘉年华跨链专场中,PolyNetwork生态核心贡献者LukeLiu认为,建立统一的跨链安全模型有助于我们系统化理解互操作风险。跨链的目标是标准化通信过程,保证一条链上的请求在另一条链上被正确、顺利地执行。各条链是不同的,但我们尽量建立起统一的风险模型,包括数据请求、通信、验证三个环节。经由数学(模型)抽象,区块链系统中的多链互操作包含应用、通信、共识等不同层的协同,这一套组合交互系统既依赖各组件的安全性,也考验各组件之间交互的安全性。建立起这样的(安全)框架可以帮助我们更系统性地理解互操作风险,而非根据个例归纳。

封面图片

使用AI语言模型有助于诊断精神分裂症

使用AI语言模型有助于诊断精神分裂症目前,精神疾病的诊断几乎完全依赖于与患者及其亲近的人交谈,血液检查和脑扫描等测试只起极小的作用。但是,这种诊断的不精确阻碍了对精神疾病成因的更深入理解,也阻碍了治疗效果的监测。研究人员让26名患有精神分裂症的参与者和26名对照组参与者完成两个言语流畅性任务,要求他们在5分钟内尽可能快地说出属于“动物”类别的词或以“p”开头的词。为了分析参与者的回答,研究团队使用了一个AI语言模型,该模型通过训练大量互联网文本来表示词义,与人类表示词义的方式类似。他们测试人们自发回忆的词是否能被AI模型预测,以及精神分裂症患者的可预测性是否降低。结果发现,对照组参与者的回答确实比精神分裂症患者的回答更可被AI模型预测,这种差异在症状更严重的患者中最大。研究人员认为这种差异可能与大脑学习记忆和思想之间的关系以及在所谓“认知地图”中存储这些信息的方式有关。该研究的第二部分中,作者利用脑扫描测量了参与学习和存储“认知地图”的大脑区域中的脑活动,为这一理论提供了支持。第一作者MatthewNour博士表示,随着类似ChatGPT这样的AI语言模型的出现,自动语言分析已经为医生和科学家所用。这项工作展示了将AI语言模型应用于和语言、意义密切相关的精神病学领域的潜力。他们计划在更大的患者样本中广泛应用这项技术,以测试它在临床中的用途。如果这些工具被证明是安全和可靠的,他预计它们会在未来十年开始应用于临床。...PC版:https://www.cnbeta.com.tw/articles/soft/1389261.htm手机版:https://m.cnbeta.com.tw/view/1389261.htm

封面图片

苹果公司发表四款开源新模型 有助于提高未来人工智能的准确性

苹果公司发表四款开源新模型有助于提高未来人工智能的准确性这些指导模型被称为开源高效LLMs或OpenELMs,托管在协作平台HuggingFace上。HuggingFace用于托管人工智能模型,以及对其进行训练和与他人合作改进。OpenELM是指一个开源库,它利用进化算法将多个大型语言模型(LLM)结合在一起。这四个OpenELM模型采用"分层缩放策略",在变压器机器学习模型的各层中分配参数,以提高精确度。这些模型使用CoreNet库进行了预训练。苹果公司提供了使用2.7亿、4.5亿、11亿和30亿个参数的预训练和指令调整模型。预训练数据集由Dolmav1.6子集、RefinedWeb、重复PILE和RedPajama子集组合而成。这样得到的数据集约有1.8万亿个标记。在本周二发布的一篇相关论文中,该项目的研究人员表示,大型语言模型的可重复性和透明度"对于推进开放式研究至关重要"。它还有助于确保结果的可信度,并允许对模型偏差和风险进行调查。至于模型的准确性,据解释,在使用10亿个参数预算的情况下,OpenELM比OLMo的准确性提高了2.36%,而所需的预训练代币数量仅为OLMo的一半。模型和论文的作者包括SachinMehta、MohammadHosseinSekhavat、QingqingCao、MaxwellHorton、YanziJin、ChenfanSun、ImanMirzadeh、MahyarNajibi、DmitryBelenko、PeterZatloukal和MohammadRastegari。发布这些模型的源代码是苹果公司宣传其人工智能和机器学习发展成果的最新尝试。这并不是苹果公司第一次公开发布人工智能程序。今年10月,苹果分享了一个名为Ferret的开源LLM,它改进了模型分析图像的方式。今年4月,Ferret的新版本增加了解析应用程序截图中数据点的功能,并能大致了解应用程序的功能。此外,还发布了关于生成式人工智能动画工具和创建人工智能头像的论文。预计6月份的WWDC将包括苹果产品在人工智能方面的许多进展。...PC版:https://www.cnbeta.com.tw/articles/soft/1428512.htm手机版:https://m.cnbeta.com.tw/view/1428512.htm

封面图片

中信证券:大模型能力边界仍远未达到

中信证券:大模型能力边界仍远未达到中信证券研报表示,2023年ChatGPT破圈以来,各领域AI应用百花齐放,但除了ChatGPT本身外并没有出现真正意义上的KillerApp。当基础模型还未触及能力的边界,投资应用面临着可能重演Jasper.ai的窘境:护城河不够而被大模型击穿。因此我们认为当前产业最核心的驱动力仍在于基础模型能力的迭代,基础模型能力的上限将决定应用的下限与算力基础设施的上限。此次OpenAI发布Sora模型将AI能够理解和生成的内容模态从文字和图片拓展到视频和3D,表明基础模型能力上限仍在不断被提升,也侧面证明ScalingLaw仍没有结束,爆款应用落地尽管尚需时日,但想象空间被打开,对算力基础设施的需求也远没有停止。新一轮产业催化已经出现,短期行情强度可能弱于2023年2-5月,但持续性可能更长。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人