苹果研究人员探索放弃“Siri”短语,改用人工智能聆听

苹果研究人员探索放弃“Siri”短语,改用人工智能聆听 据周五 (3月22日) 发表的一篇论文称,苹果公司的研究人员正在研究是否有可能利用 AI 来检测用户何时在对 iPhone 等设备说话,从而消除对“Siri”等触发短语的技术需求。在一项上传到 Arxiv 且未经同行评审的研究中,研究人员使用智能手机捕获的语音以及来背景噪声的声学数据来训练一个大型语言模型,以寻找可能表明用户何时需要设备帮助的模式。论文中研究人员写道:“该模型部分基于 OpenAI 的 GPT-2 版本构建,因为它相对轻量级,可以在智能手机等设备上运行。”论文描述了用于训练模型的超过129小时的数据和额外的文本数据,但没有说明训练集的录音来源。据领英个人资料,七位作者中有六位列出他们的隶属关系为苹果公司,其中三人在该公司的 Siri 团队工作。论文称,结果令人鼓舞。该模型能够比纯音频或纯文本模型做出更准确的预测,并且随着模型规模的扩大而进一步改进。 、

相关推荐

封面图片

据《麻省理工科技评论》报道,当地时间周五(22)日发表的一篇论文显示,苹果公司的研究人员正在探索利用人工智能来检测用户何时在与

据《麻省理工科技评论》报道,当地时间周五(22)日发表的一篇论文显示,苹果公司的研究人员正在探索利用人工智能来检测用户何时在与 iPhone 等设备交谈的可能性,从而消除像“Siri”这样的触发短语的技术需求。 在这项上传到 Arxiv 且未经同行评审的研究中,研究人员使用智能手机捕获的语音以及来自背景噪音的声学数据,训练了一个大型语言模型,以寻找“可能表明用户需要设备辅助”的模式。 论文中称,该模型部分基于 OpenAI 的 GPT-2 构建,因为它相对轻量级,可以在智能手机等设备上运行。论文还描述了用于训练模型的超过 129 小时的数据、额外的文本数据,但没有说明训练集的录音来源。据领英个人资料,七位作者中有六位列出他们的隶属关系为苹果公司,其中三人在苹果 Siri 团队工作。 论文最终得出的结论“令人鼓舞”,声称该模型能够比纯音频或纯文本模型做出更准确的预测,并且随着模型规模的扩大而进一步改进。 目前,Siri 的功能是通过保留少量音频来实现的,听到“嘿,Siri”等触发短语之前,不会开始录制或准备回答用户提示。 斯坦福人类中心人工智能研究所的隐私和数据政策研究员詹・金表示,取消“嘿,Siri”提示可能会增加对设备“始终监听”的担忧。 via 匿名 标签: #Apple 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

研究发现:用人工智能生成的图像训练出的人工智能产生了糟糕的结果。

研究发现:用人工智能生成的图像训练出的人工智能产生了糟糕的结果。 斯坦福大学和莱斯大学的研究人员发现,生成式人工智能模型需要“新鲜的真实数据”,否则输出的质量就会下降。 这对摄影师和其他创作者来说是个好消息,因为研究人员发现,训练数据集中的合成图像会放大人工痕迹,使人工智能画出的人类看起来越来越不像真人。 研究小组将这种状况命名为“模型自噬障碍”。如果自噬循环的每一代都没有足够的新鲜真实数据,未来的生成模型注定会逐渐降低其质量或多样性。 如果该研究论文是正确的,那么这意味着人工智能将无法开发出无穷无尽的数据源。人工智能仍然需要真实、高质量的图像来不断进步,而不是依赖自己的输出。这意味着生成式人工智能将需要摄影师。

封面图片

研究人员使用人工智能对1560万个流行密码进行破解

研究人员使用人工智能对1560万个流行密码进行破解 来自 Home security heroes 的研究人员决定调查使用人工智能的密码破解速度。他们使用了1560万个流行密码的集合进行测试。 结果显示,PassGAN人工智能可以做到: - 51%的密码集合在1分钟内被破解; - 在1小时内破解集合中65%的密码; - 在24小时内破解集合中71%的密码; - 1个月内从集合中破解81%的密码。 “人工智能根据它所学到的一切,预测最可能的下一个数字。它没有寻求外部知识,而是依靠它通过学习形成的模式”,研究人员说。 当然,算力始终是挑战。越复杂越长的密码需要的破解时间就越多,对AI来说也一样。 您可以在这里查看AI 在 2023 年破解您选择的密码需要多长时间: #Security #Passwords #Privacy #AI

封面图片

苹果 Siri 的生成式人工智能版本将在今年的 WWDC 上公布

苹果 Siri 的生成式人工智能版本将在今年的 WWDC 上公布 据 9to5mac 报道,苹果 Siri 基于 Ajax 模型的生成人工智能版本将在今年 WWDC 上发布。这将为 Siri 带来更自然的对话和个性化体验。新功能预计将支持跨设备使用。新版 Siri 还添加了新的“苹果专属创作服务”

封面图片

MIT研究人员利用人工智能将仓库改造成高效枢纽

MIT研究人员利用人工智能将仓库改造成高效枢纽 在一个巨大的机器人仓库里,数百个机器人在地面上来回穿梭,抓取物品并交付给人类工人进行包装和运输。这种仓库正日益成为从电子商务到汽车生产等许多行业供应链的一部分。然而,要让 800 个机器人高效地往返于目的地,同时又要防止它们相互碰撞,并非易事。这个问题非常复杂,即使是最好的路径搜索算法,也很难跟上电子商务或制造业的飞速发展。人工智能驱动的高效解决方案从某种意义上说,这些机器人就像试图在拥挤的市中心穿梭的汽车。因此,一群利用人工智能缓解交通拥堵的麻省理工学院研究人员运用了这一领域的理念来解决这一问题。他们建立了一个深度学习模型,对仓库的重要信息(包括机器人、计划路径、任务和障碍物)进行编码,并利用这些信息预测仓库的最佳疏导区域,以提高整体效率。他们的技术将仓库中的机器人分成若干组,因此这些较小的机器人组可以用协调机器人的传统算法更快地消除拥堵。最终,与强随机搜索法相比,他们的方法疏导机器人的速度快了近四倍。除了简化仓库作业,这种深度学习方法还可用于其他复杂的规划任务,如计算机芯片设计或大型建筑的管道布线。尖端的神经网络架构"我们设计了一种新的神经网络架构,它实际上适用于这些仓库这种规模和复杂程度的实时操作。它可以对数百个机器人的轨迹、出发地、目的地以及与其他机器人的关系进行编码,而且能以一种高效的方式在各组机器人之间重复使用计算,"土木与环境工程(CEE)专业吉尔伯特-W-温斯洛职业发展助理教授、信息与决策系统实验室(LIDS)和数据、系统与社会研究所(IDSS)成员凯茜-吴(Cathy Wu)说。该技术论文的资深作者 Wu 和第一作者、电子工程和计算机科学专业研究生 Zhongxia Yan 共同完成了这项研究。这项研究成果将在学习表征国际会议(International Conference on Learning Representations)上发表。机器人俄罗斯方块从鸟瞰图上看,机器人电子商务仓库的地面有点像快节奏的"俄罗斯方块"游戏。当客户下订单时,机器人会前往仓库的某一区域,抓起放置所需物品的货架,然后将其交给人类操作员,由其拣选和包装物品。数百个机器人同时进行这项工作,如果两个机器人在穿过巨大的仓库时发生路径冲突,就可能会撞车。传统的搜索算法可以避免潜在的碰撞,方法是保持一个机器人的运行轨迹,并为另一个机器人重新规划轨迹。但由于机器人数量众多,可能发生碰撞,问题很快就会呈指数级增长。"由于仓库是在线运行的,机器人大约每 100 毫秒重新扫描一次。也就是说,每秒钟,机器人要重新扫描 10 次。因此,这些操作必须非常快速,"Wu 说。由于在重新规划过程中时间非常关键,麻省理工学院的研究人员利用机器学习将重新规划的重点放在最有可能减少机器人总行驶时间的拥堵区域。Wu 和 Yan 建立的神经网络架构可同时考虑较小的机器人群组。例如,在一个拥有 800 个机器人的仓库中,网络可能会将仓库地面切割成更小的组,每组包含 40 个机器人。然后,如果使用基于搜索的求解器来协调该组机器人的轨迹,它就会预测出哪一组最有可能改进整体解决方案。整个算法是一个迭代过程,先用神经网络选出最有希望的机器人组,再用基于搜索的求解器解散机器人组,然后用神经网络选出下一个最有希望的机器人组,依此类推。简化复杂系统神经网络能有效地推理机器人群,因为它能捕捉到单个机器人之间存在的复杂关系。例如,即使一个机器人一开始离另一个机器人很远,它们在行进过程中的路径仍有可能交叉。该技术还能简化计算,只需对约束条件进行一次编码,而无需对每个子问题重复编码。例如,在一个拥有 800 个机器人的仓库中,要消除一组 40 个机器人的拥堵,需要将其他 760 个机器人作为约束条件。其他方法则需要在每次迭代中对每组所有 800 个机器人推理一次。相反,研究人员的方法只需要在每次迭代中对所有小组的 800 个机器人进行一次推理。她补充说:"仓库是一个大的环境,因此这些机器人群组中的很多都会在更大的问题上有一些共同点。我们设计的架构就是为了利用这些共同的信息。"研究人员在几个模拟环境中测试了他们的技术,包括一些像仓库一样的环境,一些带有随机障碍物的环境,甚至还有模拟建筑物内部的迷宫设置。通过识别出更有效的疏导群组,他们基于学习的方法疏导仓库的速度比强大的、非基于学习的方法快四倍。即使考虑到运行神经网络的额外计算开销,他们的方法解决问题的速度仍然快 3.5 倍。未来方向与同行认可未来,研究人员希望从他们的神经模型中获得简单、基于规则的见解,因为神经网络的决策可能不透明,难以解读。更简单、基于规则的方法也更容易在实际机器人仓库环境中实施和维护。"这种方法基于一种新颖的架构,在这种架构中,卷积和注意力机制能够有效地相互作用。令人印象深刻的是,它能够考虑到所构建路径的时空成分,而无需针对具体问题进行特征工程。结果非常出色。"康奈尔理工学院安德鲁-H.和安-R.-蒂施教授 Andrea Lodi 说:"我们不仅能在求解质量和速度方面改进最先进的大型邻域搜索方法,而且该模型还能很好地推广到未见过的案例中。"编译来源:ScitechDaily ... PC版: 手机版:

封面图片

Google研究人员发表论文探讨人工智能如何毁掉互联网

Google研究人员发表论文探讨人工智能如何毁掉互联网 研究发现,绝大多数生成式人工智能用户正在利用这项技术模糊真实性和欺骗性之间的界限,在互联网上发布虚假或篡改的人工智能内容,例如图片或视频。研究人员还仔细研究了之前发表的关于生成式人工智能的研究,以及大约 200 篇报道生成式人工智能滥用的新闻文章。研究人员总结道:操纵人类肖像和伪造证据是现实世界滥用案件中最普遍的手段。其中大多数都带有明显的意图,即影响舆论、进行诈骗或欺诈活动或牟利。使问题更加复杂的是,生成式人工智能系统日益先进且随时可用研究人员表示,只需要极少的技术专长,而这种情况正在扭曲人们对社会政治现实或科学共识的集体理解。据我们所知,这篇论文遗漏了什么?有没有提到谷歌自己在使用该技术时犯下的令人尴尬的错误 作为世界上最大的公司之一,谷歌的错误有时规模巨大。如果你读过这篇论文,你就会忍不住得出这样的结论:生成式人工智能的滥用听起来很像是该技术在按预期工作。人们正在使用生成式人工智能制作大量虚假内容,因为它非常擅长完成这项任务,结果导致互联网上充斥着人工智能垃圾。而这种情况正是谷歌自己促成的,它允许这些虚假内容泛滥,甚至是虚假内容的源头,无论是虚假图片还是虚假信息。研究人员表示,这一混乱局面也考验着人们辨别真假的能力。他们写道:同样,大量生产低质量、垃圾邮件和恶意的合成内容可能会增加人们对数字信息的怀疑态度,并使用户的验证任务负担过重。令人不寒而栗的是,由于我们被虚假的人工智能内容淹没,研究人员表示,有些情况下知名人士能够将不利的证据解释为人工智能生成的,从而以昂贵且低效的方式转移举证责任。随着谷歌等公司继续将人工智能融入到每一款产品中,我们将会看到更多这样的情况。了解更多: ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人