MIT研究人员发明可以用声音模拟世界的人工智能系统

MIT研究人员发明可以用声音模拟世界的人工智能系统计算机视觉是一个在过去几十年中被研究得相当多的领域，主要是因为它在建造自动驾驶汽车和其他可以像人类一样"看"世界的工具方面有着直接和明显的应用。然而，直到最近才看到这种水平的研究的一个领域是使用声音而不是视觉来模拟环境。现在，麻省理工学院（MIT）的研究人员已经撰写了一篇研究论文，涉及在这一领域训练的机器学习（ML）模型的构建。PC版：https://www.cnbeta.com.tw/articles/soft/1331483.htm手机版：https://m.cnbeta.com.tw/view/1331483.htm

在Telegram中查看

相关推荐

MIT研究人员利用人工智能将仓库改造成高效枢纽

MIT研究人员利用人工智能将仓库改造成高效枢纽在一个巨大的机器人仓库里，数百个机器人在地面上来回穿梭，抓取物品并交付给人类工人进行包装和运输。这种仓库正日益成为从电子商务到汽车生产等许多行业供应链的一部分。然而，要让800个机器人高效地往返于目的地，同时又要防止它们相互碰撞，并非易事。这个问题非常复杂，即使是最好的路径搜索算法，也很难跟上电子商务或制造业的飞速发展。人工智能驱动的高效解决方案从某种意义上说，这些机器人就像试图在拥挤的市中心穿梭的汽车。因此，一群利用人工智能缓解交通拥堵的麻省理工学院研究人员运用了这一领域的理念来解决这一问题。他们建立了一个深度学习模型，对仓库的重要信息（包括机器人、计划路径、任务和障碍物）进行编码，并利用这些信息预测仓库的最佳疏导区域，以提高整体效率。他们的技术将仓库中的机器人分成若干组，因此这些较小的机器人组可以用协调机器人的传统算法更快地消除拥堵。最终，与强随机搜索法相比，他们的方法疏导机器人的速度快了近四倍。除了简化仓库作业，这种深度学习方法还可用于其他复杂的规划任务，如计算机芯片设计或大型建筑的管道布线。尖端的神经网络架构"我们设计了一种新的神经网络架构，它实际上适用于这些仓库这种规模和复杂程度的实时操作。它可以对数百个机器人的轨迹、出发地、目的地以及与其他机器人的关系进行编码，而且能以一种高效的方式在各组机器人之间重复使用计算，"土木与环境工程（CEE）专业吉尔伯特-W-温斯洛职业发展助理教授、信息与决策系统实验室（LIDS）和数据、系统与社会研究所（IDSS）成员凯茜-吴（CathyWu）说。该技术论文的资深作者Wu和第一作者、电子工程和计算机科学专业研究生ZhongxiaYan共同完成了这项研究。这项研究成果将在学习表征国际会议（InternationalConferenceonLearningRepresentations）上发表。机器人俄罗斯方块从鸟瞰图上看，机器人电子商务仓库的地面有点像快节奏的"俄罗斯方块"游戏。当客户下订单时，机器人会前往仓库的某一区域，抓起放置所需物品的货架，然后将其交给人类操作员，由其拣选和包装物品。数百个机器人同时进行这项工作，如果两个机器人在穿过巨大的仓库时发生路径冲突，就可能会撞车。传统的搜索算法可以避免潜在的碰撞，方法是保持一个机器人的运行轨迹，并为另一个机器人重新规划轨迹。但由于机器人数量众多，可能发生碰撞，问题很快就会呈指数级增长。"由于仓库是在线运行的，机器人大约每100毫秒重新扫描一次。也就是说，每秒钟，机器人要重新扫描10次。因此，这些操作必须非常快速，"Wu说。由于在重新规划过程中时间非常关键，麻省理工学院的研究人员利用机器学习将重新规划的重点放在最有可能减少机器人总行驶时间的拥堵区域。Wu和Yan建立的神经网络架构可同时考虑较小的机器人群组。例如，在一个拥有800个机器人的仓库中，网络可能会将仓库地面切割成更小的组，每组包含40个机器人。然后，如果使用基于搜索的求解器来协调该组机器人的轨迹，它就会预测出哪一组最有可能改进整体解决方案。整个算法是一个迭代过程，先用神经网络选出最有希望的机器人组，再用基于搜索的求解器解散机器人组，然后用神经网络选出下一个最有希望的机器人组，依此类推。简化复杂系统神经网络能有效地推理机器人群，因为它能捕捉到单个机器人之间存在的复杂关系。例如，即使一个机器人一开始离另一个机器人很远，它们在行进过程中的路径仍有可能交叉。该技术还能简化计算，只需对约束条件进行一次编码，而无需对每个子问题重复编码。例如，在一个拥有800个机器人的仓库中，要消除一组40个机器人的拥堵，需要将其他760个机器人作为约束条件。其他方法则需要在每次迭代中对每组所有800个机器人推理一次。相反，研究人员的方法只需要在每次迭代中对所有小组的800个机器人进行一次推理。她补充说："仓库是一个大的环境，因此这些机器人群组中的很多都会在更大的问题上有一些共同点。我们设计的架构就是为了利用这些共同的信息。"研究人员在几个模拟环境中测试了他们的技术，包括一些像仓库一样的环境，一些带有随机障碍物的环境，甚至还有模拟建筑物内部的迷宫设置。通过识别出更有效的疏导群组，他们基于学习的方法疏导仓库的速度比强大的、非基于学习的方法快四倍。即使考虑到运行神经网络的额外计算开销，他们的方法解决问题的速度仍然快3.5倍。未来方向与同行认可未来，研究人员希望从他们的神经模型中获得简单、基于规则的见解，因为神经网络的决策可能不透明，难以解读。更简单、基于规则的方法也更容易在实际机器人仓库环境中实施和维护。"这种方法基于一种新颖的架构，在这种架构中，卷积和注意力机制能够有效地相互作用。令人印象深刻的是，它能够考虑到所构建路径的时空成分，而无需针对具体问题进行特征工程。结果非常出色。"康奈尔理工学院安德鲁-H.和安-R.-蒂施教授AndreaLodi说："我们不仅能在求解质量和速度方面改进最先进的大型邻域搜索方法，而且该模型还能很好地推广到未见过的案例中。"编译来源：ScitechDaily...PC版：https://www.cnbeta.com.tw/articles/soft/1422220.htm手机版：https://m.cnbeta.com.tw/view/1422220.htm

MIT 研究人员发现苹果 M1 芯片无法修复的硬件漏洞

MIT研究人员发现苹果M1芯片无法修复的硬件漏洞MIT研究人员发现苹果M1芯片存在一个无法修复的硬件漏洞，允许攻击者突破最后一道安全防线。漏洞存在于M1芯片硬件层安全机制PAC（pointerauthenticationcodes）中。PAC旨在加大向硬件内存注入恶意代码的难度，为抵御缓冲区溢出漏洞增加一层防御。但MIT的研究人员开发出了一种新颖的硬件攻击Pacman，利用预测执行泄露PAC验证结果。研究人员证明该攻击对系统内核也有效。攻击是在本地进行的，攻击者需要登陆进系统并安装一个定制的kext，操作难度很大。——IEEESpectrum，solidot

苹果研究人员开发了可以“看到”和理解屏幕上下文的人工智能

苹果研究人员开发了可以“看到”和理解屏幕上下文的人工智能根据周五发表的一篇，苹果研究人员开发了一个新的人工智能系统，可以理解对屏幕上实体的模糊引用以及对话和背景背景，从而能够与语音助理进行更自然的互动。该系统称为ReALM（参考分辨率作为语言建模），利用大型语言模型将参考分辨率的复杂任务（包括理解屏幕上对视觉元素的引用）转换为纯粹的语言建模问题。这使得ReALM能够与现有方法相比实现显著的性能提升。为了解决基于屏幕的引用，ReALM的一个关键创新是使用解析的屏幕中对象位置。研究人员证明，这种方法，结合专门用于参考分辨率的微调语言模型，在任务上可以优于GPT-4。线索：@ZaiHuabot投稿：@TNSubmbot频道：@TestFlightCN

研究人员发明结合声音和触觉刺激的耳鸣疗法

研究人员发明结合声音和触觉刺激的耳鸣疗法这不是源自于真实的声音，它被认为是在一个叫做背侧耳蜗核（DCN）的大脑区域产生的。DCN是大脑中音频信号的第一个处理站之一，但它也处理来自头部、耳朵和下巴的触摸感觉。研究人员认为，当DCN的神经回路因暴露在巨大噪音中的耳蜗损伤而发生改变，导致听觉系统感知到不存在的声音时，就会出现耳鸣。密歇根大学的一个团队研究了动物研究，其中发现通过声音和触摸信号对DCN的双感官刺激可以诱发神经可塑性，加强或削弱与耳鸣相关的电路，这取决于刺激之间的精确时间。研究人员设计了一项人体试验，其中59名男性和40名女性患有可通过下巴、头部或颈部运动进行调节的耳鸣--代表大多数耳鸣患者--接受了使用一个运行定制软件的便携式家庭设备的培训。参与者每天花30分钟连接到这个机器上，将一个电极放在靠近脖子或脸部的皮肤上，以产生微小的电脉冲，刚好低于参与者能够感觉到的水平。这些脉冲与短而低容量的音频脉冲一起呈现，旨在复制病人的耳鸣声，其时间设计旨在随着时间的推移缩小和削弱DCN中的耳鸣电路。大约一半的患者在前六周接受对照治疗，没有电脉冲。在六周后，两组人都有一个六周的"冲洗"期，他们不必做任何事情，然后两组人被调换到第二个六周的治疗期。任何在治疗过程中耳鸣症状加重的人都被排除在实验之外。病人报告说，他们无法分辨出积极治疗和控制治疗之间的区别。遵循测试方案的患者，其耳鸣功能指数平均下降了15分以上，超过了临床显著改善的13分阈值在实验的两个为期六周的治疗阶段中，积极治疗组的耳鸣功能指数（TFI）得分平均出现了临床意义上的改善，而对照组则没有。临床意义上的改善被定义为患者的TFI得分下降13分，大约65%遵循测试方案的积极组患者实现了这样的下降，而只有25%的对照组患者有同样的经历。遵循测试方案的积极组患者在六周后，其耳鸣的感觉水平平均下降了约7.5分贝。出乎意料的是，第一个活跃组的症状在没有治疗的整个冲洗期继续改善，12周后，他们的症状平均减少了10分贝以上的感觉水平。该研究没有在第二阶段的积极组中测量任何类似的长期改善。治疗6周后，患者甚至在没有进一步治疗的情况下继续改善，令研究人员感到惊讶。研究小组说，这些积极的结果表明，这种治疗方法可能会产生持久的积极影响，并可能为患者带来个性化的双感官耳鸣治疗。该研究论文在《美国医学会杂志》网络版上公开发表。...PC版：https://www.cnbeta.com.tw/articles/soft/1363857.htm手机版：https://m.cnbeta.com.tw/view/1363857.htm

苹果研究人员探索放弃“Siri”短语，改用人工智能聆听

苹果研究人员探索放弃“Siri”短语，改用人工智能聆听据周五(3月22日)发表的一篇论文称，苹果公司的研究人员正在研究是否有可能利用AI来检测用户何时在对iPhone等设备说话，从而消除对“Siri”等触发短语的技术需求。在一项上传到Arxiv且未经同行评审的研究中，研究人员使用智能手机捕获的语音以及来背景噪声的声学数据来训练一个大型语言模型，以寻找可能表明用户何时需要设备帮助的模式。论文中研究人员写道：“该模型部分基于OpenAI的GPT-2版本构建，因为它相对轻量级，可以在智能手机等设备上运行。”论文描述了用于训练模型的超过129小时的数据和额外的文本数据，但没有说明训练集的录音来源。据领英个人资料，七位作者中有六位列出他们的隶属关系为苹果公司，其中三人在该公司的Siri团队工作。论文称，结果令人鼓舞。该模型能够比纯音频或纯文本模型做出更准确的预测，并且随着模型规模的扩大而进一步改进。——、

研究人员探索使用机器人和人工智能开发更好的电池

研究人员探索使用机器人和人工智能开发更好的电池大约在今年年初，卡内基-梅隆大学的研究人员使用机器人系统又进行了几十次实验，以创造能让锂离子电池更快充电的电解质。这是广泛采用电动汽车的一个主要障碍。他们研发的Clio系统，包括自动泵、阀门和仪器，将各种化学品混合在一起，然后根据关键的电池基准测量其性能。这些结果随后被输入Dragonfly，这是一个机器学习程序，可以提出可能更有效的不同化学组合。PC版：https://www.cnbeta.com/articles/soft/1321899.htm手机版：https://m.cnbeta.com/view/1321899.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人