自主音频机器人群可在混乱的房间中实现静音对话

自主音频机器人群可在混乱的房间中实现静音对话我们人类闭着眼睛也能找到声源,这要归功于我们耳朵提供的略微分布的双麦克风阵列和音频屏蔽效果。但当音频环境变得复杂时,情况就会变得非常混乱--这与我们喜欢寻找嘈杂、拥挤和高能量空间(如周日上午的咖啡馆),然后试图在其中进行对话的怪癖不符。在这些较为混乱的音频空间中,要想隔离单个音源并静音其他音源,唯一的办法就是部署更大的麦克风阵列,然后将所有音频流处理在一起,创建一个空间地图,对每个声音的位置进行三角测量,测量声音在空气中传播并到达每个麦克风时的微小时间差。然后,您可以使用难以捉摸的深度学习算法对所有音频流进行重新处理,为每个声源创建独立的音频流,并消除来自其他声源的所有噪音。通过定位和跟踪房间中的多个声源,机器人麦克风阵列可以隔离不同的音频区域并使其静音图/华盛顿大学这个想法本身并不新鲜,但华盛顿大学的研究人员现在对这一概念提出了新的看法,他们使用了一个由七个带轮子的小麦克风机器人组成的蜂群,每个机器人都只有一块松露巧克力大小,它们能从充电站自主部署,并在可用空间内创建一个自我优化的阵列。这些机器人利用内置麦克风和扬声器,通过声纳在桌子表面导航,躲避障碍物,并尽可能广泛地分布,以最大限度地扩大麦克风之间的时间差。不幸的是,这确实意味着它们必须一个一个地移动,但一旦到位,它们的表现就相当惊人了,正如您在下面的视频中看到的那样。那么最终的目的是什么呢?研究团队认为,像这样的机器人阵列可以作为便携式、自动部署、隔音麦克风阵列,用于会议室直播等,理论上比人类更好地分散自己的声音。该团队表示,它在双向视频通话中的作用不大,因为虽然它的工作效率很高,但目前处理每三秒的声音块需要大约1.82秒。延迟也意味着它无法在短时间内将对话伙伴的纯净音频流传输到嘈杂的咖啡馆里的耳机中--尽管随着计算能力和速度的提高,这两种应用都有可能实现。当然,它也可以成为非常方便的监控工具,消除人群噪音的掩蔽效应,记录私人对话。有趣的是,华盛顿大学的研究团队表示,它的用途可能恰恰相反。这项研究的共同第一作者、博士生马利克-伊塔尼(MalekItani)说:"它有可能真正有利于隐私保护,超出目前智能扬声器所允许的范围。我可以说'不要录下我桌子周围的任何东西',我们的系统就会在我周围3英尺(0.9米)处产生一个气泡。这个气泡中的任何东西都不会被记录下来。或者,如果有两组人在旁边讲话,其中一组人正在进行私人对话,而另一组人正在录音,那么其中一组人的对话可以处于静音区,并保持私密性。"从充电站释放后,机器人利用声纳将自己分布在一个表面周围,以实现最大的空间隔离现实中,静态分布式麦克风阵列可能会在智能房间或智能家居设计中开始应用,它们可以轻松地将语音控制指令与不同区域隔离开来。比如,只听沙发上的声音就能控制电视,甚至在嘈杂的场所从站在吧台前的人那里分辨出饮料订单。该论文在《自然-通讯》(NatureCommunications)杂志上公开发表。...PC版:https://www.cnbeta.com.tw/articles/soft/1385665.htm手机版:https://m.cnbeta.com.tw/view/1385665.htm

相关推荐

封面图片

研究人员发现 WebEx 在用户关静音仍在搜集麦克风资料

研究人员发现WebEx在用户关静音仍在搜集麦克风资料研究团队分析了市面常见的视频会议App、桌面应用及网页版,包括Zoom、GoogleMeet、MicrosoftTeams、及CiscoWebex、GoToMeeting、Discord、Bluejeans等。结果显示,CiscoWebex是唯一在用户关静音时持续调用麦克风的App。虽然App静音,但是Webex的音频缓冲区(audiobuffer)仍包含麦克风的原始音频。https://www.ithome.com.tw/news/150485

封面图片

Microsoft Teams新增任务栏麦克风图标 你可以快速将麦克风静音避免翻车

MicrosoftTeams新增任务栏麦克风图标你可以快速将麦克风静音避免翻车估计有不少网友碰到过自己或他人在远程视频会议时忘记关闭麦克风导致某些私密声明被其他人听到的尴尬情况,这种情况在前几年的网课时代经常发生。因为不熟悉操作或失误导致忘记关闭麦克风和摄像头就容易出现翻车,现在微软正在改进MicrosoftTeams的麦克风指示器让用户可以更快捷地开关麦克风。在最新推出的MicrosoftTeams预览版中,当用户与他人进行通话时,任务栏会出现MicrosoftTeams的麦克风图标。这个麦克风图标有如下几个功能:查看麦克风是否为开启状态一键点击开启麦克风一键点击禁用麦克风仅在音视频通话期间才会出现当用户使用MicrosoftTeams进行视频通话时该图标就会自动出现,此时用户可以通过麦克风指示器快速禁用麦克风然后去看其他内容,这样可以一边听着其他人说话一边查看做其他事,不用担心在不知不觉中忘记关闭麦克风被其他人听到私密声明。为了方便用户使用微软还增加新的快捷键组合Win+Alt+K,使用这个快捷键组合可以快速开启或关闭麦克风,当然同样是仅限于音视频通话期间才能操作。这个新版本目前还在测试中,待测试完毕后会推送给所有MicrosoftTeams正式版用户,不过微软暂时还未透露该功能的正式发布时间。...PC版:https://www.cnbeta.com.tw/articles/soft/1433805.htm手机版:https://m.cnbeta.com.tw/view/1433805.htm

封面图片

小心​视频会议应用程序​,即便麦克风“关闭”。它仍在听 ——

小心​视频会议应用程序​,即便麦克风“关闭”。它仍在听——威斯康星大学麦迪逊分校电子和计算机工程系助理教授、在线隐私专家法瓦兹的家人遭遇了一件奇怪的事——一次视频会议上,当他静音时,他发现在麦克风的灯仍然亮着,这表明麦克风正在被访问。法瓦兹和研究生调查了这种现象是否更加普遍。他们在主要的操作系统上尝试了许多不同的视频会议应用程序,包括iOS、安卓、Windows和Mac,检查应用程序是否在麦克风被静音时仍能访问。“事实证明,在绝大多数情况下,当你自己静音时,这些应用程序并没有放弃对麦克风的访问,这是个问题。当你选择静音时,意味着你不希望这些应用程序收集数据”,法瓦兹说。首先,该团队进行了一项用户研究,询问223名视频会议应用程序用户关于他们如何理解静音按钮的功能,以及他们认为这类应用程序应该如何处理音频数据。大多数人认为应用程序在设置为静音时不应该能够收集数据。研究小组又调查了许多流行的应用程序上静音按钮的实际行为,确定了收集哪些类型的数据,以及它是否会泄露个人信息。研究发现,被测试的所有应用程序都会在静音激活时偶尔收集原始音频数据,其中一个流行的应用程序以相同的速度收集信息并将数据传递给其服务器,而不管麦克风是否被静音。研究人员随后决定看看他们是否能利用从该应用中收集到的数据来推断在后台发生了什么。利用机器学习算法,他们使用来自YouTube视频的音频训练了一个活动分类器,这些音频表现出了六种常见的背景活动,包括烹饪和吃饭、播放音乐、打字和清洁。将该分类器应用于该应用程序发送的遥测数据包的类型后,调查团队能够以平均82%的准确率识别背景活动。无论这些数据是否被访问或使用,这些发现都引起了人们对隐私的关注。法瓦兹说:“对于摄像头,你可以把它关掉,或者简单地把手放在它上面挡住,简单地做点什么就可以避免别人看到你。但麦克风可不行”。在大多数设备操作系统中,关闭麦克风是可能的,但这通常意味着要浏览多个菜单。相反,该团队建议解决方案可能在于开发一种易于使用的软件“开关”,甚至硬件开关,使用户能够手动启用和禁用麦克风。#privacy#Videoconferencing

封面图片

以色列 发布一段音频,称是哈马斯特工之间的对话,讨论 2023 年 10 月 17 日在阿赫利浸信会医院失败的伊斯兰圣战火

以色列发布一段音频,称是哈马斯特工之间的对话,讨论2023年10月17日在阿赫利浸信会医院失败的伊斯兰圣战火箭发射事件。网友提出3点疑问。1,您有麦克风可以高质量记录哈马斯对话,但无法了解他们的攻击?2,如果你能录制哈马斯的对话,是不是意味着你知道他们的位置?为什么不针对他们而是杀害平民?3,你真的认为他们在战争期间会如此平静地说话吗?

封面图片

老牌音频设备品牌舒尔进军无线领夹麦克风领域

老牌音频设备品牌舒尔进军无线领夹麦克风领域该类别产品取得了成功,竞争者也相应地从一两个发展到十几个。然而,很少有像舒尔这样值得信赖的音频品牌。事实上,大部分竞争者都是Anker和大疆创新(DJI)这样的公司,而它们在传统上并不以麦克风闻名。另一方面,舒尔生产的一些麦克风在多个行业深受喜爱。总部位于芝加哥、拥有近百年历史的音频制造商MoveMic最新加入了这一竞争行列。它并不是第一家涉足该领域的高端麦克风制造商,因为Rode在许多不同类别中都是它的直接竞争对手。尽管如此,后者还是受到了褒贬不一的评价。最近,舒尔在该类产品上的表现时好时坏,因此我们很有兴趣看看舒尔能提供什么产品。该系统单个夹式麦克风的起价为249美元。一对麦克风售价249美元,带接收器的售价499美元。接收器也可以单独购买,价格为499美元。遗憾的是,接收器不能像某些同类产品那样插入充电盒中。麦克风可与手机配对,无需接收器,不过,如果您打算连接到相机、电脑甚至非舒尔应用程序,就需要接收器。目前,它只能同时处理两个麦克风,这是目前此类产品的普遍水平...PC版:https://www.cnbeta.com.tw/articles/soft/1422393.htm手机版:https://m.cnbeta.com.tw/view/1422393.htm

封面图片

诺基亚公布世界上首个“沉浸式 3D 语音通信”技术,打电话也能“空间音频”

诺基亚公布世界上首个“沉浸式3D语音通信”技术,打电话也能“空间音频”诺基亚10日宣布他们已经完成了世界上首个沉浸式“空间音频”电话通话,可以理解为语音通话引入了“空间音频”技术。这项技术的核心是“从单声道音频转向3D音频”,由于声音中增加了空间维度,拨打电话的双方“感觉就像在同一个房间一样”,诺基亚现任CEO对此认为“这是迄今为止语音通话技术的最大飞跃”。诺基亚表示,实现相关空间音频语音通话技术不需要专门的硬件,只需要利用大多数智能手机中内置的麦克风阵列即可实时传输空间音频信息,从而增强通话的纵深性。——、

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人