科学家设计出一种可在拥挤的空间中用眼神分离出特定声音的AI耳机

科学家设计出一种可在拥挤的空间中用眼神分离出特定声音的AI耳机华盛顿大学保罗-艾伦计算机科学与工程学院教授、本研究的资深作者希亚姆-戈拉科塔(ShyamGollakota)说:"我们现在往往认为人工智能是基于网络的聊天机器人,可以回答问题。但在这个项目中,我们开发的人工智能可以根据佩戴耳机的人的喜好,改变他们的听觉感知。有了我们的设备,即使你身处嘈杂的环境中,有很多其他人在说话,你现在也能清楚地听到单个扬声器的声音。"这种耳机配有麦克风和一个按钮华盛顿大学研究人员开发的"目标语音听力"(THS)系统简单而有效。现成的耳机装有两个麦克风,每个耳罩上一个。佩戴者看着想要听到的人,按一次耳机侧面的按钮,持续三到五秒钟。说话者的声波会同时传到两个麦克风上(误差范围为16度),然后被发送到机载计算机上,由机器学习软件学习说话者的发声模式。然后,说话者的声音就会被分离出来,并通过耳机传送,即使他们走动时也是如此,无关的噪音也会被过滤掉。下面的视频展示了耳机的功效。它能快速过滤环境噪声,将注意力集中在扬声器上,消除附近(室内)有人讲电话和室外喷泉发出的嘈杂声。人工智能能以多快的速度处理说话者的声音并消除不想要的声音?研究人员在测试时发现,他们的系统的端到端延迟时间为18.24毫秒。相比之下,眼睛眨一下的时间在300到400毫秒之间。这就意味着,从看着你想听的人到耳机里只听到他的声音之间几乎没有延迟时间,一切都是实时发生的。他们让21名受试者体验了THS系统,受试者对耳机在真实的室内和室外环境中提供的噪音抑制效果进行了评分。平均而言,受试者对说话者声音清晰度的评分是未处理时的两倍。他们的THS系统建立在华盛顿大学研究人员之前开发的"语义听觉"技术基础之上。与THS一样,该技术使用的是智能手机上运行的人工智能算法,该算法与降噪耳机无线连接。语义听觉系统可以准确识别鸟鸣、警报和报警等噪音。目前,新系统一次只能过滤一个目标扬声器,而且只能在与扬声器同一方向没有其他大音量声音时过滤。但如果耳机佩戴者对音质不满意,他们可以对扬声器的声音重新采样,以提高清晰度。研究人员正在努力将他们的系统扩展到耳塞和助听器。他们还在GitHub上公开了THS代码,以便其他人在此基础上进行开发。该系统尚未投入商业使用。本月早些时候,研究人员在夏威夷檀香山举行的美国计算机协会(AssociationofComputingMachinery,ACM)计算机-人交互(Computer-HumanInteraction,CHI)会议上介绍了他们的研究成果,并获得了荣誉奖。未发表的研究论文可在此处查阅。...PC版:https://www.cnbeta.com.tw/articles/soft/1432195.htm手机版:https://m.cnbeta.com.tw/view/1432195.htm

相关推荐

封面图片

科学家使用人脑细胞成功打造语音识别 AI 系统

科学家使用人脑细胞成功打造语音识别AI系统研究人员将活体脑细胞组成的脑类器官(人的干细胞培养出的微型器官)和微电极进行了连接,微电极向脑类器官发送电信号,还有将脑神经细胞的放电反应交给外部设备读取。然后将8个人说日语元音的240个音频片段转换为信号序列,发送给系统让它识别出某个人的声音。最开始,它的准确度只有30%-40%。但经过两天的训练之后,它就可以78%的准确率识别出特定说话者。作者强调,训练只是重复音频片段,不给予任何反馈,也就是所谓的无监督学习。而在该实验之后,研究人员试着用一种药物来阻断脑类器官中神经细胞之间形成新的连接,结果发现,这样操作之后,系统的准确率就不会有任何改善了。、投稿:@TNSubmbot频道:@TestFlightCN

封面图片

"语义听觉"耳机技术可以使某些环境声音不被屏蔽

"语义听觉"耳机技术可以使某些环境声音不被屏蔽一对支持语义听觉的降噪耳机在华盛顿大学校园内接受测试环境音频从耳机的噪声监测麦克风串流到手机上的一个应用程序,经过数字过滤后,大部分声音被阻隔,只有少数声音能被听者听到。反之,它也可以阻隔一些不需要的声音,而让所有其他声音通过。目前有20种可允许和/或屏蔽的声音选择。至少从目前来看,智能手机肯定是其中的一部分。这是因为耳机本身或云端服务器上的电子设备功能不够强大,速度不够快。该研究论文的资深作者希亚姆-戈拉科塔(ShyamGollakota)教授说:"理解鸟的声音并将其从环境中的所有其他声音中提取出来需要实时智能,而目前的降噪耳机还无法做到这一点。挑战在于,耳机佩戴者听到的声音需要与他们的视觉感官同步。你不可能在别人跟你说话两秒钟后才听到他的声音,这意味着神经算法必须在百分之一秒内将声音处理完毕。"在公园、街道和办公室等环境中对22名志愿者进行测试时,新研发的语义听觉系统成功地提取了目标声音,如鸟叫声、警报声和警笛声。不过,还需要做一些工作,因为该技术难以区分类似的声音,如人类说话声和歌声。您可以在下面的视频中亲自感受一下语义听觉系统的效果:...PC版:https://www.cnbeta.com.tw/articles/soft/1396089.htm手机版:https://m.cnbeta.com.tw/view/1396089.htm

封面图片

科学家开发新型“药物工厂”植入物 可在一周内杀死小鼠体内的肿瘤

科学家开发新型“药物工厂”植入物可在一周内杀死小鼠体内的肿瘤据BGR报道,莱斯大学和贝勒医学院的研究人员创造了能够摧毁小鼠体内肿瘤的可植入珠子。该方法利用莱斯大学的细胞因子“药物工厂”和一种检查点抑制剂药物来完成这项重任。他们在测试中发现,这些植入物可以在短短几天内根除晚期肿瘤。这并不是我们第一次看到研究人员想出惊人的方法来对抗癌症。我们以前也看到研究人员用杀癌病毒工作,最近开始了人体试验。但是,允许医生将装有药物的珠子直接植入癌症肿瘤旁边,可以减少将药物送到正确位置的工作。研究人员本周在《临床癌症研究》杂志上发表了他们的发现。这项研究是我们看到的细胞因子一系列成功中的最新成果。在小鼠身上的试验被证明是如此成功,以至于可植入的珠子已被批准从今年秋天开始对卵巢癌病例进行临床试验。参与试验的莱斯大学研究生之一AmandaNash说,该团队希望创造一种可用于多种类型的免疫系统疾病以及多种类型癌症的疗法。该团队似乎也找到了答案,珠子和它们所依赖的药物在小鼠体内积极地根除间皮瘤肿瘤,效果相当好。研究人员在莱斯大学网站上发布的一篇媒体文章中详细介绍了细胞因子“工厂”的设计。这些“工厂”包括可植入的海藻酸盐珠子,这些珠子装载着经过基因工程改造的细胞,可以产生天然的IL-2。IL-2代表白细胞介素,这是一种天然化合物,当你的身体与癌症斗争时,它能激活白细胞。一旦交付,细胞就会以更高的水平产生IL-2,使你的身体能够对抗癌症。它还可以通过微创手术植入,因此医生可以直接向肿瘤提供高剂量的IL-2。在以小鼠为基础的研究中,研究人员将珠子直接放置在肿瘤旁边,在称为胸膜的薄层组织内。研究人员还进行了一些临床前研究,以了解可植入珠子对卵巢癌的疗效。而美国食品和药物管理局已经批准了将于今年晚些时候启动的试验。PC版:https://www.cnbeta.com/articles/soft/1308881.htm手机版:https://m.cnbeta.com/view/1308881.htm

封面图片

联想拯救者H7游戏耳机官宣:入耳式C口 支持7.1声卡

联想拯救者H7游戏耳机官宣:入耳式C口支持7.1声卡7.1声卡是一种音频设备,用于处理和输出7.1声道环绕音效,可在播放音乐、录音和3D声效中体验到。通过7.1声卡,用户可以在观看电影、玩游戏、听音乐等场景中获得更丰富、更真实的音频效果。它适用于配备多个音箱或扬声器的音频系统,可以将不同声道的音频信号准确地分配到各个音箱或扬声器中,以实现更好的声音定位和环绕效果。目前,官方暂未公布拯救者H7游戏耳机的售价和上市时间。...PC版:https://www.cnbeta.com.tw/articles/soft/1390217.htm手机版:https://m.cnbeta.com.tw/view/1390217.htm

封面图片

面向科研用户/科学家的Python资源列表

面向科研用户/科学家的Python资源列表面向希望充分利用开源Python生态系统的科学领域的学生和研究人员。旨在为科学家提供对常见任务有用的工具列表,但不提及他们不太可能需要的东西(例如身份验证、数据库、网络、NLP)。受awesome-python启发的列表,这是一个非常相似的资源,可用于你可能想用Python做的任何事#Python#科研

封面图片

自主音频机器人群可在混乱的房间中实现静音对话

自主音频机器人群可在混乱的房间中实现静音对话我们人类闭着眼睛也能找到声源,这要归功于我们耳朵提供的略微分布的双麦克风阵列和音频屏蔽效果。但当音频环境变得复杂时,情况就会变得非常混乱--这与我们喜欢寻找嘈杂、拥挤和高能量空间(如周日上午的咖啡馆),然后试图在其中进行对话的怪癖不符。在这些较为混乱的音频空间中,要想隔离单个音源并静音其他音源,唯一的办法就是部署更大的麦克风阵列,然后将所有音频流处理在一起,创建一个空间地图,对每个声音的位置进行三角测量,测量声音在空气中传播并到达每个麦克风时的微小时间差。然后,您可以使用难以捉摸的深度学习算法对所有音频流进行重新处理,为每个声源创建独立的音频流,并消除来自其他声源的所有噪音。通过定位和跟踪房间中的多个声源,机器人麦克风阵列可以隔离不同的音频区域并使其静音图/华盛顿大学这个想法本身并不新鲜,但华盛顿大学的研究人员现在对这一概念提出了新的看法,他们使用了一个由七个带轮子的小麦克风机器人组成的蜂群,每个机器人都只有一块松露巧克力大小,它们能从充电站自主部署,并在可用空间内创建一个自我优化的阵列。这些机器人利用内置麦克风和扬声器,通过声纳在桌子表面导航,躲避障碍物,并尽可能广泛地分布,以最大限度地扩大麦克风之间的时间差。不幸的是,这确实意味着它们必须一个一个地移动,但一旦到位,它们的表现就相当惊人了,正如您在下面的视频中看到的那样。那么最终的目的是什么呢?研究团队认为,像这样的机器人阵列可以作为便携式、自动部署、隔音麦克风阵列,用于会议室直播等,理论上比人类更好地分散自己的声音。该团队表示,它在双向视频通话中的作用不大,因为虽然它的工作效率很高,但目前处理每三秒的声音块需要大约1.82秒。延迟也意味着它无法在短时间内将对话伙伴的纯净音频流传输到嘈杂的咖啡馆里的耳机中--尽管随着计算能力和速度的提高,这两种应用都有可能实现。当然,它也可以成为非常方便的监控工具,消除人群噪音的掩蔽效应,记录私人对话。有趣的是,华盛顿大学的研究团队表示,它的用途可能恰恰相反。这项研究的共同第一作者、博士生马利克-伊塔尼(MalekItani)说:"它有可能真正有利于隐私保护,超出目前智能扬声器所允许的范围。我可以说'不要录下我桌子周围的任何东西',我们的系统就会在我周围3英尺(0.9米)处产生一个气泡。这个气泡中的任何东西都不会被记录下来。或者,如果有两组人在旁边讲话,其中一组人正在进行私人对话,而另一组人正在录音,那么其中一组人的对话可以处于静音区,并保持私密性。"从充电站释放后,机器人利用声纳将自己分布在一个表面周围,以实现最大的空间隔离现实中,静态分布式麦克风阵列可能会在智能房间或智能家居设计中开始应用,它们可以轻松地将语音控制指令与不同区域隔离开来。比如,只听沙发上的声音就能控制电视,甚至在嘈杂的场所从站在吧台前的人那里分辨出饮料订单。该论文在《自然-通讯》(NatureCommunications)杂志上公开发表。...PC版:https://www.cnbeta.com.tw/articles/soft/1385665.htm手机版:https://m.cnbeta.com.tw/view/1385665.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人