基于人工智能的耳机原型能更细致、有选择性地过滤噪音

基于人工智能的耳机原型能更细致、有选择性地过滤噪音访问：NordVPN立减75%+外加3个月时长另有NordPass密码管理器大多数主动降噪耳机通过产生声波来抵消低频环境噪音，如发动机的轰鸣声。但它们最终会抵消这些频率的所有声音，可能会消除你想听到的音频。新的原型产品旨在为用户提供更细微的噪音控制。这款耳机内置麦克风，将音频输入经过训练的神经网络，该网络能识别不同类型的声音--狗叫声、电话铃声、鸟叫声等。使用配套的应用程序，您可以启用或禁用不同类别的声音，让耳机只过滤您想要的声音。最有趣的是，这款耳机还能在背景杂音中锁定特定的声音。只需点击一个按钮，耳机就会"注册"你面前的声音，将其作为唯一的声音进行放大，抑制其他所有噪音。希亚姆-戈拉科塔（ShyamGollakota）与一组研究人员共同开发了这项技术，他于5月16日在美国声学学会和加拿大声学协会举办的一次会议上介绍了这一想法。据《新科学家》报道，他在会上演示了一个工作原型。麦克风将音频传输到人工智能处理器，该处理器能实时解码和消除不需要的声音。研究人员说，这只需要8毫秒的延迟就足以避免奇怪的延迟问题。对于设备上的人工智能处理，目前的耳机设备使用的是通过USB连接的OrangePi板，而不是通过云服务器。当然，这个原型还不是你能买到的东西。要实现商业化，可能需要将一切都缩小到一个微小的芯片，以便集成到未来的无线耳机设计中。也就是说，人工智能已经通过算法驱动的麦克风降噪技术进入了主流音频设备。但这款耳机颠覆了这一概念，利用人工智能增强佩戴者的听力，而不仅仅是麦克风拾取的声音。从理论上讲，任何拥有像样的人工智能加速器和麦克风输入的设备都能提供这种选择性降噪功能。...PC版：https://www.cnbeta.com.tw/articles/soft/1431435.htm手机版：https://m.cnbeta.com.tw/view/1431435.htm

在Telegram中查看

相关推荐

Meta 公司探索配备摄像头的人工智能耳机

Meta公司探索配备摄像头的人工智能耳机根据三名现任员工的说法，Meta正在探索开发配备摄像头的人工智能耳机，该公司希望这种耳机能用于识别物体和翻译外语。Meta正在研发新的人工智能设备，与此同时，其他几家科技公司也在开发人工智能可穿戴设备，而Meta在其Ray-Ban智能眼镜中添加了一个人工智能助手。MetaCEO马克·扎克伯格已经看过几种可能的设备设计，但没有对它们感到满意，一位员工说。目前尚不清楚最终的设计是入耳式耳塞还是头戴式耳机。在内部，该项目被称为Camerabuds。——

这种人工智能能从你的击键声中获取密码

这种人工智能能从你的击键声中获取密码想象一下，你在笔记本电脑上打字，登录一两个账户，而你的手机就静静地坐在你身边。最可怕的是：它可能会窃听你的每一次点击和敲击，并向人工智能提供数据，而人工智能正在学习你最隐私的信息。虽然这听起来像是科幻惊悚片中的情节，但它比我们想象的更接近现实，凸显了人工智能的好处和它不太完美的怪癖之间的细微差别。借助深度学习算法，研究团队开发出了一套系统，可以完全根据键盘的声音来识别你正在输入的内容。该人工智能被命名为CoAtNet，使用代表每个键发出的独特声音的频谱图进行训练。其结果是，只需将智能手机放在离MacBook20厘米远的地方，破译按键的成功率就能达到95%。这项研究的合著者埃赫桑-托雷尼博士（Dr.EhsanToreini）说，她预计"这种模型和攻击的准确率会越来越高"，因为大多数现代智能设备都配备了麦克风。研究小组还通过Zoom和Skype通话测试了他们的人工智能，准确率几乎相同。不过，目前的模型还存在一些明显的局限性。CoAtNet需要针对每种键盘类型进行定制，因为不同键盘的声音会有所不同。在训练中，我们使用不同的手指和不同的压力水平，连续按压MacBook上的36个按键（包括字母和数字）各25次。此外，人工智能很难掌握Shift键的细微差别，因此将密码与大小写字母、数字和符号混合使用是一个好的开始。这项研究主要是概念验证，还没有用于实际的密码破解，也没有在咖啡馆等现实环境中使用，因为咖啡馆的嘈杂环境会让窃听变得不那么实用或可用。不过，研究人员指出，笔记本电脑的键盘千篇一律，而且经常在公共场所使用，因此特别容易受到此类技术的影响。键盘改装者可能会发现，改变键盘的声学特性会使人工智能失效，需要对系统进行新的训练。不过，在这种情况下，最好的防御手段可能是你的老式密码管理器，因为它们可以自动填写密码，使密码免受这种声音间谍的影响。增加双因素身份验证和生物识别选项（如指纹扫描和面部识别）将使事情变得更加密不透风。归根结底，这项研究旨在提高人们对人工智能算法从新数据类型中提取洞察力的先进能力的认识。声学信号经常被用于侧信道攻击（如涉及激光麦克风的攻击），现在可以通过先进的机器学习技术进行更复杂的分析。...PC版：https://www.cnbeta.com.tw/articles/soft/1403415.htm手机版：https://m.cnbeta.com.tw/view/1403415.htm

科学家设计出一种可在拥挤的空间中用眼神分离出特定声音的AI耳机

科学家设计出一种可在拥挤的空间中用眼神分离出特定声音的AI耳机华盛顿大学保罗-艾伦计算机科学与工程学院教授、本研究的资深作者希亚姆-戈拉科塔（ShyamGollakota）说："我们现在往往认为人工智能是基于网络的聊天机器人，可以回答问题。但在这个项目中，我们开发的人工智能可以根据佩戴耳机的人的喜好，改变他们的听觉感知。有了我们的设备，即使你身处嘈杂的环境中，有很多其他人在说话，你现在也能清楚地听到单个扬声器的声音。"这种耳机配有麦克风和一个按钮华盛顿大学研究人员开发的"目标语音听力"（THS）系统简单而有效。现成的耳机装有两个麦克风，每个耳罩上一个。佩戴者看着想要听到的人，按一次耳机侧面的按钮，持续三到五秒钟。说话者的声波会同时传到两个麦克风上（误差范围为16度），然后被发送到机载计算机上，由机器学习软件学习说话者的发声模式。然后，说话者的声音就会被分离出来，并通过耳机传送，即使他们走动时也是如此，无关的噪音也会被过滤掉。下面的视频展示了耳机的功效。它能快速过滤环境噪声，将注意力集中在扬声器上，消除附近（室内）有人讲电话和室外喷泉发出的嘈杂声。人工智能能以多快的速度处理说话者的声音并消除不想要的声音？研究人员在测试时发现，他们的系统的端到端延迟时间为18.24毫秒。相比之下，眼睛眨一下的时间在300到400毫秒之间。这就意味着，从看着你想听的人到耳机里只听到他的声音之间几乎没有延迟时间，一切都是实时发生的。他们让21名受试者体验了THS系统，受试者对耳机在真实的室内和室外环境中提供的噪音抑制效果进行了评分。平均而言，受试者对说话者声音清晰度的评分是未处理时的两倍。他们的THS系统建立在华盛顿大学研究人员之前开发的"语义听觉"技术基础之上。与THS一样，该技术使用的是智能手机上运行的人工智能算法，该算法与降噪耳机无线连接。语义听觉系统可以准确识别鸟鸣、警报和报警等噪音。目前，新系统一次只能过滤一个目标扬声器，而且只能在与扬声器同一方向没有其他大音量声音时过滤。但如果耳机佩戴者对音质不满意，他们可以对扬声器的声音重新采样，以提高清晰度。研究人员正在努力将他们的系统扩展到耳塞和助听器。他们还在GitHub上公开了THS代码，以便其他人在此基础上进行开发。该系统尚未投入商业使用。本月早些时候，研究人员在夏威夷檀香山举行的美国计算机协会（AssociationofComputingMachinery，ACM）计算机-人交互（Computer-HumanInteraction，CHI）会议上介绍了他们的研究成果，并获得了荣誉奖。未发表的研究论文可在此处查阅。...PC版：https://www.cnbeta.com.tw/articles/soft/1432195.htm手机版：https://m.cnbeta.com.tw/view/1432195.htm

Google实现在人工智能生成的音乐中嵌入听不见的声纹水印

Google实现在人工智能生成的音乐中嵌入听不见的声纹水印DeepMind在一篇博文中说，这种水印人耳无法察觉，"也不会影响听觉体验"，并补充说，即使音轨被压缩、加速或减速，或添加了额外的噪音，水印仍然可以被识别出来。像SynthID这样的水印工具被认为是防止生成式人工智能造成某些危害的重要保障。例如，美国总统乔-拜登（JoeBiden）关于人工智能的行政命令要求制定一套由政府主导的新标准，用于对人工智能生成的内容进行水印处理。这是一个大有可为的领域，但目前的技术还远非抵御AI内容造假的灵丹妙药。根据DeepMind的说法，SynthID的音频实现方法是"将音频波转换为二维可视化，显示声音中的频谱如何随时间演变"。该公司声称，这种方法"与目前存在的任何方法都不同"。Google在人工智能生成的音频中嵌入水印功能的消息是在该公司发布SynthID测试版之后短短几个月发布的，测试版适用于Imagen在Google云的顶点人工智能上创建的图像。这种水印可以抵御剪裁或调整大小等编辑，不过DeepMind提醒说，它并不能抵御"极端的修图处理"。...PC版：https://www.cnbeta.com.tw/articles/soft/1397481.htm手机版：https://m.cnbeta.com.tw/view/1397481.htm

Adobe的人工智能原型可将物体粘贴到照片上同时添加逼真的照明和阴影

Adobe的人工智能原型可将物体粘贴到照片上同时添加逼真的照明和阴影每年在AdobeMax上，Adobe都会展示它所谓的"秘密"，这些研发项目有可能会成为商业产品。今年也不例外，在会议正式开始前，Adobe预览了ProjectCleverComposites。它可以利用人工智能进行自动图像合成。PC版：https://www.cnbeta.com/articles/soft/1328897.htm手机版：https://m.cnbeta.com/view/1328897.htm

Adobe正在使用人工智能来分解杂乱的音频

Adobe正在开发一种新的音频工具，可以在一次录音中分解不同层次的声音。这个工具被称为ProjectSoundLift，它可以使用人工智能将掌声等元素从某人的声音中分离出来。您所要做的就是将音频文件导入应用程序，然后选择您希望工具过滤掉的声音。有相当多的选项可供选择，包括掌声、笑声、警报、演讲、人群、交通、打字等等。ProjectSoundLift将自动检测每种声音，并吐出单独的文件，其中包含背景噪音和您想要优先考虑的轨道，如某人的声音或乐器的声音。然后，您可以在AdobePremierePro中单独导入和编辑每个轨道，允许您调整背景噪声的音量，同时增强主轨道的清晰度。现在一切还为时尚早——Adobe的ProjectSoundLift被打上了Adobe“偷偷”预览版的标签，这意味着我们还得再等一段时间才能看到该工具的最终版本发布(如果Adobe决定发布的话)。标签:#Adobe频道:@GodlyNews1投稿:@Godlynewsbot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人