研究发现我们的大脑使用基本的音速和模式来区分音乐和语音

研究发现我们的大脑使用基本的音速和模式来区分音乐和语音 每年有超过三分之一的美国人受到这种语言障碍的困扰,其中包括温迪-威廉姆斯(Wendy Williams)和布鲁斯-威利斯(Bruce Willis)。纽约大学心理学系博士后、论文第一作者安德鲁-张(Andrew Chang)解释说:"虽然音乐和语音在很多方面都不同,从音高、音色到声音质地,但我们的研究结果表明,听觉系统使用非常简单的声学参数来区分音乐和语音,总的来说,较慢和稳定的纯噪音声音片段听起来更像音乐,而较快和不规则的片段听起来更像语音"。该论文今天(5 月 28 日)发表在《PLOS 生物学》杂志上。科学家通过精确的测量单位来衡量信号的速率:赫兹(Hz)。赫兹数越大,表示每秒发生的次数(或周期)越多,而赫兹数越小,表示每秒发生的次数(或周期)越少。例如,人们通常以每秒 1.5 到 2 步的速度行走,也就是 1.5-2 赫兹。史蒂夫-汪达 1972 年的名曲"Superstition"(迷信)的节拍也是如此。迷信"的节拍约为 1.6 赫兹,而安娜-卡琳娜 1967 年的名曲"Roller Girl"则为 2 赫兹。相比之下,语音的速度通常要快两到三倍,为 4-5 赫兹。歌曲的音量或响度随时间的变化即所谓的"振幅调制"相对稳定在 1-2 赫兹。相比之下,语音的振幅调制通常为 4-5 赫兹,这意味着其音量变化频繁。尽管音乐和语音无处不在、耳熟能详,但科学家们以前并不清楚我们是如何毫不费力地自动将声音识别为音乐或语音的。声音感知实验结果在PLOS Biology的研究中,为了更好地理解这一过程,张及其同事进行了四次实验,让 300 多名参与者聆听了一系列不同振幅调制速度和规律的合成音乐和语音噪声片段。音频噪声片段只允许检测音量和速度。参与者被要求判断这些模棱两可的噪音片段(他们被告知这些片段是掩盖了噪音的音乐或语音)听起来像音乐还是语音。通过观察参与者将数百个噪音片段分类为音乐或语音的模式,可以发现速度和/或规律性特征对他们判断音乐和语音的影响有多大。科学家们总结说,这就是听觉版的"云中看脸":如果声波中的某一特征符合听众对音乐或语音的理解,那么即使是白噪声片段听起来也会像音乐或语音。音乐和语音的例子可以从以下页面中获取:<2Hz)、振幅调制较规则的片段听起来更像音乐,而速率较高(~4Hz)、振幅调制较不规则的片段听起来更像语音。对治疗和康复的影响作者指出,了解人脑是如何区分音乐和语音的,有可能使听觉或语言障碍(如失语症)患者受益。例如,旋律音调疗法是一种很有前途的方法,它可以训练失语症患者唱出他们想说的话,利用他们完好的"音乐机制"绕过受损的语言机制。因此,了解是什么使音乐和语言在大脑中相似或不同,有助于设计更有效的康复计划。编译来源:ScitechDaily ... PC版: 手机版:

相关推荐

封面图片

音频、音乐和语音生成的工具包,旨在支持可复现的研究,帮助初级研究人员和工程师入门音频、音乐和语音生成领域的研究和开发,提供经典模

音频、音乐和语音生成的工具包,旨在支持可复现的研究,帮助初级研究人员和工程师入门音频、音乐和语音生成领域的研究和开发,提供经典模型或架构的可视化特性,有助于初级研究人员和工程师更好地理解模型。 | #工具

封面图片

Amphion 是一个开源的音频、音乐和语音生成工具包。

Amphion 是一个开源的音频、音乐和语音生成工具包。 它包括文本转语音、语音转换、文本转音乐等任务的工具。 与现有的其他开源文本转语音系统相比,Amphion具有更高的性能。 #tools

封面图片

毕达哥拉斯错了:科学家发现世界上没有通用的音乐和声

毕达哥拉斯错了:科学家发现世界上没有通用的音乐和声 但是,来自剑桥大学、普林斯顿大学和马克斯-普朗克实证美学研究所的研究人员现在发现了毕达哥拉斯错误的两个关键方面。他们发表在《自然-通讯》(Nature Communications)上的研究表明,在正常的听力环境中,我们实际上并不喜欢和弦完全符合这些数学比例。我们喜欢轻微的偏差。合著者、剑桥大学音乐学院音乐与科学中心主任彼得-哈里森(Peter Harrison)博士说:"我们喜欢轻微的偏差,因为这赋予了声音生命,对我们很有吸引力。"研究人员还发现,如果考虑到西方音乐家、听众和学者不太熟悉的某些乐器,这些数学关系所起的作用就会消失。这些乐器往往是钟、锣、木琴和其他类型的有声打击乐器。他们特别研究了"bonang",这是爪哇加麦兰的一种乐器,由一组小锣组成。哈里森博士说:"当我们使用博朗琴等乐器时,毕达哥拉斯的特殊数字就会消失,我们会遇到全新的协和与不协和模式。一些打击乐器的形状意味着,当你敲击它们并产生共鸣时,它们的频率成分并不遵守那些传统的数学关系。这时我们就会发现有趣的事情发生了"。西方的研究主要集中在我们熟悉的管弦乐器上,但其他音乐文化使用的乐器,由于其形状和物理特性,我们称之为非谐波乐器。研究人员创建了一个在线实验室,来自美国和韩国的 4000 多人参加了 23 项行为实验。实验给参与者播放和弦,邀请他们给每个和弦的悦耳程度打分,或使用滑块调整和弦中的特定音符,使其听起来更悦耳。这些实验产生了超过 235000 次人类判断。实验从不同角度探讨了和弦。有些实验放大了特定的音乐音程,让参与者判断他们更喜欢完美的音程、略微尖锐的音程还是略微平缓的音程。研究人员惊讶地发现,人们对轻微不完美或"不和谐"的偏好程度很高。其他实验还探讨了西方和非西方乐器(包括笛子)的和声感知。研究人员发现,Bonang 的辅音与印尼文化中使用的特定音阶完全吻合。例如,这些辅音无法在西方钢琴上复制,因为它们会落入传统音阶的缝隙中。"我们的研究结果对'和声只能是一种方式,和弦必须反映这些数学关系'的传统观念提出了挑战。我们发现还有更多种类的和声,而且其他文化发展这些和声是有充分理由的,"哈里森博士说。重要的是,这项研究表明,参与者并非训练有素的音乐家,也不熟悉爪哇音乐,但他们却能本能地欣赏到音调中的和音。哈里森说:"音乐创作就是要探索特定品质的创造可能性,例如,你可以用长笛吹出什么样的旋律,或者你可以用嘴发出什么样的声音。我们的研究结果表明,如果使用不同的乐器,就能开启一种全新的和声语言,人们凭直觉就能欣赏这种语言,而不需要通过学习才能欣赏。在过去的 100 年里,西方古典音乐中的许多实验性音乐对听众来说都是相当困难的,因为它们涉及高度抽象的结构,很难让人喜欢。相比之下,像我们这样的心理学研究成果则有助于激发听众凭直觉欣赏新音乐的兴趣"。哈里森博士希望这项研究能鼓励音乐家们尝试使用陌生的乐器,看看它们是否能带来新的和声,开辟新的创作可能性。"现在很多流行音乐都试图将西方和声与中东、印度和世界其他地区的当地旋律结合起来。这或多或少会取得一些成功,但问题是,如果用西方乐器演奏,音符听起来会不和谐。如果音乐家和制作人考虑到我们的研究成果,并考虑通过使用特别挑选的真实乐器或合成乐器来改变'音色',即音质,那么他们或许能让这种结合更加完美。这样,他们就能真正做到两全其美:和谐与局部音阶系统"。哈里森和他的合作者正在探索不同种类的乐器,并进行后续研究,以测试更广泛的文化。他们尤其希望从使用"非和声性"乐器的音乐家那里获得启发,以了解他们是否内化了与本研究中西方参与者不同的和声概念。编译来源:ScitechDaily ... PC版: 手机版:

封面图片

AI音乐和歌曲生成器应用Suno现已登陆iOS设备

AI音乐和歌曲生成器应用Suno现已登陆iOS设备 去年 12 月,Suno 发布了Microsoft Copilot 插件,使 Copilot 用户能够通过简单的文字提示创建自己的歌曲。最近,Suno 还推出了一项新的音频输入功能,允许用户用任何声音制作歌曲。为此,用户可以录制或上传长度在 6 至 60 秒之间的音频片段,然后使用"扩展"功能设置时间戳、选择流派并提供自己的歌词,生成新的扩展音频。适用于 iOS 设备的 Suno 应用程序可从苹果应用程序商店下载,但目前仅限于美国。该团队正积极努力将 Suno iOS 版扩展到其他地区,并开发 Android 版应用。虽然 Suno 应用程序可以免费下载,但您可以创建的歌曲数量取决于您选择的订阅计划。免费的基本计划每天提供 50 个免费点数,您可以根据自己的使用情况选择以下付费计划之一:1 个月专业套餐 - 每月 10 美元,按月结算1 个月 Premier 套餐 - 30 美元/月,按月结算1 年专业套餐 - 96 美元/年(月费 8 折),按年结算1 年 Premier 套餐 - 289 美元/年(月租费 8 折),按年结算从 App Store 下载iOS 版 Suno。 ... PC版: 手机版:

封面图片

我们是否对电动汽车需要发出的声音想得太多了?

我们是否对电动汽车需要发出的声音想得太多了? 这项对美国 400 名成年人进行的在线调查发现,最受好评的声音是一种"非音调"声音,它比当今电动汽车发出的任何无机声音都更像汽油车。这项调查是由"声波品牌机构"Listen 和行为科学与神经营销研究机构 CloudArmy 共同完成的,调查要求参与者根据几项标准对一系列声音进行排名,包括喜欢度、注意度、熟悉度和悦耳度。其中有五种音调的声音和五种非音调的声音。排名最靠前的两种声音都是非音调的,可以说是音调略有不同的白噪音。在调查中,受访者更喜欢非音调的声音,而不是音调的声音,他们认为音调的声音"令人不安"、"难听"和"不吸引人"。相反,人们喜欢非音调的声音,因为它们听起来更像是白噪声或"源自大自然"。事实上,一些受访者表示,他们想要最接近传统汽车噪音的声音。这可能会让汽车制造商们大吃一惊,因为到目前为止,他们在电动汽车声音方面的投入一直过高。一些公司已经高调宣布了为其电池电动车型设计独特声音的项目。宝马聘请著名电影作曲家汉斯-齐默(Hans Zimmer)为其i4电动轿车设计音效,而梅赛德斯-奔驰则与Will.i.am合作,为其汽车打造"互动音乐体验"。菲亚特 500e 在低速行驶时甚至会发出真正的古典音乐。一些汽车制造商则反其道而行之,设计出虚假的排气声浪,以过度补偿非内燃机的声音缺失。道奇公司甚至将自己的假发动机声音命名为"Fratzonic腔体排气系统"。虽然调查似乎表明,人们对电动汽车的传统汽车声音持开放态度,但目前还不清楚这些特殊的人造声音是否会受到欢迎。政府法规要求电动汽车发出低速声音,提醒行人和其他道路使用者注意驶近的车辆。这些声音的频率必须在 1000 到 4000 Hz 之间,这个可听范围通常与人声中较高和较明亮的音调有关。这些音调较高的声音确实能吸引人们的注意力,但往往也会带来负面影响。非音调的、更多受白噪音启发的方法可能是更好的方法。 ... PC版: 手机版:

封面图片

Randy Travis在华纳AI的最新音乐实验中找回了自己的声音

Randy Travis在华纳AI的最新音乐实验中找回了自己的声音 这首名为《Where That Came From》的歌曲完全是多年前在特拉维斯成名最鼎盛时期所喜欢的那种乡土气息浓厚的伤感曲调。制作人通过训练一个不知名的人工智能模型,从他的 42 个人声分离录音开始,创作了这首歌。然后,在特拉维斯和他的职业制作人凯尔-雷宁(Kyle Lehning)的监督下,乡村歌手詹姆斯-杜普雷(James DuPre)录制了人声,并由人工智能将其转换成特拉维斯的声音。除了在 YouTube 上,这首歌还出现在其他流媒体平台上,如Apple Music和Spotify。华纳实验的结果是一首轻柔的曲子,它捕捉到了特拉维斯轻松的风格,而这种风格很少偏离其男中音的基础。达斯汀-巴拉德(Dustin Ballard)负责运营"我毁了它"(There I Ruined It)社交媒体账户的各种化身,他创作人工智能语音模仿的方式与特拉维斯团队大致相同,诞生了人工智能埃尔维斯-普雷斯利(Elvis Presley)演唱《宝贝回来了》(Baby Got Back)或合成约翰尼-卡什(Johnny Cash)演唱《芭比女孩》(Barbie Girl)等愚蠢的混搭歌曲。我们很容易对这首歌或巴拉德的作品敲响警钟,宣告我们所熟知的人造音乐的死亡。但我想说的是,它的作用恰恰相反,它强化了人工智能语音克隆等工具在合适的人手中所能发挥的作用。无论你喜不喜欢这首歌,都必须承我们不可能从随意输入的提示中得到完成度这么高的作品。华纳音乐纳什维尔分部联合总裁克里斯-莱西(Cris Lacy)告诉哥伦比亚广播公司《周日早报》,人工智能声音克隆网站生产的特拉维斯等艺人的近似声音"听起来不真实,因为它不是"。她称唱片公司使用人工智能克隆特拉维斯的声音是"人工智能的善举"。眼下,华纳公司对那些它认为不属于"人工智能公益"范畴的人工智能克隆并没有什么办法。但田纳西州最近通过的《ELVIS 法案》将于 7 月 1 日生效,该法案将允许唱片公司对未经许可使用软件复制艺人声音的行为采取法律行动。特拉维斯的这首歌是一个很好的边缘案例,说明人工智能被用于制作真正让人感觉合法的音乐。但另一方面,它也可能为华纳公司开辟一条新的道路,因为华纳公司拥有大量已故著名艺人的音乐版权,这些音乐的数字复活时机已经成熟,如果他们想这样做的话,还可能从中获利。这个故事虽然感人至深,但也让我不禁要问,华纳音乐纳什维尔公司(Warner Music Nashville)以及整个唱片业将从这首歌中汲取什么教训。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人