淘宝数字人专利可模拟用户声音

淘宝数字人专利可模拟用户声音天眼查知识产权信息显示,3月15日,淘宝(中国)软件有限公司申请的“基于数字人的视频生成与交互方法、设备、存储介质与程序产品”专利公布。摘要显示,本申请实施例基于用户的声音特征和情感标签进行文本转语音处理,以及基于用户的声音特征和表情系数之间的映射关系进行语音转表情处理,并基于语音信号和表情系数渲染数字人模型,以得到数字人模型的视频数据。该专利精准地模拟用户的声音特征,确保了数字人的语音输出不仅听起来自然,而且实现数字人的个性化驱动,提高数字人在声音和动态形象方面的逼真度,进而提高用户体验,提升了数字人的互动性、真实感和沉浸感。

相关推荐

封面图片

苹果申请专利 可以利用iMessages模仿发件人的声音

苹果申请专利可以利用iMessages模仿发件人的声音"在一些例子中,从第二台电子设备的各自用户那里收到一条信息,"专利中写道。从本质上讲,该系统将涉及iMessage用户在向某人发送文本时选择附加一个语音文件,该文件将存储在其设备上。如果发件人选择这样做,那么收件人就可以选择听到发件人的语音朗读信息。该专利解释说:"根据语音模型,提供与收到的信息相应的音频输出。"收到信息的iPhone可以建立一个人的声音档案,并在阅读信息和所有来自同一发件人的新信件时模拟它。有人甚至可以在发送第一条信息之前发送他们的声音模型,为他们的信息被读出声音做准备。能够听到发件人声音的信息似乎不是最紧迫的技术进步,但它可能会受到年长的家庭成员和合作伙伴/配偶的欢迎,他们希望听到亲人大声说的信息,就像他们在同一个房间一样。该专利的发明人是曾从事Siri工作的胡琼;苹果公司负责机器学习的高级Siri软件工程师李江川;以及苹果公司文本转语音技术总监DavidA.Winarsky。与所有的专利一样,不能保证这项专利最终会成为一项实际的功能,但苹果最近的语音人工智能相关的收购和努力表明它将会发生。这项专利的消息是在苹果公司推出其新的计划,用基于人工智能的配音来销售有声读物后不久传出的。这在配音演员中引起了愤怒,因为有声书经销商FindawayVoices允许苹果使用其有声书文件来训练库比蒂诺有声书计划所使用的机器学习模型。...PC版:https://www.cnbeta.com.tw/articles/soft/1344997.htm手机版:https://m.cnbeta.com.tw/view/1344997.htm

封面图片

SadTalker(AI数字人制作工具) 附教程

名称:SadTalker(AI数字人制作工具)附教程描述:AI数字人(ArtificialIntelligenceDigitalHuman)是一种采用人工智能技术和仿真技术创建的虚拟人物。它结合了人类外貌、语音和认知能力,能够与人类进行交流和互动。AI数字人的外貌通常由计算机图形学和虚拟现实技术生成,可以根据需要设计不同的外表特征、面部表情和肢体语言。而其语音是通过语音合成技术生成的,使得其能够像人类一样产生自然的声音和语调。链接:https://pan.quark.cn/s/0466744613fb大小:5.4G标签:#AI#SadTalker#quark频道:@yunpanshare群组:@yunpangroup

封面图片

EA新专利让玩家能为游戏角色配音 你想给谁配音?

EA新专利让玩家能为游戏角色配音你想给谁配音?EA这项专利于本月初公开,概述了一种用于在视频游戏中生成语音音频的技术,玩家可以让游戏角色使用自己的声音进行交流。专利摘要写道:“提供了一种在视频游戏中生成语音音频的计算机实现方法。该方法包括将语音内容数据输入到合成器模块中。生成并输入源说话者声音中的语音内容的源声音特征,以及将与视频游戏玩家相关的扬声器嵌入到语音转换器的声学特征编码器中。”该专利的核心是“语音转换器”,它经过训练可以将源扬声器的声学特征转换为玩家角色的声学特征。这项技术使视频游戏能够复制玩家的声音,赋予他们的角色独特的个人风格。EA新专利还指出输入数据可以采用文本形式,允许玩家输入他们希望角色传达的对话。此外该专利还可以捕获语音的非语言元素,例如语气和情绪等。如果EA的这项新专利成为现实,你想为哪位游戏角色配音呢?...PC版:https://www.cnbeta.com.tw/articles/soft/1400387.htm手机版:https://m.cnbeta.com.tw/view/1400387.htm

封面图片

苹果公司的 Apple Vision Pro 头显获得了一项技术专利,可模拟生成花香等多种气味。

苹果公司的AppleVisionPro头显获得了一项技术专利,可模拟生成花香等多种气味。该专利名称为:「非可见现象的可视化」,这项专利旨在弥补增强现实、虚拟现实和物理环境之间的差异,通过计算机生成来增强内容,让佩戴者感知无线电等不可见特征。此外,苹果声称该专利可以模拟各种气味,例如花香和水果香味。如果用户在虚拟场景中进入花店或水果店,就可以闻到相应的香味。除了模拟气味外,专利中提到的一些无法看见的特性包括电磁信号(如Wi-Fi)、HVAC系统的气流,以及物理对象的温度。专利还提到用户可能会与为宠物和音乐乐器产生声音的听觉传感器进行交互。这将大幅提升用户的沉浸感。据Apple介绍,该专利的目的在于弥补AR与VR和物理环境之间的差异,这将让用户体验到更为真实的虚拟世界。

封面图片

知网AI生成文本检测专利公布 可检测文本是否为AI生成

知网AI生成文本检测专利公布可检测文本是否为AI生成据天眼查,近日,同方知网数字出版技术股份有限公司申请的“一种AI生成文本的检测方法、装置、介质及设备”专利公布。摘要显示,通过将待检测文本输入文本分类模型,得到文本为AI生成的第一概率值;基于待检测文本及目标损失函数,得到文本的偏离度特征;基于待检测文本、预测模型及预设字典,得到文本的扩散度特征值;基于待检测文本,得到文本的句子长度特征及字词分布特征;根据上述第一概率值、偏离度特征、扩散度特征值、句子长度特征及字词分布特征,判定文本是否为AI生成文本。该专利不仅检测效率高,且不受审核人员的主观影响,检测结果更加准确。消息来源:

封面图片

知网 AI 生成文本检测专利公布 可检测文本是否为 AI 生成

知网AI生成文本检测专利公布可检测文本是否为AI生成天眼查App显示,近日,同方知网数字出版技术股份有限公司申请的“一种AI生成文本的检测方法、装置、介质及设备”专利公布。摘要显示,通过将待检测文本输入文本分类模型,得到文本为AI生成的第一概率值;基于待检测文本及目标损失函数,得到文本的偏离度特征;基于待检测文本、预测模型及预设字典,得到文本的扩散度特征值;基于待检测文本,得到文本的句子长度特征及字词分布特征;根据上述第一概率值、偏离度特征、扩散度特征值、句子长度特征及字词分布特征,判定文本是否为AI生成文本。该专利不仅检测效率高,且不受审核人员的主观影响,检测结果更加准确。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人