TikTok正在开发AI语音克隆功能,10秒即可复制自己的声音

TikTok正在开发AI语音克隆功能,10秒即可复制自己的声音社交媒体平台TikTok正在开发一项新的AI功能,该功能允许用户在几秒内将自己的声音复制并添加到“TikTok语音库”中。根据TheSpAndroid对TikTok应用最新版本的解包,这项功能仍处于开发阶段,具体的发布时间尚未确定,且TikTok尚未为该功能命名。用户通过录制自己的声音来创建个性化的语音包,然后可以利用TikTok的文本转语音功能,将这个AI版本的语音应用到自己的视频中。TikTok提示用户录制一段给定文字的语音,尽管在测试版中该功能尚未实装,且没有提供相应的文本,导致目前无法正常使用。此外,为了保护用户的隐私安全,TikTok已经采取了多种措施,包括允许用户随时删除自己创建的AI语音,以防止被他人盗用或用于他人的内容创作。线索:@ZaiHuabot投稿:@TNSubmbot频道:@TestFlightCN

相关推荐

封面图片

TikTok 正开发 AI 语音克隆功能,只需 10 秒即可复制你的音色

AssembleDebug发现TikTok正在开发一项新的AI功能,用户可以在几秒钟内让自己的声音出现在“TikTok语音库”中。TheSpAndroid对最新版本的TikTok 应用解包发现,这一功能目前还在开发中,具体发布时间尚无法确认,而且TikTok可能都没有给这一功能命名。用户只需录制一次创建自己的语音包,后续可以借助文本转语音功能在自己的TikTok 视频中使用。“只需10秒钟,即可将您的声音创建为AI版本!您可以在TikTok视频中使用文本转语音功能。”根据TikTok提示,用户需要阅读一段给定的文字并进行录音,但由于目前测试版中还没有实装,这一界面也没有对应的文本,此时就算按下录制按钮也会导致报错,因此目前基本没用。TikTok还采取了多种措施以确保用户的隐私安全问题。当然,用户可以随时将其创建的 AI语音删除,以防被他人盗用或用于他人的内容创作。标签:#TikTok#AI频道:@GodlyNews1投稿:@GodlyNewsBot

封面图片

TikTok 即将推出新功能,只需10秒即可用 AI 克隆你的声音

TikTok即将推出新功能,只需10秒即可用AI克隆你的声音TikTok正在开发这项功能,目前只是将其称为“使用AI创建你的声音”和“TikTok语音库”。在最新版本TikTok中出现的字符串,表明其正在开发此功能。介绍该功能的初始UI如上所示。Tiktok声称它可以在短短10秒内创建你声音的AI版本。生成的AI语音克隆可以与TikTok视频中的文本转语音一起使用。在隐私方面,您的AI语音将保持私密,可以随时将其删除。——

封面图片

Spotify 测试 AI 新功能:克隆播客主播的声音并将其翻译成其它语言

Spotify测试AI新功能:克隆播客主播的声音并将其翻译成其它语言Spotify正在测试一项新的人工智能功能,该功能名为“语音翻译(VoiceTranslation)”,该功能可以克隆播客主播的声音,并用该声音使用另一种语言读出播客。该工具由Spotify在OpenAI的自动语音识别(ASR)系统Whisper的帮助下开发的,使用了语音转文本生成AI模型来翻译音频文件,并使用语音复制模型来匹配原始说话者的风格。——、

封面图片

Truecaller和微软将可以让用户创建AI语音来帮助接听电话

Truecaller和微软将可以让用户创建AI语音来帮助接听电话Truecaller产品总监兼总经理拉斐尔-米蒙(RaphaelMimoun)在博文中说:"这一开创性的功能不仅为用户增添了一丝熟悉感和舒适感,还展示了人工智能在改变我们与数字助理交互方式方面的力量。"Truecaller的人工智能助理会筛选来电,并让用户知道来电原因。客户可以看到来电原因,并可以选择如何回应,是接听电话还是让助手代为接听。该助手于2022年首次在Truecaller应用程序上推出,目前只在部分国家使用。用户一直可以从预设的声音中选择代表自己的声音,该公司表示,让用户录制自己的声音是使服务更加个性化的一个步骤。在Build大会期间展示的AzureAISpeech增加了个人语音功能,让人们可以录制和复制声音。不过,微软在一篇博文中表示,个人语音功能的使用范围有限,仅适用于语音助手等特定用例。微软表示,它会自动为AzureAISpeech个人语音生成的声音添加水印。微软还发布了一份行为准则,要求用户在录音时获得被录音者的完全同意,并禁止冒名顶替。个人语音在与自己的语音邮件信息对比时的表现如何还有待观察。...PC版:https://www.cnbeta.com.tw/articles/soft/1432007.htm手机版:https://m.cnbeta.com.tw/view/1432007.htm

封面图片

TikTok 将删除未经授权的 AI 语音克隆音乐

TikTok将删除未经授权的AI语音克隆音乐TikTok与环球音乐集团(UMG)达成的新协议包含一项关键条款:该短视频应用同意删除人工智能创作的未经授权的音乐。字节跳动有限公司旗下的应用与全球最大的唱片公司达成的协议,终于结束了长达数月的关于报酬以及该平台上人工智能生成音乐的激增的争执。两家公司周四在一份声明中表示,TikTok将开发“改善艺术家和词曲作者归属的工具”,以解决音乐行业在面临人工智能生成的材料在网上迅速传播时面临的一个关键症结。——

封面图片

只需15分钟 iPhone 就能“复制”你的声音

只需15分钟iPhone就能“复制”你的声音到了今天,ALS患者虽然有了更多语音合成的选择,但总体费用和时间门槛仍然不低,普及度也有限。最近,苹果公布了全新无障碍功能PersonalVoice(暂未上线),不仅让用户能免费“备份”自己的声音,同时还在安全地应用AI技术上,作出了一次有意思的尝试。只需15分钟“调教”,就能生成你的声音在生成式AI可以模仿一切的时代里,用AI模仿一个人的声音听起来已经不算新奇,只是感觉有点安全隐患。我好奇的,更多是苹果要怎样安全和高效地实现PersonalVoice这一功能。据介绍,iPhone、iPad和Mac用户只需要根据提示录制15分钟的音频,苹果就会基于设备端的机器学习技术来生成和用户一样的声音。相比之下,为失语群体提供专业语音合成服务的公司,可能需要采用专业设备,录制几小时的语音素材,价格最低都要数百美元。另一项新无障碍功能LiveSpeech,则支持用户打电话、FaceTime或者是和他人面对面对话的时候,输入文字即可生成语音内容,为失语或不方便说话的用户提供另一种“发声”方式。结合PersonalVoice和LiveSpeech两项功能,失语用户就能用接近自己原本声音的生成声音和他人沟通。用起来是方便了,但怎样避免有人用网上扒的语音素材来生成他人的声音?素材随机化。在录制15分钟语音素材的过程中,苹果将随机生成需要用户朗读的内容,减少他人猜中素材的可能性。物理距离屏障。在录制过程中,用户需要在距离设备6-10英寸(约15-25厘米)的特定空间里完成录制。在生成过程中,所有数据都将通过苹果的NeuralEngine(神经引擎)在设备本地完成,不必要上传到云处理。语音合成后,第三方应用如果想使用PersonalVoice,都要获得用户明确授权。即便第三方应用获得授权使用时,苹果也会采用额外的背景保护,确保第三方应用无法获取PersonalVoice以及用户之前所录制的语音素材。如果是苹果“全家桶”用户,生成自己的PersonalVoice后还能通过iCloud同步到不同设备上,并以端对端的方式加密。自己的声音,失去了才懂多重要人是感性的生物,而声音是很强烈的情感触发器。有研究指出,当人在听到母亲的声音时,身体释放出催产素水平和跟妈妈拥抱时产生的程度很相似。另一个研究则指出,听到自己的声音,会增强一个人的自我能动性。这听起来有点抽象。但当我们失去它时,重要性就变得显而易见了。2021年3月,RuthBrunton被确诊ALS。那年圣诞,她就已经失语了。ALS患者中,约有25%的人患的是“延髓起病型”肌萎缩侧索硬化症,主要表现是说话障碍或吞咽困难。这类病人说话会逐渐变得含糊、带有鼻音,甚至失语。Brunton的行动很果断,确诊后马上找公司去做语音生成。来回花了一个月时间,录了3000多个句子的语料,但最后出来的结果并不理想。那家公司用的是一种名为“单元选择(unitselection)”技术。简单粗暴来说,它就是通过“拼接”来实现语音生成,把语料拆分为大量小的语音单元,然后按需把元素拼起来。▲单元选择技术下,“Bob”这一词语能被拆分成不同语音元素,图自《华盛顿邮报》这种技术生成的语音能听清,但会有点电音,听起来不太自然。结果就是,Brunton录制的语料结合了微软一个名为“Heather”的声音,不但声音和自己毫不相似,甚至逼着这英国人“讲”起了美语口音。困在这个声音里,Brunton“只会在必要的时候说话,不再是因为想说话而说话”。从前和丈夫打闹聊天的心情消失了,Brunton也不怎么愿意参加多人对话。即便是说“我爱你”,用一个不像自己的声音来说,意义也似乎被削弱了。六个月后,Brunton和丈夫争取回了最初录制的语音素材,找了另一家公司,用AI技术合成了一个更像她自己的声音:这听起来也许有点傻,但重新获得自己的声音让我更有自信了。在波士顿儿童医院负责“增强沟通”项目的JohnM.Costello留意到,那些采用了更真实生成语音的病人,似乎更能够和亲近的人建立深厚的联结。2022年圣诞节,“重获新声”的Brunton还用语音录制的一段节日祝语。然而,圣诞刚过,Brunton就染上了新冠,最后在今年2月离世了。她离开的那晚,丈夫David一整夜都握着她的手:我们有两年时间来告别。我们说好了,我们要说尽一切我们想说的。难以想象,如果Brunton后来没换上更像自己的声音,她又是否能自在地说出想说的一切。无障碍思维点亮灵感,AI燃起生产力我一直认为,无障碍设计所挖掘的,其实就是人类多样性创造的想象力资源。我们去到和自己有着截然不同生活体验的人面前,聆听更少被诉说的故事和体验,创造出我们之前没想象过,但却能对更多人友好的的新生活方式。PersonalVoice能让失语的ALS患者重新获得自己的声音;也可以帮助在经历“刀片嗓”的我用自己的声音去和其他人对话;甚至,我也很难避免会去想象,是否应该用这为自己“备份”声音留给亲近的人,以免哪天自己会突然离世。而AI技术,就是实现这些想象力生产力。正如杜编辑之前说的,虽然不赶生成式AI的热闹,但苹果一直都把AI用来提升用户体验——提升效率,保护隐私。提升效率,在于提升本地执行的机器学习算法和模型。除了PersonalVoice以外,苹果这次预览的另一个无障碍功能PointandSpeak也采用了本地设备端的机器学习技术。未来,视障用户在iPhone自带的放大器里,结合PointandSpeak和旁白功能,就能凭自己手指把iPhone变成“点读机”——点到哪儿,让iPhone给你把文字读到哪儿。去年的“门检测”功能道理也类似,让设备端的机器学习帮视障用户识别出门,并朗读出门上面的信息和周围的标识。至于隐私,按乔布斯说的,就是“如果你需要他们(用户)的数据,那就向他们(用户)请求。每一次都如此。”这在无障碍设计方面也尤其重要——因为这些功能设计起源就是服务被所谓“常规设计”忽略的人,常常都是更弱势的群体,因此更有必要确保这些用户的隐私不受侵害。在这个语境下,我们也可开启更多关于数据应用权和透明度的讨论。苹果这次做PersonalVoice时,和帮助ALS患者的非盈利机构TeamGleasonFoundation合作。▲TeamGleasonFoundationCEOBlairCasey(右)该机构的CEOBlairCasey一直也在推动语音生成公司设定一套标准录制素材设定,让用户能直接录这部分素材,并体验不同公司生成出来的语音效果,而不是像现在一样“盲赌”。同时,Casey也主张语音生成公司把用户录制的语音素材数据提供给用户(因为很多用户可能录制后就失语了),以免他们未来想把这些数据用在其他技术上:如果更好的技术出来了,你会不想试一试吗?如果你没法拿回自己的语音素材,你就没法去试。AI也许是我们时代最强的生产力。但是,这力该怎么使,也许以人为本的无障碍设计能给它不少指引。...PC版:https://www.cnbeta.com.tw/articles/soft/1364089.htm手机版:https://m.cnbeta.com.tw/view/1364089.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人