利用生成AI来模拟人类的语音和唇部动作

利用生成AI来模拟人类的语音和唇部动作Metaphysic.ai公司展示了一种新的技术，利用生成AI来模拟人类的语音和唇部动作，创建看起来非常真实的语音和视频内容。这项技术可以将语音内容翻译成多种语言格式并保持唇形一致。而且这个过程是自动的，不需要人工参与。视频展示了他们将一段英语歌曲，转化为法语、西班牙语、中文等语言。来源，来自：雷锋频道：@kejiqu群组：@kejiquchat投稿：@kejiqubot

在Telegram中查看

相关推荐

抖音发布公告严厉打击利用AI生成虚拟人物违规内容

抖音发布公告严厉打击利用AI生成虚拟人物违规内容去年抖音明确表示不鼓励利用AI生成虚拟人物进行低质创作，将严格处罚违规使用AI生成虚拟人物发布违背科学常识、弄虚作假、造谣传谣的内容。近期抖音发现，站内仍有不当使用行为。其中典型包括：生成境外虚假人设，消费爱国心理和博取关注，用虚假外国人的形象，以想嫁给中国、想到中国生活、评价社会事件等言论博取眼球；生成虚假形象骗取互动或卖课甚至进行诈骗等。针对违规行为，抖音会对违规视频下架，对违规账号进行取消其投稿和营利权限、抹除账号粉丝、封禁账号等处置。同时，抖音已掌握部分黑产团伙不当使用AI生成虚拟人物用于犯罪的线索，将报警打击。——

周鸿祎：推测 Sora 生成视频应没有靠 3D 建模训练而是模拟人类智能

周鸿祎：推测Sora生成视频应没有靠3D建模训练而是模拟人类智能在抖音个人直播间中，360创始人周鸿祎表示对OpenAI文生视频应用Sora的逼真效果十分惊讶。据其推测，Sora生成逼真的视频背后应该没有靠3D建模训练。如果Sora也只用3D建模再进行渲染，那么这和传统的电影工业走的是一样的路。他认为，Sora应该是模拟人类智能理解真实世界规律，掌握了人类观察、描绘、表现世界的方法。人类的大脑里不需要3D建模，因为人类对真实世界的物理规律有基本认知，可以控制自己所想。

抖音：已掌握部分黑产团伙不当使用 AI 生成虚拟人物用于犯罪的线索，将报警打击

抖音：已掌握部分黑产团伙不当使用AI生成虚拟人物用于犯罪的线索，将报警打击抖音安全中心发布关于不当利用AI生成虚拟人物的治理公告。公告称，针对违规使用AI生成虚拟人物的行为，平台会对违规视频下架，对违规账号进行取消其投稿和营利权限、抹除账号粉丝、封禁账号等处置，并利用模型、技术识别能力等手段，进行长期系统的识别发现和处置。同时，平台已掌握部分黑产团伙不当使用AI生成虚拟人物用于犯罪的线索，将报警打击。

利用 AI 进行实时语音绘图 | Livestory | #工具

利用AI进行实时语音绘图#工具该工具将传统的提示词输入换成了语音输入，帮你实时生成图像，做到语音控制绘图。使用到的技术框架，如下：-WhisperCPP（实时语音转文本）-SDXLTurboonCoreweave（图像生成模型）-LCM(differentversions)onReplicate（加速图像生成）目前代码已经开源，感兴趣的可以部署使用。

抖音官方：会严厉处置不当使用AI生成技术的违规账号

抖音官方：会严厉处置不当使用AI生成技术的违规账号近期，抖音平台发现站内仍有不当使用AI技术生成虚拟人物发布内容的账号，目前，该平台已掌握部分黑产团伙不当使用AI生成虚拟人物用于犯罪的线索，并且宣布将对此进行报警打击。以下为抖音关于不当利用AI生成虚拟人物的治理公告完整内容：...PC版：https://www.cnbeta.com.tw/articles/soft/1425220.htm手机版：https://m.cnbeta.com.tw/view/1425220.htm

penAI公布其语音生成模型：Voice Engine

OpenAI公布其语音生成模型：VoiceEngine根据文本输入和一个15秒的音频样本，就能生成接近原始说话者声音的自然听起来的语音。主要功能1、自然听起来的语音生成：利用单个15秒的音频样本，VoiceEngine能够创造出既情感丰富又真实的语音，显著提升合成语音的自然度和真实感。2、支持多种用途：从教育援助、内容翻译、提高偏远地区服务质量，到支持非语言人士和帮助患者恢复声音，VoiceEngine的应用场景广泛，跨越多个行业。3、语言和口音的保留：在内容翻译时，VoiceEngine能够保留原始发言者的本地口音，使得翻译后的语音不仅流利还能保持原声音的特色。4、多语种支持：能够生成多种语言的语音输出，适应全球化需求，特别是对于需要将内容本地化到不同语言市场的企业和内容创作者来说，这一特点尤为重要。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人