“让霉霉中文开口跪”的AI有开源平替了 每月立省350

“让霉霉中文开口跪”的AI有开源平替了每月立省350主要有了它,咱们在本地就能无限玩视频翻译,直接好处那可就是每月立省350~(手动狗头)毕竟,HeyGen再厉害,也只有2分钟免费时长。△ HeyGen收费情况具体瞧瞧。HeyGen开源平替来了这个视频翻译平替名叫MyHeyGen,来自b站UP主:@ai浮世绘。除了英文,MyHeyGen还支持转法语、日语等共计16种语言。视频翻译的三个流程:音频翻译、翻译校正和视频唇纹合成,它全部一个流程解决。如果你想亲手试试,步骤也不复杂。大概流程是先环境准备:需要分别去Huggface申请个token、去百度翻译申请个AppKey,并下载权重和checkpoints文件。然后就可以gitclone安装了。开始测试之前,记得将你要翻译的视频下载保存到本地。然后在执行命令中提供其保存路径+想要翻译成的语言代码(比如’en’代表英语)+翻译好的视频保存路径就可以坐等了。命令的完整格式如下:pythontranslate.py原视频文件路径目标语言代码-o保存路径有网友实测成功:不过,还是必须得满足16G显存才ok,以及windows用户可能需要自己再解决一下兼容问题(up主该视频底下有人提供了方法)。如果这些都不行,可以再等等colab实现,up主表示在测试中了。效果方面,可以发现MyHeyGen音色复刻得很是到位,用了最新的语音克隆开源技术XTTSv2。投喂给AI一个明星的采访视频,它就能克隆其中的声音讲不同的话。至于MyHeyGen的缺点,大家看完表示也明显。比如有人反映口形有一些不同步,有人则吐槽遇上面部大幅活动就容易“抽风”(如本段开头的“这英”)等等。但整体玩一玩还是ok的。OneMoreThing仔细一翻,HeyGen的开源替代品还真不少。有俄罗斯程序员也在业余时间做了一个:HeyGenClone。用的是谷歌翻译,可以支持上百种目标语言,但只支持原语言为英文的视频。由于只给了一个很短的俄语效果展示,不是很好评鉴,这里就不放视频了~参考链接:[1]https://twitter.com/dotey/status/1722543725459452211[2]https://twitter.com/gorden_sun/status/1722439866112463163...PC版:https://www.cnbeta.com.tw/articles/soft/1396173.htm手机版:https://m.cnbeta.com.tw/view/1396173.htm

相关推荐

封面图片

LAION发布世界最大ChatGPT开源平替——OpenAssistant

LAION发布世界最大ChatGPT开源平替——OpenAssistantOpenAssistant是一个开源的对话模型,支持35种语言,且是目前已开源最大规模的对话模型,其基于Pythia和LLaMA微调而来,主要用于训练人类标注的数据。OpenAssistantConversations数据集是通过13000多名志愿者的众包努力综合而来的。这一数据集中最常用语言的占比,英语和西班牙语占比最多。中文2.5%。该项目代码以Python编写,并在Apache2.0许可下发布。频道:@TestFlightCN

封面图片

一款开源免费平替 Perplexity AI 工具

一款开源免费平替PerplexityAI工具这是一款完全免费基于搜索的问答AI工具,可本地运行且无需GPU硬件支持,能很好确保隐私安全。只需输入问题,工具便会通过SearXNG进行多引擎搜索,并利用GPT-3.5处理搜索结果,总结并生成答案。主要特性:完全免费:无需支付任何费用或申请任何API密钥。本地化操作:不需GPU支持,任何电脑均可运行。保障隐私:所有操作均在本地执行,确保隐私安全。无需专门的大语言模型硬件:免GPU!支持免费的GPT-3.5API:无需API密钥即可使用。快速部署:支持DockerCompose,便捷部署。适配网络和移动端:无论是通过电脑还是移动设备,都能轻松访问。项目提供了docker-compose快速部署方式,并且是在熟悉的NextChat页面上使用,可快速上手。#工具#替代品

封面图片

Unity“平替”开源引擎 Godot 推出 4.2 版

Unity“平替”开源引擎Godot推出4.2版Godot是一款流行的开源游戏引擎,支持使用各种编程语言(包括GDScript、C++和C#)开发2D和3D游戏,这款引擎在Unity争议事件后被不少开发商采用。目前引擎4.2版本已经,共有359位贡献者提出了1800项改进,官方介绍称,此版本的变化包括必要的错误修复和令人兴奋的新功能,让开发者更轻松实现游戏和应用程序的想法。来源,频道:@kejiqu群组:@kejiquchat

封面图片

AI识别唇语:Meta 开源第一个视听语言翻译语料库 MuAViC

AI识别唇语:Meta开源第一个视听语言翻译语料库MuAViCMuAViC源数据来自TED和TEDx超过8000名演讲者的视频,提供了9种语言的1200小时的音频-视觉语料,包括英语、阿拉伯语、德语、希腊语语、西班牙语、法语、意大利语、葡萄牙语和俄语。MuAViC支持多种任务,如自动语音识别、唇读、机器翻译和端到端的语音到文本翻译。Meta的开源模型AV-HuBERT经过MuAViC训练后,在嘈杂环境中的表现远优于其它领先的翻译模型。投稿:@ZaiHuabot频道:@TestFlightCN

封面图片

一款可平替 Figma 的开源免费工具 Penpot,它是首个开源的 UI 设计与原型制作平台。

一款可平替Figma的开源免费工具Penpot,它是首个开源的UI设计与原型制作平台。目前在GitHub上已获得24.6kStar,拥有多款UI组件与样式、交互式原型以及项目设计示例与模板,可帮你快速完成项目设计工作。此外,还支持团队多人实时协作编辑,设计稿添加注释等多种团队协作工具。#工具#替代品

封面图片

#软件#视频#字幕#翻译#开源video-subtitle-master-视频批量字幕生成和翻译工具▎软件功能:视频字幕批量生成

#软件#视频#字幕#翻译#开源video-subtitle-master-视频批量字幕生成和翻译工具▎软件功能:视频字幕批量生成和翻译▎软件平台:#Windows#macOS▎软件介绍:一个可以批量为视频生成字幕,并可将字幕翻译成其它语言的工具,基于咱之前介绍过的VideoSubtitleGenerator命令行工具,保留了它的全部特性,制作成的一个客户端工具。项目的翻译能力是基于百度/火山/deeplx的翻译API来实现的,这些API的使用需要申请对的KEY和SECRET,因此,如果你需要使用到翻译服务,需要先申请一个API。申请方法▎软件下载:点击下载

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人