#bilibili #开源

#bilibili #开源 Bili2text B 站视频转文本工具,实现流程为下载视频、提取音频、分割音频,并使用 whisper 模型将语音转换为文本,整个过程是自动的,只需输入视频的 av 号即可。 频道 @WidgetChannel

相关推荐

封面图片

#语音转文字 #转换 #win #开源

#语音转文字 #转换 #win #开源 Whisper 开源语音转文字工具,基于 OpenAI 的 Whisper 语音识别模型,支持 GPU、实时语音转换,在英语语音识别方面的稳健性和准确性接近人类水平。 本地服务,仅支持 Win 64 位系统。 频道 @WidgetChannel

封面图片

#语音识别 SR #AI #开源 #web

#语音识别 #ASR #AI #开源 #web Insanely Fast Whisper 基于 Whisper Large v3 模型的语音转文字工具,使用了 Transformers、Optimum 和 flash-attn 技术,转换 150 分钟的音频最快仅需 98 秒。 极快的转换速度,加上较高的精确度,算是 AI 落地很实用的一个工具了,转录会议记录之类的很方便,建议收藏。 在线体验 丨 GitHub 频道 @WidgetChannel

封面图片

#bilibili #直播 #开源

#bilibili #直播 #开源 biliLive-tools 一个用于 B 站录播的一站式工具,支持弹幕转换与视频压制并上传至 B 站,支持录播姬与 blrec 的 webhook。 视频教程 丨 项目地址 频道 @WidgetChannel

封面图片

#软件 #开源 #AI #TTS

#软件 #开源 #AI #TTS Pandrator - 开源高质量文本转语音工具 ▎软件功能:文本转语音 ▎软件平台:#Windows ▎软件介绍:一种工具,旨在将文本、PDF、EPUB 和 SRT 文件转换为多种语言的语音音频,包括语音克隆、LLM 基于文本的预处理以及通过将同步输出与视频的原始音轨混合来直接将生成的字幕音频保存到视频文件的能力。 它利用 XTTS、Silero 和 VoiceCraft 模型进行文本到语音转换和语音克隆,并通过 RVC_CLI 进行增强,以提高质量和更好的语音克隆结果,并通过 NISQA 进行音频质量评估。 此外,它还集成了 Text Generation Webui 的 API,用于基于本地LLM的文本预处理,从而在音频生成之前实现广泛的文本操作。 ▎软件下载:点击下载

封面图片

#Bilibili #音乐 #下载 #web #开源

#Bilibili #音乐 #下载 #web #开源 Bilibili音乐下载器 V2EX 丨 GitHub 一站式 B 站音乐下载服务,一键下载+转换+嵌入元数据/封面,整个流程都在浏览器中进行,仅需数十秒,无需任何手动干预,直接获取 MP3 音乐文件,很有意思的项目。 使用方法:在网址后输入 BV 号即可开始下载,示例 https://bili.amono.me/BV1Ag4y1b7pa 频道 @WidgetChannel

封面图片

#Bilibili #YouTube #开源

#Bilibili #YouTube #开源 Bili-to-Youtube 一个简化从 B站 下载视频并上传到 Youtube 的项目,有些技术门槛,小白大概率是用不了的,如需使用请看 介绍文档 ,挺麻烦的,不过配置好了也确实能提高效率。 频道 @WidgetChannel

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人