无限时长语音、音视频文件转录字幕工具

无限时长语音、音视频文件转录字幕工具 描述:无限时长语音、音视频文件转录字幕工具CapsWriter,它是一款免费开源且可完全离线识别的语音输入工具,无需担心因在线版本识别带来的各种隐私泄露问题。支持win7及以上的系统,已经更新融合了语音输入以及音视频文件实现字幕转录的功能。软件特性: 1.完全离线、无限时长、低延迟、高准确率、中英混输、自动阿拉伯数字、自动调整中英间隔。2.热词功能:可以在 hot-en.txthot-zh.txt hot-rule.txt 中添加三种热词,客户端动态识别载入。 3.日记功能:默认每次录音识别后,识别结果记录在 年份/月份/ ,录音文件保存在 年份/月份/assets。4.关键词日记:识别结果若以关键词开头,会被记录在 年份/月份/关键词-日期.md,关键词在 keywords.txt 中定义。 5.转录功能:将音视频文件拖动到客户端打开,即可转录生成 srt 字幕、txt文本等等。6.服务端、客户端分离,可以服务多台客户端。 链接: 大小:1.2G 标签:#工具 #软件 #开源 #语音转录 #音视频转录 #无限时长语音 #quark 频道:@yunpanshare 群组:@yunpangroup

相关推荐

封面图片

无限时长语音、音视频文件转录字幕工具CapsWriter|

封面图片

开源离线语音识别输入工具CapsWriter v1.0支持无限时长语音+音视频文件转录字幕|

封面图片

包搭建运营版即时通讯/安卓iOSapp/PC端聊天/IM群聊语音视频通话支付

包搭建运营版即时通讯/安卓iOSapp/PC端聊天/IM聊天群聊语音视频通话支付 客户端:1.纯原生安卓+2.纯原生苹果+3.电脑pc+4.web网页 开发语言: Java OC C# 运行软件:eclipse Java xcode 数据库:mongodb 环境:Linux Centos 7以上64位 搭建服务包括服务端搭建及Web、安卓、IOS打包服务需买家提供服务器及域名相关信息并提供APP名称、200*200PNG LOGO, 包搭建配置+运营调试对接音视频+赠送全开源源码+搭建教程等 提供全部源码(服务端、安卓端、苹果端、pc端、web端)+文档+免费安装部署搭建 功能齐全,支持语音视频通话,红包,转账,收付款,公众号,附近人,单聊,群聊,朋友圈 需要的可联系 @Xingchen_KF

封面图片

软件STS-Bcut功能:语音转字幕

软件STS-Bcut 软件功能:语音转字幕 支持平台:#Windows 软件简介:一款音视频生成字幕工具,使用必剪API。 软件特点: ◉ 支持输入视频文件自动提取音频 ◉ 支持拖动添加文件 ◉ 支持多视频/语音文件的一次性转录 软件下载:点击下载

封面图片

:通过具有自托管 Whisper 模型的 WebSocket 进行近实时语音转录

:通过具有自托管 Whisper 模型的 WebSocket 进行近实时语音转录 VoiceStreamAI 是一种基于 Python 3 的服务器和 JavaScript 客户端解决方案,可使用 WebSocket 实现近实时音频流和转录。该系统采用 Huggingface 的语音活动检测 (VAD) 和 OpenAI 的 Whisper 模型来实现准确的语音识别和处理。 特征 通过 WebSocket 进行实时音频流。 使用 Huggingface 的 VAD 进行语音活动检测。 使用 OpenAI 的 Whisper 模型进行语音转录。 可定制的音频块处理。 支持多语言转录。

封面图片

软件CapsWriter-Offline

软件CapsWriter-Offline 软件功能:语音输入工具 支持平台:#Windows 软件简介:一个 PC 端的语音输入和字幕转录工具。通过按下键盘上的大写锁定键开始录音,松开时结束录音,并将录音内容转换为文字输入。 可以将音视频文件拖动到客户端打开,软件会自动转录生成 srt 字幕文件。所有功能都可以在没有网络连接的情况下使用。 支持长时间的语音输入和文件转录。支持中文和英文的混合输入。 软件下载:点击下载 频道 群聊 投稿 商务

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人