网站incredibly-fast-whisper

网站incredibly-fast-whisper 网站功能:音频转文字 网站简介:一款利用 OpenAI 的 Whisper Large v3 模型进行极速音频转录的工具,能够在短时间内完成长时音频的转录任务。 该模型可以在大约100秒内转录150分钟的音频内容,极大提高了转录效率。 网站链接:点击打开 频道 群聊 投稿 商务

相关推荐

封面图片

Insanely Fast Whisper

Insanely Fast Whisper 基于 Whisper Large v3 模型的语音转文字工具,使用了 Transformers、Optimum 和 flash-attn 技术,转换 150 分钟的音频最快仅需 98 秒。 极快的转换速度,加上较高的精确度,算是 AI 落地很实用的一个工具了,转录会议记录之类的很方便,建议收藏。 在线体验 丨 GitHub 频道 @WidgetChannel #语音识别 #ASR #AI #开源 #web

封面图片

Insanely Fast Whisper-基于OpenAI模型的快速音频转文字工具

Insanely Fast Whisper-基于OpenAI模型的快速音频转文字工具 #AI工具 #GitHub项目 #趣站 #语音转文字 #音频转文字 https://www.ahhhhfs.com/50814/

封面图片

网站Whisper JAX

网站Whisper JAX 网站功能:语音转文字 网站简介:一款基于 Whisper API 的在线语音转文字工具,支持麦克风、录音文件、YouTube 三种音频来源,单文件 2 小时以内免费使用。 还支持多种语言,包括繁体中文,并且可以提供时间戳和翻译功能。 网站链接:点击访问 频道 群聊 投稿 商务

封面图片

:通过具有自托管 Whisper 模型的 WebSocket 进行近实时语音转录

:通过具有自托管 Whisper 模型的 WebSocket 进行近实时语音转录 VoiceStreamAI 是一种基于 Python 3 的服务器和 JavaScript 客户端解决方案,可使用 WebSocket 实现近实时音频流和转录。该系统采用 Huggingface 的语音活动检测 (VAD) 和 OpenAI 的 Whisper 模型来实现准确的语音识别和处理。 特征 通过 WebSocket 进行实时音频流。 使用 Huggingface 的 VAD 进行语音活动检测。 使用 OpenAI 的 Whisper 模型进行语音转录。 可定制的音频块处理。 支持多语言转录。

封面图片

Whisper WebUI

Whisper WebUI 基于 Whisper API 的音频转录和翻译工具,支持 FLAC、M4A、MP3、MP4、WAV、OGG、WebM 等格式,文件限制 25MB,可通过 Prompt 指导转录风格,可导出为 Json、纯文本、SRT 等文件,需自备 OpenAI API Key ,免费无需注册。 体验地址 丨 项目地址 频道 @WidgetChannel #AI #音频 #翻译

封面图片

Whisper

Whisper 开源语音转文字工具,基于 OpenAI 的 Whisper 语音识别模型,支持 GPU、实时语音转换,在英语语音识别方面的稳健性和准确性接近人类水平。 本地服务,仅支持 Win 64 位系统。 频道 @WidgetChannel #语音转文字 #转换 #win #开源

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人