利用 AI 进行实时语音绘图 || #工具

利用 AI 进行实时语音绘图 || #工具 该工具将传统的提示词输入换成了语音输入,帮你实时生成图像,做到语音控制绘图。 使用到的技术框架,如下: - WhisperCPP(实时语音转文本) - SDXL Turbo on Coreweave(图像生成模型) - LCM (different versions) on Replicate(加速图像生成) 目前代码已经开源,感兴趣的可以部署使用。

相关推荐

封面图片

ℹ LiveCanvas 你画什么就会实时生成的 AI 绘图工具,提供多种图片风格选择#

ℹ LiveCanvas 你画什么就会实时生成的 AI 绘图工具,提供多种图片风格选择# 虽然过去早就有手动画,然后透过 AI 生成的绘图工具,不过都需要等到全部画完才能生成,没办法实时。即使是用提示指令也是,而且生成时都要等上...

封面图片

Gladia:基于 AI 的语音转文本服务,利用Whisper快速转录音频文件,并实时翻译

Gladia:基于 AI 的语音转文本服务,利用Whisper快速转录音频文件,并实时翻译 这个工具真的好用,阿喵我测试了几个,就这个最方便了,免费10小时每个月。 标签:#AI #语音转文字 #网站 #翻译 链接:

封面图片

#APPDO应用推荐▎Memo AI :本地的语音转文字工具

#APPDO应用推荐 ▎Memo AI :本地的语音转文字工具 1. 多种语言支持:支持中、日、英、韩、德、法、西、葡、小语种等九十种语言转换; 2. AI 总结翻译:支持 Open AI 总结视频内容以及翻译字幕,可能是当下 AI 翻译字幕最好的工具; 3. 实时显示字幕:流转录模式,过程实时显示字幕,可以边转边看视频; 4. 多种格式导出:Markdown 文本、SRT 字幕格式,还是 Notion 都支持; 5. GPU 加速支持:支持 Window 设备使用 GPU 加速,例如 30 分钟播客视频只需 2 分钟转录; 6. 悬浮视频笔记:支持根据视频时间戳截图、打点,笔记和视频形成互链关系方便回顾。 近期更新:英文智能断句:根据选择长度,自动生成完整句子。 ▎官网链接 (邀请码在本条评论区获取) 频道 @AppDoDo

封面图片

网站Plaud AI网站功能:语音转文字

网站Plaud AI 网站功能:语音转文字 网站简介:一款在线语音转文字工具。可通过上传录音来转文字,也可通过在线录音转文字。转录功能基于ChatGPT。 工具特点: ◉ 自动语音转写 ◉ 重点内容总结 ◉ 操作简单方便 ◉ 带时间戳文稿 ◉在线直接使用 网站网址:点击打开

封面图片

AI图像编辑工具Facet AI 实时图像生成,可精确控制图像元素

AI图像编辑工具Facet AI 实时图像生成,可精确控制图像元素 操作简单,直接拖拽就可以调整图像元素,实现精确控制,而且实时展示 实时的修改图像中的任意位置和元素,比如杯子的朝向,花的颜色,以及放在哪个区域等 可以向任何提示添加图像参考,以便快速获取符合特定主题或风格的图像。 | #工具

封面图片

VoiceBox 语音转文本工具

VoiceBox 语音转文本工具 采用了领先的开源语音识别模型Whisper,实现了offline语音转文本的功能。用户只需要一次性下载对应语言的语音模型,就可以在完全离线的状态下使用语音转文本。即使没有网络也可以流畅地进行语音转录。#iOS #苹果 #语音转文本 链接:点击下载

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人