- 基于C++的可独立编译且几乎没有额外依赖库的本地中文语音识别器

- 基于C++的可独立编译且几乎没有额外依赖库的本地中文语音识别器 SummerAsr 是一个独立编译的大范围连续语音识别系统(ASR),是一个可以本地运行的系统,不需要连接网络,并且没有其他依赖,一键编译完成即可进行语音识别。 SummerAsr识别的WAV(PCM)数据格式为: 16K 采样率,16bits int SummerAsr 的底层计算库使用 Eigen,Eigen 是一套模板定义的函数,大部分情况下,只需要包含头文件即可,所以本项目没有其他依赖,在 C++ 环境下可以独立编译和运行。 本项目使用Eigen提供的矩阵库实现了神经网络算子,不需要依赖例如pytorch,tensorflow,ncnn等其他NN运行环境。 本项目在Ubuntu上编译运行,其他类Linux平台,如Android,树莓派等,也应该没啥大问题,在Window上没有测试过,可能需要一点点。

相关推荐

封面图片

是一种开放源代码的C/C++ 编译器,它允许将几乎任何 C/C++ 代码编译为 WebAssembly 和 JavaScript

是一种开放源代码的C/C++ 编译器,它允许将几乎任何 C/C++ 代码编译为 WebAssembly 和 JavaScript。 与 Emscripten、Cheerp 等 Web 应用程序的替代 C/C++ 编译器相比,有以下优势: 1.生成更优化(更小)的 WebAssembly 代码,但也可以编译为具有动态内存(垃圾收集输出)、零开销 DOM 操作和对 ​​Web API 的访问以及卓越的 C++-JavaScript 互操作性的 JavaScript 输出。 2.[[cheerp::genericjs]]允许通过(可选地)用和标记部分代码,将单个代码库编译成 WebAssembly 和 JavaScript 的组合[[cheerp::wasm]]。 Cheerp 的主要组件,即Cheerp编译器,可以在Github上找到:,而其他存储库在,和最近该项目发布了3.0这个大版本。同时把许可证从gpl换成了Apache 2.0 / LLVM 许可,对商业使用更加友好。

封面图片

:适用于虚幻引擎(Unreal Engine)的跨平台、实时、离线语音识别插件,基于OpenAI 的 Whisper 语音识别引

:适用于虚幻引擎(Unreal Engine)的跨平台、实时、离线语音识别插件,基于OpenAI 的 Whisper 语音识别引擎。 主要特征 识别速度快 提供纯英文和多语言模型,多语言支持100种语言 提供不同型号大小(从 75 Mb 到 2.9 Gb) 在编辑器中自动下载语言模型 任选将已识别的语音翻译成英语 可定制的属性 在设置中轻松选择模型尺寸和语言 没有静态库或外部依赖项 跨平台兼容性

封面图片

Cheep C++ 到 Webassembly 编译器现已开源。

Cheep C++ 到 Webassembly 编译器现已开源。 Cheerp 是一个用于 Web 应用程序的 C/C++ 编译器,可让你将几乎所有 C/C++ 代码编译为 WebAssembly 和 JavaScript。其最新的3.0版本已经开源。 ​​​ Cheerp 是一个用于 Web 应用程序的 C/C++ 编译器,可让您将几乎所有 C/C++ 代码编译为 WebAssembly 和 JavaScript。其最新的3.0版本已经开源。 Cheerp 主要用于将现有的 C/C++ 库和应用程序移植到 HTML5,但也可用于从头开始编写高性能 Web 应用程序和 WebAssembly 组件。使用 Cheerp,C/C++ 代码被编译成 JavaScript/WebAssembly,并通过公开正确的 JavaScript 接口进行优化,可以轻松集成到 Web 应用程序中。 Cheerp 是 Webassembly 编译工具系列的一部分,与 CheerpJ、CheerpX for Flash 和 WebVM 并列。可用于以下场景: 1.将遗留 Java 应用程序和 Java Applets 转换为 HTML5,只需很少的努力或无需任何努力,以延长它们的生命,直到弃用,或直到开发出替代的本机 HTML 应用程序。 2.将现有的 Java 客户端迁移到基于浏览器的 Web 应用程序,通常通过使用 CheerpJ 将业务逻辑从 Java 转换为 WebAssembly/JavaScript,并用原生 HTML 重写 UI。 3.使用(转换后的)Java 库作为本机 Web 应用程序的一部分。 在幕后,CheerpJ 需要 WebAssembly 中的完整 Java SE 运行时和存在于浏览器中的 JavaScript,以及支持从 Java 访问和操作 DOM 的 JavaScript/DOM 互操作性 API。 相比之下,C++ 的 Cheerp 不需要这样的运行时,而是直接使用 LLVM 字节码格式作为目标文件和库的中间表示。它的特性如下: 解析代码,发出最终的警告和错误,然后生成对输入程序进行编码的等效 IR(= 内部表示)。 IR 通过一系列转换优化为更紧凑和更高性能的 IR。 优化后的 IR 最终由代码生成为 JavaScript 和 WebAssembly 函数和变量的组合。 或者简单地说:C++ 代码库 ->Cheerp(使用 LLVM 的优化) ->JS + Wasm 一旦生成了 .js 和 .wasm 文件,接下来就是为这两个静态文件提供服务,将它们嵌入到相关的 HTML 页面中,在库的 API 之上构建功能,并测试是否一切正常。主文件到被调用的仍然是一个 .js 文件,但是一个 .wasm 文件也被加载并从 .js 文件运行。 虽然 CheerpJ 不是开源产品,但 Cheerp 现在是。 在这一点上,重要的是要注意,从 languageX 到 WebAssembly 的工具现在可以证明更有用,因为 WebAssembly 最近摆脱了浏览器的限制,现在可以用于运行微服务和无服务函数,甚至可以运行 Wasm 二进制 文件在命令行上,这样甚至可以开发跨平台的 CLI 应用程序。

封面图片

:以C++编写的物理仿真代码库,旨在提供高效且灵活的仿真解决方案,支持独立运行或作为第三方模块集成到其他应用中。

:以C++编写的物理仿真代码库,旨在提供高效且灵活的仿真解决方案,支持独立运行或作为第三方模块集成到其他应用中。 它包含了一系列实用工具,如高效的三角/四面体网格数据结构、便捷的参数输入输出模块、碰撞检测器以及可扩展的虚拟物理框架,以支持各种求解器。

封面图片

Windows 11语音识别功能半年后淘汰 但仍可在Windows 10上使用

Windows 11语音识别功能半年后淘汰 但仍可在Windows 10上使用 微软计划于 2024 年 9 月从 Windows 11 的支持版本中移除 Windows Speech Recognition,所有用户需要迁移到 Voice Access。根据更新后的支持文档,"Windows 11 22H2 及更高版本的 Windows Speech Recognition(WSR)将从 2024 年 9 月开始被语音访问所取代"。虽然这意味着语音识别功能仍能在 Windows 11 21H2 上运行,但您将无法在更新的版本上访问它。如果你还在使用 21H2 版本,那么在未来几周内,你将被迫升级到 22H2 或 23H2 版本,并需要使用语音访问功能来代替语音识别功能。不出所料,语音访问和 WSR 出现在同一个辅助功能设置页面。不过,语音访问位于顶部,而 WSR 出现在"其他语音命令"部分。还有一条关于支持结束的警告信息,建议你使用语音访问。如果你使用的是将于 2025 年 10 月结束支持的 Windows 10,那么 WSR 将在你的电脑上继续工作两年多。由于微软已确认其将被淘汰,因此它将不会获得任何新功能或更新。不过,Voice Access 应用程序并没有你想象的那么糟糕。与 WSR 相比,Voice Access 应用程序推出时仅支持几种语言,但现在已经好多了。在 Windows 11 Moment 5 中,微软为该应用添加了更多语言支持。现在,它可以识别法语(法国)、法语(加拿大)、德语、西班牙语(西班牙)和西班牙语(墨西哥)等语言。语音访问需要互联网连接来设置和下载相应的语言模型。之后,您就可以使用它来用语音控制屏幕上的元素。配置好工具后,您就可以打开应用程序、与按钮互动,而且不用动动手指就能打字。另一项功能是支持多显示器,让你能在多个显示器之间切换。你可以设置自定义命令来打开应用程序和链接,并执行其他基本功能。微软决定移除传统应用程序,转而采用更好的替代方案并没有错。不过,有些人可能仍然希望使用语音识别功能,尤其是当你不想使用基于互联网的应用程序时。 ... PC版: 手机版:

封面图片

:超简单的类GPT语音助手,采用开源大型语言模型 (LLM) 以响应口头请求,完全在树莓派上本地运行。

:超简单的类GPT语音助手,采用开源大型语言模型 (LLM) 以响应口头请求,完全在树莓派上本地运行。 它不需要互联网连接或云服务支持。使用按钮触发录音,经过自动语音识别生成文本,然后由 TinyLlama-1.1B LLM 生成回复,并通过 eSpeak 语音合成器产生音频输出。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人