:用于检索增强生成、语义搜索、语义文本相似性、释义挖掘等多种应用的Python库,通过微调提升特定任务性能,支持从头开始训练新模

None

相关推荐

封面图片

从头开始编写 Python SQL 引擎 |

封面图片

使用 FastAPI (Python) 从头开始构建 API

封面图片

用于处理大规模非结构化文本数据集的工具,提供清理和筛选功能,旨在筛选微调数据集、创建用于检索增强生成(RAG)的文档集合,甚至对

封面图片

▎Diff Text文本差异比对网站,可以对两段文本进行差异对比,看看有什么地方不同。适合文本相似对比,发现一些难以看到的差异。

封面图片

一个开源的文档内容高效检索 AI 工具:Semantra,与传统的文本匹配方式不同,它能够直接使用语义查询,提升检索效率。可选择

一个开源的文档内容高效检索 AI 工具:Semantra,与传统的文本匹配方式不同,它能够直接使用语义查询,提升检索效率。可选择多种语言模型,支持在本地离线部署运行,注重隐私安全。 使用命令行即可快速处理本地的文本和 PDF 文件。在任务完成后,它会在本地搭建一个 Web 搜索页面,让你能在界面上对直接查询文档。 Semantra 的设计目的是方便易用,可定制。适合需要在大量文档中进行精确搜索的个人或团体,例如新闻从业者、研究员、学生或教师等。主要作用是对存储在本地计算机上的文档(文本或 PDF 文件)进行操作,你可以选择处理单个或多个文档。 该项目对文档的处理有两种方式:「内嵌模型」和调用「OpenAI API」。默认是用的 MPNet 语言模型。 如果你电脑配置还过得去,或者想离线处理文档,可以优先选择下载大语言模型,这种方式可以最大程度保证你的隐私安全。 如果想用 OpenAI API,项目也提供了相对应的方案,不过所产生的 Token 消耗,你需要自行承担。 针对这两种方案,作者都在 GitHub 中给出了详细文档。 | #工具

封面图片

功能:AI绘画,通义千问模型,Gpt模型,讯飞星火模型,文案续写,文本相似度检测,视频去水印,王者战力查询,学习通题目答案,图片

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人