大家似乎对此非常感兴趣,专门写了一篇Blog 介绍如何搭建自己的中文检索 Bot。

大家似乎对此非常感兴趣,专门写了一篇Blog 介绍如何搭建自己的中文检索 Bot。 你需要自备一台VPS 来运行这些项目。 订阅第一时间获得内容更新 标签: #Blog #Telegram 频道: @GodlyNews1 投稿: @GodlyNewsBot

相关推荐

封面图片

由于 Telegram 的检索功能太烂,特别是中文,故专门为频道搭建了一个信息引索 bot,支持中英文检索。

由于 Telegram 的检索功能太烂,特别是中文,故专门为频道搭建了一个信息引索 bot,支持中英文检索。 使用方法: 私聊 @yummy_search_bot,发送内容,点击检索结果即可跳转频道对应消息 下面几条命令任何用户都可以使用: 1./search [keyword]: 搜索消息,同去掉 /search 的情形等价。 2./chats [keyword]: 列出所有被索引的,标题中包含 keyword 的会话列表。如果没有指定 keyword,则返回所有的会话。bot 会返回一列按钮,点击一个按钮之后这条消息就对应了一个会话。有一些指令包含 chat_id 作为参数,对于这些指令,如果没有指定 chat_id 参数,那么可以通过回复这条消息来把会话的 ID 当作参数。如果回复搜索的关键词,则只搜索这个会话中的消息。 3./random:返回一条随机的消息(暂不支持指定会话) 标签: #bot #中文搜索 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

Telegram 团队在他们的博客上发布了一篇文章,详细描述了通过内置编辑器创建新贴纸、向贴纸包添加贴纸、扩展贴纸包等的过程。

Telegram 团队在他们的博客上发布了一篇文章,详细描述了通过内置编辑器创建新贴纸、向贴纸包添加贴纸、扩展贴纸包等的过程。 在文章最后,开发者宣布本月他们将发布另外 16 个新功能。您现在可以在我们的中阅读其中一些内容。 文章(原文): 中文译文:(仅对原文进行翻译) 订阅第一时间获得内容更新 标签: #Telegram #Blog 频道: @GodlyNews1 投稿: @Godlynewsbot

封面图片

elvis写了一篇非常详细的文章来介绍 RAG 生态的所有部分,还会添加清晰易懂的参考文献列表以及技术性编程教程帮助提高 RAG

elvis写了一篇非常详细的文章来介绍 RAG 生态的所有部分,还会添加清晰易懂的参考文献列表以及技术性编程教程帮助提高 RAG 系统的性能。 主要内容来自《大语言模型的检索增强生成:一项调查》这篇论文,我简要总结了一下文章每个部分的内容,感兴趣可以去看原文: 检索增强生成(Retrieval Augmented Generation, RAG)技术,旨在通过结合外部知识源,如数据库,来提升大语言模型(LLMs)的能力。它主要用于解决领域知识的缺失、事实性问题和生成错误。RAG特别适用于那些需要最新知识、又不需针对每个特定任务重复训练LLM的应用场景,比如对话代理和知识密集型任务。 RAG如何工作 RAG通过接收输入的提示信息,从资源如维基百科中检索相关文档,再将这些文档作为上下文来生成回答。这种方法使LLMs能够访问最新的信息,并生成更准确、更可控、更相关的内容。它能及时适应不断变化的信息,这对于LLM来说至关重要,因为它们的知识库本身是静态的。 RAG系统的发展 RAG系统已经从初级阶段(Naive RAG)发展到高级阶段(Advanced RAG)和模块化阶段(Modular RAG),以解决性能、成本和效率的限制。高级RAG通过优化不同阶段,如预检索、检索和检索后处理,来提高检索质量。模块化RAG则通过调整不同的功能模块来适应特定问题的背景,提供了更大的灵活性。 RAG系统的关键组成 检索:包括提升语义表示、对齐查询与文档,以及调整检索器输出以符合LLM的偏好。 生成:涉及将检索到的信息转化为连贯的文本,并在检索后对LLM进行微调。 增强:在生成任务中融合检索到的段落的上下文,包括不同阶段和增强数据源。 RAG与模型微调 RAG适合用于集成新知识,而模型微调则有助于提升模型的性能和效率。这两种方法可以互补,结合提示工程(Prompting Engineering),能够优化LLM在复杂和可扩展应用中的表现。 RAG的评估 RAG系统的评估基于检索到的上下文质量和生成的内容质量。评估指标包括规范化折扣累计增益(NDCG)、命中率、F1值和精确匹配(EM)等。评估重点是上下文的相关性、答案的准确性和相关性,以及抗噪声能力和信息整合能力。 RAG面临的挑战与未来展望

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人