关于ChatGPT 做 Search 会杀死大部分 Wrapper 型 AI 搜索引擎的讨论,我有一些不一样的看法

关于ChatGPT 做 Search 会杀死大部分 Wrapper 型 AI 搜索引擎的讨论,我有一些不一样的看法 1. AI 搜索引擎的第一要义是准确度。 准确度的决定性因素主要是两个:问答底座模型的智能程度 + 挂载上下文的信息密度。 做好 AI 搜索引擎的关键,选用最智能的问答底座模型,再对 RAG 的检索结果进行排序去重,保证信息密度。 第一个步骤容易,第二个步骤很难。所以现在市面上大部分的 AI 搜索引擎,包括 Perplexity,准确度也就 60% 左右。 2. ChatGPT自己做搜索,首先保证了问答底座模型的智能程度。 其次在检索联网信息层面会做黑盒优化,包括 Query Rewrite / Intent Detection / Reranking 这些措施。 最终依赖自身模型的 Long Context 特性,效果就能做到比其他纯 Wrapper 类型的 AI Search Engine 要好一点。 3. 我并不觉得大模型厂商自己做 AI 搜索 就一定会比第三方做的好。 比如我做 ThinkAny, 首先接入 claude-3-opus,在模型底座智能程度方面,就不会输 gpt-4,第三方甚至能有更多的选择,针对不同的场景切换不同的模型。 其次,Long Context 也有很多模型能够保证。 再者,工程层面对 RAG 挂载上下文内容的优化,ChatGPT 能做,第三方也可以做。 4. 做好 AI 搜索引擎,最重要的三点是准 / 快 / 稳,即回复结果要准,响应速度要快,服务稳定性要高。 其次要做差异化创新,错位竞争。比如对问答结果以 outline / timeline 等形式输出,支持多模态搜索问答,允许挂载自定义信息源等策略。 5. AI 搜索引擎是一个持续雕花的过程。 特别是在提升准确度这个问题上,就有很多事情可以做,比如 Prompt Engineering / Query Rewrite/ Intent Detection / Reranking 等等,每个步骤都有不少坑。 其中用 function calling 去做 Intent Detection 就会遇到识别准确度很低的问题。 用 llamaindex + embedding + Vector DB 做 Reranking 也会遇到排序效率低下的问题。 6. AI Search + Agents + Workflows 是趋势。 AI Search 做通用场景,通过 Agents 做垂直场景,支持个性化搜索需求。 通过 Workflows 实现更加复杂的流程编排,有机会把某类需求解决的更好。 使用 GPTs 做出的提示词应用或知识库挂载型应用,价值点还是太薄。 7. 我个人不是太看好垂直搜索引擎。 一定程度上,垂直搜索引擎可以在某个场景做深做透,但是用户的搜索需求是非常多样的,我不太可能为了搜代码问题给 A 产品付费,再为了搜旅游攻略给 B 产品付费。 垂直搜索引擎自建 index 索引,工程投入比较大,效果不一定比接 Google API 要好,而且接入的信息源太有限。 8. AI 搜索是一个巨大的市场,短时间内很难形成垄断。 海外 Perplexity 一家独大,国内 Kimi/秘塔小范围出圈。各家的产品体验,市场占有率还没有达到绝对的领先,后来者依然有机会。 9. AI 搜索引擎需要尽早考虑成本优化。 主要支出在于大模型的 token 成本和搜索引擎的 API 请求费用。 成本优化是个持续的过程,比如可以自行部署 SearXNG 来降低搜索的成本,部署开源模型来降低大模型的 API 调用成本。 day one payment,趁早向用户收费也许是一种 cover 成本的好办法,但是也要考虑用户流失的问题。 以上是我个人做一个多月以来的一些经验和思考。欢迎交流探讨。

相关推荐

封面图片

AI Video Search Engine-人工智能视频搜索引擎(AVSE)

AI Video Search Engine-人工智能视频搜索引擎(AVSE) #AI工具 #GitHub项目 #趣站 #搜索引擎 #视频搜索引擎 https://www.ahhhhfs.com/52274/

封面图片

软件GPTGO功能:搜索引擎+AI问答

软件GPTGO 软件功能:搜索引擎+AI问答 支持平台:#Web #iOS #Android 软件简介:一个结合了Google搜索技术和ChatGPT智能回应能力的搜索引擎。 无需拥有ChatGPT账户,网站已经为用户集成了一个免费的高级ChatGPT账户。 使用无需注册登录,搜索时左侧显示搜索引擎式结果,右侧显示ChatGPT问答结果,非常直观高效。 软件下载:点击下载

封面图片

#搜索引擎 Luxirty Search

#搜索引擎 Luxirty Search 基于 Google 的搜索引擎,特点是屏蔽了内容农场,如 CSDN、华为云、百度云智能、腾讯云开发者等,无广告,无跟踪,另外针对开发社区和 V2EX、Reddit 进行了快捷搜索,感兴趣的可以试试。 search.luxirty.com 频道 @WidgetChannel

封面图片

网站Farfalle网站功能:AI搜索引擎

网站Farfalle 网站功能:AI搜索引擎 网站简介:一款开源的 AI 驱动的问答引擎,与其它AI搜索引擎类似,也是帮助我们搜索并给出最佳总结,并列出引用的相关链接。可持续追问。 可以用作者部署好的,也可以用 Docker 或 Vercel 自己部署。 网站链接:点击打开 开源地址:点击打开 频道 群聊 投稿 商务

封面图片

网站博查网站功能:AI搜索引擎

网站博查 网站功能:AI搜索引擎 网站简介:一款聚合多个AI模型的AI搜索引擎,包括豆包、通义千问、Kimi等多个智能体搜索。 支持抖音视频搜索和图片搜索功能,支持微信扫码登录。 网站链接:点击打开 频道 群聊 投稿 商务

封面图片

阿里开源创新大模型ZeroSearch 无需外部搜索引擎而自学检索

阿里开源创新大模型ZeroSearch 无需外部搜索引擎而自学检索   阿里巴巴近日开源了一种创新大模型 ZeroSearch ,在训练过程中无需调用任何外部搜索引擎即可掌握信息检索能力。新模型表现堪比甚至超越依赖真实搜索引擎训练的模型,而且更节约训练成本。   在涵盖七个问答数据集的对比测试中,该模型 7B 参数的检索模块便能达到与 Google 搜索相当的水平,而 14B 参数版本则表现更佳。更令人瞩目的是其成本优势:若通过 SerpAPI 调用 Google 搜索执行 64,000 次查询,训练费用约为 586.70 美元;而在 4 块 NVIDIA A100 GPU 上运行 14B 参数的模拟 LLM,仅需约 70.80 美元,成本削减高达 88%。   目前,ZeroSearch 已在 Qwen-2.5、LLaMA-3.2 等多个主流模型家族中完成验证。研究团队已将全部代码、数据集及预训练模型开源至 GitHub 和 Hugging Face。 【全球大事件】 助您掌握时事,稳操胜券! #China #全球大事件 #热点新闻  #投稿曝光

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人