一个500行Python代码构建的AI搜索工具，而且还会开源，试了一下麻雀虽小该有的都有。

一个500行Python代码构建的AI搜索工具，而且还会开源，试了一下麻雀虽小该有的都有。后端是Mixtral-8x7b 模型，托管在 LeptonAI 上，输出速度能达到每秒大约200个 token，用的搜索引擎是 Bing 的搜索 API。作者还写了一下自己的经验： (1) 搜索质量至关重要。优质的摘要片段是形成精准概括的关键。 (2) 适当加入一些虚构内容实际上有助于补充摘要片段中缺失的“常识性信息”。 (3) 在进行内容概括时，开源模型表现出了卓越的效果。这里尝试：

在Telegram中查看

相关推荐

微软刚刚发布了 Phi-3 Mini，而且开源了。目前看它几乎所有基准测试中都表现更好。

微软刚刚发布了 Phi-3 Mini，而且开源了。目前看它几乎所有基准测试中都表现更好。您可以在本地电脑搭建和免费使用它，喜欢倒腾的铁子可以按以下步骤试试看：第一步：下载 LM Studio 。它是免费的开源软件，可让您运行任何开源 AI 模型。转至，然后下载并安装适合您操作系统的版本。第二步：获得Phi-3。在主页上搜索“Phi-3”。选择“microsoft/Phi-3-mini-4k-instruct-gguf”，然后在右侧列表中下载 4K 版本。4K 版本更轻、更快，但比“fp16”损失更大一些。第三步：开始使用Phi-3。单击左侧菜单中的聊天选项卡和“New Chat”。选择在顶部栏中选择的 Phi-3 模型。然后写下并发送您的提示！

Bloop一个基于 GPT-4 的开源代码搜索引擎

Bloop一个基于 GPT-4 的开源代码搜索引擎 bloop 是一个代码搜索引擎，它使用 GPT-4 来回答有关您的代码的问题。使用自然语言、正则表达式和过滤查询搜索本地和远程存储库。 #GPT4 来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

Gorse是一个用Go编写的开源推荐系统。 Gorse旨在成为一个通用的开源推荐系统，可以快速引入各种在线服务。通过将项目、用户

Gorse是一个用Go编写的开源推荐系统。 Gorse旨在成为一个通用的开源推荐系统，可以快速引入各种在线服务。通过将项目、用户和交互数据导入Gorse，系统将自动训练模型为每个用户生成推荐。项目特点如下: - 多源推荐：对于用户，从不同的方式（流行、最新、基于用户、基于项目和协同过滤）收集推荐项目，并通过点击率预测进行排名 - AutoML：通过后台模型搜索自动选择最佳推荐模型和策略 - 分布式推荐：单节点训练，分布式预测，在推荐阶段实现水平扩展的能力 - RESTful API：为数据 CRUD 和推荐请求提供 RESTful API - Dashboard：提供数据导入导出、监控、集群状态检查的dashboard |

- HumanEval：Python代码补全任务，（Chen等人，2021），零-shot评估通过率@1。

- HumanEval：Python代码补全任务，（Chen等人，2021），零-shot评估通过率@1。 - 数学：中学和高中的数学问题以LaTeX格式编写，（Hendrycks等，2021），使用固定的4个提示进行提示。在这些基准测试中，Grok-1展现出了强大的结果，超过了其所属计算级别中的所有其他模型，包括ChatGPT-3.5和Inflection-1。它只被那些使用了大量训练数据和计算资源进行训练的模型所超越，比如GPT-4。这展示了我们在xAI方面以卓越的效率训练LLM模型所取得的快速进展。由于这些基准测试可以在网络上找到，我们不能排除我们的模型无意中是在这些基准测试上进行训练的，因此我们对我们的模型（以及Claude-2和GPT-4）进行了手动评分，评估的是2023年5月底发布的匈牙利国家高中数学期末考试，这是在我们收集数据集之后发布的。Grok在考试中获得了C（59%），而Claude-2获得了相同的成绩（55%），GPT-4获得了B（68%）。所有模型都在温度为0.1且相同的提示下进行评估。值得注意的是，我们没有为这次评估进行任何调整。这个实验是对我们的模型从未明确调整过的数据集进行的“现实生活”测试。我们在模型卡中提供了Grok-1的重要技术细节摘要。 xAI的工程技术在深度学习研究的前沿，可靠的基础设施必须像数据集和学习算法一样慎重构建。为了创建Grok，我们基于Kubernetes、Rust和JAX构建了一个定制的训练和推理框架。 LLM培训就像一辆疾驰的货运火车，如果其中一节车厢出轨，整个火车都会脱轨，使得重新恢复正常运行变得困难。GPU的故障方式多种多样：制造缺陷、松动的连接、配置错误、降级的内存芯片、偶发的随机位翻转等等。在训练过程中，我们需要在数万个GPU之间进行计算同步，而由于规模的扩大，所有这些故障模式都变得更加频繁。为了克服这些挑战，我们采用了一套自定义的分布式系统，确保每一种故障都能立即被识别并自动处理。在xAI，我们将最大化每瓦有用计算作为我们努力的重点。在过去几个月中，我们的基础设施使我们能够将停机时间降至最低，并在硬件不可靠的情况下保持高模型浮点运算利用率（MFU）。 Rust已被证明是构建可扩展、可靠和易维护基础设施的理想选择。它提供高性能、丰富的生态系统，并防止了分布式系统中通常会遇到的大多数错误。考虑到我们团队规模较小，基础设施的可靠性至关重要，否则维护将会抑制创新。Rust让我们有信心，任何代码修改或重构都有可能产生可运行数月且需要最少监督的程序。我们现在正在为我们下一次模型能力的跃升做准备，这将需要可靠地协调数万个加速器上的训练运行，运行互联网规模的数据管道，并将新的能力和工具集成到Grok中。如果这听起来令人兴奋，请申请加入我们的团队。 xAI的研究我们为Grok提供了搜索工具和实时信息的访问权限，但是像所有基于下一个标记预测训练的LLM一样，我们的模型仍然可能生成错误或矛盾的信息。我们相信实现可靠的推理是解决当前系统限制的最重要的研究方向。在这里，我们想要强调一些在xAI最令人兴奋的有前途的研究方向。 - 可扩展的工具辅助监督。人类反馈至关重要。然而，在处理冗长的代码或复杂的推理步骤时，提供一致准确的反馈可能具有挑战性。人工智能可以通过查找不同来源的参考资料、使用外部工具验证中间步骤，并在必要时寻求人类反馈来协助可扩展的监督。我们的目标是在我们的模型的帮助下，最有效地利用我们的人工智能导师的时间。 - 将正式验证与安全性、可靠性和基础结合起来。为了创建能够深入思考现实世界的AI系统，我们计划在较少歧义和更可验证的情况下开发推理能力。这使我们能够在没有人类反馈或与现实世界的互动的情况下评估我们的系统。这种方法的一个主要即时目标是为代码正确性提供正式保证，特别是关于AI安全的可验证方面。 - 长上下文理解和检索。训练模型以高效地在特定上下文中发现有用的知识是打造真正智能系统的核心。我们正在研究能够在需要时发现和检索信息的方法。 - 对抗性鲁棒性。对抗性示例表明，优化器可以轻易地利用人工智能系统的漏洞，无论是在训练还是服务期间，从而导致系统犯下严重错误。这些漏洞是深度学习模型长期存在的弱点。我们特别关注提高LLMs、奖励模型和监控系统的鲁棒性。 - 多模态能力。目前，Grok没有其他感官，比如视觉和听觉。为了更好地帮助用户，我们将为Grok配备这些不同的感官，以实现更广泛的应用，包括实时互动和协助。我们相信人工智能对于为社会做出重大科学和经济贡献具有巨大潜力，因此我们将努力开发可靠的防范措施，以防止恶意使用带来的灾难性后果。我们坚信要尽最大努力确保人工智能始终成为一种正能量。如果你和我们一样乐观，并且想为我们的使命做出贡献，请申请加入我们的团队。 Grok的早期访问我们正在向美国地区的一部分用户提供机会，让他们尝试我们的Grok原型，并提供宝贵的反馈意见，以帮助我们在正式发布之前改进其功能。您可以在这里加入Grok的等待列表。这次发布只是xAI的第一步。展望未来，我们有一个令人兴奋的路线图，并将在未来几个月推出新的功能和特性。

AIGC Weekly #18更新了，本期主要介绍了Mini GPT-4等开源项目以及一些传统互联网公司的AI尝试动态和其他一堆

AIGC Weekly #18更新了，本期主要介绍了Mini GPT-4等开源项目以及一些传统互联网公司的AI尝试动态和其他一堆非常值得阅读的内容。下面是上周一些行业动态和产品推荐，更多详细的内容可以去图里的竹白查看：本周精选：上周值得关注的开源项目 RedPajama：一个计划创建一套领先开源模型的项目： Mini GPT-4：取巧的方式实现了多模态能力： Stable Diffusion的开发商Stability AI发布了开源大语言模型Stable LM：复旦训练的语言模型Moss开源了：一些传统互联网厂商的AI尝试 Raycast AI 逐步开放测试资格，这是功能介绍：谷歌计划构建新的搜索引擎： Adobe Firefly 可以通过自然语言编辑视频了： Webflow推出了自己的AI能力：产品推荐： AI 论文速递：快速阅读近期AI论文： Finchat：一个金融信息的ChatGPT： Vercel AI Playground：免费使用多个语言模型进行对比： Codeamigo：利用AI学习代码：

GPT搜索引擎原型曝光：新模型GPT4-Lite驱动虽然鸽了发布会但代码已上传

GPT搜索引擎原型曝光：新模型GPT4-Lite驱动虽然鸽了发布会但代码已上传与此同时还有小动作不断，比如现在GPT-4的文字描述已不再是“最先进的模型”，而仅仅是“先进的”。以及被鸽掉的GPT搜索引擎，原型代码上传到ChatGPT了。黑客“光头哥”Tibor Blaho，从更新的前端代码中扒出SearchGPT的界面。从泄露的界面来看，SearchGPT会出现在侧边栏，与其他GPTs一起。首页目前还很简洁，像Google一样只有一个居中的搜索框。甚至非常挑衅的设计了一个“比较”按钮，可以一键打开Google和Perplexity搜索结果，直接与SearchGPT做对比。（有种要怼脸开大的感觉。）不过光头哥认为，这很有可能只是内部测试和评估方便做的临时设置，不一定会提供给用户。虽然虽然尚未正式发布，但从曝光界面和文字说明，已经为内测做好准备，离与大家见面的日子或许不远了。SearchGPT原型初露真容先来看“欢迎页”，目前明确写着SearchGPT“正在施工”，从内容和语气来看，正是为内测用户准备的说明。正在施工：SearchGPT正在不断变化和改进，它可能会犯错误或有时会不可用。信息共享：为了搜索和回答您的问题，SearchGPT可能会与第三方搜索提供商共享去标识化的搜索查询。更多信息，请查看我们的隐私政策。位置：我们收集并与第三方搜索提供商共享一般位置信息，以提高您搜索结果的准确性。您可以选择通过在设置菜单中更新您的控制来共享更精确的位置信息，以帮助提供最佳结果。改进我们的服务：查询可能会被审查并用于训练我们的模型。您可以在设置菜单中调整您对改进我们服务的偏好。任何更改都将在ChatGPT和SearchGPT之间传递。账户历史：您的SearchGPT搜索历史与您的ChatGPT聊天历史是分开的。如果您希望删除任一历史记录，您必须在每项服务中单独进行删除。设置中也已经有了更改黑暗/白天模式，是否允许获取地理位置信息，是否允许聊天记录用于模型改进。最后还有一键删除所有搜索记录的按钮。不过这还不是全部，深入挖掘之后，光头哥又找到了更多隐藏设置！包括是否开启自动建议，选择语言模型，选择搜索引擎，是否开启内部搜索，是否开启图片搜索。最后的“评估模板”应该也是内部测试用的暂时不用管，但上面的选项都值得仔细看看。语言模型选项，除了大家已经知道的GPT3.5和GPT4之外，还出现了GPT4-Lite。这很可能是速度更快的GPT4优化版本，括号里的POR推测可能是指概念验证（Proof of Concept）。搜索引擎的选项，与微软合作的Bing肯定在列，另外两个选项Sydney和Fortis暂时不知道指什么。可能有朋友还记得，Sydney曾代表早期网友发现的微软Bing AI“里人格”，情绪非常不稳定，一言不合就发疯或结束对话，最后惨遭微软删除，但也因文字充满个性而深受网友喜爱和怀念。总之OpenAI取这个名字，不知只是巧合还是某种暗示……内部搜索，括号中的单词是“拉布拉多”，作为一种“寻回犬”（Retriever），可能暗示这个功能使用了RAG技术（Retrieval Augmented Generation）。那么综合来看，内部搜索可能指检索ChatGPT里的聊天记录了。早期泄露代码中还可以找到“小组件”的踪影，包括查询天气、计算器、体育比赛信息、金融和时区转换。这些传统搜索引擎常用功能，SearchGPT也打算插手，代表各种天气的图标都准备好了。最后，SearchGPT将用什么样的形式回答用户的查询呢？内部的一些提示词也已经曝光，比如“重写片段和标题”：下一条消息将是网页的文本内容。将网页概括为一个简短的英文句子，不超过300个字符，并生成一个合适的简短标题。您的摘要是一个概述，描述了网页的要点。请不要参考网页本身；您的回复只是一个摘要。该页面的原始标题是“{title}”。保持简洁，不要以“网页”作为摘要的开头。使用“title”和“summary”键以 JSON 格式回复。这看起来不像最终呈现给用户的回复，而是一个中间步骤，对搜索结果中排名靠前的每个页面先做摘要，用JSON格式串联起多个页面的摘要后再整理最终回复。再加上前端代码中反复出现的Agent字样，总之SearchGPT可能比大家想象的更复杂。One More Thing就在几个小时之后，OpenAI将于北京时间5月14日周二凌晨1点举行线上发布会。按奥特曼最新口径，这次发布的不是GPT-5，也不是搜索引擎。目前多方猜测最大的可能性是发布会先发布新的ChatGPT语音功能，就像打电话一样。有泄露消息称新语音功能能理解人类语音中的停顿、语气等信息，比如判断人类提问时是否在讽刺。结合OpenAI此前申请了“Voice Engine”商标的消息，不少人猜测很可能有一个端到端的神经网络，直接根据语音输入预测语音输出，不再需要经过语音到文本的转换。这样一来延迟也会更低，让对话更流畅，不像现在的ChatGPT语音模式一样没轮对话都要等待很久。这项技术让不少人想起电影《她》中的AI伴侣萨曼莎，事实上过去奥特曼也多次表示《她》是他本人最喜欢的AI主题科幻电影。总之，奥特曼将要发布的功能形容为“感觉像魔法”，总裁菠萝曼也出来造势。 ... PC版：手机版：

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人