PolyMind：多模态、函数调用驱动的LLM webui，旨在与Mixtral 8x7B + TabbyAPI一起使用，提供了

：多模态、函数调用驱动的LLMwebui，旨在与Mixtral8x7B+TabbyAPI一起使用，提供了广泛的功能：使用DuckDuckGo和网络抓取功能进行互联网搜索。使用comfyui生成图像。使用sharegpt4v（通过llama.cpp的服务器）、OCR和Yolo输入图像。使用nmap进行端口扫描。WolframAlpha集成。Python解释器。RAG可对PDF和各种文本文件进行语义搜索。90%的Web部件（HTML、JS、CSS和Flask）完全由Mixtral编写。

在Telegram中查看

相关推荐

ReverserAI：通过使用本地大语言模型 (LLM)，自动推荐函数名称，帮用户进行软件逆向工程

：通过使用本地大语言模型(LLM)，自动推荐函数名称，帮用户进行软件逆向工程核心特点离线操作：完全在本地CPU/GPU上运行LLM，确保数据隐私和安全。自动函数命名：从反编译器输出中自动建议具有语义意义的函数名称。BinaryNinja集成：作为插件与BinaryNinja无缝集成。模块化架构：专为轻松扩展而设计，以支持IDA和Ghidra等其他逆向工程工具。消费类硬件兼容性：经过优化，可在消费级硬件（例如Apple芯片架构）上运行。

苹果开放 AI 研究成果，发布多模态 LLM 模型 Ferret

苹果开放AI研究成果，发布多模态LLM模型Ferret苹果公司工作的研究人员和来自哥伦比亚大学的研究人员在10月份悄然推出了开源多模态LLM，这是一个名为"Ferret"的研究版本，可以使用图像区域进行查询。Ferret于10月份在Github上发布，在很大程度上没有引起人们的注意，也没有发布任何公开发布或宣传操作。Ferret的代码于10月30日与Ferret-Bench一起发布，并于12月14日推出了检查点版本。该模型可以分析图像上绘制的区域，确定其中对用户查询有用的元素，并将其识别出来，在检测到的元素周围绘制一个边界框。然后，它就可以将识别出的元素用作查询的一部分，并以典型的方式作出响应。从Github发布的信息中可以发现一个有趣的现象，Reddit的r/Apple发现Ferret是"在8个A100GPU和80GB内存上进行训练的"。鉴于苹果对NVIDIAGPU支持的历史，这被认为是对GPU生产商的罕见认可。投稿：@TNSubmbot频道：@TestFlightCN

微软公司宣布，推出必应深度搜索（BingDeepSearch）功能，旨在为用户的复杂查询提供更相关和更全面的答案。微软称，今年是

微软公司宣布，推出必应深度搜索（BingDeepSearch）功能，旨在为用户的复杂查询提供更相关和更全面的答案。微软称，今年是人工智能走进人们日常生活中的一年。以必应聊天（BingChat）为例，它改变了人们在互联网上搜索、购物、编码、准备求职面试、提高游戏技能、创建漂亮的文档和图像的方式。微软表示，必应深度搜索将利用GPT-4的力量，为复杂的主题提供优化的搜索结果。深度搜索是必应的一项新功能，可以为最复杂的搜索查询提供更相关和更全面的答案。深度搜索并不是对必应现有网络搜索的替代，而是一种增强，提供了对网络进行更深层次和更丰富探索的选项。在Copilot领域继续进行人工智能创新。

DuckDuckGo 推出了一款被称为“Android 应用程序跟踪保护（App Tracking Protection）”的测

DuckDuckGo推出了一款被称为“Android应用程序跟踪保护（AppTrackingProtection）”的测试工具，可在Android应用程序中添加阻止隐藏跟踪器的功能。DuckDuckGo通过对流行的免费Android应用程序的分析显示，超过96%的应用程序包含跟踪器。绝大多数应用程序的代码中都隐藏了第三方跟踪器，这些跟踪器可监控在不同应用程序中的行为，并创建关于用户的个人资料，包括用户购买的商品、人口统计数据以及可用于供个性化广告的其他信息。例如，在使用谷歌手机时，DuckDuckGo安装了36个流行的免费应用程序，其中包括LinkedIn、Facebook、亚马逊和BBCSounds。然后，在预览DuckDuckGo的Android跟踪器阻止功能后，将手机单独放置了四天，根本没有使用。但在96小时内，其中23个应用程序在后台进行了630多次跟踪尝试。“即便不登录，相关的应用程序也会触发追踪器。而屏蔽这些跟踪器意味着Facebook和谷歌无法收到用户的隐私数据，并且无法推出个性化广告。”DuckDuckGo的产品总监PeterDolanjski表示：“我们的想法是阻止从追踪者不拥有的应用程序中收集数据。”与Apple不同的是，DuckDuckGo并不拥有基础设施（手机和底层操作系统）——来强制实施大规模更改，其隐私浏览器应用程序可以像GooglePlay商店中的任何其他应用程序一样，安装在手机上。——IThome

生成视觉叙述：以每秒一帧的速率对视频帧进行采样。然后使用建立在Vicuna-V1-13B 的LLaMA-V1-13B模型的fi

生成视觉叙述：以每秒一帧的速率对视频帧进行采样。然后使用建立在Vicuna-V1-13B的LLaMA-V1-13B模型的fine-tuned检查点LLaVAv1.0对每帧进行标题标注。检索功能利用向量存储：通过使用OpenAI的text-embedding-ada-002将每个视频的视觉叙述（标题和摘要）进行嵌入。将视频整合成共同的主题：提供用户视频收藏中主题的摘要。提示包括一个功能指令，然后是画廊视频的视觉叙述。然后将此提示发送到LLM以生成概览，随后在聊天界面中呈现给用户进行审阅。基于用户的所有视频进行视频编辑创意：提示结构以功能指令开头。如果提供了创意指导，会在提示中包含用户的创意指导，以引导头脑风暴。根据用户提供的叙述在序列中剪辑视频片段：与以前的功能不同，它只影响时间轴上的视频。与头脑风暴类似，系统会检查用户提供的叙述中是否有任何创意指导。4⃣LAVE应用构建：LAVE系统实现为全栈Web应用程序。前端UI采用React.js开发，而后端服务器采用Flask。对于LLM推理，主要使用OpenAI的最新GPT-4模型。然而，为了将行动计划映射到功能，使用了gpt-4-0613检查点，专门针对函数调用的使用进行了微调。论文地址：

Sycamore：一个对话式搜索和分析平台，适用于复杂的非结构化数据，例如文档、演示文稿、成绩单、嵌入式表格和内部知识存储库。

：一个对话式搜索和分析平台，适用于复杂的非结构化数据，例如文档、演示文稿、成绩单、嵌入式表格和内部知识存储库。它通过将人工智能引入数据准备、索引和检索来检索和综合高质量的答案。Sycamore可以轻松准备用于搜索和分析的非结构化数据，提供用于数据清理、信息提取、丰富、汇总和生成封装数据语义的向量嵌入的工具包。Sycamore使用你选择的生成式AI模型来使这些操作变得简单而有效，并且可以实现快速实验和迭代。此外，Sycamore使用OpenSearch进行索引，支持混合（向量+关键字）搜索、检索增强生成(RAG)管道、过滤、分析功能、会话记忆和其他功能来改进信息检索。特征自然语言、对话界面，可针对非结构化数据提出复杂问题。包括对来源段落和对话记忆的引用。包括对非结构化数据的各种查询操作，包括混合搜索、检索增强生成(RAG)和分析函数。通过高级数据分段、用于数据丰富的LLM支持的UDF、使用Python进行的高性能数据操作以及使用各种AI模型的向量嵌入，准备和丰富用于搜索和分析的复杂非结构化数据。自动数据爬虫（AmazonS3和HTTP）和Jupyter笔记本支持等有用的功能可用于创建和迭代数据准备脚本。可扩展、安全且可定制的OpenSearch后端，用于索引和数据检索。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人