PolyMind:多模态、函数调用驱动的LLM webui,旨在与Mixtral 8x7B + TabbyAPI一起使用,提供了

:多模态、函数调用驱动的LLMwebui,旨在与Mixtral8x7B+TabbyAPI一起使用,提供了广泛的功能:使用DuckDuckGo和网络抓取功能进行互联网搜索。使用comfyui生成图像。使用sharegpt4v(通过llama.cpp的服务器)、OCR和Yolo输入图像。使用nmap进行端口扫描。WolframAlpha集成。Python解释器。RAG可对PDF和各种文本文件进行语义搜索。90%的Web部件(HTML、JS、CSS和Flask)完全由Mixtral编写。

相关推荐

封面图片

ReverserAI:通过使用本地大语言模型 (LLM),自动推荐函数名称,帮用户进行软件逆向工程

:通过使用本地大语言模型(LLM),自动推荐函数名称,帮用户进行软件逆向工程核心特点离线操作:完全在本地CPU/GPU上运行LLM,确保数据隐私和安全。自动函数命名:从反编译器输出中自动建议具有语义意义的函数名称。BinaryNinja集成:作为插件与BinaryNinja无缝集成。模块化架构:专为轻松扩展而设计,以支持IDA和Ghidra等其他逆向工程工具。消费类硬件兼容性:经过优化,可在消费级硬件(例如Apple芯片架构)上运行。

封面图片

苹果开放 AI 研究成果,发布多模态 LLM 模型 Ferret

苹果开放AI研究成果,发布多模态LLM模型Ferret苹果公司工作的研究人员和来自哥伦比亚大学的研究人员在10月份悄然推出了开源多模态LLM,这是一个名为"Ferret"的研究版本,可以使用图像区域进行查询。Ferret于10月份在Github上发布,在很大程度上没有引起人们的注意,也没有发布任何公开发布或宣传操作。Ferret的代码于10月30日与Ferret-Bench一起发布,并于12月14日推出了检查点版本。该模型可以分析图像上绘制的区域,确定其中对用户查询有用的元素,并将其识别出来,在检测到的元素周围绘制一个边界框。然后,它就可以将识别出的元素用作查询的一部分,并以典型的方式作出响应。从Github发布的信息中可以发现一个有趣的现象,Reddit的r/Apple发现Ferret是"在8个A100GPU和80GB内存上进行训练的"。鉴于苹果对NVIDIAGPU支持的历史,这被认为是对GPU生产商的罕见认可。投稿:@TNSubmbot频道:@TestFlightCN

封面图片

微软公司宣布,推出必应深度搜索(BingDeepSearch)功能,旨在为用户的复杂查询提供更相关和更全面的答案。微软称,今年是

微软公司宣布,推出必应深度搜索(BingDeepSearch)功能,旨在为用户的复杂查询提供更相关和更全面的答案。微软称,今年是人工智能走进人们日常生活中的一年。以必应聊天(BingChat)为例,它改变了人们在互联网上搜索、购物、编码、准备求职面试、提高游戏技能、创建漂亮的文档和图像的方式。微软表示,必应深度搜索将利用GPT-4的力量,为复杂的主题提供优化的搜索结果。深度搜索是必应的一项新功能,可以为最复杂的搜索查询提供更相关和更全面的答案。深度搜索并不是对必应现有网络搜索的替代,而是一种增强,提供了对网络进行更深层次和更丰富探索的选项。在Copilot领域继续进行人工智能创新。

封面图片

DuckDuckGo 推出了一款被称为“Android 应用程序跟踪保护(App Tracking Protection)”的测

DuckDuckGo推出了一款被称为“Android应用程序跟踪保护(AppTrackingProtection)”的测试工具,可在Android应用程序中添加阻止隐藏跟踪器的功能。DuckDuckGo通过对流行的免费Android应用程序的分析显示,超过96%的应用程序包含跟踪器。绝大多数应用程序的代码中都隐藏了第三方跟踪器,这些跟踪器可监控在不同应用程序中的行为,并创建关于用户的个人资料,包括用户购买的商品、人口统计数据以及可用于供个性化广告的其他信息。例如,在使用谷歌手机时,DuckDuckGo安装了36个流行的免费应用程序,其中包括LinkedIn、Facebook、亚马逊和BBCSounds。然后,在预览DuckDuckGo的Android跟踪器阻止功能后,将手机单独放置了四天,根本没有使用。但在96小时内,其中23个应用程序在后台进行了630多次跟踪尝试。“即便不登录,相关的应用程序也会触发追踪器。而屏蔽这些跟踪器意味着Facebook和谷歌无法收到用户的隐私数据,并且无法推出个性化广告。”DuckDuckGo的产品总监PeterDolanjski表示:“我们的想法是阻止从追踪者不拥有的应用程序中收集数据。”与Apple不同的是,DuckDuckGo并不拥有基础设施(手机和底层操作系统)——来强制实施大规模更改,其隐私浏览器应用程序可以像GooglePlay商店中的任何其他应用程序一样,安装在手机上。——IThome

封面图片

生成视觉叙述:以每秒一帧的速率对视频帧进行采样。然后使用建立在Vicuna-V1-13B 的LLaMA-V1-13B模型 的fi

生成视觉叙述:以每秒一帧的速率对视频帧进行采样。然后使用建立在Vicuna-V1-13B的LLaMA-V1-13B模型的fine-tuned检查点LLaVAv1.0对每帧进行标题标注。检索功能利用向量存储:通过使用OpenAI的text-embedding-ada-002将每个视频的视觉叙述(标题和摘要)进行嵌入。将视频整合成共同的主题:提供用户视频收藏中主题的摘要。提示包括一个功能指令,然后是画廊视频的视觉叙述。然后将此提示发送到LLM以生成概览,随后在聊天界面中呈现给用户进行审阅。基于用户的所有视频进行视频编辑创意:提示结构以功能指令开头。如果提供了创意指导,会在提示中包含用户的创意指导,以引导头脑风暴。根据用户提供的叙述在序列中剪辑视频片段:与以前的功能不同,它只影响时间轴上的视频。与头脑风暴类似,系统会检查用户提供的叙述中是否有任何创意指导。4⃣LAVE应用构建:LAVE系统实现为全栈Web应用程序。前端UI采用React.js开发,而后端服务器采用Flask。对于LLM推理,主要使用OpenAI的最新GPT-4模型。然而,为了将行动计划映射到功能,使用了gpt-4-0613检查点,专门针对函数调用的使用进行了微调。论文地址:

封面图片

Sycamore:一个对话式搜索和分析平台,适用于复杂的非结构化数据,例如文档、演示文稿、成绩单、嵌入式表格和内部知识存储库。

:一个对话式搜索和分析平台,适用于复杂的非结构化数据,例如文档、演示文稿、成绩单、嵌入式表格和内部知识存储库。它通过将人工智能引入数据准备、索引和检索来检索和综合高质量的答案。Sycamore可以轻松准备用于搜索和分析的非结构化数据,提供用于数据清理、信息提取、丰富、汇总和生成封装数据语义的向量嵌入的工具包。Sycamore使用你选择的生成式AI模型来使这些操作变得简单而有效,并且可以实现快速实验和迭代。此外,Sycamore使用OpenSearch进行索引,支持混合(向量+关键字)搜索、检索增强生成(RAG)管道、过滤、分析功能、会话记忆和其他功能来改进信息检索。特征自然语言、对话界面,可针对非结构化数据提出复杂问题。包括对来源段落和对话记忆的引用。包括对非结构化数据的各种查询操作,包括混合搜索、检索增强生成(RAG)和分析函数。通过高级数据分段、用于数据丰富的LLM支持的UDF、使用Python进行的高性能数据操作以及使用各种AI模型的向量嵌入,准备和丰富用于搜索和分析的复杂非结构化数据。自动数据爬虫(AmazonS3和HTTP)和Jupyter笔记本支持等有用的功能可用于创建和迭代数据准备脚本。可扩展、安全且可定制的OpenSearch后端,用于索引和数据检索。

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人