开源社区终于有一个好的视频转绘项目了!

开源社区终于有一个好的视频转绘项目了! 还提供了 Colab 笔记,直接运行就可以,不需要摆弄麻烦的 Comfyui 流程和一堆模型了。 Diffutoon 能够以动漫风格渲染出细节丰富、高分辨率和长时间的视频。它还可以通过一个附加模块根据提示编辑内容。 项目地址,里面有 Colab 笔记可以直接运行: Invalid media:

相关推荐

封面图片

#视频 #压缩 #开源

#视频 #压缩 #开源 CompressO 一个基于 FFmpeg 的视频压缩工具,可以大幅度减少视频体积,简单易用,支持压缩中取消、拖拽视频、静音视频,完全离线运行,适用于 Windows、Linux 和 macOS。 FFmpeg 这个项目是真牛逼,只要是视频处理领域的,几乎避不开它,主要还是开源的,人类之光了属实是。 项目地址 频道:@ZYPD123 群组:@mumu_software

封面图片

终于有人干这个了,之前很多在 Comfyui 中的 LLM 都得单独配置,一个插件一个玩法。

终于有人干这个了,之前很多在 Comfyui 中的 LLM 都得单独配置,一个插件一个玩法。 Comfyui-ollama 这个插件可以直接使用 Ollama 中的 LLM。 你可以使用带视觉能力的模型生成图片描述,也可以自定义提示词对你的图像提示进行润色生成。 插件地址:

封面图片

发现一个根据线条生成法线贴图的项目:

发现一个根据线条生成法线贴图的项目: 作者笔记: 目前些到的两个运用方向: 利好材质,SD生成的纹理,现在可以一并生成法线贴图了。 利好 AI 影楼,前景合成背景以后提取线条,生成新的normalmap,再重新生成光影。 但我都还没试,求社区出一个 ComfyUI 版本

封面图片

Open AI 发布了一个 Assistants API 和 NextJS 构建项目的快速入门指南。

Open AI 发布了一个 Assistants API 和 NextJS 构建项目的快速入门指南。 具有流式传输、工具使用(代码解释器和文件搜索)和函数调用能力。 直接部署输入 API 就可以启动了。 项目地址:

封面图片

重磅:Google 刚刚发布了一个超强的开源模型 Gemma

重磅:Google 刚刚发布了一个超强的开源模型 Gemma 这是 AI 开源模型生态的一大步。 Google DeepMind CEO Demis 表示:「我们长期以来一直支持负责任的开放源代码和科学,这可以推动快速的研究进展,因此我们很自豪地发布了 Gemma:一套轻量级的开放模型,其大小在同类产品中名列前茅,其灵感来源于双子座所使用的相同技术。 」 Gemma 开放模型的特点 - Gemma 是一个轻量级、最先进的开放式模型系列,采用了与Gemini相同的研究和技术。 - Gemma 由 Google DeepMind 和 Google 的其他团队共同开发,其灵感来源于双子座,名字反映了拉丁语 gemma,意为「宝石」。 - 两种尺寸:Gemma 2B 和 Gemma 7B。每种规模都发布了预训练和指令调整变体。(Hans 注,在图2中,你能看到 7B 在多项核心指标, 大幅领先Llama-2。) - 经过预训练和指令调整的 Gemma 模型可在你的笔记本电脑、工作站或Google Cloud上运行,并可在 Vertex AI 和谷歌 Kubernetes Engine 上轻松部署。 使用、研究和AI 伦理方面的补充: - 允许所有组织(无论规模大小)以负责任的方式进行商业使用和分发。 - Gemma 专为推动人工智能创新的开发人员和研究人员组成的开放社区而打造。 - 现在就可以开始使用 Gemma,免费访问 Kaggle,免费使用 Colab 笔记本,首次使用 Google Cloud 的用户还可获得 300 美元的积分。 - 研究人员还可以申请高达 500,000 美元的 Google Cloud 信用额度来加速他们的项目。 详情部署和使用,现在就可以访问:

封面图片

RAGFlow开源了一个RAG框架,有下面这些特点:

RAGFlow开源了一个RAG框架,有下面这些特点: RAGFlow的核心功能是文档的智能解析和管理,支持多种格式,并允许用户使用任何大型语言模型查询他们上传的文档。 RAGFlow提供了多种智能文档处理模板,以满足不同行业和角色的需求,如会计、人力资源专业人员和研究人员。 它还强调了智能文档处理的可视化和可解释性,允许用户查看文档处理结果,进行比较、修改和查询。 RAGFlow的一个关键优势是它允许LLM以受控方式回答问题,提供了一种理性和基于证据的方法来消除幻觉。 项目地址:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人