最近在做的项目几乎是清一色的 comfyui + animatediff + lcm,忙里偷闲和 @Simon阿文 做了一个《低

最近在做的项目几乎是清一色的 comfyui + animatediff + lcm,忙里偷闲和 @Simon阿文 做了一个《低俗小说》里舞蹈的转绘版本,阿文的版本在这里( ) 我做的是女生的部分。人物、麦穗和天空分为三层控制生成,达成了不同层有不同自由程度 (不同闪烁程度 X) 的控制效果。 工作流参考的朋友 Jerry Davos 的工作流,他将 AI 动画的工作流切成了 controlnet 提取、lcm 生成、refine、face fix 四步,8G 显存的显卡都可以跑 非常菩萨,欢迎通过他的 patreon 支持他:

相关推荐

封面图片

:ComfyUI的Portrait Master节点,旨在帮助AI图像创作者生成人像提示。提供多种参数控制,如头像类型、性别、种

:ComfyUI的Portrait Master节点,旨在帮助AI图像创作者生成人像提示。提供多种参数控制,如头像类型、性别、种族、眼睛颜色、头发风格等,与SDXL和LCM等工作流兼容性。提供了一套完整的工作流程,可在不同的环境中生成高分辨率图像

封面图片

和 @Simon阿文 最近一起做的 Lalaland 舞蹈 AI remix 版本。

和 @Simon阿文 最近一起做的 Lalaland 舞蹈 AI remix 版本。 工具是 Morph Studio 目前还在内测的 V2V,用了油画、像素、波普艺术、3D 动画、涂鸦等几个风格,像素风格真的太棒了,是真像素啊 o(╥﹏╥)o 想起了以前看姐姐打轩辕剑的时候。 现在画面和角色也终于能比较稳定地输出了!期待产品能早日上线和大家见面! #AI工作流 Invalid media:

封面图片

Andrej Karpathy 提出了一个工作流希望自动将长视频内容转换为带对应示例的播客文章。现在虽然也有一些类似工具但是都做

Andrej Karpathy 提出了一个工作流希望自动将长视频内容转换为带对应示例的播客文章。现在虽然也有一些类似工具但是都做的不好。 同时他还把前几天自己的视频教程转成了文字内容,觉得视频太浪费时间的可以看文本。 AK 设想的完整工作流: 一个有趣的大语言模型 (Large Language Model) 挑战是:将我的2小时13分钟的分词器视频转换成一本书的章节(或者博客文章)形式,专门讨论分词。具体步骤如下: 为视频添加字幕或解说文字。 将视频切割成若干带有配套图片和文字的段落。 利用大语言模型的提示工程技术,逐段进行翻译。 将结果输出为网页形式,其中包含指向原始视频各部分的链接。 从更广泛的角度来看,这样的工作流程可以应用于任何视频输入,自动生成各种教程的“配套指南”,使其格式更加便于阅读、浏览和搜索。这听起来是可行的,但也颇具挑战。 LLM Tokenization课程文字版本:

封面图片

近几个月我一直在做 AI 动画的尝试,许多 demo 都得到了内外网的很多关注,其中 AI 蜘蛛侠的效果在抖音拿到了 17 万喜

近几个月我一直在做 AI 动画的尝试,许多 demo 都得到了内外网的很多关注,其中 AI 蜘蛛侠的效果在抖音拿到了 17 万喜欢和 1.8 万评。很多朋友希望我能分享是怎么做的,决定趁机做一个梳理总结。 完整文章链接: 目前有许多不同的路径,大致包括:A. 根据参考视频进行风格迁移、B. 文本生成动画、C. 根据静态图生成动画等。(在每一大类的末尾,我都会附上我推荐的教程,这些教程都是免费的,对我在探索的过程中起了很大的帮助。) 再次感谢开源社区。 #AI工作流

封面图片

RuoYi-Vue 发布的全新 Pro 版本,优化重构所有功能。基于 Spring Boot + MyBatis Plus +

RuoYi-Vue 发布的全新 Pro 版本,优化重构所有功能。基于 Spring Boot + MyBatis Plus + Vue & Element 实现的后台管理系统 + 微信小程序,支持 RBAC 动态权限、数据权限、SaaS 多租户、Flowable 工作流、三方登录、支付、短信、商城等功能。 管理后台的 Vue3 版本采用 vue-element-plus-admin ,Vue2 版本采用 vue-element-admin 管理后台的移动端采用 uni-app 方案,一份代码多终端适配,同时支持 APP、小程序、H5! 后端采用 Spring Boot 多模块架构、MySQL + MyBatis Plus、Redis + Redisson 数据库可使用 MySQL、Oracle、PostgreSQL、SQL Server、MariaDB、国产达梦 DM、TiDB 等 权限认证使用 Spring Security & Token & Redis,支持多终端、多种用户的认证系统,支持 SSO 单点登录 支持加载动态权限菜单,按钮级别权限控制,本地缓存提升性能 支持 SaaS 多租户系统,可自定义每个租户的权限,提供透明化的多租户底层封装 工作流使用 Flowable,支持动态表单、在线设计流程、会签 / 或签、多种任务分配方式 高效率开发,使用代码生成器可以一键生成前后端代码 + 单元测试 + Swagger 接口文档 + Validator 参数校验 集成微信小程序、微信公众号、企业微信、钉钉等三方登陆,集成支付宝、微信等支付与退款 集成阿里云、腾讯云等短信渠道,集成 MinIO、阿里云、腾讯云、七牛云等云存储服务 集成报表设计器,支持数据报表、图形报表、打印设计等 |||

封面图片

Meta确认其Llama 3开源大语言模型将于下个月推出

Meta确认其Llama 3开源大语言模型将于下个月推出 Meta 公司全球事务总裁尼克-克莱格(Nick Clegg)说:"我们希望在下个月内,甚至更短的时间内,开始推出我们新的下一代基础模型套件 Llama 3。"他的描述听起来像是要发布该产品的几个不同迭代或版本。"今年内,我们将发布一系列具有不同功能、不同通用性的模型,很快就会开始发布。"Meta 首席产品官 Chris Cox 补充说,计划用 Llama 3 支持 Meta 的多个产品。一年多前,OpenAI 推出了 ChatGPT,并将人工智能生成式问答变成了日常的主流体验,这让 Meta 和Google等其他大型科技公司措手不及。Meta 公司在人工智能方面基本上采取了非常谨慎的态度,但这并没有得到公众的认可,以前版本的 Llama 被批评为能力过于有限。(Llama 2于 2023 年 7 月公开发布)。第一版 Llama 并未对外发布,但仍在网上泄露)。与前几代产品相比,Llama 3 的功能更强大,不仅能更准确地回答问题,还能回答更广泛的问题,其中可能包括更具争议性的话题。该公司希望这将使产品受到用户的欢迎。"随着时间的推移,我们的目标是让由 Llama 驱动的 Meta AI 成为世界上最有用的助手,"人工智能研究副总裁 Joelle Pineau 说。"要达到这个目标,还有相当多的工作要做。"该公司没有谈及《Llama 3》中使用的参数的大小,也没有提供它将如何工作的任何演示。预计它将拥有约 1400 亿个参数,而最大的 Llama 2 型号只有 700 亿个参数。最值得注意的是,Meta 的 Llama 系列是作为开源产品构建的,代表了一种不同的哲学方法,即人工智能作为一种更广泛的技术应如何发展。与专有模式相比,Meta 希望通过这种方式获得更多开发者的青睐。但 Meta 似乎也在谨慎行事,尤其是在文本生成之外的其他生成式人工智能方面。皮诺说,公司尚未发布图像生成工具 Emu。考克斯说:"延迟、安全性和易用性都非常重要,只有这样才能生成令你自豪的图像,并代表你的创意背景。"具有讽刺意味的是,或者可以说是意料之中的,即使在 Meta 公司努力推出 Llama 3 的同时,公司内部也有一些对生成式人工智能持怀疑态度的重要人士。兼任 Meta 首席人工智能科学家的著名人工智能学者 Yann LeCun 对生成式人工智能的整体局限性进行了抨击,并表示他将赌注押在生成式人工智能之后。他预测这将是联合嵌入式预测架构(JEPA),这是一种训练模型和产生结果的不同方法,Meta 公司一直在使用这种方法在图像生成领域构建更准确的预测性人工智能。"人工智能的未来是 JEPA。它不是生成式人工智能,"他说。"我们得给克里斯的产品部门改个名字"。 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人