就知道会有这个,AnimateLCM-SVD-xt 利用了 LCM 技术蒸馏的 SVD 模型,只需要四步就能生成不错的视频,相比

就知道会有这个,AnimateLCM-SVD-xt 利用了 LCM 技术蒸馏的 SVD 模型,只需要四步就能生成不错的视频,相比原来的模型生成时间缩短了好几倍。 遵循 AnimateLCM 论文中提出的策略,一致性蒸馏稳定视频扩散 Image2Video-XT (SVD-xt)。 AnimateLCM-SVD-xt 可以通过 2~8 个步骤生成 25 帧的高质量图像调节视频,分辨率为 576x1024。 AnimateLCM-SVD-xt 通常能在无需依赖分类器的自由引导下,仅通过四个步骤就生成高质量的演示。因此与普通的 SVD 模型相比,可以节省 25 x 2 / 4 = 12.5 倍的计算资源。 模型地址:

相关推荐

封面图片

字节跳动发布文生图开放模型 SDXL-Lightning,生成速度提升十倍

字节跳动发布文生图开放模型 SDXL-Lightning,生成速度提升十倍 字节跳动发布了文生图开放模型 SDXL-Lightning。据悉,该模型能够在极短的时间内生成高质量和高分辨率的图像,是目前最快的文生图模型之一。 目前,文生图领域的主流模型都采用了扩散过程的生成技术,即通过多次迭代,将噪声逐渐转化为图像。这种技术虽然能够生成逼真的图像,但是也存在着计算资源消耗大、生成速度慢的缺点。生成一张高质量图像,大约需要 5 秒。 字节跳动的 SDXL-Lightning 模型则采用了一种渐进式对抗蒸馏的技术,实现前所未有的生成速度,该模型能够在 2 步或 4 步内生成极高质量和分辨率的图像,将生成速度加快十倍,是 1024 分辨率下速度最快的文生图模型,计算成本则降低为十分之一。 该模型已经在 AI 开源社区 Hugging Face 上公开,跻身模型趋势榜,同时也成为上的热门模型。来源 , 频道:@kejiqu 群组:@kejiquchat

封面图片

字节跳动发布了文生图开放模型 SDXL-Lightning。据悉,该模型能够在极短的时间内生成高质量和高分辨率的图像,是目前最快

字节跳动发布了文生图开放模型 SDXL-Lightning。据悉,该模型能够在极短的时间内生成高质量和高分辨率的图像,是目前最快的文生图模型之一。 文生图技术虽然能够生成逼真的图像,但是也存在着计算资源消耗大、生成速度慢的缺点。生成一张高质量图像,大约需要 5 秒。 SDXL-Lightning 模型则采用了一种渐进式对抗蒸馏的技术,实现前所未有的生成速度,该模型能够在 2 步或 4 步内生成极高质量和分辨率的图像,将生成速度加快十倍,是 1024 分辨率下速度最快的文生图模型,计算成本则降低为十分之一。 字节跳动智能创作团队称,该模型是基于字节跳动之前开源的文生图模型 SDXL 的改进版本,与开放模型社区的其他工具和插件兼容,SDXL-Lightning 可以作为增速插件无缝整合到卡通、动漫等多样风格的 SDXL 模型中,并支持当前流行的控制插件 ControlNet、生成软件 ComfyUI,方便开发者、研究人员和创意从业者结合使用这些工具,助力整个行业的创新和协作。 在线体验: GitHub: Hugging Face: via 匿名 标签: #字节跳动 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

字节发布了一个用类似 SDXL Turbo 的模型SDXL-Lightning,只需几步即可生成高质量的 1024px 图像。

字节发布了一个用类似 SDXL Turbo 的模型SDXL-Lightning,只需几步即可生成高质量的 1024px 图像。 包括了 unet 模型和 Lora 模型都已经发布,Lora 模型可以用在其他 SDXL 模型上。感兴趣可以试试。 模型下载:

封面图片

Google发布视频生成模型Veo 支持生成1080P

Google发布视频生成模型Veo 支持生成1080P视频 据了解,Veo能够根据文本、图像创建超过60秒的高质量1080P视频,用户可对光照、镜头语言、视频颜色风格等进行设定。用户仅需写出文本提示即可生成视频,比如文本提示:“在宁静的山地平移镜头,相机慢慢露出白雪皑皑的山峰、花岗岩岩石和倒映天空的清澈湖泊。”“一艘宇宙飞船在浩瀚的太空中穿梭,星星划过,高速,科幻”。 ... PC版: 手机版:

封面图片

华为发布 DiT 架构的图像生成模型,可以直出 4K 分辨率图像。

华为发布 DiT 架构的图像生成模型,可以直出 4K 分辨率图像。 论文简介: 我们引入了 PixArt-\Sigma,一个能够直接生成 4K 分辨率图像的 Diffusion Transformer (Diffusion Transformer, DiT) 模型。相比其前身 PixArt-\alpha,PixArt-\Sigma 有了显著进步,提供了明显更高保真度的图像,并改进了与文本提示的一致性。 PixArt-\Sigma 的一个关键特点是其训练效率。借助 PixArt-\alpha 的基础预训练,它通过合并更高质量的数据,从"较弱"的基线演变为"较强"的模型,我们将这个过程称为"弱到强训练"。PixArt-\Sigma 的进步主要体现在两个方面: 高质量训练数据:PixArt-\Sigma 结合了更高质量的图像数据,与更精确和详细的图像标题配对。 高效的 Token 压缩:我们在 DiT 框架内提出了一个新的注意力模块,可以压缩键 (Key) 和值 (Value),显著提高效率,并促进超高分辨率图像生成。 得益于这些改进,PixArt-\Sigma 以显著较小的模型规模 (6 亿参数) 实现了优于现有文本到图像扩散模型 (如 SDXL (26 亿参数) 和 SD Cascade (51 亿参数)) 的图像质量和用户提示遵从能力。 此外,PixArt-\Sigma 生成 4K 图像的能力支持创建高分辨率海报和壁纸,有效地增强了电影和游戏等行业中高质量视觉内容的制作。 项目地址:

封面图片

- 利用大模型,一键生成短视频

- 利用大模型,一键生成短视频 只需提供一个视频主题或关键词,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。 功能特性 1.完整的 MVC架构,代码 结构清晰,易于维护,支持API和Web界面 2.支持视频文案 AI自动生成,也可以自定义文案 3.支持多种 高清视频 尺寸 -竖屏 9:16,1080x1920 -横屏 16:9,1920x1080 4.支持批量视频生成,可以一次生成多个视频,然后选择一个最满意的 5.支持视频片段时长设置,方便调节素材切换频率 6.支持中文和英文视频文案 7.支持多种语音合成 8.支持字幕生成,可以调整字体、位置、颜色、大小,同时支持字幕描边`设置 9.支持背景音乐,随机或者指定音乐文件,可设置背景音乐音量 10.视频素材来源无版权问题 后期计划 1.优化语音合成,利用大模型,使其合成的声音,更加自然,情绪更加丰富 2.增加视频转场效果,使其看起来更加的流畅 3.优化视频素材的匹配度

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人