就知道会有这个，AnimateLCM-SVD-xt 利用了 LCM 技术蒸馏的 SVD 模型，只需要四步就能生成不错的视频，相比

就知道会有这个，AnimateLCM-SVD-xt 利用了 LCM 技术蒸馏的 SVD 模型，只需要四步就能生成不错的视频，相比原来的模型生成时间缩短了好几倍。遵循 AnimateLCM 论文中提出的策略，一致性蒸馏稳定视频扩散 Image2Video-XT (SVD-xt)。 AnimateLCM-SVD-xt 可以通过 2~8 个步骤生成 25 帧的高质量图像调节视频，分辨率为 576x1024。 AnimateLCM-SVD-xt 通常能在无需依赖分类器的自由引导下，仅通过四个步骤就生成高质量的演示。因此与普通的 SVD 模型相比，可以节省 25 x 2 / 4 = 12.5 倍的计算资源。模型地址：

在Telegram中查看

相关推荐

字节跳动发布文生图开放模型 SDXL-Lightning，生成速度提升十倍

字节跳动发布文生图开放模型 SDXL-Lightning，生成速度提升十倍字节跳动发布了文生图开放模型 SDXL-Lightning。据悉，该模型能够在极短的时间内生成高质量和高分辨率的图像，是目前最快的文生图模型之一。目前，文生图领域的主流模型都采用了扩散过程的生成技术，即通过多次迭代，将噪声逐渐转化为图像。这种技术虽然能够生成逼真的图像，但是也存在着计算资源消耗大、生成速度慢的缺点。生成一张高质量图像，大约需要 5 秒。字节跳动的 SDXL-Lightning 模型则采用了一种渐进式对抗蒸馏的技术，实现前所未有的生成速度，该模型能够在 2 步或 4 步内生成极高质量和分辨率的图像，将生成速度加快十倍，是 1024 分辨率下速度最快的文生图模型，计算成本则降低为十分之一。该模型已经在 AI 开源社区 Hugging Face 上公开，跻身模型趋势榜，同时也成为上的热门模型。来源，频道：@kejiqu 群组：@kejiquchat

字节跳动发布了文生图开放模型 SDXL-Lightning。据悉，该模型能够在极短的时间内生成高质量和高分辨率的图像，是目前最快

字节跳动发布了文生图开放模型 SDXL-Lightning。据悉，该模型能够在极短的时间内生成高质量和高分辨率的图像，是目前最快的文生图模型之一。文生图技术虽然能够生成逼真的图像，但是也存在着计算资源消耗大、生成速度慢的缺点。生成一张高质量图像，大约需要 5 秒。 SDXL-Lightning 模型则采用了一种渐进式对抗蒸馏的技术，实现前所未有的生成速度，该模型能够在 2 步或 4 步内生成极高质量和分辨率的图像，将生成速度加快十倍，是 1024 分辨率下速度最快的文生图模型，计算成本则降低为十分之一。字节跳动智能创作团队称，该模型是基于字节跳动之前开源的文生图模型 SDXL 的改进版本，与开放模型社区的其他工具和插件兼容，SDXL-Lightning 可以作为增速插件无缝整合到卡通、动漫等多样风格的 SDXL 模型中，并支持当前流行的控制插件 ControlNet、生成软件 ComfyUI，方便开发者、研究人员和创意从业者结合使用这些工具，助力整个行业的创新和协作。在线体验： GitHub： Hugging Face： via 匿名标签: #字节跳动频道: @GodlyNews1 投稿: @GodlyNewsBot

字节发布了一个用类似 SDXL Turbo 的模型SDXL-Lightning，只需几步即可生成高质量的 1024px 图像。

字节发布了一个用类似 SDXL Turbo 的模型SDXL-Lightning，只需几步即可生成高质量的 1024px 图像。包括了 unet 模型和 Lora 模型都已经发布，Lora 模型可以用在其他 SDXL 模型上。感兴趣可以试试。模型下载：

Google发布视频生成模型Veo 支持生成1080P

Google发布视频生成模型Veo 支持生成1080P视频据了解，Veo能够根据文本、图像创建超过60秒的高质量1080P视频，用户可对光照、镜头语言、视频颜色风格等进行设定。用户仅需写出文本提示即可生成视频，比如文本提示：“在宁静的山地平移镜头，相机慢慢露出白雪皑皑的山峰、花岗岩岩石和倒映天空的清澈湖泊。”“一艘宇宙飞船在浩瀚的太空中穿梭，星星划过，高速，科幻”。 ... PC版：手机版：

华为发布 DiT 架构的图像生成模型，可以直出 4K 分辨率图像。

华为发布 DiT 架构的图像生成模型，可以直出 4K 分辨率图像。论文简介：我们引入了 PixArt-\Sigma,一个能够直接生成 4K 分辨率图像的 Diffusion Transformer (Diffusion Transformer, DiT) 模型。相比其前身 PixArt-\alpha,PixArt-\Sigma 有了显著进步,提供了明显更高保真度的图像,并改进了与文本提示的一致性。 PixArt-\Sigma 的一个关键特点是其训练效率。借助 PixArt-\alpha 的基础预训练,它通过合并更高质量的数据,从"较弱"的基线演变为"较强"的模型,我们将这个过程称为"弱到强训练"。PixArt-\Sigma 的进步主要体现在两个方面: 高质量训练数据:PixArt-\Sigma 结合了更高质量的图像数据,与更精确和详细的图像标题配对。高效的 Token 压缩:我们在 DiT 框架内提出了一个新的注意力模块,可以压缩键 (Key) 和值 (Value),显著提高效率,并促进超高分辨率图像生成。得益于这些改进,PixArt-\Sigma 以显著较小的模型规模 (6 亿参数) 实现了优于现有文本到图像扩散模型 (如 SDXL (26 亿参数) 和 SD Cascade (51 亿参数)) 的图像质量和用户提示遵从能力。此外,PixArt-\Sigma 生成 4K 图像的能力支持创建高分辨率海报和壁纸,有效地增强了电影和游戏等行业中高质量视觉内容的制作。项目地址：

- 利用大模型，一键生成短视频

- 利用大模型，一键生成短视频只需提供一个视频主题或关键词，就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐，然后合成一个高清的短视频。功能特性 1.完整的 MVC架构，代码结构清晰，易于维护，支持API和Web界面 2.支持视频文案 AI自动生成，也可以自定义文案 3.支持多种高清视频尺寸 -竖屏 9:16，1080x1920 -横屏 16:9，1920x1080 4.支持批量视频生成，可以一次生成多个视频，然后选择一个最满意的 5.支持视频片段时长设置，方便调节素材切换频率 6.支持中文和英文视频文案 7.支持多种语音合成 8.支持字幕生成，可以调整字体、位置、颜色、大小，同时支持字幕描边`设置 9.支持背景音乐，随机或者指定音乐文件，可设置背景音乐音量 10.视频素材来源无版权问题后期计划 1.优化语音合成，利用大模型，使其合成的声音，更加自然，情绪更加丰富 2.增加视频转场效果，使其看起来更加的流畅 3.优化视频素材的匹配度

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人