视频生成模型SVD刚才发布了1.1版本，我试用了一下。

视频生成模型SVD刚才发布了1.1版本，我试用了一下。发现比上个版本的进步非常多，之前的几个比较大的问题都有了改善，这下终于是一个可用的模型了。我测评了多种风格的内容，主要是图片生成视频，图片由MJ生成，下面是发现的一些变化： ◆XT模型本体从9G多缩小到了4G多，显存要求降低了，同时推理速度加快许多，之前跑不了的电脑这下可以试试了。 ◆整体运动幅度大幅增加，很多内容不再只是运镜了，也意味着模型真的理解了内容。 ◆生物和人像的运动幅度和一致性大幅提升，人物不再是完全不动的图片了，会进行相应的运动和跟环境交互。 ◆之前视频中的密集噪点得到了一定程度优化。 ◆2D动漫图像现在也可以动了，不过效果依然不太好。 ◆已往的强项流体运动效果依然很顶，没有负向优化。你可以在这里下载模型： Invalid media:

在Telegram中查看

相关推荐

大的来了！！ Luma 发布 DIT 视频生成模型 Dream Machine。

大的来了！！ Luma 发布 DIT 视频生成模型 Dream Machine。图生视频的表现相当惊艳，绝对是电影级表现。分辨率、运动幅度、美学表现都是非常牛批，现在可以免费使用。这里使用： Invalid media:

快手今天发布了可灵视频生成模型，支持生成最长两分钟 30FPS 1080P 的。

快手今天发布了可灵视频生成模型，支持生成最长两分钟 30FPS 1080P 的视频。生成质量是现在普通用户能接触到的天花板，5 秒视频这个等级完全超越了谷歌Voe 视频模型。运动幅度、不同比例、一致性、物理特性都是除了 Sora 之外现在看到最好的。体验方法：快影 APP-AI 玩法-AI 视频生成中申请。

快手发布国内首个效果对标Sora的视频生成大模型“可灵”，现已开放邀测

快手发布国内首个效果对标Sora的视频生成大模型“可灵”，现已开放邀测近日，快手“可灵”视频生成大模型官网正式上线。据介绍，可灵大模型为快手AI团队自研，基于快手在视频技术方面的多年积累，采用Sora相似的技术路线，结合多项自研技术创新，效果对标Sora。可灵大模型不仅具备强大的概念组合能力和想象力，还能够生成大幅度的合理运动、模拟物理世界特性。其生成的视频分辨率高达1080p，时长最高可达2分钟（帧率30fps），且支持自由的宽高比。目前，可灵大模型已在快影App开放邀测体验。（36氪）标签: #快手 #Sora #可灵频道: @GodlyNews1 投稿: @GodlyNewsBot

快手再放大招！可灵真成世界第一视频生成模型了。

快手再放大招！可灵真成世界第一视频生成模型了。发布一系列重磅更新：基础模型升级，生成更高分辨率的视频增加首尾帧控制增加运镜控制，还有自动大师运镜 Web 端上线，限时免费新模型的运动幅度和清晰度完全可以跟Gen3对标，同时美学表现也获得了提升。控制方式更是吊打现有DiT模型。 Web端地址： Invalid media:

：阿里巴巴开发的高保真图像到视频生成开源模型可以生成符合真实世界运动状态的

：阿里巴巴开发的高保真图像到视频生成开源模型可以生成符合真实世界运动状态的视频主要功能： 1、高保真视频生成：AtomoVideo可以从单一静态图像生成高保真的视频序列，视频中的内容不仅与原始图片保持高度一致，而且动作自然流畅。 2、动作强度和连贯性：AtomoVideo生成的视频具有自然流畅的动作和良好的时间连贯性。视频中的运动看起来既自然又符合逻辑，没有突兀或不自然的过渡。为了让视频里的动作看起来自然，AtomoVideo引入了时间卷积和时间注意力模块，这些模块专门处理视频帧之间的时间关系，帮助模型预测下一帧画面的变化，从而实现连贯的视频动作。AtomoVideo会特别处理视频的时间信息，让图片中的物体像在真实世界那样随时间移动和变化。 3、个性化适配：AtomoVideo能够与不同的个性化文本到图像（T2I）模型兼容，无需进行特定调整，这让它能够广泛适用于各种场景。AtomoVideo还能结合文字描述来生成视频。比如，你给它一张静态的海边图片，并告诉它“海浪轻轻拍打沙滩”，它就能根据这个描述生成一段海浪真的拍打沙滩的视频。

终于有普通人可以立刻使用的类 Sora 视频生成工具了！#ai# #sora#

终于有普通人可以立刻使用的类 Sora 视频生成工具了！#ai视频# #sora# 海外产品 viva 发布了首个开放给全部用户使用的 Sora 同架构视频生成模型，而且现阶段免费。支持文本生成视频、图片生成视频以及 4K 分辨率放大功能，另外也支持提示词的自动优化。文生视频单次可以生成一条 5 秒的视频，图生视频是 4 秒视频我测试了一下应该是目前运动幅度最大的视频生成模型，同时图像分辨率也是现在可以用的视频生成产品中最大的。文生视频的效果比图生视频要更好，同时如果要是用的话建议把运动幅度调到 20 左右比较合适。 viva 优势领域就是可以生成比较好的竖屏视频，目前很多视频模型的演示都是横屏视频，竖屏的表现并不好，但是短视频又是视频内容的大头，所以竖屏视频的生成质量是个很重要的指标。但是一致性有一部分测试中保持的不是很好，同时没有表现出 Sora 那样强大的物理特性模拟以及 3D 一致性。跟谷歌刚发布的 Veo 模型对比来看在写实内容上其实以及差不多了。下面是 viva 的视频演示，15 秒开始有相同的提示词跟谷歌刚发布的 Veo 模型的对比。这里体验 viva：

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人