视频生成模型SVD刚才发布了1.1版本,我试用了一下。

视频生成模型SVD刚才发布了1.1版本,我试用了一下。 发现比上个版本的进步非常多,之前的几个比较大的问题都有了改善,这下终于是一个可用的模型了。 我测评了多种风格的内容,主要是图片生成视频,图片由MJ生成,下面是发现的一些变化: ◆XT模型本体从9G多缩小到了4G多,显存要求降低了,同时推理速度加快许多,之前跑不了的电脑这下可以试试了。 ◆整体运动幅度大幅增加,很多内容不再只是运镜了,也意味着模型真的理解了内容。 ◆生物和人像的运动幅度和一致性大幅提升,人物不再是完全不动的图片了,会进行相应的运动和跟环境交互。 ◆之前视频中的密集噪点得到了一定程度优化。 ◆2D动漫图像现在也可以动了,不过效果依然不太好。 ◆已往的强项流体运动效果依然很顶,没有负向优化。 你可以在这里下载模型: Invalid media:

相关推荐

封面图片

大的来了!! Luma 发布 DIT 视频生成模型 Dream Machine。

大的来了!! Luma 发布 DIT 视频生成模型 Dream Machine。 图生视频的表现相当惊艳,绝对是电影级表现。 分辨率、运动幅度、美学表现都是非常牛批,现在可以免费使用。 这里使用: Invalid media:

封面图片

快手今天发布了可灵视频生成模型,支持生成最长两分钟 30FPS 1080P 的。

快手今天发布了可灵视频生成模型,支持生成最长两分钟 30FPS 1080P 的视频。 生成质量是现在普通用户能接触到的天花板,5 秒视频这个等级完全超越了谷歌Voe 视频模型。 运动幅度、不同比例、一致性、物理特性都是除了 Sora 之外现在看到最好的。 体验方法:快影 APP-AI 玩法-AI 视频生成中申请。

封面图片

快手发布国内首个效果对标Sora的视频生成大模型“可灵”,现已开放邀测

快手发布国内首个效果对标Sora的视频生成大模型“可灵”,现已开放邀测 近日,快手“可灵”视频生成大模型官网正式上线。据介绍,可灵大模型为快手AI团队自研,基于快手在视频技术方面的多年积累,采用Sora相似的技术路线,结合多项自研技术创新,效果对标Sora。可灵大模型不仅具备强大的概念组合能力和想象力,还能够生成大幅度的合理运动、模拟物理世界特性。其生成的视频分辨率高达1080p,时长最高可达2分钟(帧率30fps),且支持自由的宽高比。目前,可灵大模型已在快影App开放邀测体验。(36氪) 标签: #快手 #Sora #可灵 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

快手再放大招!可灵真成世界第一视频生成模型了。

快手再放大招!可灵真成世界第一视频生成模型了。 发布一系列重磅更新: 基础模型升级,生成更高分辨率的视频 增加首尾帧控制 增加运镜控制,还有自动大师运镜 Web 端上线,限时免费 新模型的运动幅度和清晰度完全可以跟Gen3对标,同时美学表现也获得了提升。 控制方式更是吊打现有DiT模型。 Web端地址: Invalid media:

封面图片

:阿里巴巴开发的高保真图像到视频生成开源模型 可以生成符合真实世界运动状态的

:阿里巴巴开发的高保真图像到视频生成开源模型 可以生成符合真实世界运动状态的视频 主要功能: 1、高保真视频生成:AtomoVideo可以从单一静态图像生成高保真的视频序列,视频中的内容不仅与原始图片保持高度一致,而且动作自然流畅。 2、动作强度和连贯性:AtomoVideo生成的视频具有自然流畅的动作和良好的时间连贯性。视频中的运动看起来既自然又符合逻辑,没有突兀或不自然的过渡。 为了让视频里的动作看起来自然,AtomoVideo引入了时间卷积和时间注意力模块,这些模块专门处理视频帧之间的时间关系,帮助模型预测下一帧画面的变化,从而实现连贯的视频动作。AtomoVideo会特别处理视频的时间信息,让图片中的物体像在真实世界那样随时间移动和变化。 3、个性化适配:AtomoVideo能够与不同的个性化文本到图像(T2I)模型兼容,无需进行特定调整,这让它能够广泛适用于各种场景。AtomoVideo还能结合文字描述来生成视频。比如,你给它一张静态的海边图片,并告诉它“海浪轻轻拍打沙滩”,它就能根据这个描述生成一段海浪真的拍打沙滩的视频。

封面图片

终于有普通人可以立刻使用的类 Sora 视频生成工具了!#ai# #sora#

终于有普通人可以立刻使用的类 Sora 视频生成工具了!#ai视频# #sora# 海外产品 viva 发布了首个开放给全部用户使用的 Sora 同架构视频生成模型,而且现阶段免费。 支持文本生成视频、图片生成视频以及 4K 分辨率放大功能,另外也支持提示词的自动优化。 文生视频单次可以生成一条 5 秒的视频,图生视频是 4 秒视频 我测试了一下应该是目前运动幅度最大的视频生成模型,同时图像分辨率也是现在可以用的视频生成产品中最大的。文生视频的效果比图生视频要更好,同时如果要是用的话建议把运动幅度调到 20 左右比较合适。 viva 优势领域就是可以生成比较好的竖屏视频,目前很多视频模型的演示都是横屏视频,竖屏的表现并不好,但是短视频又是视频内容的大头,所以竖屏视频的生成质量是个很重要的指标。 但是一致性有一部分测试中保持的不是很好,同时没有表现出 Sora 那样强大的物理特性模拟以及 3D 一致性。跟谷歌 刚发布的 Veo 模型对比来看在写实内容上其实以及差不多了。 下面是 viva 的视频演示,15 秒开始有相同的提示词跟谷歌刚发布的 Veo 模型的对比。 这里体验 viva:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人