测试了一下 #StableVideoDiffusion ,说一下结果,效果真的非常好,可以自动判断哪些地方该动以及应该怎样动。同

测试了一下#StableVideoDiffusion,说一下结果,效果真的非常好,可以自动判断哪些地方该动以及应该怎样动。同时也不会有Runway那种涉及到复杂的内容比如人脸的时候画面崩坏的问题,非常稳定。用的Colab里面的V100显卡,没有A100了,16G显存刚好够25帧的视频生成。生成时间大概144秒。就是这个对硬件要求实在太高,希望社区大佬给力一些,优化到可以本地跑。下面是测试生成的视频。Invalidmedia:

相关推荐

封面图片

前几天刷到了好几个用Pixverse做的好视频,刚好他们最近上线了网页版本和新模型就想顺便测试一下和 Runway 以及 Pik

前几天刷到了好几个用Pixverse做的好视频,刚好他们最近上线了网页版本和新模型就想顺便测试一下和Runway以及Pika的质量相比怎么样。先说结论:如果不考虑其他功能和交互我这次测试的结果Pixverse和Pika的质量接近分别是74.5分和73.5分。Runway效果居然最差只有64.5分。Pixverse的模型是这三者最为平衡的,可以有比较强的运动幅度,同时可以维持较好的一致性,模型可以比较好的对提示词进行响应,尤其是2.5D那个镜头非常的惊艳,但是纯二次元图片的效果也不是很好。Pika在动漫和2.5D风格上的优势巨大,但是只有Pika每次生成是3秒钟,所以图像质量打分会比其他两个差,写实风格效果也不是很如意,图像质量以及一致性相对差一些。Runway的模型质量和上面两者差距较大,主要是二次元风格的还原度太差还有2.5D风格直接无法维持一致性,写实场景对复杂画面改动较大有时候无法维持画面一致性,但是Runway对生成内容的控制还是三者最强的,因为其他两个都没有所以这部分就不计入分数。这里使用Pixverse:https://app.pixverse.ai/create/说一下测试的内容这次只测试视频模型的质量,所以三者都会使用图生视频来测试,这样可以忽略各自的图像模型的差距。另外每个都会使用物品特写、写实风景、写实人像、皮克斯2.5D风格、2D动画风格,这五种风格,然后每张图片生成的视频会从主题一致性、运动平滑度、运动程度以及成像质量这四个维度进行主观评分,每张图片随机一次,所以评分非常主观不保证复现,就是给大家使用的时候一个参考。下面是具体每个测试的分数,视频是三者生成视频的对比:物品特写-橘子落水:Runway主题一致性4分、运动平滑度4分、运动程度4.5分、成像质量3.5分、总分:16Pixverse主题一致性4分、运动平滑度4分、运动程度3.5分、成像质量4分、总分:15.5Pika主题一致性3.5分、运动平滑度4分、运动程度4分、成像质量3.5分、总分:15写实风景-伦敦塔着火:Runway:主题一致性2分、运动平滑度4分、运动程度4分、成像质量3.5分、总分:13.5Pixverse:主题一致性4分、运动平滑度4分、运动程度3.5分、成像质量4分、总分:15.5Pika:主题一致性3.5分、运动平滑度3.5分、运动程度3.5分、成像质量3.5分、总分:14皮克斯2.5D风格-拟人狐狸:Runway:主题一致性2分、运动平滑度3.5分、运动程度4分、成像质量2分、总分:11.5Pixverse:主题一致性4分、运动平滑度4分、运动程度4分、成像质量4分、总分:16Pika:主题一致性3.5分、运动平滑度4分、运动程度3.5分、成像质量3.5分、总分:14.5写实人像-水面古装:Runway:主题一致性4分、运动平滑度4分、运动程度2分、成像质量3.5分、总分:13.5Pixverse:主题一致性4分、运动平滑度4分、运动程度4分、成像质量4分、总分:16Pika:主题一致性3分、运动平滑度3.5分、运动程度4.5分、成像质量3分、总分:14动漫场景-植物园女孩:Runway:主题一致性1分、运动平滑度2分、运动程度4分、成像质量3分、总分:10Pixverse:主题一致性3分、运动平滑度3分、运动程度2.5分、成像质量3分、总分:11.5Pika:主题一致性4分、运动平滑度4分、运动程度4.5分、成像质量3.5分、总分:16总分:Runway:64.5、Pixverse:74.5、Pika:73.5Invalidmedia:

封面图片

#群友提问菲律宾不太平,狗推想转战其他国家想问一下小伙伴们,现在除了大家都知道的#菲迪柬这些地方,还有哪些地方有狗推的痕迹呢?条

#群友提问菲律宾不太平,狗推想转战其他国家想问一下小伙伴们,现在除了大家都知道的#菲迪柬这些地方,还有哪些地方有狗推的痕迹呢?条件好吗?安全吗?听说过斯里兰卡,也不知道具体的什么情况来菲5年咯先了解一下,没合适的就打道回府,因为现在不太平打仗肯定是打不起来的,各方面的原因吧,也想去新的地方试试看,就当旅游了ps:上帖非洲都抓了一波,哪里还有什么安全的地方。trx秒兑换:@LYTRX_BOT欢迎投稿爆料:@linyihaokeai金三角特区追寻梦想的地方【@tequvip8】

封面图片

DALL-E 3已经在Bing中实装了,我大概测试了一下,真的很强特别是提示词的理解方面比Midjourney强太多了,某些方面

DALL-E3已经在Bing中实装了,我大概测试了一下,真的很强特别是提示词的理解方面比Midjourney强太多了,某些方面的生成质量也跟MJ差不多,肯定是比SDXL要好非常多的。MidjourneyV6要是再不出,感觉危险了,而且DALL-E3还是免费的。下面是一些实验和对应的提示词(左MJ右DALL-E3),感兴趣可以自己去试着玩玩提示词:Perfumebottlecoveredwithplumblossoms,JamesTurrellstyle,premiumperfumebottle,renderedincinema4d,minimalistproductdesign,uniqueartdesign,productposter,conceptart,elegantbalanceSummernights,Theyellowmoon,street,Therewasacutelittlegirlwithacat,cityroad,atmosphere;Full,cutedoodle,thicklineartbyMrDoodleAbstractandminimalCMYKharajukufashionphotographyfromY2Kwithlotsofblur,doubleexposure,Awomanwhoiscoveringherhandsupwithherhandsassheholdsherhandsinlight,inthestyleofshige'svisualaestheticstyle,portraitswithsoftlighting,motekei,hauntingshadows,prismaticportraits,distinctfacialfeatures,国内的话访问Bing需要强制国外IP才行,打开之后输入“创建一张图像:提示词”就可以了。速度还非常快,妈的感觉MJ的订阅要降一个档,换成10美元的了。

封面图片

尝试了一下Dashtoon 这个 AI 漫画生成应用,发现做的挺成熟的,该有的功能都有,可以一次性生成也给了充分的编辑和自定义空

尝试了一下Dashtoon这个AI漫画生成应用,发现做的挺成熟的,该有的功能都有,可以一次性生成也给了充分的编辑和自定义空间。国内的很多小说视频还是手工用各种AI工具拼凑的阶段,可以借鉴一下这个产品的实现方式,是个机会。他的人物一致性是通过内置的非常多人物Lora实现的,目前来看这确实是最稳定的方案。具体的生成逻辑是你输入大概的故事描述,他会为你生成很多个场景描述,你修改确认之后就会根据文字场景描述生成图片和漫画的对话。后两张是我一次性生成的漫画。这里尝试:

封面图片

LayerDiffusion 这个可以直接生成透明背景图片的项目已经可以在forge的扩展上使用了,试了一下确实非常牛批。#ai

LayerDiffusion这个可以直接生成透明背景图片的项目已经可以在forge的扩展上使用了,试了一下确实非常牛批。不仅支持直接生成透明的图片元素,还支持在已有图片上生成跟环境融合的透明图片,这个就可以做很多事情了。不得不怀疑老哥只支持forge是为了推广他的项目,哈哈forge是WebUI的一个分支操作逻辑和交互完全跟WebUI一样不过进行了一些底层修改,让生成速度更快,插件运行时会自动下载模型。你可以在这里下载LayerDiffusion扩展:

封面图片

又刷到一个不错的 Wonder Dynamics 案例,简单总结一下流程就是……其实没什么好总结的。

又刷到一个不错的WonderDynamics案例,简单总结一下流程就是……其实没什么好总结的。你只需要拍摄一段真人影片,再上传一个CG角色模型,AI就可以无缝地把角色合成到真人场景中。AI能一键完成的包括但不仅限于动捕、打光、检测角色、动态描边、等等等等。▶▶作者:DonAllenStevensonIII(对,之前玩runway的也是他)▶工具:WonderDynamics▶虽然一直对制作3D角色没太大兴趣,但这次确实是心动了,这个工具绝对利好所有模型师,看来要把@考拉OK-的课捡起来了……#AI视频##blender#

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人