试了一下 ElevenLabs 的新模型 v2,可以克隆中文声音了。用我自己过去播客的音频素材训练了一下。

试了一下 ElevenLabs 的新模型 v2,可以克隆中文声音了。用我自己过去播客的音频素材训练了一下。 乍一听很惊人,后面就成了费翔的商务殷语了。 不过未来可期,有的本来就读稿、没有情绪起伏的单口主播们也许真的不用自己录了。 Invalid media:

相关推荐

封面图片

前几天拿到测试资格,试了一下HeyGen的数字人,藏师傅豁出去了真人出镜,哈哈。录得时候眼睛在看稿子所以角度不太对,将就一下。

前几天拿到测试资格,试了一下HeyGen的数字人,藏师傅豁出去了真人出镜,哈哈。录得时候眼睛在看稿子所以角度不太对,将就一下。 各位可以跟其他类似产品的对比一下。视频很清晰面部变化和嘴形也没那么违和。我这是用手机摄像头录制的30秒视频。如果两分钟的话效果可能还会更好。 没有用克隆声音,因为他不支持中文,英语需要念好多,我口语实在不行。 Invalid media:

封面图片

试了一下 AgentGPT,让它列出过去小时内所有的谈过 AI 这个关键词的推文。

试了一下 AgentGPT,让它列出过去小时内所有的谈过 AI 这个关键词的推文。 它给自己设置了任务: 第一步找到符合要求的推文 第二步判断哪些推文更相关 它自己拆解: . 做一个算法来识别 .微调一个Bert模型来 .找到微调模型的数据集 .开始从网上找数据 我赶紧停了下来,这样下去我的API要爆掉了…

封面图片

视频生成模型SVD刚才发布了1.1版本,我试用了一下。

视频生成模型SVD刚才发布了1.1版本,我试用了一下。 发现比上个版本的进步非常多,之前的几个比较大的问题都有了改善,这下终于是一个可用的模型了。 我测评了多种风格的内容,主要是图片生成视频,图片由MJ生成,下面是发现的一些变化: ◆XT模型本体从9G多缩小到了4G多,显存要求降低了,同时推理速度加快许多,之前跑不了的电脑这下可以试试了。 ◆整体运动幅度大幅增加,很多内容不再只是运镜了,也意味着模型真的理解了内容。 ◆生物和人像的运动幅度和一致性大幅提升,人物不再是完全不动的图片了,会进行相应的运动和跟环境交互。 ◆之前视频中的密集噪点得到了一定程度优化。 ◆2D动漫图像现在也可以动了,不过效果依然不太好。 ◆已往的强项流体运动效果依然很顶,没有负向优化。 你可以在这里下载模型: Invalid media:

封面图片

前几天刷到了好几个用Pixverse做的好视频,刚好他们最近上线了网页版本和新模型就想顺便测试一下和 Runway 以及 Pik

前几天刷到了好几个用Pixverse做的好视频,刚好他们最近上线了网页版本和新模型就想顺便测试一下和 Runway 以及 Pika 的质量相比怎么样。 先说结论: 如果不考虑其他功能和交互我这次测试的结果Pixverse和 Pika 的质量接近分别是 74.5 分和 73.5 分。Runway 效果居然最差只有 64.5 分。 Pixverse的模型是这三者最为平衡的,可以有比较强的运动幅度,同时可以维持较好的一致性,模型可以比较好的对提示词进行响应,尤其是 2.5D 那个镜头非常的惊艳,但是纯二次元图片的效果也不是很好。 Pika 在动漫和 2.5D 风格上的优势巨大,但是只有 Pika 每次生成是 3秒钟,所以图像质量打分会比其他两个差,写实风格效果也不是很如意,图像质量以及一致性相对差一些。 Runway 的模型质量和上面两者差距较大,主要是二次元风格的还原度太差还有 2.5D 风格直接无法维持一致性,写实场景对复杂画面改动较大有时候无法维持画面一致性,但是 Runway 对生成内容的控制还是三者最强的,因为其他两个都没有所以这部分就不计入分数。 这里使用Pixverse: 说一下测试的内容这次只测试视频模型的质量,所以三者都会使用图生视频来测试,这样可以忽略各自的图像模型的差距。 另外每个都会使用物品特写、写实风景、写实人像、皮克斯 2.5D 风格、 2D 动画风格,这五种风格,然后每张图片生成的视频会从主题一致性、运动平滑度、运动程度以及成像质量这四个维度进行主观评分,每张图片随机一次,所以评分非常主观不保证复现,就是给大家使用的时候一个参考。 下面是具体每个测试的分数,视频是三者生成视频的对比: 物品特写-橘子落水: Runway 主题一致性4分、运动平滑度 4分、运动程度 4.5分、成像质量 3.5分 、总分: 16 Pixverse 主题一致性4分、运动平滑度 4分、运动程度 3.5分 、成像质量 4分 、总分:15.5 Pika 主题一致性 3.5分、运动平滑度 4分、运动程度 4分 、成像质量 3.5分、总分:15 写实风景-伦敦塔着火: Runway:主题一致性2分、运动平滑度 4分、运动程度 4分、成像质量 3.5分 、总分: 13.5 Pixverse:主题一致性4分、运动平滑度 4分、运动程度 3.5分 、成像质量 4分 、总分:15.5 Pika:主题一致性 3.5分、运动平滑度 3.5分、运动程度 3.5分 、成像质量 3.5分、总分:14 皮克斯 2.5D 风格-拟人狐狸: Runway:主题一致性2分、运动平滑度 3.5分、运动程度 4分、成像质量 2分 、总分: 11.5 Pixverse:主题一致性4分、运动平滑度 4分、运动程度 4分 、成像质量 4分 、总分:16 Pika:主题一致性 3.5分、运动平滑度 4分、运动程度 3.5分 、成像质量 3.5分、总分:14.5 写实人像-水面古装: Runway:主题一致性4分、运动平滑度 4分、运动程度 2分、成像质量 3.5分 、总分: 13.5 Pixverse:主题一致性4分、运动平滑度 4分、运动程度 4分 、成像质量 4分 、总分:16 Pika:主题一致性 3分、运动平滑度 3.5分、运动程度 4.5分 、成像质量 3分、总分:14 动漫场景-植物园女孩: Runway:主题一致性 1分、运动平滑度 2分、运动程度 4分、成像质量 3分 、总分:10 Pixverse:主题一致性3分、运动平滑度 3分、运动程度 2.5分 、成像质量 3分 、总分:11.5 Pika:主题一致性 4分、运动平滑度 4分、运动程度 4.5分 、成像质量 3.5分、总分:16 总分: Runway:64.5、Pixverse:74.5 、Pika:73.5 Invalid media:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人