商汤发布首个 “可控” 人物视频生成大模型 Vimi

商汤发布首个 “可控” 人物视频生成大模型 Vimi 据界面新闻,商汤发布首个 “可控” 人物视频生成大模型 Vimi,该模型主要面向 C 端用户,支持聊天、唱歌、舞动等多种娱乐互动场景。商汤方面称,Vimi 可生成长达 1 分钟的单镜头人物类视频,画面效果不会随着时间的变化而劣化或失真,Vimi 基于商汤日日新大模型,通过一张任意风格的照片就能生成和目标动作一致的人物类视频,可通过已有人物视频、动画、声音、文字等多种元素进行驱动。

相关推荐

封面图片

7 月 4 日,世界人工智能大会(WAIC 2024)在上海召开,由商汤科技打造的首个面向 C 端用户的可控人物视频生成大模型

7 月 4 日,世界人工智能大会(WAIC 2024)在上海召开,由商汤科技打造的首个面向 C 端用户的可控人物视频生成大模型 Vimi 入选 WAIC 展览展示最高荣誉 “镇馆之宝”。华尔街见闻获悉,Vimi 基于商汤日日新大模型的能力,通过一张任意风格的照片就能生成和目标动作一致的人物类视频,并支持多种驱动方式,可通过已有人物视频、动画、声音、文字等多种元素进行驱动。(全天候科技)

封面图片

【快手发布国内首个效果对标Sora的视频生成大模型“可灵”,现已开放邀测】

【快手发布国内首个效果对标Sora的视频生成大模型“可灵”,现已开放邀测】 近日,快手“可灵”视频生成大模型官网正式上线。据介绍,可灵大模型为快手AI团队自研,基于快手在视频技术方面的多年积累,采用Sora相似的技术路线,结合多项自研技术创新,效果对标Sora。可灵大模型不仅具备强大的概念组合能力和想象力,还能够生成大幅度的合理运动、模拟物理世界特性。其生成的视频分辨率高达1080p,时长最高可达2分钟(帧率30fps),且支持自由的宽高比。目前,可灵大模型已在快影App开放邀测体验。(36氪)

封面图片

快手发布国内首个效果对标Sora的视频生成大模型“可灵”,现已开放邀测

快手发布国内首个效果对标Sora的视频生成大模型“可灵”,现已开放邀测 近日,快手“可灵”视频生成大模型官网正式上线。据介绍,可灵大模型为快手AI团队自研,基于快手在视频技术方面的多年积累,采用Sora相似的技术路线,结合多项自研技术创新,效果对标Sora。可灵大模型不仅具备强大的概念组合能力和想象力,还能够生成大幅度的合理运动、模拟物理世界特性。其生成的视频分辨率高达1080p,时长最高可达2分钟(帧率30fps),且支持自由的宽高比。目前,可灵大模型已在快影App开放邀测体验。(36氪) 标签: #快手 #Sora #可灵 频道: @GodlyNews1 投稿: @GodlyNewsBot

封面图片

重磅!美国OpenAI发布首个视频生成模型

重磅!美国OpenAI发布首个视频生成模型 2月16日,OpenAI在其官网发布文生视频模型Sora。据介绍,该模型可以生成长达一分钟的视频,同时保持视觉标准并遵循用户提示。 该公司表示Sora能够生成复杂的场景,不仅包括多个角色,还有特定的动作类型,以及针对对象和背景的准确细节主题。除此之外,Sora还可以将静态图像制作成动画。 PS:我有个想法

封面图片

【马斯克评OpenAI首个视频生成模型:人类认赌服输】

【马斯克评OpenAI首个视频生成模型:人类认赌服输】 OpenAI周四发布了首个视频生成模型Sora,并展示了几段效果炸裂的演示视频。一位X用户分享了Sora生成的一名女子在东京街头漫步的视频,并评论称:“OpenAI今天宣布了Sora,它使用混合扩散和变压器模型架构生成长达1分钟的视频。他们似乎又领先了其他所有人1-2年。以下是我看过的最令人印象深刻的视频,以及生成它们的提示。”另一位X用户评论称:“gg皮克斯。”马斯克回应称:“gg人类(gg humans)。”gg是网络游戏用语“good games”的缩写,主要用于游戏结束后,输赢双方都可以用。 快讯/广告 联系 @xingkong888885

封面图片

MAGIC-ME 字节发布了一个针对视频生成中人物身份保持的项目。

MAGIC-ME 字节发布了一个针对视频生成中人物身份保持的项目。 可以在视频生成中保持对应输入图像人物的身份特征,看起来还行,但是用名人演示不太好看出效果。 项目简介: 提出了一种简单却高效的主题身份可控视频生成框架,称之为视频定制扩散(Video Custom Diffusion,VCD)。通过定义一 ...

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人