腾讯混元推出 AI 动图神器 “Follow-Your-Pose-v2”

腾讯混元推出AI动图神器“Follow-Your-Pose-v2”今日，腾讯混元团队联合中山大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Pose-v2”，只需要输入一张人物图片和一段动作视频，就可以让图片上的人跟随视频上的动作动起来，生成视频长度可达10秒。该模型可以在推理耗时更少的情况下，支持多人视频动作生成。模型具备较强的泛化能力，无论输入人物是什么年龄、服装，背景如何杂乱，动作视频的动作如何复杂，都能生成出高质量的视频。

在Telegram中查看

相关推荐

香港科技大学联合腾讯混元团队和清华推出全新图生视频模型“Follow-Your-Click”：用户指哪动哪

香港科技大学联合腾讯混元团队和清华大学推出全新图生视频模型“Follow-Your-Click”：用户指哪动哪香港科技大学联合腾讯混元团队和清华大学联合推出全新图生视频模型“Follow-Your-Click”，目前已经上架GitHub（代码四月公开），同时还发表了一篇研究论文（DOI:2403.08268）。这款图生视频模型主要功能包括局部动画生成和多对象动画，支持多种动作表达，如头部调整、翅膀拍动等。线索：@ZaiHuabot投稿：@TNSubmbot频道：@TestFlightCN

腾讯混元文生图模型开源采用Sora同架构

腾讯混元文生图模型开源采用Sora同架构5月14日，腾讯宣布旗下混元文生图模型升级并开源，参数量15亿，目前已在平台及上发布，包含模型权重、推理代码、模型算法等完整模型，企业与个人开发者可免费商用。该模型支持文生图功能且可作为视频等多模态视觉生成的基础。随着腾讯混元文生图大模型入局，采用DiT架构的大模型玩家再增一名。OpenAI的视频生成模型Sora也采用DiT架构。腾讯方面介绍，混元文生图大模型是业内首个中文原生的DiT架构文生图模型，综合指标在文生图算法中排名第三。——

腾讯混元文生图大模型全面开源

腾讯混元文生图大模型全面开源5月25日获悉，腾讯近日宣布旗下混元文生图大模型全面升级，并对外开源。这是业内首个中文原生的DiT架构文生图开源模型，具备原生中文理解能力和双语编码能力，参数量15亿。此次开源的模型包含模型权重、推理代码、模型算法等完整模型，供企业与个人开发者免费商用，目前已在专注于自然语言处理的开源机器学习平台HuggingFace及面向软件开发者的代码托管平台Github上发布。腾讯混元文生图技术负责人芦清林介绍，升级后的混元文生图大模型采用了与Sora一致的DiT架构，不仅可支持文生图，也可作为文生视频等多模态视觉生成的基础。混元文生图大模型的开源，将丰富以中文为主的文生图开源生态，推动中文文生图技术研发和应用。（科技日报）

腾讯混元大模型全面降价

腾讯混元大模型全面降价5月22日，腾讯云公布全新大模型升级方案，主力模型之一混元-lite模型，API输入输出总长度计划从目前的4k升级到256k，价格从0.008元/千tokens调整为全面免费。混元-standardAPI输入价格从0.01元/千tokens降至0.0045元/千tokens，下降55%，API输出价格从0.01元/千tokens降至0.005元/千tokens，下降50%。新上线的混元-standard-256k，具备处理超过38万字符的超长文本能力，API输入价格下调至0.015元/千tokens，下降87.5%，API输出价格下降至0.06元/千tokens，下降50%。其中，最高配置万亿参数模型混元-pro，API输入价格从0.1元/千tokens降至0.03元/千tokens，降幅达70％。以上价格调整立即生效。腾讯云表示，目前大模型赛道还处于能力爬坡的过程中，腾讯云非常重视技术积累与客户体验，未来会持续为客户提供有竞争力的产品和服务。

腾讯混元大模型升级：部分中文能力已追平 GPT-4 支持 16s 视频生成

腾讯混元大模型升级：部分中文能力已追平GPT-4支持16s视频生成5月17日，腾讯集团副总裁蒋杰在腾讯云生成式AI产业应用峰会上表示，腾讯混元大模型通过持续迭代，目前整体性能已居国内第一梯队，部分中文能力已追平GPT-4。针对备受关注的生视频能力，腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力，已经支持16s视频生成。在生3D层面，腾讯混元已布局文/图生3D，单图仅需30秒即可生成3D模型。（证券时报）

5月14日，腾讯宣布旗下的混元文生图大模型全面升级并对外开源，目前已在HuggingFace平台及Github上发布，包含模型权

5月14日，腾讯宣布旗下的混元文生图大模型全面升级并对外开源，目前已在HuggingFace平台及Github上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。这是业内首个中文原生的DiT架构文生图开源模型，支持中英文双语输入及理解，参数量15亿。升级后的混元文生图大模型采用了与sora一致的DiT架构，不仅可支持文生图，也可作为视频等多模态视觉生成的基础。（全天候科技）

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人