快手可灵 AI 网页端上线，文生图大模型“可图”宣布开源

快手可灵AI网页端上线，文生图大模型“可图”宣布开源正在举行的世界人工智能大会期间，快手宣布可灵AI网页端正式上线，所有功能限时免费（需自行申请）。“文生视频”开放最长10秒生成能力，“图生视频”新增运镜控制、自定义首尾帧等功能。同时宣布文生图大模型可图正式开源，目前已经上线网页版和微信小程序，支持文生图和图生图两类功能。关注频道@ZaiHuaPd频道爆料@ZaiHuabot

在Telegram中查看

相关推荐

快手上线自研文生图大模型 “可图” 参数规模达十亿级

快手上线自研文生图大模型“可图”参数规模达十亿级界面新闻从多位知情人士处获悉，快手自研文生图大模型“可图”已于近日正式对外开放。“可图”大模型目前支持文生图和图生图两类功能，可用于AI创作图像以及AI形象定制。用户可通过“可图”微信小程序和网页版使用，这也是快手首次将其自研的系列大模型对外开放。“可图”大模型的参数规模达十亿级，这些数据来自于开源社区、快手内部构建和自研AI技术合成，覆盖了常见的千万级中文实体概念，还引入强化学习和奖励模型技术（RLHF），解决了文生图大模型在长文本和复杂语义文本输入下的效果问题。

腾讯混元文生图模型开源采用Sora同架构

腾讯混元文生图模型开源采用Sora同架构5月14日，腾讯宣布旗下混元文生图模型升级并开源，参数量15亿，目前已在平台及上发布，包含模型权重、推理代码、模型算法等完整模型，企业与个人开发者可免费商用。该模型支持文生图功能且可作为视频等多模态视觉生成的基础。随着腾讯混元文生图大模型入局，采用DiT架构的大模型玩家再增一名。OpenAI的视频生成模型Sora也采用DiT架构。腾讯方面介绍，混元文生图大模型是业内首个中文原生的DiT架构文生图模型，综合指标在文生图算法中排名第三。——

腾讯混元文生图大模型全面开源

腾讯混元文生图大模型全面开源5月25日获悉，腾讯近日宣布旗下混元文生图大模型全面升级，并对外开源。这是业内首个中文原生的DiT架构文生图开源模型，具备原生中文理解能力和双语编码能力，参数量15亿。此次开源的模型包含模型权重、推理代码、模型算法等完整模型，供企业与个人开发者免费商用，目前已在专注于自然语言处理的开源机器学习平台HuggingFace及面向软件开发者的代码托管平台Github上发布。腾讯混元文生图技术负责人芦清林介绍，升级后的混元文生图大模型采用了与Sora一致的DiT架构，不仅可支持文生图，也可作为文生视频等多模态视觉生成的基础。混元文生图大模型的开源，将丰富以中文为主的文生图开源生态，推动中文文生图技术研发和应用。（科技日报）

快手可灵大模型开放图生视频，续写最长可达 3 分钟

快手可灵大模型开放图生视频，视频续写最长可达3分钟快手可灵大模型发布重磅更新：正式开放图生视频功能，支持将静态图像转化为5秒钟视频，用户可通过提示词文本控制图像中物体的运动；同时推出视频续写功能，支持对生成视频一键续写和连续多次续写，最长可生成约3分钟视频。今年6月，快手发布自研的视频生成大模型可灵，可支持生产最高达120秒的视频，在快影App开放邀测体验，目前累计已有约14万人申请内测。(澎湃新闻)

6 月 6 日，华尔街见闻获悉，快手 “可灵” 视频生成大模型官网近日正式上线，可灵大模型为 AI 团队自研，基于在

6月6日，华尔街见闻获悉，快手“可灵”视频生成大模型官网近日正式上线，可灵大模型为快手AI团队自研，基于快手在视频技术方面的多年积累，采用Sora相似的技术路线，结合多项自研技术创新，效果对标Sora。据了解，可灵大模型不仅具备较强的概念组合能力和想象力，还能够生成大幅度的合理运动、模拟物理世界特性。其生成的视频分辨率高达1080p，时长最高可达2分钟（帧率30fps），且支持自由的宽高比。目前，可灵大模型已在快影App开放邀测体验。（全天候科技）

腾讯混元文生图大模型开源训练代码

腾讯混元文生图大模型开源训练代码今日，腾讯混元文生图大模型（以下简称为混元DiT模型）宣布全面开源训练代码，同时对外开源混元DiTLoRA小规模数据集训练方案与可控制插件ControlNet。据腾讯混元方面介绍，这意味着，全球的企业与个人开发者、创作者们，都可以基于混元DiT训练代码进行精调，创造更具个性化的专属模型，进行更大自由度的创作；或基于混元DiT的代码进行修改和优化，基于此构建自身应用，推动技术的快速迭代和创新。(证券时报)

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人