快手可灵 AI 网页端上线,文生图大模型“可图”宣布开源

快手可灵AI网页端上线,文生图大模型“可图”宣布开源正在举行的世界人工智能大会期间,快手宣布可灵AI网页端正式上线,所有功能限时免费(需自行申请)。“文生视频”开放最长10秒生成能力,“图生视频”新增运镜控制、自定义首尾帧等功能。同时宣布文生图大模型可图正式开源,目前已经上线网页版和微信小程序,支持文生图和图生图两类功能。关注频道@ZaiHuaPd频道爆料@ZaiHuabot

相关推荐

封面图片

快手上线自研文生图大模型 “可图” 参数规模达十亿级

快手上线自研文生图大模型“可图”参数规模达十亿级界面新闻从多位知情人士处获悉,快手自研文生图大模型“可图”已于近日正式对外开放。“可图”大模型目前支持文生图和图生图两类功能,可用于AI创作图像以及AI形象定制。用户可通过“可图”微信小程序和网页版使用,这也是快手首次将其自研的系列大模型对外开放。“可图”大模型的参数规模达十亿级,这些数据来自于开源社区、快手内部构建和自研AI技术合成,覆盖了常见的千万级中文实体概念,还引入强化学习和奖励模型技术(RLHF),解决了文生图大模型在长文本和复杂语义文本输入下的效果问题。

封面图片

腾讯混元文生图模型开源 采用Sora同架构

腾讯混元文生图模型开源采用Sora同架构5月14日,腾讯宣布旗下混元文生图模型升级并开源,参数量15亿,目前已在平台及上发布,包含模型权重、推理代码、模型算法等完整模型,企业与个人开发者可免费商用。该模型支持文生图功能且可作为视频等多模态视觉生成的基础。随着腾讯混元文生图大模型入局,采用DiT架构的大模型玩家再增一名。OpenAI的视频生成模型Sora也采用DiT架构。腾讯方面介绍,混元文生图大模型是业内首个中文原生的DiT架构文生图模型,综合指标在文生图算法中排名第三。——

封面图片

腾讯混元文生图大模型全面开源

腾讯混元文生图大模型全面开源5月25日获悉,腾讯近日宣布旗下混元文生图大模型全面升级,并对外开源。这是业内首个中文原生的DiT架构文生图开源模型,具备原生中文理解能力和双语编码能力,参数量15亿。此次开源的模型包含模型权重、推理代码、模型算法等完整模型,供企业与个人开发者免费商用,目前已在专注于自然语言处理的开源机器学习平台HuggingFace及面向软件开发者的代码托管平台Github上发布。腾讯混元文生图技术负责人芦清林介绍,升级后的混元文生图大模型采用了与Sora一致的DiT架构,不仅可支持文生图,也可作为文生视频等多模态视觉生成的基础。混元文生图大模型的开源,将丰富以中文为主的文生图开源生态,推动中文文生图技术研发和应用。(科技日报)

封面图片

快手可灵大模型开放图生视频,续写最长可达 3 分钟

快手可灵大模型开放图生视频,视频续写最长可达3分钟快手可灵大模型发布重磅更新:正式开放图生视频功能,支持将静态图像转化为5秒钟视频,用户可通过提示词文本控制图像中物体的运动;同时推出视频续写功能,支持对生成视频一键续写和连续多次续写,最长可生成约3分钟视频。今年6月,快手发布自研的视频生成大模型可灵,可支持生产最高达120秒的视频,在快影App开放邀测体验,目前累计已有约14万人申请内测。(澎湃新闻)

封面图片

6 月 6 日,华尔街见闻获悉,快手 “可灵” 视频生成大模型官网近日正式上线,可灵大模型为 AI 团队自研,基于在

6月6日,华尔街见闻获悉,快手“可灵”视频生成大模型官网近日正式上线,可灵大模型为快手AI团队自研,基于快手在视频技术方面的多年积累,采用Sora相似的技术路线,结合多项自研技术创新,效果对标Sora。据了解,可灵大模型不仅具备较强的概念组合能力和想象力,还能够生成大幅度的合理运动、模拟物理世界特性。其生成的视频分辨率高达1080p,时长最高可达2分钟(帧率30fps),且支持自由的宽高比。目前,可灵大模型已在快影App开放邀测体验。(全天候科技)

封面图片

腾讯混元文生图大模型开源训练代码

腾讯混元文生图大模型开源训练代码今日,腾讯混元文生图大模型(以下简称为混元DiT模型)宣布全面开源训练代码,同时对外开源混元DiTLoRA小规模数据集训练方案与可控制插件ControlNet。据腾讯混元方面介绍,这意味着,全球的企业与个人开发者、创作者们,都可以基于混元DiT训练代码进行精调,创造更具个性化的专属模型,进行更大自由度的创作;或基于混元DiT的代码进行修改和优化,基于此构建自身应用,推动技术的快速迭代和创新。(证券时报)

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人