一个可以用来打造个人数字形象的深度学习模型工具,仅需要提供最低三张照片即可获得独属于自己的个人形象数字替身

一个可以用来打造个人数字形象的深度学习模型工具,仅需要提供最低三张照片即可获得独属于自己的个人形象数字替身 FaceChain由阿里达摩院开发。使用了多个模型,包括面部检测模型、图像旋转模型、人体解析模型、肤色修饰模型等。 算法介绍: 训练阶段: 输入用户上传的清晰面部区域图像,输出Face LoRA模型。通过一系列的图像处理和模型微调,获取高质量的面部训练图像,并获得面部LoRA模型。 推断阶段: 基于面部LoRA模型和样式LoRA模型生成个人肖像图像,然后进一步改善肖像图像的面部细节。 你可以通过FaceChain的Python脚本或熟悉的Gradio界面训练你的数字孪生模型并生成照片,也可以直接通过ModelScope Studio体验FaceChain。 | #工具

相关推荐

封面图片

一个懒人 LoRA 制作指南,手把手教你用 OneTrainer 训练自己的 AI 绘画模型,无需深入理论,轻松掌握关键步骤。

一个懒人 LoRA 制作指南,手把手教你用 OneTrainer 训练自己的 AI 绘画模型,无需深入理论,轻松掌握关键步骤。 作者是用XL生成的图片,你可以用MIdjoureny生成效果比较好。 我完整翻译了内容,并且重新整理了适合推特阅读的版本,或者你可以在下面看完整翻译的内容: - 1⃣ LoRA 模型制作教程 作者作为一名 LoRA 模型制作的新手,通过自己的学习实践,总结了一份简明扼要的制作教程。 这份教程不涉及太多理论知识,而是直奔主题,手把手教初学者如何训练自己的 LoRA 模型。 作者坦诚分享了自己从最初尝试 Embedding 和 LoRA 时遇到的问题,以及后来找到的解决方法,为读者提供了宝贵的经验参考。 所需工具介绍 要制作 LoRA 模型,需要准备一些必要的工具。作者推荐使用自己喜欢的模型和图像生成工具,他个人使用的是 StableSwarmUI 和 GhostXL 模型。 此外,还需要一个训练工具,作者选择了 OneTrainer,因为有人说它比另一个常用的工具 Kohya 更易用。作者还提到,训练时如果需要将 SDXL 格式的图像转换为 SD 格式,需要在设置中开启分辨率覆盖选项。 2⃣ LoRA 模型制作步骤 作者将 LoRA 模型的制作过程分为三个主要步骤: 第一步是用现有的模型生成大量高质量的图像作为训练数据; 第二步是人工检查挑选图像,剔除所有质量不合格的; 第三步是使用 OneTrainer 进行训练,调整必要的参数设置。 作者还特别提到,在训练时如果需要将 SDXL 格式的图像转换为 SD 格式,一定要记得开启分辨率覆盖选项,否则训练会出问题。 训练参数调整心得 作为一名新手,作者在调整训练参数时主要参考了一份网上的指南。 他尝试调整了 Lora 设置中的 rank 参数,将其从默认的 16 改为 32,解决了模型训练中遇到的问题。作者分享了这份参数调整指南的链接,供其他学习者参考。 3⃣ 作者的训练数据集分享 为了帮助更多学习者,作者慷慨地分享了自己完整的训练图像数据集,其中还包含了他使用的 OneTrainer 配置文件。这些数据可供其他 LoRA 制作人下载参考和使用。数据集已经过作者的筛选,图像质量有保证。 4⃣ 训练成果展示

封面图片

微软的 VASA-1 模型根据一张照片和一条音轨生成该人的说话视频

微软的 VASA-1 模型根据一张照片和一条音轨生成该人的说话视频 微软亚洲研究院发布了模型,该模型能根据一个人的一张照片和一条音轨生成其说话或唱歌的同步动画视频。VASA 代表 Visual Affective Skills Animator,它使用了机器学习分析静态图像和音频片段,然后生成有精确面部表情、头部运动以及与音频口型同步的逼真视频。微软声称该模型在真实性、表现力和效率方面显著优于以前的语音动画方法。微软研究员使用了 VoxCeleb2 数据集训练了 VASA-1。该数据集包含了 6112 位名人的逾 100 万条话语,提取自上传到 YouTube 的视频。VASA-1 能以每秒最高 40 帧的速度生成 512x512 像素分辨率的视频,它潜在可用于深度伪造,研究人员没有公开模型源代码。#视频 来源 , 频道:@kejiqu 群组:@kejiquchat

封面图片

【三个零零后的元宇宙社交实验】他们认为人在虚拟世界的数字孪生,不仅可以通过外观模拟,也可以用向内看的方式构建。在谓尔的模式中,通

【三个零零后的元宇宙社交实验】他们认为人在虚拟世界的数字孪生,不仅可以通过外观模拟,也可以用向内看的方式构建。在谓尔的模式中,通过算法模型处理,用户的行为一旦做出改变,就反应在宠物的形象上。而借由能够反映自身的数字孪生来进行社交,既能满足社交的需求,也能获得一层由距离产生的防御,这是三人最早的构思。 #抽屉IT

封面图片

《米娅魅力成长实操课 (男生版)》|简介:《米娅魅力成长实操课 (男生版)》是一门专为男生设计的成长课程。课程内容涵盖个人形象塑

《米娅魅力成长实操课 (男生版)》|简介:《米娅魅力成长实操课 (男生版)》是一门专为男生设计的成长课程。课程内容涵盖个人形象塑造,从发型设计的技巧与适合不同场合的发型选择,到服装搭配的原则与色彩搭配方法,帮助男生提升外在形象气质;社交技巧培养方面,教授如何有效沟通,包括语言表达的清晰准确、肢体语言的恰当运用,以及如何拓展社交圈子、建立良好人际关系;还涉及个人自信提升的方法,如通过设定目标与逐步实现目标增强成就感,克服内心的自卑与焦虑。通过系统学习这门课程,男生能够在形象、社交与心理等多方面实现成长,提升个人魅力与综合素质,更好地应对生活与工作中的各种挑战。|标签:#米娅魅力成长课男生版#成长课程#男生成长|文件大小:NG|链接:

封面图片

阿里大文娱AI数字人“厘里”录制真人秀综艺

阿里大文娱AI数字人“厘里”录制真人秀综艺 据悉,厘里已正式接入语义大模型“通义星尘”,从而成为国内首个能够无限制自由对话的超写实数字人。这一技术突破使得厘里能够更加自然、流畅地与人类进行交互,为观众带来前所未有的视听体验。通义星尘作为个性化角色创作平台,其基于大规模高质量个性化对话数据,通过分阶段的个性化训练策略,使模型在保持通用能力的基础上,展现出更加拟人、情感丰富、语言风格鲜明的特点。这种能力使得厘里在角色的个性、风格遵循上具有更强的指令遵循能力,为观众呈现出一个鲜活、立体的数字人形象。与通用模型相比,通义星尘具有深度定义人设、与用户建立深度连接、支持多种形式对话互动等独特优势。同时,它还能基于具体事件设定展开对话,使得厘里在情感陪伴、游戏NPC、IP复刻等场景中有着广泛的应用前景。除了正在热播的《盒子里的猫》,厘里还参与了新纪录片《万物经济学》的制作,该纪录片即将上线与观众见面。此外,由其主演的科幻微短剧也将在今年下半年在优酷播出,无疑为观众带来了更多期待。 ... PC版: 手机版:

封面图片

OpenAI的Sora视频生成模型也能用来渲染游戏

OpenAI的Sora视频生成模型也能用来渲染视频游戏 这篇题为《作为世界模拟器的视频生成模型》(Video generation models as world simulators)的论文由多位 OpenAI 研究人员共同撰写,揭开了 Sora 架构关键方面的神秘面纱例如,Sora 可以生成任意分辨率和长宽比(最高 1080p)的视频。根据论文所述,Sora 能够执行一系列图像和视频编辑任务,从创建循环视频、向前或向后延伸视频到更改现有视频的背景。但最吸引笔者的还是 Sora"模拟数字世界"的能力,OpenAI 的合著者如是说。在一次实验中,OpenAI 将 Sora 放到 Minecraft 上,让它在控制玩家的同时渲染世界及其动态(包括物理)。Sora 在 Minecraft 中控制一名玩家,并渲染视频游戏世界,请注意,颗粒感是由视频到 GIF 的转换工具造成的,而不是 Sora。图片来源:OpenAIOpenAI那么,Sora 是如何做到这一点的呢?正如 NVIDIA 高级研究员 Jim Fan(通过 Quartz)所说,与其说 Sora 是一个创意引擎,不如说它是一个"数据驱动的物理引擎"。它不仅能生成单张照片或视频,还能确定环境中每个物体的物理特性,并根据这些计算结果渲染照片或视频(或交互式 3D 世界,视情况而定)。合著者写道:"这些功能表明,继续扩展视频模型是开发物理和数字世界以及其中的物体、动物和人的高能力模拟器的一条大有可为的途径。"现在,Sora在视频游戏领域也有其通常的局限性。该模型无法准确模拟玻璃碎裂等基本互动的物理过程。即使在可以建模的互动中,Sora 也经常出现不一致的情况,例如在渲染一个人吃汉堡时,却无法渲染汉堡上的咬痕。不过,如果我没看错的话,Sora 似乎可以为更逼真(甚至可能是逼真)的程序生成游戏铺平道路。这既令人兴奋,又令人恐惧(考虑到Deepfake的影响)这也许就是为什么 OpenAI 选择暂时将 Sora 关在一个非常有限的访问程序后面的原因。相关文章:OpenAI 推出文本到视频人工智能模型 SoraOpenAI首个视频生成模型发布 能生成长达1分钟的高清视频 ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人