中国电信发布新一代3D数字人:几张照片就能快速生成

中国电信发布新一代3D数字人:几张照片就能快速生成只需要几张照片就可以快速生成自己的超写实3D数字人,高度还原了面部形状、褶皱、五官形状、皮肤纹理等细节。在该技术下3D数字人制作时间可从1个月缩短至3天,人工参与步骤相比原来减少80%。同时自研了一套半自动拓扑绑定流程,可精细到眼角、嘴角级稳定拓扑,支持微表情级的动作表达。最终结合自研的驱动引擎和渲染引擎,让数字人在动作及情绪表达上有更多的可能性。...PC版:https://www.cnbeta.com.tw/articles/soft/1396177.htm手机版:https://m.cnbeta.com.tw/view/1396177.htm

相关推荐

封面图片

支付宝推出AI毛发自测工具 拍几张照片就能检测

支付宝推出AI毛发自测工具拍几张照片就能检测用户只需上传几张头皮照片,AI即可在半分钟内识别出脱发类型和级别,并提供相应的健康建议,用户可以通过支付宝App搜索“毛发检测”来体验这一服务。项目负责人蔡科发表示,研发这款应用的初衷是帮助人们及时、科学地了解自己的脱发状况,避免盲目听信偏方,错过最佳养护时机。他分享了自己的脱发经历,幽默地提到:“我第一次意识到自己脱发,是看到女儿在幼儿园里画的爸爸,居然只有三根头发。”支付宝AI技术在医疗领域的应用并非首次。此前,支付宝已推出“AI就医助理”解决方案,通过AI大模型、数字人等技术,为医疗机构提供全面的“AI陪伴就诊”服务,而此次推出的AI毛发自测工具,为更多脱发患者带来便利和科学的指导。...PC版:https://www.cnbeta.com.tw/articles/soft/1433924.htm手机版:https://m.cnbeta.com.tw/view/1433924.htm

封面图片

英伟达发布 LATTE3D 模型 1 秒生成高质量 3D 效果

英伟达发布LATTE3D模型1秒生成高质量3D效果英伟达AI研究副总裁SanjaFidler所属位于多伦多的AI实验室团队在GTC2024春季场的座谈活动中,发布了LATTE3D模型并于现场进行实机展示,该技术能够高效率通过文本提示词生成3D模型,在搭配英伟达RTXA6000GPU的情况下能够几乎即时(不到1秒时间)生成3D模型,3D形状可以随意放大、旋转,360度无死角。“一年前,AI模型需要1小时才能生成这种质量的3D视觉效果,而目前的技术水平大约是10到12秒。”SanjaFidler说。

封面图片

一张照片生成3D头像 苹果新模型击败StyleGAN2 表情光线都能调

一张照片生成3D头像苹果新模型击败StyleGAN2表情光线都能调进行3D建模时,需要的照片素材无需专门选择角度,数量上也只需一张。甚至对表情、发型、眼镜等元素进行调节时,也不需要额外素材。而传统的头像合成工具或者需要多张图片才能工作,或者对照片角度有刁钻的要求。正是凭借这一创新,FaceLit获得了3.5的FID评分,较同类产品直接高出了25%。改进式EG3D合成人像,光线信息单独处理下面就来看一下FaceLit具体是如何实现头像合成的。总的来说,苹果采用了将人物本体与光线分别处理再进行叠加的策略。早期的三维人像合成工具在转换过程中可能产生形变。而爆火的NeRF通过将场景拆分成具体因素,提高了3D图像合成效果,改善了这一问题。但苹果团队认为,在可控性方面,NeRF仍存有不足之处。于是,在EG3D框架的基础上,苹果创造了FaceLit的合成模型。EG3D通过三平面解码器,赋予了二维卷积神经网络生成渲染3D模型所需深度参数的能力。苹果团队对标准的EG3D训练方式进行了扩展,并将之转化成了FaceLit框架。FaceLit与传统EG3D渲染流程对比图标准的ED3G使用相机位置p参数作为基本输入参数。在建立GAN2操作时,苹果在EG3D的基础上加入了光照参数l。不同p(左→右)与l(上→下)值下的初始图像苹果选择了经过球形谐波方式简化后的Phong反射模型作为处理光源的物理基础。光照参数l就是在这一基础之上独立处理得到的。在自然界中,反射包括镜面反射和漫反射两种形式。不同镜面反射率条件下的效果对比因此,苹果在ED3G模型中加入了镜面反射解码器和漫反射解码器。它们替代了可以直接得到颜色c、密度σ数据的三平面解码器。反射解码器流程示意图通过对GAN2产生的数据进行再次解码,可以得到镜面反射率ks和漫反射率kd。然后再通过两种反射着色器得到颜色c,密度σ则由漫反射解码器计算得出。最终,FaceLit以与三平面解码器相同的参数(c,w,σ)渲染图像,并进行分辨率优化。有的放矢设计训练策略,数据无需人工标注生成框架已有,那就来到训练阶段,其特点在于训练过程中无需人工标注。方法论层面,在训练时,团队使用了FFHQ、MetFaces和CelebA-HQ数据集。对于不同的数据集,苹果使用了不同的训练方式。FFHQ包含了7万余条人脸数据,其训练分为两个阶段:先在较低的分辨率下训练,再提高分辨率再次进行。对于包含2万数据量的CelebA-HQ,训练不需要分阶段进行。而对于更小的MetFAces,则只需要通过ADA扩容的方式,使用预训练的FFHQ进行优化调整即可。定性地看,训练结果在机位、光源和反射高光等方面都有出色的表现,图中的细节也有所增强。FaceLit生成的头像(左侧四列)唇齿部位的细节进行了明显重构定量结果同样表明,FaceLit在FID、KID等指标上均优于包括标准EG3D在内的传统生成方式。在使用FFHQ作为训练集的条件下,各生成方式的表现如下表,不难看出FaceLit拥有最低的FID和KID值。而相比于英伟达的StyleGAN2,FaceLit的表现依旧出色:光线准确度方面,FaceLit在使用三种不同训练数据集的情况下,与人工设定的标准值平均均方误差均低于0.01。网友:人们低估了苹果AI消息发出后,便有网友认为“这是对更重磅产品的预热”。更有网友直接推测,FaceLit的出现标示着人工智能将进军AR和VR领域,苹果的混合现实将最终实现商用……也有网友认为,FaceLit不会商用,否则苹果才不会以论文的形式发表。针对FaceLit本身,也有网友表示,除了LLM,其他都是浮云,他们(苹果)如果不开发LLM,就没有未来。但这位网友同时也说,苹果可能已经在做(LLM)了。相应的,也有网友称人们“低估了苹果在AI领域的深度”。所以各位网友对苹果在AI领域还有什么样的期待呢?...PC版:https://www.cnbeta.com.tw/articles/soft/1357791.htm手机版:https://m.cnbeta.com.tw/view/1357791.htm

封面图片

国泰君安:“AI 生成 3D” 的突破将对游戏产业产生实质性影响,关注行业 “AI 拐点”

国泰君安:“AI生成3D”的突破将对游戏产业产生实质性影响,关注游戏行业“AI拐点”国泰君安研报表示,“AI生成3D”是今年生成式AI发展对游戏赛道有重要影响的一环,特别是当前3D数据资产和技术持续积累,“AI生成视频”快速发展。“AI生成3D”的突破将对游戏产业产生实质性影响,这种变化不仅是在降本增效,还体现在游戏产业趋势的变化下。建议重视如下思路:1.继续重视小游戏平台价值,以及具备优秀的发行和运营能力的公司;2.具备突出3D开发能力或优质IP的大型游戏公司;3.积极布局AI的游戏公司;4.MR及3D资产产业链相关公司。

封面图片

一个无限高质量3D数据的生成器,使用程序生成的无限逼真世界

一个无限高质量3D数据的生成器,使用程序生成的无限逼真世界100%的程序化生成,不需要外部资产,也不依赖AI。并且是免费开源的。生成质量非常高,可以说达到以假乱真的地步!甚至是花瓣上的皱纹都可定制Infinigen由普林斯顿视觉和学习实验室开发,Infinigen的主要特性和功能包括:1、程序化:Infinigen是一个程序生成器,它完全使用随机的数学规则来创建所有的形状和材料,从宏观结构到微观细节。Infinigen可以创建无限的变化。用户可以通过覆盖随机化的默认参数来完全控制资产的生成。2、多样化:Infinigen为自然世界中的多样化对象和场景提供生成器,包括植物、动物、地形,以及火、云、雨、雪等自然现象。当前对自然的关注是由于观察到哺乳动物的视觉在自然世界中进化。然而,预计Infinigen将随着时间的推移扩展到覆盖建筑环境和人造物体。3、真实的几何形状:Infinigen针对计算机视觉研究进行了优化,特别是3D视觉。Infinigen不使用bump/normal-maps、全透明度或其他伪造几何细节的技术。Infinigen的所有细微的几何细节都是真实的,确保了精确的3D地面真实性。4、自动注释:Infinigen可以自动生成各种计算机视觉任务的高质量注释,包括光流、3D场景流、深度、表面法线、全景分割、遮挡边界。因为用户可以完全访问渲染过程,所以注释很容易定制。#生成器

封面图片

全球最大的游戏引擎Unity要出生成式AI工具了 能不能做好3D是个问题

全球最大的游戏引擎Unity要出生成式AI工具了能不能做好3D是个问题Unity中国AI技术负责人暴林超在演讲中谈到这一构想,“通过建立大语言模型和用户交互这样一个更自然的交互界面,来串联起我们的3DAIGC模型,以及Unity引擎内部可以提供的一些工具(如程序化生成等)。同时我们会探索将用户的隐私数据更安全地在本地做管理,在保护用户隐私的情况下,用户可以实现在本地部署引擎,并以这样的方式接入Copilot。”“Copilot”(直译为“副驾驶”)的说法目前被广泛用于GitHubCopilot和Microsoft365Copilot等产品,几乎已经成为AI辅助工具的代称。不过从Unity技术开放日当天透露的信息来看,U3DCopilot目前还只停留在构想,Unity中国并没有在现场进行任何相关演示。这场活动是Unity时隔两年之后再次举办线下巡回技术开放日。“前两年大家还都在讲元宇宙,今年都在讲AIGC,几乎是引爆了整个(游戏)行业。”Unity中国CEO张俊波在当天的致辞中讲到。不仅是行业,Unity的中国业务也在过去两年经历了较大变化。去年8月,Unity中国宣布成立,引入了阿里巴巴、中国移动、吉比特、米哈游、OPPO、佳都科技和抖音等投资者,成为Unity在中国的合资公司。张俊波的title从“Unity大中华区总经理”变为“Unity中国总裁兼首席执行官”,负责AI技术的暴林超则是在不久前刚加入Unity中国。“这也是我们关注中国开发者的新起点。”张俊波在致辞中说。Unity中国关注生成式AI的步调和Unity基本一致。Unity可以说是最早宣布将投入生成式AI大模型的大型游戏引擎。今年3月举办的GDC开发者大会上,Unity发布了一段名叫“UnityAI”的视频。视频以文本框的形式输入了一系列指令,包括“生成一个女性3D角色”,“生成一片拥有灰暗天空的大型地貌”,“慢慢推进摄像机,并加入戏剧性的光线”等等,暗示这些效果和资产未来都可以跳过繁琐的代码与调试,在Unity中通过文字prompt直接生成。UnityCEOJohnRiccitiello在接受采访时同时提到,未来不排除会开放一片AIGC专用的交易市场,供开发者在其中买卖AI工具。而后在今年5月发布第一季度财报时,Unity在股东信中专门开辟了“Gen-AI(AI时代)”专栏来回答股东提问。比如提到会在今年内推出使用自然语言的UI页面,而“一键生成游戏”的工具现阶段还不太可能,其目前对AI工具的定位更多是草稿的快速生成助手。此外,Unity还计划将引擎打造为一个供开发商训练AI模型的工具,帮助开发商“按照自己的需求进行数据创造、模拟和训练”。Unity中国频繁因为AI被关注也是最近一个月的事情。5月初,Unity中国在采访中透露已建立了中国本土AI研发团队,其负责人也开始频繁出现在各种关于AIGC的活动上,如张俊波“有八成原画师下岗”和“今后的游戏公司不一定会像现在那么集中在几个大厂等巨头公司”等言论也频繁在行业中被提及。而在6月8日举办的北京站技术开放日上,Unity中国引擎技术负责人左瑞文也在介绍中明确提到,Unity中国在今年的首要任务——研发Unity中国版引擎的三大方向之一,就是以生成式AI为主的智能化(其他两个方向是本地化和云化)。当然这其中不乏难点,难点在于3D内容开发的复杂性。暴林超在当天的AI主题演讲中先是回溯了生成式AI在近一年发展的节点性事件,介绍了stablediffusion和ChatGPT两大热门生成式AI工具的核心技术原理,以及AI技术从“领域专用AI小模型”到“生成式AI大模型”、生成式AI大模型从“通用”到“专用”的发展趋势,接着便谈到了3D生成式AI的三大技术难点:第一,3D的数据表示有非常多的选择,如体素、点云、Mesh、SDF和隐式场等,尽管经常会有针对不同数据表示的论文发布,但距离达到生产质量都还有一定差距;第二,3D数据的呈现依赖也非常多,也就是说,要在引擎里渲染出一个比较好的效果,不但取决于模型本身,还受到贴图、材质、Shader、光照、动画和VFX等的影响,这些也给3D的AIGC生产带来了很多困难;第三,3D高质量数据相对而言比较稀缺,而1D或2D维度不管是文本还是图片生成,数据量都是巨大的,目前3D的数据量还远远达不到这些量级。由于Unity引擎主要专注于游戏中3D技术的应用,这些3D数据的难点也都给其生成式AI工具的开发带来了挑战。暴林超接着提到了Unity中国3D生成式AI主要的几个技术方向:分别是3D模型、材质和贴图、3D场景、3D虚拟人,还有隐式场及神经渲染。就目前来说,Unity引擎界面依然非常复杂,看上去仍不够“智能”。未来Unity中国能否将以上存在在PPT和演示视频中的构想一一实现,将决定它究竟是履行了“帮助开发者更好地应对技术和市场革新的天然使命”,还是只是在取悦投资者。...PC版:https://www.cnbeta.com.tw/articles/soft/1364661.htm手机版:https://m.cnbeta.com.tw/view/1364661.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人