英伟达发布 LATTE3D 模型 1 秒生成高质量 3D 效果

英伟达发布LATTE3D模型1秒生成高质量3D效果英伟达AI研究副总裁SanjaFidler所属位于多伦多的AI实验室团队在GTC2024春季场的座谈活动中,发布了LATTE3D模型并于现场进行实机展示,该技术能够高效率通过文本提示词生成3D模型,在搭配英伟达RTXA6000GPU的情况下能够几乎即时(不到1秒时间)生成3D模型,3D形状可以随意放大、旋转,360度无死角。“一年前,AI模型需要1小时才能生成这种质量的3D视觉效果,而目前的技术水平大约是10到12秒。”SanjaFidler说。

相关推荐

封面图片

One-2-3-45:45秒内将任何单一的2D图像转化为3D效果

One-2-3-45:45秒内将任何单一的2D图像转化为3D效果使用一个特殊的模型(视图条件的2D扩散模型)来从原始的2D图片生成多个不同角度的2D图像。这就像是从不同的角度看同一个物体。然后,他们使用一个基于SDF(有符号距离函数)的神经网络模型,根据这些多视图图像来构建出3D模型。这就像是将这些不同角度的2D图像"堆叠"起来,形成一个完整的3D形状。与其他现有的方法相比,这种方法有几个优点:●速度快:它可以在很短的时间内生成3D模型,比其他方法快很多。●几何形状好:生成的3D模型的形状更接近真实物体的形状。●一致性好:从不同角度看,生成的3D模型的外观更一致。●紧密遵循输入图像:生成的3D模型更准确地反映了原始2D图片的内容。此外,这种方法还可以与其他的AI模型(如文本到图像的模型)结合使用,从而实现从文本描述直接生成3D模型的功能。https://one-2-3-45.github.io/来自:雷锋频道:@kejiqu群组:@kejiquchat投稿:@kejiqubot

封面图片

一个无限高质量3D数据的生成器,使用程序生成的无限逼真世界

一个无限高质量3D数据的生成器,使用程序生成的无限逼真世界100%的程序化生成,不需要外部资产,也不依赖AI。并且是免费开源的。生成质量非常高,可以说达到以假乱真的地步!甚至是花瓣上的皱纹都可定制Infinigen由普林斯顿视觉和学习实验室开发,Infinigen的主要特性和功能包括:1、程序化:Infinigen是一个程序生成器,它完全使用随机的数学规则来创建所有的形状和材料,从宏观结构到微观细节。Infinigen可以创建无限的变化。用户可以通过覆盖随机化的默认参数来完全控制资产的生成。2、多样化:Infinigen为自然世界中的多样化对象和场景提供生成器,包括植物、动物、地形,以及火、云、雨、雪等自然现象。当前对自然的关注是由于观察到哺乳动物的视觉在自然世界中进化。然而,预计Infinigen将随着时间的推移扩展到覆盖建筑环境和人造物体。3、真实的几何形状:Infinigen针对计算机视觉研究进行了优化,特别是3D视觉。Infinigen不使用bump/normal-maps、全透明度或其他伪造几何细节的技术。Infinigen的所有细微的几何细节都是真实的,确保了精确的3D地面真实性。4、自动注释:Infinigen可以自动生成各种计算机视觉任务的高质量注释,包括光流、3D场景流、深度、表面法线、全景分割、遮挡边界。因为用户可以完全访问渲染过程,所以注释很容易定制。#生成器

封面图片

【英伟达推出面向大语言模型和生成式 AI 的云服务产品】

【英伟达推出面向大语言模型和生成式AI的云服务产品】英伟达宣布推出一组云服务产品,能够使企业构建、优化和运行定制的大型语言模型和生成式AI模型。GettyImages、Morningstar、Quantiphi和Shutterstock等公司将创建和使用利用新的NVIDIAAIFoundations服务构建的AI模型、应用和服务。企业还可使用NVIDIANeMo™语言服务和NVIDIAPicasso图像、视频和3D服务来构建专用的、特定领域的生成式AI应用,用于智能聊天和客户支持、专业内容创作、数字模拟等。英伟达还宣布了用于生物学的NVIDIABioNeMo™云服务的新模型。此外,英伟达还推出了针对生成式AI应用进行优化的四种推理平台,可帮助开发者快速构建专门的、由AI驱动的应用。

封面图片

NVIDIA新AI模型可将视频生成高精模型 3D扫描效率剧增

NVIDIA新AI模型可将视频生成高精模型3D扫描效率剧增据悉,Neuralangelo模型之所以能够有着这样的效果,是因为它采用了即时神经绘图,并利用了自家的InstantNeRF技术。这使得它即使是面对于低对比度的视频,也可以从中捕捉到微妙的细节,并转换为更具备商业价值的3D模型。对于3D模型扫描来说,该技术的诞生,将改变目前高精度扫描以手动雕刻为主的产出流程,从而让开发人员能够以更高的效率,制作精细物体的数字孪生。据不出意外,NVIDIA将在6月18日至22日举办的CVPR(omputerVisionandPatternRecognition,即电脑视觉与样式辨识)大会上,正式发布Neuralangelo模型。...PC版:https://www.cnbeta.com.tw/articles/soft/1363115.htm手机版:https://m.cnbeta.com.tw/view/1363115.htm

封面图片

Stability AI 太惨了老是发消息被忽略,昨晚他们还跟Tripo AI 联合推出了 TripoSR 3D 生成模型,可以

StabilityAI太惨了老是发消息被忽略,昨晚他们还跟TripoAI联合推出了TripoSR3D生成模型,可以在不到1秒的时间里生成高质量的3D模型。TripoSR的推理只需要极低的算力,甚至都不需要GPU,极大的降低了生产成本。权重模型允许商业化使用。性能:TripoSR可以在其他模型所需时间的一小部分时间内创建详细的3D模型。在NvidiaA100上进行测试时,它可以在大约0.5秒内生成初步质量的3D输出(纹理网格),表现优于其他开放的图像到3D模型,如OpenLRM。技术细节:训练数据准备包括多种数据渲染技术,更贴近真实世界中图像的分布,显著提高了模型的泛化能力。精心策划了一个CC-BY,即Objaverse数据集的高质量子集,用于训练数据。在模型方面,还对基础LRM模型进行了多项技术改进,包括通道数优化、蒙版监督和更高效的裁剪渲染策略。详细信息:

封面图片

OpenAI发布Shap・E模型:通过输入文本创建逼真3D模型

OpenAI发布Shap・E模型:通过输入文本创建逼真3D模型OpenAI最近发布了名为Shap・E的模型,可以通过输入文本创建逼真且多样化的3D模型。这种模型与现有的只能输出点云或体素的模型不同,可以生成高质量的3D资产,具有细粒度纹理和复杂形状。Shap・E不仅仅是一个3D模型生成器,而且可以直接生成隐式函数的参数,这些参数可以用于渲染纹理网格和神经辐射场(NeRF)。NeRF是一种具有隐式场景表示的新型视场合成技术,在计算机视觉领域引起了广泛的关注。它可以用于视图合成和三维重建,广泛应用于机器人、城市地图、自主导航、虚拟现实/增强现实等领域。值得注意的是,Shap・E模型还可以生成神经辐射场,这是一种新型的三维场景表示方法。通过这种方法,Shap・E可以呈现更加真实的光照效果和材质感,让3D图像更加生动、逼真。未来,这种模型可能会被广泛应用于游戏、电影、建筑等领域,为人们带来更加精彩、逼真的视觉体验。#AI来源,https://github.com/openai/shap-e来自:雷锋频道:@kejiqu群组:@kejiquchat投稿:@kejiqubot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人