英伟达发布 LATTE3D 模型 1 秒生成高质量 3D 效果

英伟达发布LATTE3D模型1秒生成高质量3D效果英伟达AI研究副总裁SanjaFidler所属位于多伦多的AI实验室团队在GTC2024春季场的座谈活动中，发布了LATTE3D模型并于现场进行实机展示，该技术能够高效率通过文本提示词生成3D模型，在搭配英伟达RTXA6000GPU的情况下能够几乎即时（不到1秒时间）生成3D模型，3D形状可以随意放大、旋转，360度无死角。“一年前，AI模型需要1小时才能生成这种质量的3D视觉效果，而目前的技术水平大约是10到12秒。”SanjaFidler说。

在Telegram中查看

相关推荐

One-2-3-45：45秒内将任何单一的2D图像转化为3D效果

One-2-3-45：45秒内将任何单一的2D图像转化为3D效果使用一个特殊的模型（视图条件的2D扩散模型）来从原始的2D图片生成多个不同角度的2D图像。这就像是从不同的角度看同一个物体。然后，他们使用一个基于SDF（有符号距离函数）的神经网络模型，根据这些多视图图像来构建出3D模型。这就像是将这些不同角度的2D图像"堆叠"起来，形成一个完整的3D形状。与其他现有的方法相比，这种方法有几个优点：●速度快：它可以在很短的时间内生成3D模型，比其他方法快很多。●几何形状好：生成的3D模型的形状更接近真实物体的形状。●一致性好：从不同角度看，生成的3D模型的外观更一致。●紧密遵循输入图像：生成的3D模型更准确地反映了原始2D图片的内容。此外，这种方法还可以与其他的AI模型（如文本到图像的模型）结合使用，从而实现从文本描述直接生成3D模型的功能。https://one-2-3-45.github.io/来自：雷锋频道：@kejiqu群组：@kejiquchat投稿：@kejiqubot

一个无限高质量3D数据的生成器，使用程序生成的无限逼真世界

一个无限高质量3D数据的生成器，使用程序生成的无限逼真世界100%的程序化生成，不需要外部资产，也不依赖AI。并且是免费开源的。生成质量非常高，可以说达到以假乱真的地步！甚至是花瓣上的皱纹都可定制Infinigen由普林斯顿视觉和学习实验室开发，Infinigen的主要特性和功能包括：1、程序化：Infinigen是一个程序生成器，它完全使用随机的数学规则来创建所有的形状和材料，从宏观结构到微观细节。Infinigen可以创建无限的变化。用户可以通过覆盖随机化的默认参数来完全控制资产的生成。2、多样化：Infinigen为自然世界中的多样化对象和场景提供生成器，包括植物、动物、地形，以及火、云、雨、雪等自然现象。当前对自然的关注是由于观察到哺乳动物的视觉在自然世界中进化。然而，预计Infinigen将随着时间的推移扩展到覆盖建筑环境和人造物体。3、真实的几何形状：Infinigen针对计算机视觉研究进行了优化，特别是3D视觉。Infinigen不使用bump/normal-maps、全透明度或其他伪造几何细节的技术。Infinigen的所有细微的几何细节都是真实的，确保了精确的3D地面真实性。4、自动注释：Infinigen可以自动生成各种计算机视觉任务的高质量注释，包括光流、3D场景流、深度、表面法线、全景分割、遮挡边界。因为用户可以完全访问渲染过程，所以注释很容易定制。#生成器

【英伟达推出面向大语言模型和生成式 AI 的云服务产品】

【英伟达推出面向大语言模型和生成式AI的云服务产品】英伟达宣布推出一组云服务产品，能够使企业构建、优化和运行定制的大型语言模型和生成式AI模型。GettyImages、Morningstar、Quantiphi和Shutterstock等公司将创建和使用利用新的NVIDIAAIFoundations服务构建的AI模型、应用和服务。企业还可使用NVIDIANeMo™语言服务和NVIDIAPicasso图像、视频和3D服务来构建专用的、特定领域的生成式AI应用，用于智能聊天和客户支持、专业内容创作、数字模拟等。英伟达还宣布了用于生物学的NVIDIABioNeMo™云服务的新模型。此外，英伟达还推出了针对生成式AI应用进行优化的四种推理平台，可帮助开发者快速构建专门的、由AI驱动的应用。

NVIDIA新AI模型可将视频生成高精模型 3D扫描效率剧增

NVIDIA新AI模型可将视频生成高精模型3D扫描效率剧增据悉，Neuralangelo模型之所以能够有着这样的效果，是因为它采用了即时神经绘图，并利用了自家的InstantNeRF技术。这使得它即使是面对于低对比度的视频，也可以从中捕捉到微妙的细节，并转换为更具备商业价值的3D模型。对于3D模型扫描来说，该技术的诞生，将改变目前高精度扫描以手动雕刻为主的产出流程，从而让开发人员能够以更高的效率，制作精细物体的数字孪生。据不出意外，NVIDIA将在6月18日至22日举办的CVPR（omputerVisionandPatternRecognition，即电脑视觉与样式辨识）大会上，正式发布Neuralangelo模型。...PC版：https://www.cnbeta.com.tw/articles/soft/1363115.htm手机版：https://m.cnbeta.com.tw/view/1363115.htm

Stability AI 太惨了老是发消息被忽略，昨晚他们还跟Tripo AI 联合推出了 TripoSR 3D 生成模型，可以

StabilityAI太惨了老是发消息被忽略，昨晚他们还跟TripoAI联合推出了TripoSR3D生成模型，可以在不到1秒的时间里生成高质量的3D模型。TripoSR的推理只需要极低的算力，甚至都不需要GPU，极大的降低了生产成本。权重模型允许商业化使用。性能：TripoSR可以在其他模型所需时间的一小部分时间内创建详细的3D模型。在NvidiaA100上进行测试时，它可以在大约0.5秒内生成初步质量的3D输出（纹理网格），表现优于其他开放的图像到3D模型，如OpenLRM。技术细节：训练数据准备包括多种数据渲染技术，更贴近真实世界中图像的分布，显著提高了模型的泛化能力。精心策划了一个CC-BY，即Objaverse数据集的高质量子集，用于训练数据。在模型方面，还对基础LRM模型进行了多项技术改进，包括通道数优化、蒙版监督和更高效的裁剪渲染策略。详细信息：

OpenAI发布Shap・E模型：通过输入文本创建逼真3D模型

OpenAI发布Shap・E模型：通过输入文本创建逼真3D模型OpenAI最近发布了名为Shap・E的模型，可以通过输入文本创建逼真且多样化的3D模型。这种模型与现有的只能输出点云或体素的模型不同，可以生成高质量的3D资产，具有细粒度纹理和复杂形状。Shap・E不仅仅是一个3D模型生成器，而且可以直接生成隐式函数的参数，这些参数可以用于渲染纹理网格和神经辐射场(NeRF)。NeRF是一种具有隐式场景表示的新型视场合成技术，在计算机视觉领域引起了广泛的关注。它可以用于视图合成和三维重建，广泛应用于机器人、城市地图、自主导航、虚拟现实/增强现实等领域。值得注意的是，Shap・E模型还可以生成神经辐射场，这是一种新型的三维场景表示方法。通过这种方法，Shap・E可以呈现更加真实的光照效果和材质感，让3D图像更加生动、逼真。未来，这种模型可能会被广泛应用于游戏、电影、建筑等领域，为人们带来更加精彩、逼真的视觉体验。#AI来源，https://github.com/openai/shap-e来自：雷锋频道：@kejiqu群组：@kejiquchat投稿：@kejiqubot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人