AI根据人眼的反射图像重建3D场景

AI根据人眼的反射图像重建3D场景人眼的反射性质是一个未被充分重视的信息来源,马里兰大学帕克分校的研究员发现,通过AI模型和人类肖像中的眼睛反射,可以重建相机镜头之外的多个3D场景。所有健康成年人的角膜几何形状大致相同,如果计算图像中人类角膜的像素大小,就可以准确计算出他们眼睛的方位。利用这种判断力,研究员训练了一个眼睛反射的辐射场,为了消除重建中出现的虹膜,研究员同时训练AI学习了虹膜的2D纹理图来执行纹理分解。——频道:@TestFlightCN

相关推荐

封面图片

研究人员现在可以获取眼睛反射图像来对一个房间进行3D建模

研究人员现在可以获取眼睛反射图像来对一个房间进行3D建模在现在发表在预印本服务器arXiv上的一项研究中,研究人员展示了他们如何能够拍摄一个人在房间里移动的多张高清图像,然后放大看他们的角膜反射,翻转它们,去除颜色和虹膜可能增加的细节,处理它们以去除弧形镜面的失真,并使用它们来创建3D图像。当然,这些3D模型的分辨率不是很高;你可以知道这些物品是什么,但不是很详细,而且该团队必须使用特定的灯光来带出这种效果。而且很难说谁会需要这种技术,又是为了什么--就像一个硬塞进去的"碟中谍"类型的场景。研究人员想出了一个真实世界的场景来尝试这个装备:他们放大了麦莉-赛勒斯和LadyGaga的视频片段中的眼睛反射,希望利用高质量的特写视觉和有利的照明情况。但不幸的是,分辨率不够高,他们最接近的判断是,麦莉-赛勒斯可能是在看一个照明网格,而LadyGaga可能是在看一个形状非常像人的躯干的物体。无论哪种方式,这都是对人们能从一个场景中获得多少信息的一次尝试。这让我想起了麻省理工学院在2014年研究的一个疯狂的想法,他们通过拍摄薯片包的高速视频,分析其失真,建立一个音频波形,设法重建一个密封房间里的一些音频。...PC版:https://www.cnbeta.com.tw/articles/soft/1367869.htm手机版:https://m.cnbeta.com.tw/view/1367869.htm

封面图片

AI根据人类大脑活动重建视觉图像

AI根据人类大脑活动重建视觉图像这项研究利用了开源的StableDiffusion模型,由日本大阪大学的科学家完成。该AI模型能够有效地生成高质量图像,并且能够捕捉到图像中不同层次的特征,从低级的边缘和纹理到高级的语义和场景。他们使用功能性磁共振成像(fMRI)记录了人类大脑在观看不同类型的图片时产生的神经活动。然后设计了一个AI神经网络,学习大脑活动与StableDiffusion的潜在表示(图片的多维特征)之间的映射关系。通过这个网络,他们能够从大脑活动中重建出与原始图片非常相似的图像。投稿:@ZaiHuabot频道:@TestFlightCN

封面图片

科学家开始进行3D打印义眼的试验

科学家开始进行3D打印义眼的试验机器制作的眼睛仍然需要由熟练的眼科医生进行微调,以达到完美的配合和完成,但这项技术肯定有其好处,除了周转速度更快之外,3D打印的眼睛在丢失或损坏的情况下也能迅速复制。一些患者可能也希望有一个备份,以确保安心,它们也比手工制作的变体更实惠。假眼可以帮助那些因外伤、癌症或天生没有眼睛而失去眼睛的病人恢复信心。克雷格-法尔因癌症失去了一只眼睛,他说社会和情感后果可能是最难处理的。他将他的手工制作的眼眶假体保留在社交活动中,以防止在日常使用中可能出现的损坏。正在进行的试验涉及10名患者,如果成功的话,接下来可能会有更大的临床试验。赫斯顿生物制造研究所的高级研究员詹姆斯-诺瓦克博士不相信机器会取代人类。昆士兰卫生部负责制作和涂抹义眼的眼科医生尼古拉斯-普尔斯也不相信。诺瓦克说,结合了3D打印机和人类所能做到的最佳元素的混合方法是最好的方法。...PC版:https://www.cnbeta.com.tw/articles/soft/1366999.htm手机版:https://m.cnbeta.com.tw/view/1366999.htm

封面图片

首创AI裸眼3D手机 中兴远航3D开售 售价1499元

首创AI裸眼3D手机中兴远航3D开售售价1499元中兴远航3D配有专属物理按键,一键即可进入指定App(如咪咕视频),且拥有3D观影区。AI方面,该机支持AI智慧语音、AI智慧翻译、AI魔法消除等功能。核心配置上,中兴远航3D采用6.58英寸水滴屏,2408*1080分辨率,支持120Hz刷新率和240Hz触控采样率,后置5000万像素AI双摄。该机搭载展锐T760 5G处理器,采用6nm工艺,最高主频2.2GHz,支持SA/NSA双模5G,内置4500mAh电池,支持33W快充。...PC版:https://www.cnbeta.com.tw/articles/soft/1436174.htm手机版:https://m.cnbeta.com.tw/view/1436174.htm

封面图片

Opus.ai正在开发一种根据文本驱动的3D世界开发方法

Opus.ai正在开发一种根据文本驱动的3D世界开发方法今天,大量基于人工智能的工具有一个类似的目标:精简、自动化或简化以前复杂的手工任务。从创意到纯粹的技术,目前可用的人工智能工具可以做许多事情,从生成书面内容和图像到基于特定算法、文本输入和其他可配置参数的新应用程序代码。Opus.ai希望继续这一趋势,这次是帮助用户开发复杂的虚拟世界,只需他们的语言。人工智能爱好者和Twitter用户@nonmayorpete是以人工智能为中心的通讯《神经元日报》的所有者,他在周三上午推送了一段Opus.ai的操作视频。这段一分钟的视频在左下角醒目地显示了技术预览的字样,快速预览了Opus.ai的能力,即采取正常的描述性内容,并利用它来实时创建3D模型和资产。创建构建3D环境所需的框架、纹理、照明、阴影等不是一项小任务。成功构建3D环境的能力需要熟练的3D建模人员和开发人员对包括几何学、解剖学、纹理和照明等概念的理解,以及对模型开发中使用的工具、语法和优化方法的技术理解。Opus.ai声称将建立这些环境所需的开发成本和资源要求降到最低,并表示可以用传统开发成本的1/10创建虚拟世界。当被问及使用该工具的硬件要求时,Opus.ai媒体团队简单地回答说:"......如果你能运行TikTok或YouTube,你就能运行这个。"该技术专注于为游戏玩家、艺术家、讲故事的人和其他创作者提供工具,以快速、轻松地创建3D形态的世界和资产。Opus.ai生成的内容具有创建动态照明、相机控制、地形、树木和动物、建筑、道路以及人形和动画角色的能力,只需使用用户的文本输入。这一概念可以打破缺乏这种类型的开发技能或资源的创作者所面临的传统的进入壁垒。但现在还不要太兴奋,因为还没有正式的发布日期。然而,该公司正在接受申请加入Opus.ai的邮件列表,以及最终的早期访问试验。在那之前,创作者将只能借助于诸如最新发布的虚幻引擎5.2等工具。...PC版:https://www.cnbeta.com.tw/articles/soft/1352405.htm手机版:https://m.cnbeta.com.tw/view/1352405.htm

封面图片

新型人工智能算法可在5秒钟内从2D图像中创建3D模型

新型人工智能算法可在5秒钟内从2D图像中创建3D模型研究人员创建了首个大型重建模型(LRM),他们认为该模型能够通过单张二维图像预测三维模型的形状,而且只需5秒钟即可完成。研究人员在论文中解释说,以前的三维生成模型是在专注于单一图像类别的小规模数据集上进行训练的。相反,他们的LRM模型具有高度可扩展性、基于变换器的架构,拥有5亿个可学习参数,并已在Objaverse和MVImgNet数据集中的约100万个3D物体上进行了训练。研究人员解释说,大容量模型和大规模训练数据的结合为LRM算法提供了"高度通用"的内容创建能力。论文称,该模型能够从包括真实世界照片在内的各种测试图像中生成"高质量"的三维重建。此外,LRM还能将"正常"图像和由DALL-E和StableDiffusion等人工智能服务生成的视觉拼凑图像作为其输入二维模型。该研究的第一作者洪一聪认为,LRM是单图像三维重建领域的重大突破。这种人工智能算法可以从视频或形状图像中生成详细的几何图形,并保留木纹等复杂纹理。研究人员指出,LRM具有潜在的"变革"能力,可以应用于设计、娱乐和游戏等众多行业。设计师或三维艺术家可以简化三维建模过程,大大缩短生成视频游戏或动画资产所需的时间。在快速发展的行业中创建三维内容已成为一项挑战,人工智能公司正急于提供潜在的解决方案,如StabilityAI最近推出的Stable3D服务。LRM还能使3D建模的工作普及化,因为"普通"用户有可能通过智能手机拍摄的照片制作出高度精细的模型。尽管LRM仍面临挑战,例如图像隐藏部分的纹理模糊,但它为创意和商业机会开辟了广阔天地。研究人员提供了一个页面,上面有视频演示和交互式3D网格,展示LRM目前能做什么:https://yiconghong.me/LRM/...PC版:https://www.cnbeta.com.tw/articles/soft/1396051.htm手机版:https://m.cnbeta.com.tw/view/1396051.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人