Meta 开源计算机视觉基础模型 DINOv2

Meta 开源计算机视觉基础模型 DINOv2 Meta 开源了它的计算机视觉基础模型 DINOv2,源代码托管在上,和 Meta 近期开源的其它 AI 模型一样,采用的是非商用的 CC-BY-NC 4.0 许可证。DINOv2 是基于 Vision Transformer (ViT)架构,使用一个包含 1.42 亿幅图像的精选数据集进行预训练,可用于图像分类、视频动作识别、语义分割和深度估计等任务。Meta 称 DINOv2 模型的速度是旧方法的两倍,使用的内存只有旧方法的三分之一。测试显示它相比其它同类模型有显著改进。来源 , 来自:雷锋 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

相关推荐

封面图片

Meta最新的开源项目DINOv2:具有自我监督学习功能的最先进的计算机视觉模型

Meta最新的开源项目DINOv2:具有自我监督学习功能的最先进的计算机视觉模型 这款全新的自监督视觉Transformer模型可以作为几乎所有计算机视觉任务的主干模型。无需微调。 • 无需大量标注数据,即可训练计算机视觉模型。 • 多功能主干:图像分类、分割、图像检索和深度估计。 • 直接从图像中学习特征,而无需依赖文本描述,这有助于更好地理解局部信息。 • 可以从任何图像集合中学习。 • DINOv2 的预训练版本已经上线,并在众多任务中与 CLIP 和 OpenCLIP 竞争。 Meta继SAM(Segment Anything) 网页链接 之后又一计算机视觉领域的重量级开源项目。 |||

封面图片

【Meta发布「分割一切」AI 模型,CV或迎来GPT-3时刻】「对于 Meta 的这项研究,我认为是计算机视觉领域的 GPT-

【Meta发布「分割一切」AI 模型,CV或迎来GPT-3时刻】「对于 Meta 的这项研究,我认为是计算机视觉领域的 GPT-3 时刻之一。它已经了解了物体的一般概念,即使对于未知对象、不熟悉的场景(例如水下图像)和模棱两可的情况下也能进行很好的图像分割。最重要的是,模型和数据都是开源的。」 #抽屉IT

封面图片

计算机视觉应用基础 - 带源码课件

计算机视觉应用基础 - 带源码课件 描述:溯本清源,把握问题的本质,理解经典方法的思想精髓,举一反三。 链接: 大小:NG 标签:#学习 #知识 #课程 #资源 #计算机视觉应用基础 #quark 频道:@yunpanshare 群组:@yunpangroup

封面图片

【深蓝学院】计算机视觉应用基础

【深蓝学院】计算机视觉应用基础 描述:溯本清源,把握问题的本质,理解经典方法的思想精髓,举一反三。 链接: 大小:未统计 标签:#学习 #知识 来自:雷锋 频道:@Aliyundrive_Share_Channel 群组:@alyd_g 投稿:@AliYunPanBot

封面图片

斯坦福《CS231A计算机视觉:从3D重建到识别》课程资料

斯坦福《CS231A计算机视觉:从3D重建到识别》课程资料 介绍计算机视觉中的概念和应用,主要涉及几何和3D理解。主题包括:相机和投影模型,低级图像处理方法,如滤波和边缘检测;中级视觉主题,如分割和聚类;从立体进行形状重建;高级视觉主题,例如学习的低级视觉表示;深度估计和光学/场景流;6D姿势估计和对象跟踪。先决条件:线性代数,基本概率和统计。 || #计算机视觉

封面图片

计算机视觉应用基础 - 带源码课件

计算机视觉应用基础 - 带源码课件 描述:溯本清源,把握问题的本质,理解经典方法的思想精髓,举一反三。 链接: 大小:NG 标签:#学习 #知识 #课程 #资源 来自:雷锋 频道:@Aliyundrive_Share_Channel 群组:@alyd_g 投稿:@AliYunPanBot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人