Meta 开源计算机视觉基础模型 DINOv2
Meta开源计算机视觉基础模型DINOv2Meta开源了它的计算机视觉基础模型DINOv2,源代码托管在上,和Meta近期开源的其它AI模型一样,采用的是非商用的CC-BY-NC4.0许可证。DINOv2是基于VisionTransformer(ViT)架构,使用一个包含1.42亿幅图像的精选数据集进行预训练,可用于图像分类、视频动作识别、语义分割和深度估计等任务。Meta称DINOv2模型的速度是旧方法的两倍,使用的内存只有旧方法的三分之一。测试显示它相比其它同类模型有显著改进。来源,来自:雷锋频道:@kejiqu群组:@kejiquchat投稿:@kejiqubot