Meta最新的开源项目DINOv2:具有自我监督学习功能的最先进的计算机视觉模型
Meta最新的开源项目DINOv2:具有自我监督学习功能的最先进的计算机视觉模型
这款全新的自监督视觉Transformer模型可以作为几乎所有计算机视觉任务的主干模型。无需微调。
• 无需大量标注数据,即可训练计算机视觉模型。
• 多功能主干:图像分类、分割、图像检索和深度估计。
• 直接从图像中学习特征,而无需依赖文本描述,这有助于更好地理解局部信息。
• 可以从任何图像集合中学习。
• DINOv2 的预训练版本已经上线,并在众多任务中与 CLIP 和 OpenCLIP 竞争。
Meta继SAM(Segment Anything) 网页链接 之后又一计算机视觉领域的重量级开源项目。
|||