Meta最新的开源项目DINOv2：具有自我监督学习功能的最先进的计算机视觉模型这款全新的自监督视觉Transformer模型可以作为几乎所有计算机视觉任务的主干模型

18:15 · Apr 21, 2023 · Fri

Meta最新的开源项目DINOv2：具有自我监督学习功能的最先进的计算机视觉模型

这款全新的自监督视觉Transformer模型可以作为几乎所有计算机视觉任务的主干模型。无需微调。

• 无需大量标注数据，即可训练计算机视觉模型。
• 多功能主干：图像分类、分割、图像检索和深度估计。
• 直接从图像中学习特征，而无需依赖文本描述，这有助于更好地理解局部信息。
• 可以从任何图像集合中学习。
• DINOv2 的预训练版本已经上线，并在众多任务中与 CLIP 和 OpenCLIP 竞争。

Meta继SAM（Segment Anything）网页链接之后又一计算机视觉领域的重量级开源项目。

demo | 主页 | 源码 | Paper