Skip to main content

An Introduction to Vision-Language Modeling归纳了当前视觉语言模型的主要方法,即对比学习、掩码、生成式和利用预训练模型,阐述了各自的工作机制、优势和局限,为视觉语言模型研究提供指导