用语言对齐多模态信息,北大腾讯等提出LanguageBind,刷新多个榜单-机器之心

北京大学与腾讯等机构的研究者们提出了多模态对齐框架 ——LanguageBind。该框架在视频、音频、文本、深度图和热图像等五种不同模态的下游任务中取得了卓越的性能,刷榜多项评估榜单,这标志着多模态学习领域向着「大一统」理念迈进了重要一步。

via 机器之心 文中所提及项目

投稿:@ZaiHuaBot
频道:@TestFlightCN
 
 
Back to Top