近日,国际人工智能顶级会议IJCAI(The 30th International Joint Conference on Artificial Intelligence)官方发布了接受论文列表。实验室2019级硕士生王文杰作为第一作者撰写的论文“Norm-guided Adaptive Visual Embedding for Zero-Shot Sketch-Based Image Retrieval”被该会议全文录用。IJCAI(International Joint Conference on Artificial Intelligence, CCF-A)是人工智能与机器学习的权威国际专业学会之一,其投稿难度大,接受率低,在业内具有很高的评价。今年IJCAI共有4204篇有效论文投稿,绝大部分论文有至少5名专业审稿人进行双盲审稿,最终有587篇被接收,总接受率为13.9%。
零样本草图检索(Zero-shot Sketch-Based Image Retrieval,ZS-SBIR)是跨模态图像检索面向应用环境的拓展,其旨在通过运用学到的已见类知识去构建未见类的跨模态映射,其关键在于如何通过对已见类的映射关系进行修正和校准,进而使其在未见类上同时具有较高的匹配度和判别性。既有方法大多使用了额外的语言模型对标签进行向量化,并由此构建具有语言相似性信息的公共空间,然而其视觉相似性具有本质上的矛盾。为解决此问题,本文提出了一种基于视觉范数引导的自适应学习模型,通过将模态范数作为显式参考值来监督模型学习到更加平衡的公共空间,从而避开了语言模型对已见类相似关系的干扰,由视觉相似性关系对已见类映射关系进行建模,由此提高未见类的匹配准确性。
论文地址:https://www.ijcai.org/proceedings/2021/0153.pdf