近日,国际人工智能顶级会议NeurIPS(The Thirty-fifth Conference on Neural Information Processing Systems)官方发布了接受论文列表。实验室2019级博士生陈使明作为第一作者撰写的论文“HSVA: Hierarchical Semantic-Visual Adaptation for Zero-Shot Learning”被该会议全文录用。
NeurIPS(The Annual Conference on Neural Information Processing Systems, CCF-A)是人工智能与机器学习最权威的国际专业学会之一,以投稿难度大、录用论文偏理论著称,在业内具有极高的评价。作为全球备受瞩目的AI领域顶会,这届NeurIPS在论文投稿和评审机制上做了一些重要改革,如使用OpenReview系统提交稿件、多轮讨论机制、录用论文审稿意见公开等。今年共有9122篇有效论文投稿,总接受率为26%。
零样本学习(Zero-shot Learning, ZSL)是机器学习里面的基础性研究问题,在自然语言处理、计算机视觉领域均有应用需求。ZSL旨在通过运用已学到的已知类知识去认知未知类知识,其关键在于学习视觉和语言之间的映射关系(例如,将视觉信息和语义信息映射到一个公共空间中进行对准)。然而当前基于公共空间学习 (Common Space Learning)的零样本学习方法使用单步域适应 (One-step Adaptation)的方式进行分布对准(Distribution Alignment),从而忽略了视觉和语义这两种异构特征之间同时存在流形结构和分布的差异(Structure and Distribution Variations),不可避免的造成视觉和语义特征映射在不同的子流形中,使得视觉和语义的映射关系不准确。为解决此问题,本文提出一种基于层次视觉-语义域适应的学习模型,同时对不同模态的特征进行结构和分布的对准,从而学习一个本真的公共空间以提供视觉-语义的映射关系准确性并提高零样本学习精度。并通过足够的定性和定量实验验证所提出方法的有效性。
论文地址:https://arxiv.org/abs/2109.15163;
论文代码:https://github.com/shiming-chen/HSVA;