用于细粒度视觉分类的类别一致多粒度特征的渐进式学习。

Progressive Learning of Category-Consistent Multi-Granularity Features for Fine-Grained Visual Classification.

出版信息

IEEE Trans Pattern Anal Mach Intell. 2022 Dec;44(12):9521-9535. doi: 10.1109/TPAMI.2021.3126668. Epub 2022 Nov 7.

DOI:10.1109/TPAMI.2021.3126668

Abstract

Fine-grained visual classiﬁcation (FGVC) is much more challenging than traditional classiﬁcation tasks due to the inherently subtle intra-class object variations. Recent works are mainly part-driven (either explicitly or implicitly), with the assumption that fine-grained information naturally rests within the parts. In this paper, we take a different stance, and show that part operations are not strictly necessary - the key lies with encouraging the network to learn at different granularities and progressively fusing multi-granularity features together. In particular, we propose: (i) a progressive training strategy that effectively fuses features from different granularities, and (ii) a consistent block convolution that encourages the network to learn the category-consistent features at specific granularities. We evaluate on several standard FGVC benchmark datasets, and demonstrate the proposed method consistently outperforms existing alternatives or delivers competitive results. Codes are available at https://github.com/PRIS-CV/PMG-V2.

摘要

细粒度视觉分类（FGVC）比传统分类任务更具挑战性，因为其内在的类内对象变化非常细微。最近的工作主要是基于部件的（无论是显式的还是隐式的），其假设是细粒度信息自然存在于部件内。在本文中，我们采取了不同的立场，并表明部件操作不是严格必需的 - 关键在于鼓励网络以不同的粒度进行学习，并逐步融合多粒度特征。具体来说，我们提出了：（i）一种有效的融合不同粒度特征的渐进式训练策略，以及（ii）一种一致的块卷积，鼓励网络在特定粒度上学习类别一致的特征。我们在几个标准的 FGVC 基准数据集上进行了评估，结果表明，所提出的方法始终优于现有方法，或者能够提供有竞争力的结果。代码可在 https://github.com/PRIS-CV/PMG-V2 上获得。

相似文献

Progressive Learning of Category-Consistent Multi-Granularity Features for Fine-Grained Visual Classification.用于细粒度视觉分类的类别一致多粒度特征的渐进式学习。

IEEE Trans Pattern Anal Mach Intell. 2022 Dec;44(12):9521-9535. doi: 10.1109/TPAMI.2021.3126668. Epub 2022 Nov 7.

Multi-Granularity Part Sampling Attention for Fine-Grained Visual Classification.用于细粒度视觉分类的多粒度部分采样注意力机制

IEEE Trans Image Process. 2024;33:4529-4542. doi: 10.1109/TIP.2024.3441813. Epub 2024 Aug 23.

A Multi-Group Multi-Stream attribute Attention network for fine-grained zero-shot learning.一种用于细粒度零样本学习的多组多流属性注意网络。

Neural Netw. 2024 Nov;179:106558. doi: 10.1016/j.neunet.2024.106558. Epub 2024 Jul 20.

Image local structure information learning for fine-grained visual classification.细粒度视觉分类中的图像局部结构信息学习。

Sci Rep. 2022 Nov 10;12(1):19205. doi: 10.1038/s41598-022-23835-0.

Cross-Part Learning for Fine-Grained Image Classification.用于细粒度图像分类的跨部分学习

IEEE Trans Image Process. 2022;31:748-758. doi: 10.1109/TIP.2021.3135477. Epub 2021 Dec 28.

Learning Cascade Attention for fine-grained image classification.学习级联注意力进行细粒度图像分类。

Neural Netw. 2020 Feb;122:174-182. doi: 10.1016/j.neunet.2019.10.009. Epub 2019 Oct 22.

Fine-Grained Self-Supervised Learning with Jigsaw puzzles for medical image classification.基于拼图的细粒度自监督学习在医学图像分类中的应用。

Comput Biol Med. 2024 May;174:108460. doi: 10.1016/j.compbiomed.2024.108460. Epub 2024 Apr 8.

AP-CNN: Weakly Supervised Attention Pyramid Convolutional Neural Network for Fine-Grained Visual Classification.AP-CNN：用于细粒度视觉分类的弱监督注意力金字塔卷积神经网络。

IEEE Trans Image Process. 2021;30:2826-2836. doi: 10.1109/TIP.2021.3055617. Epub 2021 Feb 12.

On the Eigenvalues of Global Covariance Pooling for Fine-Grained Visual Recognition.用于细粒度视觉识别的全局协方差池化的特征值研究

IEEE Trans Pattern Anal Mach Intell. 2023 Mar;45(3):3554-3566. doi: 10.1109/TPAMI.2022.3178802. Epub 2023 Feb 3.

Fine-grained classification based on multi-scale pyramid convolution networks.基于多尺度金字塔卷积网络的细粒度分类。

PLoS One. 2021 Jul 9;16(7):e0254054. doi: 10.1371/journal.pone.0254054. eCollection 2021.

引用本文的文献

Multi-class rice seed recognition based on deep space and channel residual network combined with double attention mechanism.基于深度空间与通道残差网络结合双注意力机制的多类别水稻种子识别

PLoS One. 2025 May 16;20(5):e0322699. doi: 10.1371/journal.pone.0322699. eCollection 2025.

An inherently interpretable deep learning model for local explanations using visual concepts.基于视觉概念的可解释深度学习模型用于局部解释。

PLoS One. 2024 Oct 28;19(10):e0311879. doi: 10.1371/journal.pone.0311879. eCollection 2024.

Identification of Pepper Leaf Diseases Based on TPSAO-AMWNet.基于TPSAO-AMWNet的辣椒叶部病害识别

Plants (Basel). 2024 Jun 6;13(11):1581. doi: 10.3390/plants13111581.

Dual-Dependency Attention Transformer for Fine-Grained Visual Classification.用于细粒度视觉分类的双依赖注意力变换器

Sensors (Basel). 2024 Apr 6;24(7):2337. doi: 10.3390/s24072337.

Hybrid Granularities Transformer for Fine-Grained Image Recognition.用于细粒度图像识别的混合粒度Transformer

Entropy (Basel). 2023 Apr 1;25(4):601. doi: 10.3390/e25040601.

文献检索

告别复杂PubMed语法，用中文像聊天一样搜索，搜遍4000万医学文献。AI智能推荐，让科研检索更轻松。

立即免费搜索

文件翻译

保留排版，准确专业，支持PDF/Word/PPT等文件格式，支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述，25分钟生成高质量综述，智能提取关键信息，辅助科研写作。

立即免费体验

用于细粒度视觉分类的类别一致多粒度特征的渐进式学习。

Progressive Learning of Category-Consistent Multi-Granularity Features for Fine-Grained Visual Classification.

出版信息

相似文献

引用本文的文献

文献检索

文件翻译

深度研究

Suppr 超能文献

相似文献

引用本文的文献