基于少量数据训练的自动编码器进行的开放式音频分类。

Open Set Audio Classification Using Autoencoders Trained on Few Data.

机构信息

Visualfy, 46181 Benisanó, Spain.

Computer Science Department, Universitat de València, 46100 Burjassot, Spain.

出版信息

Sensors (Basel). 2020 Jul 3;20(13):3741. doi: 10.3390/s20133741.

DOI:10.3390/s20133741

PMID:32635378

原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC7374438/

Abstract

Open-set recognition (OSR) is a challenging machine learning problem that appears when classifiers are faced with test instances from classes not seen during training. It can be summarized as the problem of correctly identifying instances from a known class (seen during training) while rejecting any unknown or unwanted samples (those belonging to unseen classes). Another problem arising in practical scenarios is few-shot learning (FSL), which appears when there is no availability of a large number of positive samples for training a recognition system. Taking these two limitations into account, a new dataset for OSR and FSL for audio data was recently released to promote research on solutions aimed at addressing both limitations. This paper proposes an audio OSR/FSL system divided into three steps: a high-level audio representation, feature embedding using two different autoencoder architectures and a multi-layer perceptron (MLP) trained on latent space representations to detect known classes and reject unwanted ones. An extensive set of experiments is carried out considering multiple combinations of openness factors (OSR condition) and number of shots (FSL condition), showing the validity of the proposed approach and confirming superior performance with respect to a baseline system based on transfer learning.

摘要

开集识别（OSR）是机器学习中的一个具有挑战性的问题，它出现在分类器面临训练中未见过的测试实例时。可以将其概括为正确识别来自已知类（在训练中见过）的实例，同时拒绝任何未知或不需要的样本（属于未见过的类）的问题。另一个在实际场景中出现的问题是小样本学习（FSL），当没有大量正样本可用于训练识别系统时，就会出现这种情况。考虑到这两个限制，最近发布了一个用于音频数据的 OSR 和 FSL 的新数据集，以促进针对解决这两个限制的解决方案的研究。本文提出了一个音频 OSR/FSL 系统，分为三个步骤：高级音频表示、使用两种不同自动编码器架构的特征嵌入以及在潜在空间表示上训练的多层感知机（MLP），用于检测已知类并拒绝不需要的类。考虑到开放性因素（OSR 条件）和样本数量（FSL 条件）的多种组合进行了广泛的实验，验证了所提出方法的有效性，并证实了相对于基于迁移学习的基线系统的优越性能。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/573f/7374438/e52d76aa56d4/sensors-20-03741-g001.jpg

相似文献

Open Set Audio Classification Using Autoencoders Trained on Few Data.基于少量数据训练的自动编码器进行的开放式音频分类。

Sensors (Basel). 2020 Jul 3;20(13):3741. doi: 10.3390/s20133741.

Recent Advances in Open Set Recognition: A Survey.开放集识别的最新进展：一项综述。

IEEE Trans Pattern Anal Mach Intell. 2021 Oct;43(10):3614-3631. doi: 10.1109/TPAMI.2020.2981604. Epub 2021 Sep 2.

HFM: A Hybrid Feature Model Based on Conditional Auto Encoders for Zero-Shot Learning.HFM：一种基于条件自动编码器的用于零样本学习的混合特征模型。

J Imaging. 2022 Jun 16;8(6):171. doi: 10.3390/jimaging8060171.

Adversarial Reciprocal Points Learning for Open Set Recognition.用于开放集识别的对抗性互反点学习

IEEE Trans Pattern Anal Mach Intell. 2022 Nov;44(11):8065-8081. doi: 10.1109/TPAMI.2021.3106743. Epub 2022 Oct 4.

Orientational Distribution Learning With Hierarchical Spatial Attention for Open Set Recognition.基于分层空间注意力的面向集识别的方向分布学习。

IEEE Trans Pattern Anal Mach Intell. 2023 Jul;45(7):8757-8772. doi: 10.1109/TPAMI.2022.3227913. Epub 2023 Jun 5.

Open Set Bioacoustic Signal Classification based on Class Anchor Clustering with Closed Set Unknown Bioacoustic Signals.基于带有闭集未知生物声学信号的类锚聚类的开集生物声学信号分类。

Annu Int Conf IEEE Eng Med Biol Soc. 2023 Jul;2023:1-4. doi: 10.1109/EMBC40787.2023.10340108.

Divergent Angular Representation for Open Set Image Recognition.用于开集图像识别的发散角表示

IEEE Trans Image Process. 2022;31:176-189. doi: 10.1109/TIP.2021.3128318. Epub 2021 Dec 2.

CORE: CORrelation-Guided Feature Enhancement for Few-Shot Image Classification.CORE：用于少样本图像分类的相关性引导特征增强

IEEE Trans Neural Netw Learn Syst. 2025 Feb;36(2):3098-3110. doi: 10.1109/TNNLS.2024.3355774. Epub 2025 Feb 6.

Multi-Learner Based Deep Meta-Learning for Few-Shot Medical Image Classification.基于多学习者的深度元学习用于少样本医学图像分类

IEEE J Biomed Health Inform. 2023 Jan;27(1):17-28. doi: 10.1109/JBHI.2022.3215147. Epub 2023 Jan 5.

Balancing Feature Alignment and Uniformity for Few-Shot Classification.用于少样本分类的平衡特征对齐与一致性

IEEE Trans Image Process. 2023 Nov 3;PP. doi: 10.1109/TIP.2023.3328475.

引用本文的文献

Few-Shot Emergency Siren Detection.突发紧急警笛检测。

Sensors (Basel). 2022 Jun 8;22(12):4338. doi: 10.3390/s22124338.

本文引用的文献

Recent Advances in Open Set Recognition: A Survey.开放集识别的最新进展：一项综述。

IEEE Trans Pattern Anal Mach Intell. 2021 Oct;43(10):3614-3631. doi: 10.1109/TPAMI.2020.2981604. Epub 2021 Sep 2.

Sparse Representation-Based Open Set Recognition.基于稀疏表示的开集识别。

IEEE Trans Pattern Anal Mach Intell. 2017 Aug;39(8):1690-1696. doi: 10.1109/TPAMI.2016.2613924. Epub 2016 Sep 27.

Probability Models for Open Set Recognition.开放式识别的概率模型。

IEEE Trans Pattern Anal Mach Intell. 2014 Nov;36(11):2317-24. doi: 10.1109/TPAMI.2014.2321392.

Distance-based image classification: generalizing to new classes at near-zero cost.基于距离的图像分类：以近乎零的成本推广到新类别。

IEEE Trans Pattern Anal Mach Intell. 2013 Nov;35(11):2624-37. doi: 10.1109/TPAMI.2013.83.

文献AI研究员

20分钟写一篇综述，助力文献阅读效率提升50倍。

立即体验

用中文搜PubMed

大模型驱动的PubMed中文搜索引擎

马上搜索

文档翻译

学术文献翻译模型，支持多种主流文档格式。

立即体验

基于少量数据训练的自动编码器进行的开放式音频分类。

Open Set Audio Classification Using Autoencoders Trained on Few Data.

机构信息

出版信息

相似文献

引用本文的文献

本文引用的文献

文献AI研究员

用中文搜PubMed

文档翻译

Suppr 超能文献

相似文献

引用本文的文献

本文引用的文献