• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基于结构码本的语音增强。

Speech enhancement using a structured codebook.

机构信息

Sri Sathya Sai Institute of Higher Learning, Prasanthi Nilayam AP 515134, India.

出版信息

J Acoust Soc Am. 2012 Oct;132(4):EL329-35. doi: 10.1121/1.4751987.

DOI:10.1121/1.4751987
PMID:23039573
Abstract

Codebook-based speech enhancement methods that use trained codebooks of speech and noise spectra provide good performance even under non-stationary noise conditions. A drawback, however, is their high computational cost. For every pair of speech and noise codebook vectors, a likelihood score indicating how well that pair matches the observation is computed. In this paper, a method that identifies and performs only relevant likelihood computations by imposing a hierarchical structure on the speech codebook is proposed. The performance of the proposed method is shown to be close to that of the original scheme but at a significantly lower computational cost.

摘要

基于码本的语音增强方法使用经过训练的语音和噪声谱码本来提供良好的性能,即使在非平稳噪声条件下也是如此。然而,其缺点是计算成本高。对于每一对语音和噪声码本向量,都会计算一个似然分数,指示该对向量与观察结果的匹配程度。本文提出了一种通过在语音码本上施加层次结构来识别和仅执行相关似然计算的方法。所提出的方法的性能被证明接近于原始方案,但计算成本显著降低。

相似文献

1
Speech enhancement using a structured codebook.基于结构码本的语音增强。
J Acoust Soc Am. 2012 Oct;132(4):EL329-35. doi: 10.1121/1.4751987.
2
Speech enhancement using a generic noise codebook.使用通用噪声码本来增强语音。
J Acoust Soc Am. 2012 Aug;132(2):EL161-7. doi: 10.1121/1.4737592.
3
Statistical voice activity detection in kernel space.基于核空间的统计语音活动检测。
J Acoust Soc Am. 2012 Oct;132(4):EL303-9. doi: 10.1121/1.4747325.
4
The optimal ratio time-frequency mask for speech separation in terms of the signal-to-noise ratio.基于信噪比的语音分离最优时频掩蔽比。
J Acoust Soc Am. 2013 Nov;134(5):EL452-8. doi: 10.1121/1.4824632.
5
Metrics for vector quantization-based parametric speech enhancement and separation.基于矢量量化的参数量化语音增强和分离的度量。
J Acoust Soc Am. 2013 May;133(5):3062-71. doi: 10.1121/1.4799004.
6
Model-based speech enhancement using a bone-conducted signal.基于模型的骨导信号语音增强。
J Acoust Soc Am. 2012 Mar;131(3):EL262-7. doi: 10.1121/1.3687014.
7
A subspace approach based on embedded prewhitening for voice activity detection.基于嵌入式预白化的子空间方法用于语音活动检测。
J Acoust Soc Am. 2011 Nov;130(5):EL304-10. doi: 10.1121/1.3638927.
8
Optimal subband Kalman filter for normal and oesophageal speech enhancement.
Biomed Mater Eng. 2014;24(6):3569-78. doi: 10.3233/BME-141183.
9
Speech enhancement using empirical mode decomposition and the Teager-Kaiser energy operator.基于经验模态分解和Teager-Kaiser能量算子的语音增强
J Acoust Soc Am. 2014 Jan;135(1):451-9. doi: 10.1121/1.4837835.
10
Objective and subjective evaluation of adaptive speech enhancement methods for functional MRI.功能磁共振成像自适应语音增强方法的客观与主观评估
J Magn Reson Imaging. 2010 Jan;31(1):46-55. doi: 10.1002/jmri.21993.