• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一种听觉模型在语音识别中的应用。

Application of an auditory model to speech recognition.

作者信息

Cohen J R

机构信息

IBM Thomas J. Watson Research Center, Yorktown Heights, New York 10598.

出版信息

J Acoust Soc Am. 1989 Jun;85(6):2623-9. doi: 10.1121/1.397756.

DOI:10.1121/1.397756
PMID:2526170
Abstract

Some aspects of auditory processing are incorporated in a front end for the IBM speech-recognition system [F. Jelinek, "Continuous speech recognition by statistical methods," Proc. IEEE 64 (4), 532-556 (1976)]. This new process includes adaptation, loudness scaling, and mel warping. Tests show that the design is an improvement over previous algorithms.

摘要

听觉处理的某些方面被整合到了IBM语音识别系统的前端中[F. 杰利内克,“基于统计方法的连续语音识别”,《IEEE汇刊》64 (4),532 - 556 (1976)]。这个新过程包括自适应、响度缩放和梅尔频率非线性变换。测试表明,该设计比以前的算法有所改进。

相似文献

1
Application of an auditory model to speech recognition.一种听觉模型在语音识别中的应用。
J Acoust Soc Am. 1989 Jun;85(6):2623-9. doi: 10.1121/1.397756.
2
Limits on alternative auditory representations of speech.言语替代听觉表征的局限性。
Ann N Y Acad Sci. 1983;405:33-8. doi: 10.1111/j.1749-6632.1983.tb31615.x.
3
A computer model of the auditory periphery and its application to the study of hearing.听觉外围的计算机模型及其在听觉研究中的应用。
Adv Exp Med Biol. 2013;787:11-9; discussion 19-20. doi: 10.1007/978-1-4614-1590-9_2.
4
Discrimination of computer-synthesized speech.计算机合成语音的辨别
Percept Mot Skills. 1984 Oct;59(2):619-22. doi: 10.2466/pms.1984.59.2.619.
5
Speech perception using combinations of auditory, visual, and tactile information.使用听觉、视觉和触觉信息组合的言语感知。
J Rehabil Res Dev. 1989 Winter;26(1):15-24.
6
Speech perception studies using a multichannel electrotactile speech processor, residual hearing, and lipreading.使用多通道电触觉语音处理器、残余听力和唇读进行的语音感知研究。
J Acoust Soc Am. 1989 Jun;85(6):2593-607. doi: 10.1121/1.397754.
7
Microprocessor-controlled speech pattern audiometry. Preliminary results.微处理器控制的言语模式听力测定法。初步结果。
Audiology. 1985;24(5):325-35. doi: 10.3109/00206098509078351.
8
A model of auditory perception as front end for automatic speech recognition.一种作为自动语音识别前端的听觉感知模型。
J Acoust Soc Am. 1999 Oct;106(4 Pt 1):2040-50. doi: 10.1121/1.427950.
9
Development and preliminary evaluation of two speech communication aids.两种言语交流辅助工具的开发与初步评估
J Med Eng Technol. 1989 Jan-Apr;13(1-2):18-22. doi: 10.3109/03091908909030188.
10
Decelerated synthesized speech as a means of shaping speed of auditory processing of children with delayed language.
Percept Mot Skills. 1982 Dec;55(3 Pt 1):783-92. doi: 10.2466/pms.1982.55.3.783.

引用本文的文献

1
Spectro-temporal templates unify the pitch percepts of resolved and unresolved harmonics.时频谱模板统一了可分辨和不可分辨谐波的音高感知。
J Acoust Soc Am. 2019 Feb;145(2):615. doi: 10.1121/1.5088504.
2
State of the art in continuous speech recognition.连续语音识别的技术现状。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):9956-63. doi: 10.1073/pnas.92.22.9956.