• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用动态规划对语音进行分割。

Segmenting speech using dynamic programming.

作者信息

Cohen J R

出版信息

J Acoust Soc Am. 1981 May;69(5):1430-8. doi: 10.1121/1.385826.

DOI:10.1121/1.385826
PMID:7240574
Abstract

Speech is modeled as a Markov chain. Scoring is developed to convert observations of the speech signal into estimated probabilities of the locations of segment boundaries. Dynamic programming is then used to compute a most-probable segmentation for the speech. The process automatically adjusts to speakers and incorporates a priori information in a probabilistic and systemic fashion. The performance of the algorithm appears to be state-of-the-art, independent of speaker.

摘要

语音被建模为马尔可夫链。开发了评分方法,将语音信号的观测值转换为段边界位置的估计概率。然后使用动态规划来计算语音的最可能分割。该过程会自动适应说话者,并以概率和系统的方式纳入先验信息。该算法的性能似乎是最先进的,且与说话者无关。

相似文献

1
Segmenting speech using dynamic programming.使用动态规划对语音进行分割。
J Acoust Soc Am. 1981 May;69(5):1430-8. doi: 10.1121/1.385826.
2
Training and search methods for speech recognition.语音识别的训练与搜索方法。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):9964-9. doi: 10.1073/pnas.92.22.9964.
3
Structural design of hidden Markov model speech recognizer using multivalued phonetic features: comparison with segmental speech units.
J Acoust Soc Am. 1992 Dec;92(6):3058-67. doi: 10.1121/1.404202.
4
State of the art in continuous speech recognition.连续语音识别的技术现状。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):9956-63. doi: 10.1073/pnas.92.22.9956.
5
Fractal dimensions of speech sounds: computation and application to automatic speech recognition.语音的分形维数:计算及其在自动语音识别中的应用。
J Acoust Soc Am. 1999 Mar;105(3):1925-32. doi: 10.1121/1.426738.
6
Probabilistic Phonotactics as a Cue for Recognizing Spoken Cantonese Words in Speech.概率音位结构作为识别语音中粤语单词的线索
J Psycholinguist Res. 2017 Feb;46(1):201-210. doi: 10.1007/s10936-016-9428-0.
7
Segmenting words from natural speech: subsegmental variation in segmental cues.从自然语音中切分单词:音段线索的次分段变化。
J Child Lang. 2010 Jun;37(3):513-43. doi: 10.1017/S0305000910000085. Epub 2010 Mar 22.
8
A commercial large-vocabulary discrete speech recognition system: DragonDictate.
Lang Speech. 1992 Jan-Jun;35 ( Pt 1-2):237-46. doi: 10.1177/002383099203500218.
9
Statistical Speech Segmentation in Tone Languages: The Role of Lexical Tones.声调语言中的统计语音分割:声调的作用。
Lang Speech. 2018 Mar;61(1):84-96. doi: 10.1177/0023830917706529. Epub 2017 May 9.
10
The impact of attention load on the use of statistical information and coarticulation as speech segmentation cues.注意力负荷对将统计信息和协同发音用作语音分割线索的影响。
Atten Percept Psychophys. 2010 Aug;72(6):1522-32. doi: 10.3758/APP.72.6.1522.