• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

迈向终极合成/识别系统。

Toward the ultimate synthesis/recognition system.

作者信息

Furui S

机构信息

Nippon Telegraph and Telephone (NTT) Human Interface Laboratories, Tokyo, Japan.

出版信息

Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):10040-5. doi: 10.1073/pnas.92.22.10040.

DOI:10.1073/pnas.92.22.10040
PMID:7479723
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC40732/
Abstract

This paper predicts speech synthesis, speech recognition, and speaker recognition technology for the year 2001, and it describes the most important research problems to be solved in order to arrive at these ultimate synthesis and recognition systems. The problems for speech synthesis include natural and intelligible voice production, prosody control based on meaning, capability of controlling synthesized voice quality and choosing individual speaking style, multilingual and multidialectal synthesis, choice of application-oriented speaking styles, capability of adding emotion, and synthesis from concepts. The problems for speech recognition include robust recognition against speech variations, adaptation/normalization to variations due to environmental conditions and speakers, automatic knowledge acquisition for acoustic and linguistic modeling, spontaneous speech recognition, naturalness and ease of human-machine interaction, and recognition of emotion. The problems for speaker recognition are similar to those for speech recognition. The research topics related to all these techniques include the use of articulatory and perceptual constraints and evaluation methods for measuring the quality of technology and systems.

摘要

本文预测了2001年的语音合成、语音识别和说话人识别技术,并描述了为实现这些终极合成和识别系统而需要解决的最重要的研究问题。语音合成的问题包括自然且可理解的语音生成、基于语义的韵律控制、控制合成语音质量和选择个人说话风格的能力、多语言和多方言合成、面向应用的说话风格选择、添加情感的能力以及从概念进行合成。语音识别的问题包括针对语音变化的鲁棒识别、适应/归一化因环境条件和说话人导致的变化、用于声学和语言建模的自动知识获取、自发语音识别、人机交互的自然性和便捷性以及情感识别。说话人识别的问题与语音识别的问题类似。与所有这些技术相关的研究主题包括使用发音和感知约束以及用于衡量技术和系统质量的评估方法。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5f02/40732/a6ba664216c7/pnas01500-0140-a.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5f02/40732/a6ba664216c7/pnas01500-0140-a.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5f02/40732/a6ba664216c7/pnas01500-0140-a.jpg

相似文献

1
Toward the ultimate synthesis/recognition system.迈向终极合成/识别系统。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):10040-5. doi: 10.1073/pnas.92.22.10040.
2
Deployment of human-machine dialogue systems.人机对话系统的部署
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):10017-22. doi: 10.1073/pnas.92.22.10017.
3
The future of voice-processing technology in the world of computers and communications.计算机与通信领域中语音处理技术的未来。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):10060-3. doi: 10.1073/pnas.92.22.10060.
4
State of the art in continuous speech recognition.连续语音识别的技术现状。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):9956-63. doi: 10.1073/pnas.92.22.9956.
5
Computer speech synthesis: its status and prospects.计算机语音合成:现状与展望。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):9928-31. doi: 10.1073/pnas.92.22.9928.
6
Voice-processing technologies--their application in telecommunications.语音处理技术——及其在电信领域的应用。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):9991-8. doi: 10.1073/pnas.92.22.9991.
7
A perspective on early commercial applications of voice-processing technology for telecommunications and aids for the handicapped.语音处理技术在电信及残疾人辅助设备方面的早期商业应用展望。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):9989-90. doi: 10.1073/pnas.92.22.9989.
8
Models of speech synthesis.语音合成模型。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):9932-7. doi: 10.1073/pnas.92.22.9932.
9
Linguistic aspects of speech synthesis.语音合成的语言方面。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):9946-52. doi: 10.1073/pnas.92.22.9946.
10
Scientific bases of human-machine communication by voice.人机语音通信的科学基础。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):9914-20. doi: 10.1073/pnas.92.22.9914.

引用本文的文献

1
What is the Value of Embedding Artificial Emotional Prosody in Human-Computer Interactions? Implications for Theory and Design in Psychological Science.在人机交互中嵌入人工情感韵律的价值是什么?对心理科学理论与设计的启示。
Front Psychol. 2015 Nov 12;6:1750. doi: 10.3389/fpsyg.2015.01750. eCollection 2015.
2
Speech recognition technology: a critique.语音识别技术:一篇评论
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):9953-5. doi: 10.1073/pnas.92.22.9953.
3
Speech technology in the year 2001.2001年的语音技术。

本文引用的文献

1
Processing of speech signals for physical and sensory disabilities.针对身体和感官残疾的语音信号处理。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):9999-10006. doi: 10.1073/pnas.92.22.9999.
2
Voice-processing technologies--their application in telecommunications.语音处理技术——及其在电信领域的应用。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):9991-8. doi: 10.1073/pnas.92.22.9991.
3
Integration of speech with natural language understanding.语音与自然语言理解的整合。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):10038-9. doi: 10.1073/pnas.92.22.10038.
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):9983-8. doi: 10.1073/pnas.92.22.9983.
4
Models of natural language understanding.自然语言理解模型。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):9977-82. doi: 10.1073/pnas.92.22.9977.
5
State of the art in continuous speech recognition.连续语音识别的技术现状。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):9956-63. doi: 10.1073/pnas.92.22.9956.
6
Models of speech synthesis.语音合成模型。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):9932-7. doi: 10.1073/pnas.92.22.9932.
7
The role of voice input for human-machine communication.语音输入在人机通信中的作用。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):9921-7. doi: 10.1073/pnas.92.22.9921.
8
New trends in natural language processing: statistical natural language processing.自然语言处理的新趋势:统计自然语言处理。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):10052-9. doi: 10.1073/pnas.92.22.10052.
9
Speech technology in 2001: new research directions.2001年的语音技术:新的研究方向。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):10046-51. doi: 10.1073/pnas.92.22.10046.
10
User interfaces for voice applications.语音应用的用户界面。
Proc Natl Acad Sci U S A. 1995 Oct 24;92(22):10031-7. doi: 10.1073/pnas.92.22.10031.