《图解语音识别》PDF电子书免费下载

作者:  [日]荒木雅弘

出版社: 人民邮电出版社

出版年: 2020年04月

ISBN: 9787115528711

~~滚到底部有网盘下载链接~~

内容简介

目录

目录

第 1章 开篇

1.1 什么是语音识别 2

1.2 语音识别的历史 4

1.3 语音识别的用处 6

1.4 为什么很难 8

1.5 本书的目标 10

1.6 小结 12

第 2章 什么是语音

2.1 语音学 16

2.2 声音是如何产生的——发音语音学 16

2.3 声音的真面目——声学语音学 23

2.4 声音是如何被感知的——感知语音学 29

2.5 总结 32

第3章 统计模式识别

3.1 什么是模式识别 34

3.2 统计模式识别的思路 36

3.3 生成模型的训练 40

3.4 判别模型的训练 44

3.5 统计语音识别的概要 45

3.6 总结 48

第4章 有限状态自动机

4.1 什么是有限状态自动机 50

4.2 用有限状态自动机表达的语言 53

4.3 各种各样的有限状态自动机 55

4.4 有限状态自动机的性质 58

4.5 总结 59

第5章 语音特征的提取

5.1 特征提取的步骤 62

5.2 语音信号的数字化 64

5.3 人类听觉模拟——频谱分析 67

5.4 另一个精巧设计——倒谱分析 69

5.5 噪声去除 72

5.6 总结 73

第6章 语音识别:基本声学模型

6.1 声学模型的单位 76

6.2 什么是隐马尔可夫模型 78

6.3 隐马尔可夫模型的概率计算 81

6.4 状态序列的估计 83

6.5 参数训练 85

6.6 总结 89

第7章 语音识别:高级声学模型

7.1 实际的声学模型 92

7.2 判别训练 94

7.3 深度学习 96

7.4 总结 98

第8章 语音识别:语言模型

8.1 基于语法规则的语言模型 100

8.2 统计语言模型的思路 101

8.3 统计语言模型的建立方法 103

8.4 总结 108

第9章 语音识别:搜索算法

9.1 填补声学模型和语言模型之间的空隙 112

9.2 状态空间搜索 113

9.3 用树形字典减少浪费 115

9.4 用集束搜索缩小范围 116

9.5 用多次搜索提高精度 118

9.6 总结 120

第 10章 语音识别:WFST运算

10.1 WFST的合成运算 124

10.2 确定化 129

10.3 权重移动 133

10.4 小化 134

10.5 总结 135

第 11章 语音识别:使用 WFST进行语音识别

11.1 WFST转换 138

11.2 声学模型的 WFST转换 139

11.3 发音字典的 WFST转换 141

11.4 语言模型的 WFST转换 142

11.5 WFST的搜索 144

11.6 总结 145

第 12章 语义分析

12.1 什么是语义表示 148

12.2 基于规则的语义分析处理 151

12.3 基于统计的语义分析处理 153

12.4 智能手机的语音服务 156

12.5 总结 159

第 13章 语音对话系统的实现

13.1 对话系统的开发方法 162

13.2 基于规则的对话管理 164

13.3 针对对话管理的统计方法 166

13.4 总结 170

第 14章 终篇

14.1 语音分析工具 WaveSurfer 174

14.2 HMM构建工具 HTK 175

14.3 大词汇量连续语音识别引擎 Julius 177

14.4 虚拟代理对话工具 MMDAgent 179

14.5 深入学习之路 180

思考题的解答 182

参考文献 188

后 记 191

显示部分信息

下载价格:免费
立即下载
登入/注册
知识就是力量
没有账号? 忘记密码?