图书介绍

现代语音处理技术及应用PDF|Epub|txt|kindle电子书版本网盘下载

现代语音处理技术及应用
  • 张雄伟等编著 著
  • 出版社: 北京:机械工业出版社
  • ISBN:7111127951
  • 出版时间:2003
  • 标注页数:320页
  • 文件大小:19MB
  • 文件页数:332页
  • 主题词:语言处理-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

现代语音处理技术及应用PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1 章绪论1

1.1 概述1

1.2 语音处理的研究方法2

1.3 语音处理的应用2

1.3.1 语音压缩编码3

1.3.2 语音识别3

1.3.3 说话人识别4

1.3.4 语音理解4

1.3.5 语音合成5

1.3.6 语音增强5

1.4 本书的内容与组织6

1.5 习题6

第2章 语音信号处理基础7

2.1 语音的波形及特性7

2.2 语音的产生9

2.2.1 发声器官9

2.2.2 清音、浊音和爆破音9

2.2.3 基音频率10

2.2.4 共振峰10

2.2.5 语谱图11

2.3 汉语语音的基本特性11

2.3.1 声母和韵母11

2.3.2 元音和辅音13

2.3.3 汉语的四声13

2.4 语音信号的简化数字模型14

2.5 听觉系统和听觉特性16

2.5.1 听觉系统16

2.5.2 听觉特性17

2.6 小结18

2.7 习题18

第3章 语音信号的时域分析19

3.1 概述19

3.2 语音短时分析技术19

3.3 短时能量和平均幅度21

3.4 短时平均过零率24

3.5 短时自相关分析26

3.5.1 短时自相关函数26

3.5.2 语音信号的短时自相关函数27

3.5.3 修正的短时自相关函数29

3.6 语音端点检测30

3.7 基音周期估计31

3.7.1 基于短时自相关函数的基音周期估计32

3.7.2 基于短时平均幅度差函数(AMDF)的基音周期估计33

3.8 小结34

3.9 习题34

第4章 语音信号的变换域分析36

4.1 语音信号的频域分析36

4.1.1 短时傅里叶变换36

4.1.2 短时傅里叶反变换42

4.1.3 语谱图44

4.1.4 频域分析应用——频域基音检测45

4.2 语音信号的同态处理47

4.2.1 卷积同态系统47

4.2.2 复倒谱和倒谱49

4.2.3 复倒谱分析50

4.2.4 复倒谱与倒谱的计算51

4.2.5 同态处理应用——同态声码器54

4.3 语音信号的非线性处理58

4.3.1 小波变换及应用58

4.3.2 混沌、分形处理及应用66

4.4 分形内插语音编码算法71

4.4.1 分形插值函数72

4.4.2 参数选择72

4.4.3 系统设计73

4.5 小结74

4.6 习题74

第5章 语音信号线性预测分析76

5.1 LP分析的基本原理76

5.2 LP正则方程的自相关解法和自协方差解法78

5.2.1 LP正则方程的自相关解法78

5.2.2 LP正则方程的自协方差解法79

5.2.3 自相关方程的杜宾递推算法80

5.3 模型增益G的确定84

5.4 线谱对(LSP)分析86

5.4.1 LSP的特点和定义86

5.4.2 LP参数到LSP参数的转换87

5.4.3 LSP参数到LP参数的转换89

5.5 LP导出的其他语音参数90

5.5.1 部分相关系数90

5.5.2 对数面积比系数91

5.5.3 LP复倒谱与倒谱91

5.6 LP分析的频域解释92

5.7 小结94

5.8 习题94

第6章 矢量量化97

6.1 概述97

6.1.1 矢量量化的定义97

6.1.2 最佳矢量量化器98

6.1.3 最佳矢量量化器的设计99

6.2 无记忆矢量量化器100

6.2.1 全搜索矢量量化器101

6.2.2 树搜索矢量量化器101

6.2.3 多级矢量量化器102

6.2.4 波形/增益矢量量化器102

6.2.5 分离均值矢量量化器103

6.3 有记忆矢量量化器103

6.4 特征矢量及失真测度105

6.4.1 特征矢量105

6.4.2 失真测度107

6.5 小结110

6.6 习题111

第7章 语音编码112

7.1 语音编码的基本概念112

7.2 波形编码113

7.2.1 脉冲编码调制(PCM)113

7.2.2 差分脉冲编码调制(DPCM)118

7.2.3 增量调制(△M)120

7.2.4 波形编码中的自适应技术122

7.2.5 子带编码(SBC)126

7.3 参数编码和混合编码131

7.3.1 基于开环搜索的LPC语音编码131

7.3.2 基于ABS法的LPC编码137

7.3.3 多带激励(MBE)148

7.4 混合激励线性预测(MELP)157

7.4.1 参数的选取和比特分配158

7.4.2 分析部分159

7.4.3 参数量化编码部分163

7.4.4 合成部分167

7.4.5 语音的合成170

7.4.6 MELP算法的性能评估171

7.5 语音编码的质量评估172

7.5.1 语音算法音质的主观评价方法172

7.5.2 语音算法音质的客观评价方法173

7.5.3 客观评价方法与主观评价方法的拟合177

7.6 小结178

7.7 习题178

第8章 语音识别180

8.1 概述180

8.1.1 发展简介180

8.1.2 语音识别的指标181

8.2 动态时间规整182

8.3 隐马尔可夫模型184

8.3.1 马尔可夫过程184

8.3.2 隐马尔可夫模型184

8.3.3 隐马尔可夫模型的基本问题185

8.4 HMM的基本问题186

8.4.1 K-均值聚类算法186

8.4.2 EM算法186

8.4.3 HMM的估计问题187

8.4.4 HMM的解码问题188

8.4.5 HMM的学习问题188

8.5 连续HMM和半连续HMM190

8.5.1 连续HMM190

8.5.2 半连续HMM190

8.6 HMM相似度的比较191

8.7 HMM的应用192

8.7.1 初值选择192

8.7.2 拓扑选择193

8.7.3 训练准则选择195

8.7.4 多观察序列的训练195

8.7.5 HMM的计算优化196

8.8 孤立词识别197

8.9 连接词识别198

8.9.1 采用DTW技术的连接词识别199

8.9.2 采用HMM算法的连接词识别201

8.10 连续语音识别202

8.10.1 声学模型203

8.10.2 大词汇量的语言模型204

8.10.3 最佳路径搜索算法206

8.11 说话人自适应技术208

8.11.1 MAP算法209

8.11.2 基于变换的自适应算法210

8.11.3 基于说话人分类的自适应算法211

8.12 关键词确认212

8.13 说话人识别213

8.13.1 性能指标214

8.13.2 表征说话人特点的基本特征215

8.13.3 高斯混合模型(GaussianMixtureModel,GMM)216

8.14 人工神经网络在语音识别中的应用218

8.14.1 人工神经网络基本概念218

8.14.2 神经网络在语音识别中的应用219

8.15 鲁棒语音识别的研究223

8.15.1 概述223

8.15.2 鲁棒语音特征的研究224

8.15.3 特征补偿技术225

8.15.4 模型匹配技术225

8.15.5 基于人耳听觉的信号处理225

8.15.6 听觉视觉双模态语音识别226

8.16 小结226

8.17 习题227

第9章 语音合成229

9.1 概述229

9.1.1 发展历史229

9.1.2 组成和分类230

9.1.3 性能指标231

9.2 文-语转换系统232

9.3 文本分析234

9.4 韵律生成235

9.4.1 韵律236

9.4.2 韵律的生成和抽象处理238

9.5 语音生成239

9.5.1 发音器官参数合成法(ArticulatorySynthesis)240

9.5.2 线性预测参数合成法(LinearPredictionSynthesis)240

9.5.3 共振峰合成法(FormantSythesis)241

9.5.4 波形拼接合成法242

9.6 小结246

9.6.1 语音合成系统的发展246

9.6.2 语音合成的发展趋势247

9.7 习题247

第10章 语音增强248

10.1 概述248

10.1.1 语音和噪声特性248

10.1.2 语音增强算法分类250

10.2 基于语音谱特征的谐波增强算法250

10.3 基于短时谱估计的增强算法251

10.3.1 噪声对消法251

10.3.2 短时谱估计252

10.3.3 谱相减法253

10.3.4 维纳滤波254

10.3.5 短时谱幅度的MMSE估计255

10.4 基于信号子空间的增强算法257

10.4.1 信号和噪声的线性模型和子空间描述258

10.4.2 语音信号线性估计器259

10.5 基于语音生成模型的增强算法262

10.5.1 基于LPC全极点模型的增强算法262

10.5.2 最大后验概率估计法263

10.5.3 卡尔曼滤波法264

10.6 语音增强的新发展265

10.6.1 基于神经网络的语音增强265

10.6.2 基于HMM的语音增强265

10.6.3 基于听觉感知的语音增强265

10.6.4 基于多分辨率分析的语音增强266

10.7 小结266

10.8 习题267

第11章 语音通信应用中的关键技术268

11.1 不连续传输(DTX)268

11.2 语音激活检测(VAD)269

11.2.1 语音激活检测270

11.2.2 拖尾延迟保护(Hangover)270

11.2.3 舒适噪声产生270

11.2.4 语音激活检测算法举例271

11.3 回波抵消273

11.3.1 回波的产生273

11.3.2 数字回波抵消的基本原理274

11.3.3 回波抵消的实现275

11.4 声码器同步276

11.5 纠错编码277

11.5.1 语音信号纠错编码的特性277

11.5.2 纠错码278

11.5.3 纠错编码策略278

11.5.4 CELP的纠错保护方案279

11.6 小结280

11.7 习题280

第12章 语音处理的实时实现281

12.1 DSP语音处理系统281

12.1.1 实时语音处理系统的构成281

12.1.2 DSP语音处理系统的特点282

12.1.3 DSP语音处理系统的设计过程282

12.1.4 DSP语音处理系统的开发工具283

12.2 可编程DSP芯片应用基础284

12.2.1 DSP芯片的基本概念284

12.2.2 DSP芯片的发展284

12.2.3 DSP芯片的分类285

12.2.4 DSP芯片的选择285

12.2.5 DSP芯片的基本结构288

12.2.6 常用DSP芯片简介289

12.3 CCSDSP集成开发环境292

12.3.1 DSP的开发工具292

12.3.2 CCS的基本概念292

12.3.3 CCS的构成292

12.3.4 CCS的使用296

12.4 一个基于TMS320VCDSP应用系统的开发296

12.4.1 系统构成296

12.4.2 系统软硬件设计297

12.4.3 系统调试298

12.4.4 独立系统形成299

12.5 小结301

12.6 习题302

附录303

附录A 读写语音文件的C语言程序303

附录B FFT算法的C语言实现程序305

附录C 8位μ律/16位线性互换的C语言子程序307

附录D μ律到线性变换表309

附录E 语音信号线性预测(LPC)子程序310

附录F 时域波形以及频谱的显示程序311

附录G 语音信号基音检测程序312

参考文献319

热门推荐