图书介绍

语音信号处理PDF|Epub|txt|kindle电子书版本网盘下载

语音信号处理
  • 赵力编著 著
  • 出版社: 北京:机械工业出版社
  • ISBN:711111762X
  • 出版时间:2003
  • 标注页数:316页
  • 文件大小:20MB
  • 文件页数:327页
  • 主题词:语言信号处理-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

语音信号处理PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 绪论1

第2章 语音信号处理的基础知识5

2.1 概述5

2.2 语音和语言5

2.3 汉语语音学10

2.3.1 汉语语音的特点10

2.3.2 汉语的拼音方法10

2.3.3 汉语音节的一般结构10

2.3.4 汉语声母的结构12

2.3.5 汉语韵母的结构12

2.3.6 声母和韵母的相互作用——音征互载13

2.3.7 汉语的声调13

2.4.1 语音发音系统14

2.4 语音生成系统和语音感知系统14

2.4.2 语音听觉系统16

2.5 语音信号生成的数学模型20

2.5.1 激励模型21

2.5.2 声道模型22

2.5.3 辐射模型24

2.5.4 语音信号的数学模型25

2.6 语音信号的特性分析26

2.6.1 语音信号的时域波形和频谱特性26

2.6.2 语音信号的语谱图27

2.6.3 语音信号的统计特性29

思考与复习题30

第3章 语音信号分析31

3.1 概述31

3.2 语音信号的数字化和预处理31

3.2.2 预处理32

3.2.1 预滤波、采样、A/D变换32

3.3 语音信号的时域分析35

3.3.1 短时能量及短时平均幅度分析35

3.3.2 短时过零率分析36

3.3.3 短时相关分析38

3.3.4 短时平均幅度差函数41

3.4 语音信号的频域分析42

3.4.1 利用短时傅里叶变换求语音的短时谱42

3.4.2 语音的短时谱的临界带特征矢量44

3.5 语音信号的倒谱分析45

3.5.1 同态信号处理的基本原理45

3.5.2 复倒谱和倒谱46

3.5.3 语音信号两个卷积分量的复倒谱48

3.5.4 复倒谱分析中的相位卷绕及避免相位卷绕的算法51

3.5.5 语音信号倒谱分析实例53

3.6 语音信号的线性预测分析56

3.6.1 线性预测分析的基本原理56

3.6.2 线性预测方程组的求解58

3.6.3 LPC谱估计和LPC复倒谱62

3.6.4 线谱对(LSP)分析64

3.7 基音周期估计65

3.7.1 自相关法66

3.7.2 平均幅度差函数法(AMDF)69

3.7.3 并行处理技术(PPROC)方法70

3.7.4 倒谱(CEP)法71

3.7.5 简化逆滤波法(SIFT)73

3.7.6 小波变换法74

3.7.7 基音检测的后处理75

3.8 共振峰估计76

3.8.2 倒谱法77

3.8.1 带通滤波器组法77

3.8.3 LPC法78

思考与复习题80

第4章 矢量量化技术(VQ)81

4.1 概述81

4.2 矢量量化的基本原理81

4.3 矢量量化的失真测度84

4.3.1 欧氏距离测度84

4.3.2 线性预测失真测度85

4.3.3 识别失真测度86

4.4 矢量量化器的最佳码本设计87

4.4.1 LBG算法87

4.4.2 初始码本的生成88

4.5 矢量量化技术的优化设计89

4.5.1 无记忆的矢量量化系统90

4.5.2 有记忆的矢量量化系统92

4.5.3 模糊矢量量化(Fuzzy VQ)94

4.5.4 遗传算法优化码本——GAVQ算法95

思考与复习题97

第5章 隐马尔可夫模型(HMM)98

5.1 概述98

5.2 隐马尔可夫模型的引入98

5.3 隐马尔可夫模型的定义100

5.3.1 离散Markov过程100

5.3.2 隐Markov模型101

5.3.3 HMM的基本元素101

5.4 隐马尔可夫模型的基本算法103

5.4.1 前向-后向算法104

5.4.2 维特比(Viterbi)算法106

5.4.3 Baum-Welch算法107

5.5.1 按照HMM的状态转移概率矩阵(A参数)分类108

5.5 隐马尔可夫模型的各种结构类型108

5.5.2 按照HMM的输出概率分布(B参数)分类110

5.5.3 其他一些特殊的HMM的形式114

5.6 隐马尔可夫模型的一些实际问题115

5.6.1 下溢问题115

5.6.2 参数的初始化问题117

5.6.3 提高HMM描述语音动态特性的能力119

5.6.4 HMM训练方法的改进120

5.6.5 直接利用状态持续时间分布概率的HMM系统123

思考与复习题125

6.1 概述127

6.2 人工神经网络简介127

第6章 人工神经网络初步127

6.3 人工神经网络的构成128

6.3.1 神经元129

6.3.2 神经元的学习算法130

6.3.3 网络拓扑130

6.3.4 网络的学习算法130

6.4 几种用于模式识别的神经网络模型及其主要算法131

6.4.1 单层感知器131

6.4.2 双层感知器132

6.4.3 多层感知器133

6.4.4 径向基函数神经网络的分类特性134

6.4.5 自组织特征映射模型135

6.4.6 时延神经网络136

6.4.7 循环神经网络138

6.5.2 单输出型139

6.5 用神经网络进行模式识别的典型做法139

6.5.1 多输出型139

6.6 人工神经网络模型的应用举例140

思考与复习题141

第7章 语音编码142

7.1 概述142

7.2 语音信号压缩编码的原理和压缩系统评价144

7.2.1 语音压缩的基本原理144

7.2.2 语音编码的关键技术146

7.2.3 语音压缩系统的性能指标和评测方法148

7.3 语音信号的波形编码154

7.3.1 脉冲编码调制(PCM)154

7.3.2 自适应预测编码(APC)158

7.3.3 自适应增量调制(ADM)和自适应差分脉冲编码调制(ADPCM)160

7.3.4 子带编码(SBC)163

7.3.5 自适应变换编码(ATC)168

7.4 语音信号的参数编码171

7.4.1 线性预测声码器171

7.4.2 LPC-10编码器173

7.5 语音信号的混合编码177

7.6 现代通信中的语音信号编码方法179

7.6.1 EVRC算法基本原理179

7.6.2 EVRC算法概述180

思考与复习题184

第8章 语音合成185

8.1 概述185

8.2 共振峰合成法187

8.3 线性预测合成法189

8.4 语音合成专用硬件简介192

8.5 PSOLA算法合成语音195

8.6 文语转换系统(TTS)197

8.6.1 文语转换系统的组成198

8.6.2 连读语音的韵律特性199

8.6.3 文本分析方法202

8.6.4 语音合成方法204

8.6.5 语音合成中的韵律控制208

思考与复习题210

第9章 语音识别212

9.1 概述212

9.2 语音识别原理和识别系统的组成215

9.2.1 预处理和参数分析217

9.2.2 语音识别219

9.2.3 语音识别系统的基本数据库221

9.3 动态时间规整(DTW)222

9.4 孤立字(词)识别系统223

9.4.1 基于MQDF的汉语塞音语音识别系统225

9.4.2 基于概率尺度DP识别方法的孤立字(词)识别系统227

9.5 连续语音识别系统228

9.6 连续语音识别系统的性能评测231

9.6.1 连续语音识别系统的评测方法以及系统复杂性和识别能力的测度231

9.6.2 综合评估连续语音识别系统时需要考虑的其他因素234

思考与复习题235

第10章 说话人识别与语种辨识236

10.1 概述236

10.2 说话人识别方法和系统结构237

10.2.1 预处理238

10.2.2 说话人识别特征的选取238

10.2.3 特征参量评价方法240

10.2.5 说话人识别中判别方法和阈值的选择241

10.2.4 模式匹配方法241

10.2.6 说话人识别系统的评价242

10.3 应用DTW的说话人确认系统243

10.4 应用VQ的说话人识别系统244

10.5 应用HMM的说话人识别系统245

10.5.1 基于HMM的与文本有关的说话人识别246

10.5.2 基于HMM的与文本无关的说话人识别246

10.5.3 基于HMM的指定文本型说话人识别247

10.5.4 说话人识别HMM的学习方法248

10.5.5 鲁棒的HMM说话人识别技术248

10.6 应用GMM的说话人识别系统249

10.6.1 GMM模型的基本概念249

10.6.2 GMM模型的参数估计249

10.6.3 训练数据不充分的问题250

10.7 说话人识别中尚需进一步探索的研究课题251

10.6.4 GMM模型的识别问题251

10.8 语种辨识的原理和应用253

10.8.1 语种辨识的基本原理和方法253

10.8.2 语种辨识的应用领域257

思考与复习题257

第11章 语音信号中的情感信息处理259

11.1 概述259

11.2 语音信号中的情感分类和情感特征分析259

11.2.1 情感的分类259

11.2.2 情感特征分析260

11.3 语音情感识别方法265

11.3.1 主元分析法(PCA)265

11.3.2 神经网络方法(ANN)266

11.4 情感语音的合成267

11.3.3 混合高斯模型法(GMM)267

11.5 今后的研究方向269

思考与复习题270

第12章 语音增强271

12.1 概述271

12.2 语音特性、人耳感知特性及噪声特性272

12.2.1 语音特性272

12.2.2 人耳感知特性272

12.2.3 噪声特性273

12.3 滤波法语音增强技术273

12.3.1 陷波器法273

12.3.2 自适应滤波器274

12.4 利用相关特性的语音增强技术276

12.4.1 自相关处理抗噪法语音增强技术276

12.4.2 利用复数帧段主分量特征的降噪方法277

12.5 非线性处理法语音增强技术278

12.5.1 中心削波法278

12.5.2 同态滤波法279

12.6 减谱法语音增强技术280

12.6.1 基本原理280

12.6.2 基本减谱法的改进281

12.7 利用Weiner滤波法的语音增强技术282

12.7.1 基本原理282

12.7.2 Weiner滤波的改进形式283

思考与复习题283

附录A 语音信号LPC美尔倒谱系数(LPCMCC)分析程序285

附录B 利用HMM的孤立字(词)语音识别程序295

附录C 汉英名词术语对照307

参考文献315

热门推荐