您好,欢迎来到聚文网。 登录 免费注册
现代语音信号处理

现代语音信号处理

  • 字数: 750000.0
  • 装帧: 平装
  • 出版社: 电子工业出版社
  • 作者: 无
  • 出版日期: 2014-07-01
  • 商品条码: 9787121226250
  • 版次: 1
  • 开本: 16开
  • 页数: 414
  • 出版年份: 2014
定价:¥65 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书系统介绍了语音信号处理的基础、原理、方法、应用、新理论、新成果与新技术,以及该研究领域的背景知识、研究现状、应用前景和发展趋势。
全书分三篇共17章。第一篇语音信号处理基础,包括第1章绪论,第2章语音信号处理的基础知识;第二篇语音信号分析,包括第3章时域分析,第4章短时傅里叶分析,第5章倒谱分析与同态滤波,第6章线性预测分析,第7章语音信号的非线性分析,第8章语音特征参数检测与估计,第9章矢量量化,第10章隐马尔可夫模型;第三篇语音信号处理技术与应用,包括第11章语音编码,第12章语音合成,第13章语音识别,第14章说话人识别和语种辨识,第15章智能信息处理技术在语音信号处理中的应用,第16章语音增强,第17章基于麦克风阵列的语音信号处理。
本书体系完整,结构严谨;系统性强,层次分明;内容深入浅出,原理阐述透彻;取材广泛,繁简适中;内容丰富而新颖;联系实际应用。
目录
第一篇语音信号处理基础
第1章绪论1
1.1语音信号处理的发展历史1
1.2语音信号处理的主要研究内容及发展
概况3
1.3本书的内容7
思考与复习题8
第2章语音信号处理的基础知识9
2.1概述9
2.2语音产生的过程9
2.3语音信号的特性12
2.3.1语言和语音的基本特性12
2.3.2语音信号的时间波形和频谱特性13
2.3.3语音信号的统计特性15
2.4语音产生的线性模型16
2.4.1激励模型17
2.4.2声道模型18
2.4.3辐射模型20
2.4.4语音信号数字模型21
2.5语音产生的非线性模型22
2.5.1FM-AM模型的基本原理22
2.5.2Teager能量算子22
2.5.3能量分离算法23
2.5.4FM-AM模型的应用24
2.6语音感知24
2.6.1听觉系统24
2.6.2神经系统25
2.6.3语音感知26
思考与复习题29

第二篇语音信号分析
第3章时域分析30
3.1概述30
3.2数字化和预处理31
3.2.1取样率和量化字长的选择31
3.2.2预处理33
3.3短时能量分析34
3.4短时过零分析36
3.5短时相关分析39
3.5.1短时自相关函数39
3.5.2修正的短时自相关函数40
3.5.3短时平均幅差函数42
3.6语音端点检测42
3.6.1双门限前端检测43
3.6.2多门限过零率前端检测43
3.6.3基于FM-AM模型的端点检测43
3.7基于高阶累积量的语音端点检测44
3.7.1噪声环境下的端点检测44
3.7.2高阶累积量与高阶谱44
3.7.3基于高阶累积量的端点检测46
思考与复习题48
第4章短时傅里叶分析50
4.1概述50
4.2短时傅里叶变换50
4.2.1短时傅里叶变换的定义50
4.2.2傅里叶变换的解释51
4.2.3滤波器的解释54
4.3短时傅里叶变换的取样率55
4.4语音信号的短时综合56
4.4.1滤波器组求和法56
4.4.2FFT求和法58
4.5语谱图59
思考与复习题61
第5章倒谱分析与同态滤波62
5.1概述62
5.2同态信号处理的基本原理62
5.3复倒谱和倒谱63
5.4语音信号两个卷积分量复倒谱的性质64
5.4.1声门激励信号64
5.4.2声道冲激响应序列65
5.5避免相位卷绕的算法66
5.5.1微分法67
5.5.2最小相位信号法67
5.5.3递推法69
5.6语音信号复倒谱分析实例70
5.7Mel频率倒谱系数72
思考与复习题73
第6章线性预测分析74
6.1概述74
6.2线性预测分析的基本原理74
6.2.1基本原理74
6.2.2语音信号的线性预测分析75
6.3线性预测方程组的建立76
6.4线性预测分析的解法(1)―自相关和
协方差法77
6.4.1自相关法78
6.4.2协方差法79
6.4.3自相关和协方差法的比较80
6.5线性预测分析的解法(2)―格型法81
6.5.1格型法基本原理81
6.5.2格型法的求解83
6.6线性预测分析的应用―LPC谱估计和
LPC复倒谱85
6.6.1LPC谱估计85
6.6.2LPC复倒谱87
6.6.3LPC谱估计与其他谱分析方法的
比较88
6.7线谱对(LSP)分析89
6.7.1线谱对分析原理89
6.7.2线谱对参数的求解91
6.8极零模型91
思考与复习题93
第7章语音信号的非线性分析94
7.1概述94
7.2时频分析94
7.2.1短时傅里叶变换的局限95
7.2.2时频分析96
7.3小波分析97
7.3.1概述97
7.3.2小波变换的定义97
7.3.3典型的小波函数99
7.3.4离散小波变换100
7.3.5小波多分辨分析与Mallat算法100
7.4基于小波的语音分析101
7.4.1语音分解与重构101
7.4.2清/浊音判断102
7.4.3语音去噪102
7.4.4听觉系统模拟103
7.4.5小波包变换在语音端点检测中的
应用103
7.5混沌与分形104
7.6基于混沌的语音分析105
7.6.1语音信号的混沌性105
7.6.2语音信号的相空间重构106
7.6.3语音信号的Lyapunov指数108
7.6.4基于混沌的语音、噪声判别109
7.7基于分形的语音分析110
7.7.1概述110
7.7.2语音信号的分形特征111
7.7.3基于分形的语音分割112
思考与复习题113
第8章语音特征参数估计114
8.1基音估计114
8.1.1自相关法115
8.1.2并行处理法117
8.1.3倒谱法118
8.1.4简化逆滤波法120
8.1.5高阶累积量法122
8.1.6小波变换法123
8.1.7基音检测的后处理124
8.2共振峰估计125
8.2.1带通滤波器组法125
8.2.2DFT法126
8.2.3倒谱法127
8.2.4LPC法129
8.2.5FM-AM模型法130
思考与复习题131
第9章矢量量化132
9.1概述132
9.2矢量量化的基本原理133
9.3失真测度134
9.3.1欧氏距离―均方误差135
9.3.2LPC失真测度135
9.3.3识别失真测度137
9.4很好矢量量化器和码本的设计137
9.4.1矢量量化器很好设计的两个条件137
9.4.2LBG算法138
9.4.3初始码书生成138
9.5降低复杂度的矢量量化系统139
9.5.1无记忆的矢量量化系统140
9.5.2有记忆的矢量量化系统142
9.6语音参数的矢量量化144
9.7模糊矢量量化145
9.7.1模糊集概述146
9.7.2模糊矢量量化147
9.8遗传矢量量化148
9.8.1遗传算法148
9.8.2遗传矢量量化150
思考与复习题151
第10章隐马尔可夫模型152
10.1概述152
10.2隐马尔可夫模型的引入153
10.3隐马尔可夫模型的定义155
10.4隐马尔可夫模型三个问题的求解156
10.4.1概率的计算157
10.4.2HMM的识别159
10.4.3HMM的训练160
10.4.4EM算法161
10.5HMM的选取162
10.5.1HMM的类型选择162
10.5.2输出概率分布的选取163
10.5.3状态数的选取163
10.5.4初值选取163
10.5.5训练准则的选取165
10.6HMM应用与实现中的一些问题166
10.6.1数据下溢166
10.6.2多输出(观察矢量序列)情况166
10.6.3训练数据不足167
10.6.4考虑状态持续时间的HMM168
10.7HMM的结构和类型170
10.7.1HMM的结构170
10.7.2HMM的类型172
10.7.3按输出形式分类173
10.8HMM的相似度比较174
思考与复习题175

第三篇语音信号处理技术与应用
第11章语音编码176
11.1概述176
11.2语音信号的压缩编码原理178
11.2.1语音压缩的基本原理178
11.2.2语音通信中的语音质量179
11.2.3两种压缩编码方式180
11.3语音信号的波形编码180
11.3.1PCM及APCM180
11.3.2预测编码及自适应预测编码183
11.3.3ADPCM及ADM185
11.3.4子带编码(SBC)187
11.3.5自适应变换编码(ATC)189
11.4声码器191
11.4.1概述191
11.4.2声码器的基本结构192
11.4.3通道声码器192
11.4.4同态声码器194
11.5LPC声码器195
11.5.1LPC参数的变换与量化196
11.5.2LPC-10197
11.5.3LPC-10e198
11.5.4变帧率LPC声码器199
11.6各种常规语音编码方法的比较200
11.6.1波形编码的信号压缩技术200
11.6.2波形编码与声码器的比较200
11.6.3各种声码器的比较201
11.7基于LPC模型的混合编码201
11.7.1混合编码采用的技术202
11.7.2MPLPC204
11.7.3RPELPC207
11.7.4CELP209
11.7.5CELP的改进形式211
11.7.6基于分形码本的CELP213
11.8基于正弦模型的混合编码214
11.8.1正弦变换编码215
11.8.2多带激励(MBE)编码215
11.9极低速率语音编码217
11.9.1400~1.2kb/s数码率的声码器217
11.9.2识别-合成型声码器218
11.10语音编码的性能指标219
11.11语音编码的质量评价221
11.11.1主观评价方法221
11.11.2客观评价方法222
11.11.3主客观评价方法的结合225
11.11.4基于多重分形的语音质量评价226
11.12语音编码国际标准227
11.13语音编码与图像编码的关系228
小结229
思考与复习题229
第12章语音合成231
12.1概述231
12.2语音合成原理232
12.2.1语音合成的方法232
12.2.2语音合成的系统特性234
12.3共振峰合成235
12.3.1共振峰合成原理235
12.3.2共振峰合成实例237
12.4LPC合成237
12.5PSOLA语音合成239
12.5.1概述239
12.5.2PSOLA的原理240
12.5.3PSOLA的实现240
12.5.4PSOLA的改进242
12.5.5PSOLA语音合成系统的发展243
12.6文语转换系统243
12.6.1组成与结构243
12.6.2文本分析244
12.6.3韵律控制245
12.6.4语音合成248
12.6.5TTS系统的一些问题248
12.7基于HMM的参数化语音合成249
12.8语音合成的研究现状和发展趋势253
12.9语音合成硬件简介255
思考与复习题256
第13章语音识别257
13.1概述257
13.2语音识别原理260
13.3动态时间规整264
13.4基于有限状态矢量量化的语音识别266
13.5孤立词识别系统267
13.6连接词识别270
13.6.1基本原理270
13.6.2基于DTW的连接词识别271
13.6.3基于HMM的连接词识别273
13.6.4基于分段K-均值的很好词串分割及
模型训练273
13.7连续语音识别274
13.7.1连续语音识别存在的困难274
13.7.2连续语音识别的训练及识别方法275
13.7.3连续语音识别的整体模型276
13.7.4基于HMM统一框架的大词汇非特定
人连续语音识别277
13.7.5声学模型278
13.7.6语言学模型280
13.7.7很优路径搜索282
13.8说话人自适应284
13.8.1MAP算法285
13.8.2基于变换的自适应方法285
13.8.3基于说话人分类的自适应方法286
13.9鲁棒的语音识别287
13.10关键词确认289
13.11可视语音识别291
13.11.1概述291
13.11.2机器自动唇读291
13.11.3双模态语音识别293
13.12语音理解296
13.12.1MAP语义解码297
13.12.2语义结构的表示297
13.12.3意图解码器298
小结299
思考与复习题299
第14章说话人识别300
14.1概述300
14.2特征选取301
14.2.1说话人识别所用的特征301
14.2.2特征类型的优选准则302
14.2.3常用的特征参数303
14.3说话人识别系统303
14.3.1说话人识别系统的结构303
14.3.2说话人识别的基本方法概述304
14.4说话人识别系统实例305
14.4.1DTW型说话人识别系统305
14.4.2应用VQ的说话人识别系统306
14.5基于HMM的说话人识别307
14.6基于GMM的说话人识别310
14.7说话人识别中需进一步研究的问题312
14.8语种辨识313
思考与复习题316
第15章智能信息处理技术在语音信号
处理中的应用317
15.1人工神经网络317
15.1.1概述317
15.1.2神经网络的基本概念319
15.2神经网络的模型结构320
15.2.1单层感知机320
15.2.2多层感知机321
15.2.3自组织映射神经网络323
15.2.4时延神经网络324
15.2.5循环神经网络325
15.3神经网络与传统方法的结合325
15.3.1概述325
15.3.2神经网络与DTW326
15.3.3神经网络与VQ326
15.3.4神经网络与HMM327
15.4神经网络语音识别328
15.4.1静态语音识别328
15.4.2连续语音识别330
15.5基于神经网络的说话人识别330
15.6基于神经网络的语音信号非线性预测
编码332
15.6.1语音信号的非线性预测332
15.6.2基于MLP的非线性预测编码333
15.6.3基于RNN的非线性预测编码334
15.7基于神经网络的语音合成335
15.8支持向量机336
15.8.1概述336
15.8.2支持向量机的基本原理337
15.9基于支持向量机的语音分类识别339
15.10基于支持向量机的说话人识别340
15.10.1基于支持向量机的说话人辨认340
15.10.2基于支持向量机的说话人确认340
15.11基于混沌神经网络的语音识别342
15.11.1混沌神经网络342
15.11.2基于混沌神经网络的语音识别342
15.12分形在语音识别中的应用344
15.13智能优化算法在语音信号处理中的
应用344
15.14各种智能信息处理技术的融合与
集成346
15.14.1模糊系统与神经网络的融合347
15.14.2神经网络与遗传算法的融合347
15.14.3模糊逻辑、神经网络及遗传算法的
融合348
15.14.4神经网络、模糊逻辑及混沌的
融合349
15.14.5混沌与遗传算法的融合349
思考与复习题350
第16章语音增强351
16.1概述351
16.2语音、人耳感知及噪声的特性352
16.3滤波器法354
16.3.1固定滤波器354
16.3.2变换技术354
16.3.3自适应噪声对消354
16.4非线性处理357
16.5基于相关特性的语音增强358
16.6减谱法359
16.6.1减谱法的基本原理359
16.6.2减谱法的改进形式360
16.7基于Wiener滤波的语音增强361
16.8基于语音产生模型的语音增强362
16.9基于小波的语音增强364
16.9.1概述364
16.9.2基于小波的语音增强364
16.9.3基于小波包的语音增强366
16.10基于信号子空间分解的语音增强367
16.11语音增强的一些新发展370
小结371
思考与复习题372
第17章基于麦克风阵列的语音信号
处理373
17.1概述373
17.2麦克风阵列语音处理技术的难点374
17.3声源定位375
17.3.1去混响375
17.3.2近场模型376
17.3.3声源定位377
17.4语音增强381
17.4.1概述381
17.4.2方法与技术382
17.4.3应用386
17.4.4本节小结387
17.5语音盲分离387
17.5.1瞬时线性混合模型388
17.5.2卷积混合模型393
17.5.3非线性混合模型395
17.5.4需进一步研究的问题396
思考与复习题396
汉英名词术语对照398
参考文献407

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网