登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書

『簡體書』数字语音信息处理 贾懋珅 陈仙红 马勇 熊文梦

書城自編碼: 4107393
分類:簡體書→大陸圖書→教材高职高专教材
作者: 贾懋珅 陈仙红 马勇 熊文梦
國際書號(ISBN): 9787111776710
出版社: 机械工业出版社
出版日期: 2025-04-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 64.9

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
有兽焉.10
《 有兽焉.10 》

售價:HK$ 65.8
人文传统一(“人文传统”系列丛书第七版,人文传统1:史前时期—中世纪,回溯人类文明的源头)
《 人文传统一(“人文传统”系列丛书第七版,人文传统1:史前时期—中世纪,回溯人类文明的源头) 》

售價:HK$ 140.8
西瓜船
《 西瓜船 》

售價:HK$ 54.9
轻松阅读:如何高效阅读一本书
《 轻松阅读:如何高效阅读一本书 》

售價:HK$ 65.8
帝都绘“图解世界文化遗产”三部曲(长城、中轴线、大运河)
《 帝都绘“图解世界文化遗产”三部曲(长城、中轴线、大运河) 》

售價:HK$ 400.4
左岸译丛:袜子的哲学
《 左岸译丛:袜子的哲学 》

售價:HK$ 52.8
全球对话主义(第二版)
《 全球对话主义(第二版) 》

售價:HK$ 107.8
思考,快与慢
《 思考,快与慢 》

售價:HK$ 107.8

編輯推薦:
本书为数字语音信息处理课程教材,结合信号处理、声学、计算机科学、统计学等多个学科,系统介绍了数字语音信息处理的基础知识、基本原理、重要方法以及该学科领域近年来取得的一些重大研究成果与技术突破。
內容簡介:
本书为数字语音信息处理课程教材,结合信号处理、声学、计算机科学、统计学等多个学科,系统介绍了数字语音信息处理的基础知识、基本原理、重要方法以及该学科领域近年来取得的一些重大研究成果与技术突破。本书遵循了科学性、实用性、创新性原则。全书共10章,内容包括:绪论、语音产生与听觉感知、语音信号特征、常用建模算法、语音编码和质量评估、语音识别、说话人识别、语音合成、语音增强、语音分离。另外,在本书的每章末尾都加入了思考题与习题,供读者思考、练习。本书以帮助读者快速、直观地理解概念为目标,展示了基本的数学公式,同时注重理论与实践相结合,在每节都详细地阐述了相关知识和具体方法,以便读者进一步融会贯通。本书可作为高等院校计算机科学与技术、通信工程、电子信息、人工智能等相关专业及学科的高年级本科生、研究生教材,也可供相关领域的科研及工程技术人员参考。本书配有以下教学资源:PPT课件、教学大纲、教案、习题答案、课程实验、教学视频。欢迎选用本书作教材的教师登录www.cmpedu.com注册后下载,或发邮件到jinacmp@163.com索取。
目錄
第1章 绪论 11.1 语音信号处理介绍 11.2 语音信号处理应用 5思考题与习题 10参考文献 10第2章 语音产生与听觉感知 122.1 语音产生 122.1.1 发音器官 122.1.2 发音原理 132.2 心理声学原理 142.2.1 听觉范围 142.2.2 绝对听阈 152.2.3 临界频带 162.2.4 同时掩蔽 172.2.5 异时掩蔽 19本章小结 19思考题与习题 19参考文献 20第3章 语音信号特征 213.1 时域特征 223.1.1 短时平均过零率 223.1.2 短时平均幅度 233.1.3 短时平均能量 233.1.4 短时自相关函数 243.2 频域特征 253.2.1 语谱图特征 263.2.2 滤波器组特征 263.3 倒谱域特征 273.3.1 同态信号处理 273.3.2 倒谱特征 283.3.3 复倒谱特征 283.3.4 Mel频率倒谱特征 293.3.5 动态倒谱特征 303.4 线性预测特征 303.4.1 LPC基本原理 303.4.2 LPC的求解 323.4.3 LPC谱估计 353.4.4 LPC复倒谱 353.4.5 感知线性预测 363.4.6 LPC的推演参数 37本章小结 38思考题与习题 38参考文献 40第4章 常用建模算法 414.1 矢量量化 414.1.1 VQ基本原理 424.1.2 VQ的失真测度 424.1.3 VQ模型学习方法 444.1.4 VQ模型的改进 454.2 高斯混合模型 474.2.1 高斯混合模型的基本原理 474.2.2 期望最大化算法 484.3 隐马尔可夫模型 504.3.1 HMM的基本概念 504.3.2 HMM的三个基本问题 524.3.3 HMM的结构类型 574.3.4 GMM-HMM算法 584.3.5 HMM的自适应算法 594.4 支持向量机 604.4.1 SVM的基本原理 614.4.2 对偶优化 614.4.3 非线性SVM 624.4.4 支持向量回归 634.5 神经网络 644.5.1 NN的基本概念 644.5.2 多层感知器 644.5.3 误差反向传播算法 654.5.4 NN的过拟合问题 664.6 深度神经网络 674.6.1 浅层网络到深层网络 674.6.2 DNN的训练 674.6.3 常用的DNN模型 684.6.4 Transformer的基本概念 704.6.5 BERT模型和GPT模型 71本章小结 72思考题与习题 72参考文献 73第5章 语音编码和质量评估 745.1 量化和熵编码 745.1.1 概率密度函数 755.1.2 标量量化 765.1.3 矢量量化 785.1.4 比特分配算法 805.1.5 熵编码 805.2 波形编码 845.2.1 脉冲编码调制 855.2.2 差分脉冲编码调制 855.2.3 自适应差分脉冲编码调制 875.3 参数编码 875.3.1 线性预测编码 885.3.2 正弦变换编码 885.4 混合编码 895.5 变速率编码 905.6 神经网络语音编码 925.7 编码器主要属性 935.7.1 带宽 935.7.2 编码速率 945.8 质量评估 955.8.1 主观评价 955.8.2 客观评价 98本章小结 100思考题与习题 100参考文献 101第6章 语音识别 1036.1 模版匹配方法 1046.1.1 矢量量化技术 1046.1.2 动态时间规整技术 1056.2 统计概率模型方法 1086.2.1 基于GMM-HMM的语音识别方法 1086.2.2 基于DNN-HMM的语音识别方法 1126.3 端到端语音识别方法 1136.3.1 连接时序分类模型 1146.3.2 递归神经网络转换器模型 1176.3.3 LAS模型 1186.3.4 联合CTC-注意力模型 121本章小结 122思考题与习题 123参考文献 124第7章 说话人识别 1257.1 基于高斯混合模型的说话人识别 1287.1.1 GMM说话人识别 1287.1.2 GMM-UBM说话人识别 1307.1.3 GMM-SVM说话人识别 1327.2 基于i-vector的说话人识别 1347.2.1 基于GMM的i-vector说话人识别 1347.2.2 基于DNN的i-vector说话人识别 1367.2.3 说话人相似度打分 1387.3 基于深度神经网络的说话人识别 1407.3.1 x-vector说话人识别 1417.3.2 ResNet说话人识别 1437.3.3 ECAPA-TDNN说话人识别 1447.3.4 基于预训练大模型的说话人识别 1467.4 说话人日志技术 1467.4.1 基于分割聚类的说话人日志 1487.4.2 基于端到端的说话人日志技术 1507.4.3 难点和发展方向 151本章小结 152思考题与习题 152参考文献 153第8章 语音合成 1548.1 参数合成法 1558.2 波形拼接合成法 1588.3 基于隐马尔可夫的语音合成 1608.3.1 模型训练阶段 1618.3.2 语音合成阶段 1628.3.3 HMM语音合成的关键 1648.4 基于深度学习的语音合成 1658.4.1 Tacotron 1678.4.2 FastSpeech 1698.4.3 WaveNet 1718.4.4 VITS 1748.4.5 GPT-SoVITS 177本章小结 178思考题与习题 179参考文献 179第9章 语音增强 1809.1 研究背景 1809.2 信号模型与评价指标 1819.2.1 信号模型 1819.2.2 语音质量评价标准 1819.3 单通道方法 1839.3.1 谱减法 1839.3.2 维纳滤波 1849.3.3 深度学习方法 1889.4 多通道方法 1979.4.1 信号模型与特征提取 1979.4.2 基于数字信号处理的波束形成方法 1989.4.3 基于神经网络时频掩蔽的波束形成方法 2019.4.4 基于神经网络的多通道语音增强方法 2029.5 混响环境下的语音信号增强方法 2059.5.1 信号模型 2059.5.2 WPE去混响方法 205本章小结 207思考题与习题 208参考文献 209第10章 语音分离 21010.1 研究背景 21010.2 独立成分分析 21110.2.1 定义 21110.2.2 ICA目标函数 21210.2.3 优化算法 21410.3 非负矩阵分解 21410.3.1 基于NMF的语音分离 21410.3.2 NMF算法 21510.3.3 加稀疏约束的NMF算法 21710.3.4 加权NMF算法 21710.4 稀疏分量分析 21810.4.1 稀疏分量分析基本理论 21810.4.2 信号稀疏化处理 21810.4.3 混合矩阵估计 21910.4.4 源信号重构 22010.5 机器学习方法 22310.5.1 深度聚类算法 22310.5.2 置换不变性训练算法 22410.5.3 时域端到端语音分离法 226本章小结 230思考题与习题 230参考文献 231
內容試閱
语音信号处理技术在现代科技和人工智能领域占据着重要的地位。其起源可以追溯到20世纪六七十年代,伴随着信息处理和通信技术的发展,取得了长足的进步。语音信号处理经历了从模拟化到数字化的重要转变,从基础技术到智能应用的不断演进,对语音通信、人机交互、消费电子、人工智能等方面产生了深远影响。语音信号处理涉及电子学、信号处理、模式识别、心理学、生理学、语言学、人机交互等多个研究领域,该学科的发展促进了多学科的交叉创新。本书围绕语音信号处理的基础知识和主要应用进行介绍,全书共10章。第1章是绪论;第2章探讨语音产生与人耳听觉感知;第3章介绍语音信号的时域、频域、倒谱域和线性预测等几个方面的特征分析方法;第4章主要介绍语音信号处理常用的建模方法;第5章讨论语音信号的编码技术,同时介绍编码质量评估方法;第6章和第7章分别探讨了语音识别和说话人识别技术;第8章详细介绍语音合成方法;第9章和第10章分别介绍语音增强和语音分离技术。本书的第1、2、5章由贾懋珅编写,第3、4章由马勇编写,第6、7、8章由陈仙红编写,第9、10章由熊文梦编写。贾懋珅负责全书的整体安排和审定。本书参考了大量文献资料,在此向相关作者表示深深的谢意。由于编者水平有限,疏漏和错误在所难免,敬请读者批评指正。编著者

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2025 (香港)大書城有限公司  All Rights Reserved.