语音信号处理中基频提取算法综述
语音信号处理中基频提取算法综述,论述了各种基频检测的算法,对比分析各方法与思想,不错的总结增刊张杰等:语音信号处理中基频提取算法综述101信号是由频率具有谐波关系的信号组成的,因此有的一个改进是采用多分辩率方法。该方法的思想是:很多尝试利用频域信息提取基频的方法如果一个特定算法在特定分辨率下的准确性是可疑21基于滤波器的算法的,那么采用更高或者更低的分辨率,可以进一步21.1最佳梳状滤波器法判断前面的基频估计是否可信。如果在全部或人部最仹梳状滤波器法閃是具有高鲁棒性但计算代分的分辨率下求得相同的基频,那么该频率值就可价很大的算法。一个梳状滤波器有很多等距离分布以作为最终的基频估计结果。当然,在带来好处的的通带,在最佳梳状滤波器算法中,通带的位置都同时,该方法也会带来计算量上的代价,因为针对是由第一个迸带决定的,即通带的中心频率都是第每个分辨率都需要重新计算频谱,这也是为什么一个通带中心频率的整数倍。输入信号通过多个与多分辨率的傳里叶分析比专门的多分辨率变换(如第一个通带中心频率不同的梳状滤波器。如果输入离散小波变換)要慢的原因信号是由一组频率成谐波关系的信号组成的,那么2.4离散小波变换法滤波器的输出在全部谐波成分都通过滤波器时达到离散小波变换是一个强大的工具,它允许在连最大。但是如果信号只有一个基频成分,该方法就续的尺度上把信号分解为高频成分和低频成分,它会失效,因为会有很多个梳状滤波器能让信号通过。是时间和频率的局部变换,能有效地从信号中提取不过,语音信号的频率具有谐波结构,所以可采用信息。与快速傅里叶变换相比,离散小波变换的主该方法提取基频。要好处在于,在髙频部分它可以取得好的时间分辨2.1.2可调的IR滤波器率,在低频部分可以取得好的频率分辨率。文献四提出了一种基于中心频率可调节的带通3统计的方法IR滤波器提取棊频的方法,随着用户的调节,滤波器的中心频率扫过整个频域。当输入信号的一个强在某种意义上,基频提取的问题可以被看作是的频率成分在通带沱围内时,滤波器会输出最大值,个统计问题。每一个输入帧都被划分给一组类中信号的基频就可以用此时滤波器的中心频率来估的一个,代表信号的基频估计。所以很多研究者计。文献[9提到,对于可调的I滤波器,有经验的直试图将现代的统计方法应用于基频提取问题用户能够识别只有一个谐波结构的信号的输出和包Boris和 Xavier发表了一系列使用最人似然法估含多个基频信号的输出的差异计基频的方法。他们的模型如卜:观察集是语音信2.2倒谱分析法号分帧后做短时傅里叶变换的结果,每一个观察都倒谱分析是谱分析的一种方法,翰出是傅里叶被看作是基频激励产生的信号与其他剩余信息(包变换的幅度谱取对数后做傅里叶逆变换的结果。该括非谐波部分和噪声)两部分的混合。该模型是由方法所依据的理论是,一个具有基频的信号的傅立般的语音信号产生的模型的简单化得到的,假没叶变换的幅度谱有一些等距离分布的峰值,代表信个语音包括在基频及其整数倍点的值处较大的谐波号中的谐波结构,当对幅度谱取对数之后,这些峰成分,以及在非谐波处和噪声处的很小的值。对于值被削弱到一个可用的范围。幅度谱取对数后得到一组候选的基频值,该方法计算每一个观察可能是的结果是在频域的一个周期信号,而这个频域信号由某一个基频产生的概率,并将概率最大的基频值的周期(是频率值)可以认为就是原始信号的基频,所作为最终的估计值。所以候选的基频值的选择是很以对这个信号做傅里叶逆变换就可以在原始信号的重要的,因为从理论上讲,观察可能对应着任意的基音周期处得到一个峰值基频值。另妒,如果对信号的傅里叶变换的嘔度谱取对数后的结果直接进行分析,而不是雨接着做傅里叶4算法的改进逆变换,就是谐波成分谱的方法。进一步,如果在前面提到的每种算法都有自己的改进方法,下求频域的变换时不使用傅里叶变换,而使用能使频面介绍两种对以上大部分算法均适用的改进方法。谱更加精细的Chip变换,就是基」Chi变换的提取41人的听觉模型基频的方法,该方法具有高分辨率和高鲁棒性。由于基频提取本身就是听觉感知问题,所以所23多分辨率的方法有的算法都可通过加入人耳的听觉模型提扃性能对于任何基于傅里叶分析的频域方法都可以做人耳的听觉模型将人的听觉系统对声音信号的处理102电子科技大学学报第39卷分为分析、传递和还原3个阶段。分析阶段主要考虑5经典的基频检测方法耳蜗的分频效应,耳蜗的外端对高频敏感,内端对低频敏感,可以用一组中心频率不同的带通滤波器自从有了语音信号分析饼究这门学科以来,基来模拟。传递阶段声波振动沿基膜传播,并在听觉频的检测一直是一个重点研究的课题。经典的基频神经纤维内产生电流,最终传入听觉中枢。还原阶检测方法可以大致分为3类,如表1所示段听觉系统提取语音中诸如音质、音调、时域和位表1经典的基音检测方法以及特点置等信息。分类基因检测方法特点在声学中,声强是指单位时间内通过垂直」声由多种简单的波形峂值泼传播方向的单位面积的声波能量,用表示。当声并行处理法检沏器提取基音周期波的频率在20~20000Hz(可闻频率)之间,而声强波形根据各种理沦探作,从波形中去行计法数据减少法达到一定的强度(听阈),就能被人耳感知。前人大量掉修正基音以外的数的实验测试结果表明,人耳对不同频率的声波感受讨零率法利用波形的讨零率,差眼于重复图形到相同响度时的声强是不同的。人耳对两端频段的利用语音波形的自相关函数提取自相关法声波反应较为迟钝,而对中间频段的声波反应相对基音,采用中心削波平坦欠理频谱,及其改进较为敏感采用峰值削波可以简化运算对于任意的频域方法,简单的改进是用Q值恒语音波形降低采样率斤,进行IPC分析相关定的谱变换方法代替傅里叶变换。恒的变换方法SIFT法用逆滤波器平坦处理频谱,通过预测误差处埋法计算代价更人,但更接近于人的听觉感知系统。的自相关函数恢复时间精度在决定是否使用人的听觉模型吋必须考虑两个采用平均幅度差函数(AMDF检测周期AMDF法性,也可以根据残差信号的因素:(1)基频提取的用途。如果应用的目的很简单,AMDF法行提取要求也不是太高,那么人的听觉感知因素也许不是倒谱法根据对数功率谱的傅立叶反变换很必要。(2)计算的复杂度。使用人的听觉感知模型分离频谱包络和微细结构会使计算复杂度大大增加,如果原来算法的复杂度变换法在频谱上求出基频高次谐波成分的直方已经很大,再加入人的听觉感知模型可能会使算法循环直方图法图,根据高次谐波的公约数决定某音的复杂度过高4.2基频的跟踪(1)波形估计法。直接由语音波形估计、分析波另一种对基频提取的改进是基频跟踪。前面提形上的周期峰值到的基频提取都是在个单独的时间窗内进行的。(2)相关处珄法。时域中周期信号最明显的特征人的听觉系统是能够眼踪输入信号的基频的。一个是波形的类似性,因而可以道过比较原始信号和它只包含有限个基音周期的时间窗内的基频是很难提位移后的信号之间的相似性确定基音周期。该类方取的。但是,如果输入是连续的语音信号,相当于法抗波形的相位失真能力强,且馍件处理结构简单。很多时间窗个接个输入,基频的提取反而变得3)变换法。将语音信号变換至频域或倒谱域估很容易。研究发现,语音信号的基频具有连续性,计基音周期即前后两帧的基频是连续的,不出现跳变。一帧内6总结的基频提取常见的问题是得到的佔计值是正确值的本文列出了若干基频提取的主要方法,对它们整数倍或者整数倍分之一。针对该问题,利用语音分别进行了简单的介绍,并讨论了对算法的改进。信号基频的连续性,可对基频提取算法做一个简单需要注意的是,所介绍的方法都是针对一个语音信的改进:在计算某一恢的基频时对于它前血一帧的号而言的,对于混合的语音信号的基频提取,如果基频附近的值给予更大的可能性,即一唢语音信号可以先将混合的语音信号分离丌,那么基频提取就中基频的值不可能出现崁变的情况。这就是简单的会变待很简单。同样地,在一些基于时频分析的语基频跟踪思想,并且不会在计算上增加任何复杂度。音分离算法中,如果知道了各个语音的基频,那么另外一种比较复杂的基频跟踪方法是使用隐马语吝分离也就变得很容易解决了。尔科大模型。(下转第126页)126电子科技大学学报第39卷L9 GONG L, NEEDIIAM R, YAIIALOM R Reasoning about1990 IEEE Symposium on Research in Security and privacybelief in cryptographic protocols C]/Proceedings of the Los Alamitos, CA: IEEE Computer Society Press, 1990编辑税红(上接第102页)参考文献[5 BENJAMiN K. Spectral analysis and discrimination by[ DELLER了R, PROAKIS了 G HANSEN J H Lzero-crossings[C]Proceedings of the Institute of ElectricalDiscrete-time processing of speech signals [M]. New York:and Electronics Engineers. S 1.: [ s.n. 1986: 1477-1493[6] CURTIS R. The computer music tutorial]. CambridgeMaxell McMillan. 1993MIT Press. 1996[2 FORT A, ISMAELLI A, MANFREDI C, et al. Parametric[7] DE CHEVEIGNE A, YIN H K. A fundamental frequencyd non-parametric estimation ofapplication to infant cry[]. Med Eng Phys, 1996, 18(8estimator for speech and music[J]. Journal of the AcousticalSociety of America, 2002,11(4):1917-1930[3] PARSONS T. Voice and speech processing[M]. New York[8 EARGLE J M. Music, sound and technology M. TorontoHill,1986.Van Nostrand reinhold. 19954 RABINERR L, SCIIAFERR W. Digital processing ofspeech signals. Englewood Cliffs M]. New Jersey: Prentice编辑税红Hll,1978
- 2020-12-05下载
- 积分:1
Latex排版学习笔记
Latex排版学习笔记,用于Latex学习入门与提高。共9章内容,较为全面。目录第一章基本使用1.1基本排版流程1.2文本排版..1.2.1英文文档12.2输入特殊字符1.2.3段落换行124中文文档777789991.3列表环境1.4文档结构101.4.1文档类别101.4.2标题摘要111.4.3章节目录1.4.4参考文献121.5插入表格131.5.1基本表格131.5.2跨列表格131.5.3浮动表格141.6插入图片151.6.1图文并排的小图片16.2图文分开的大图片161.6.3位置浮动的大图片17第二章格式调整21各种长度单位1922字体使用192.2.1字体编码193日录222字体族名20223字体系列20224字体形状20225字体大小23段落对齐2223.1居中对齐22232单侧对齐2224页面大小布局232.5目录页格式24第三章数学公式2631两种公式263.2各种字母273.3数学函数3.4配对括号283.5多行公式3.6定理环境31第四章图形绘制334.1画交换图3341.1用 ascd包画交换图3341.2用 diagrams包画交换图33413用ⅹy-pic包画交换图344.2画图语言和画图软件3543PGF/TkZ绘图364.3.1画流程图3643.2函数图像374.3.3几何图形第五章演示文稿395.1最简单例子5.2逐步显示4153主题模板4254中文演示43目录第六章高级应用446.1输入各种撇号引号6.2文件拆分及独立编译446.3合并多个PDF文件6.4错误处理466.4.1编译时的错误信息476.4.2编译时的警告信息47第七章背景资料7.1TeX系统的前世今生497.2TeX系统的目录结构507.3TeX系统的文件查找51第八章字体详解8.1字体类型与文档格式548.2新字体选择方案NFSS5583中文排版历程568.3.1CCT中文排版8.3.2CJK中文排版578.3.3 XeTeX中文排版第九章相关软件609.1纯文本编辑器609.1.1 TeXmaker编辑器6091.2 Te Xworks编辑器619.1.3正向搜索与反向搜索629.2可视化编辑器639.2.1IyX文档处理软件639.22 TeXmacs文档排版软件659.3新版 Office的公式排版6694在网页中显示数学公式67附录ATeX排版原理69A.1读取文件A.2生成盒子70A.3分段为行71A.4组行为页6日录附录 B PostScript语言75B.1PS语言的基本知识B.2PS语言的点阵图像B.3PS语言的点阵字体附录C常用宏包介绍81第一章基本使用1.1基本排版流程和 Microsoft office Word等所见即所得的办公软件不同,用Ix排版文档,首先要用文本编辑器编辑好tex文档,然后通过各种程序编译,得到pdf文档用于打印或者阅读。基本的排版流程如下图:xelatextexpalatelatexs pdfdvipsd.ps般我们经常用 datex或者 xelatex程序直接从tex文件生成pdf文件如果是中文tex文档,优先使用ⅹ elate程序编译。如何使用编辑器以及编译文档在后面的章节有详细介绍。12文本排版121英文文档最简单的TX英文文档如下:第一章基本使用l hello. texdocumentclass La4paper]articlesusepackagethyperref]egintdocumentyHello worldend]我们来看看上面的tex文档内容。在Ix里面,每行的%符号后面的内容都表示注释,在编译时都会被忽略。因此第一行的内容没有任何结果接着看第二行。在ⅣX文档中,用开始的字母串来表示一个命令,这里的 documentclass是1X文档的基本命令,用于指明文档类。命令后面用花括号包含的内容是该命令的参数,必不可少。对于这个例子, article参数就指明我们撰写的是一篇文章,类似地还可以用book或者 report参数,分别表示书籍和报告。命令后用方括号[]包含的内容是该命令的选项,选项可以省略,省略时必需连冋方括号也去掉。如果选项省略,将会使用默认值。这里例了的a4 paper指明我们文档的页面是A4纸张的大小,改为b5 paper就是B5纸张的大小。第三行的 usepackage命令也是IX的基本命令,用于载入I①X宏包I系统中包含了各种各样的宏包,对IX的基本功能作了各种扩展。我们这一行载入的 hyperref宏包后面将介绍到。接下来在 begin{ document}和 endidocument}之间的部分我们称为正文区,一般用于正文内容的撰写。这个例子的正文内容只有简单的 Hello wor1d!对应的,在 documentclass和 beginidocument}命令之间的部分我们称为导言区,一般用于载入宏包,定义命令和调整格式。X文档把格式和内容部分分开,是一种良好的设计准则。1.2.2输入特殊字符在ⅣX的文本内容中,大部分字符都可以直接输入,但是#,$,%,&,{,}这几个字符由于有特殊用途不能直接输入。我们可以按照下表的方式输入这些特殊字符输入#${}、-O显示#8%k输入 Textless extgreater extbartextbackslash显示1.3列表环境另外, Latex中是区分左右引号的,输入`和‘分别显示左右单引号,输入`和“分别显示左右双引号。连字号、起止号和破折号看起来都是一个差不多的短横线,但输入的方式也是不同的。用-得到连接单词的连字号-,用--得到表示数字范围的起止号,用---得到英文的破折号。123段落换行用一个空行或者par命令可以开始新的段落,同时会有默认的首行缩进。用或者 newline可以强制换行在下一行继续,且在下一行不会有缩进。12.4中文文档Latex中文文档的排版有各种方式,例如CCT,CJK,ⅹeCJK等等。目前最优秀的方式是用ctex文档类来排版中文文档,它在其它各种方式的基础上以一致的方式解决了中文排版的问题。例如:documentclass [UTF8] Ictexart]eginidocument)中文内容测试!endfdocumentH使用这种方式,只需要将文档类从英文的 article改成 ctexart,所有中文环境和章芇编号等等都已绎按照中文习惯设置好了,简单易行。例子屮的UIF8这个可选参数指明了中文文档的编码。编码主要有这两种:GBK和UTF8,而不同的 Latex编辑器对中文文档的默认编码不同。以CTeX套装29版本包含的两个编辑器为例, Winedt编辑器的默认中文编码为GBK,而ReWorks编辑器的默认中文编码为UTF8。因此,对于初学者,为了避免乱码的出现,最好根据编辑器的默认情形来选择编码,如果使用的是 Winedt编辑器,将文档的编码设为GBK,如果使用的是reκ works编辑器,将文档的编码设为UTF8。如果编码不指定,默认为GBK另外,对于bok和 report文档类,也有对应的 ctexbook和 ctexrep中文文档类,其用法类似。1.3列表环境Latex的命令实际上也有不同的类型,形如begin环境名}.lend环境名}第一章基本使用的命令组合我们称为环境。环境一般用于对某种类型的段落用特殊的形式来显示。在文本段落中,常见的环境有列表环境。列表环境有三种:无序列表( itemize)、有序列表( enumerate)和描述列表( description)。它们的使用方式和显示效果如eginfitemize]item无编号的列表无编号的列表item带编号的列表·带编号的列表item带标签的列表带标签的列表end[]Abegintenumeratehitem无编号的列表1.无编号的列表item带编号的列表2.带编号的列表iem带标签的列表3.带标签的列表endtenumeratelegintdescriptionhitem[无序列表]无编号的列表。无序列表无编号的列表。item[有序列表]带编号的列表。有序列表带编号的列表item[描述列表]带标签的列表。描述列表带标签的列表。endidescriptionh14文档结构4.1文档类别前面已经讲过,用下面的命令可以指定文档类documentclass[选项]{文档类其中文档类有文章( article),书籍(book),报告( report),书信( letter)这几种选择。文档类的选项有下面这些。页面大小(a4 paper,a5 paper,b4 paper, letterpaper, legalpaper, executiveper):默认的 letterpaper常见于美国,其大小为216毫米乘以279毫米(即8.5英寸乘以11英寸),而国内常用的a4 paper的大小为210毫米乘以297毫米,两者稍有区别。虽然这里可以指定不同的页面大小,但是纸张却始终为A4大小。比如你指定为A5页面大小,那么生成的PDF文件中,内容只在A4纸张的左上角。
- 2020-11-27下载
- 积分:1