欢迎来到专业的新思文库网平台! 工作计划 工作总结 心得体会 事迹材料 述职报告 疫情防控 思想汇报 党课下载
当前位置:首页 > 范文大全 > 公文范文 > 正文

基于CEP和LPC谱提取语音信号基音周期的方法

时间:2022-10-25 08:30:05 来源:网友投稿

摘 要:在语音信号分析中,只有分析出可表示语音信号本质特征的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识别等处理。因此对语音信号采用CEP和LPC谱提取语音信号基音周期的异同进行了研究,并采用Matlab实现了仿真分析。从中可以看出,LPC谱估计基音周期的算法运算量较大,而CEP 谱算法更直观,且在少部分情况下基音峰会变得更突出一些, CEP谱具有更加广阔的应用前景。

关键词:同态分析;线性预测分析(LPC);基音周期;Matlab

中图分类号:TP274文献标识码:A

文章编号:1004-373X(2009)20-150-02

Speech Signal Extraction Method of Pitch Based on CEP and LPC Spectrum

MA Ying,SHI Xiaorong,LI Haixin

(Qinghai Nationality College,Xining,810000,China)

Abstract:In voice signal analysis,by analysing the voice signal substantive characteristics′ parameter,these parameters can be used to carry on high effective processing and voice communication,speech synthesis and speech recognition.Therefore,difference between speech signal extraction of pitch by CEP and speech signal extraction of pitch by LPC spectrum are analysed,and Matlab is used to realize the simulation analysis.LPC spectrum is used toestimate tone cycle"s algorithm which has big calculation,but the CEP spectrum algorithm is more direct-viewing,and the tone summit becomes prominent,CEP spectrum has widely application prospect.

Keywords:analysis of same state;LPC;pitch;Matlab

0 引 言

语音信号的分析,就是提取语音产生模型的各种参数(语音的特征参数),应用于语音的编码、识别和合成等。不论是分析怎样的参数以及采用什么分析方法,在按帧进行语音分析,提取语音特征参数前,有一些经常使用的、共同的短时分析技术必须预先进行,如语音信号的数字化、预加重、加窗和分帧等。经过这些处理,语音信号就被分割成一帧一帧加过窗函数的短时信号,然后再把每一个短时语音帧看成平稳的随机信号,利用数字信号处理技术提取语音特征参数。

在进行处理时,按帧从数据区中取出数据,处理完后再取下一帧。最后得到由每一帧参数组成的语音特征参数的时间序列。基音周期是语音信号最重要的参数之一,它描述了语音激励源的一个重要特征。因为汉语言是一种有调语言,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息,有区别意义的功能,所以基音周期的提取和估计对汉语言更是一个十分重要的问题。

1 同态分析

1.1 同态信号处理的原理

同态信号处理也称为同态滤波,实现将卷积关系和乘积关系变换为求和关系的分离处理。将非线性信号处理变为线性信号处理的过程。语音信号x(n)可视为声门激励信息u(n)及声道冲击响应h(n)的卷积:x(n)=u(n)*h(n);通过处理可将语音信号的声门激励信息及声道冲击响应信息分离开来,从而求得声道共振特征和基音周期。卷积同态系统可分为三个子系统[3]:

第一个子系统特征系统D*[] 完成将卷积信号转化为加性信号的运算,对x(n)=x1(n)x2(n)进行如下处理:

Z[x(n)]=X(z)=X1(z)X2(z)(1)

ln X(z)=ln X1(z)+ln X2(z)=

1(z)+2(z)=(z)(2)

Z-1[(z)]=Z-1[1(z)+2(z)]=

1(n)+2(n)=(n)(3)

第二个子系统对加性信号进行所需要的线性处理(满足线性叠加原理等):

(n)=LTI[(n)]=LTI[1(n)+2(n)]

第三个子系统是逆特征系统D-1*[],使其恢复为卷积性信号。对(n)=1(n)+2(n)进行如下处理:

Z[(n)]=(z)=1(z)+2(z)(4)

exp[(z)]=Y(z)=Y1(z)Y2(z)(5)

y(n)=Z-1[Y1(z)Y2(z)]=y1(n)y2(n)(6)

1.2 倒谱

设X(ejω)=|X(ejω)|ejarg[X(ejω)],对其取对数得:

(ejω)=ln|X(ejω)|+j arg[X(ejω)]

(ejω)仍然是复数,只考虑其实部。令:

c(n)=IDTFT[ln|X(ejω)|]

c(n)=IDFT[ln|X(k)|]

式中:c(n)是序列x(n)对数幅度谱的傅里叶逆变换,称为倒频谱,简称为倒谱,有时也称为对数倒频谱,其量纲为时间。c(n)就是要求取得语音信号倒谱特征[4]。因此,设信号为s(n),则其倒谱为:

c(n)=IDFT{ln|DFT[s(n)]|}

1.3 倒谱的作用

倒谱的作用为:

(1) 区分清/浊音;

(2) 求浊音的基音周期,可以得到浊音的激励信号;

(3) 得到声道冲击响应[5]h(n)。

2 基于LPC系数的倒谱

由于语音样点之间存在相关性,所以可以用过去的样点值预测现在或未来的样点值。这是线性预测分析的基本思想。通过使实际语音x(n)和线性预测结果x′(n)之间的误差e(n){e(n)=x(n)- x′(n)} 在某个准则下达到最小值来决定惟一的一组预测系数ak。这组系数就能反映语音信号的特性,可以作为语音信号特征参数用于语音编码、语音合成和语音识别等应用中去。语音信号的倒谱特征系数与语音信号的LPC参数有密切关系。LPC系数是线性预测分析的基本参数,它可以表示整个LPC系统冲激响应的复倒谱。

预测误差e(n)就是激励信号G•u(n),预测系数{ak}就是声道滤波器的系数{dk}。线性预测分析可以对生成模型的增益参数G和滤波器系数{dk}进行直接和高效率的计算。这样,结合清浊音的判断和基音周期的估计,可得到语音信号生成模型的全部参数,实现语音的产生。

3 Matlab仿真及基音周期提取

具体步骤如下:

(1) 打开Matlab软件,在命令窗口中利用wavread函数打开语音信号的波形文件,得到抽样频率fs,n bits的值以及语音信号的二维图形。实验仿真是对一男声“沙地”的语音信号进行分析,其采样频率为8 kHz[6]。

(2) 对该语音信号截取一帧的长度,帧长为20 ms。

(3) 定义窗函数,在此选用汉明窗。

(4) 对截取的一帧语音信号AMP(见图1)进行加窗处理。

图1 一帧语音信号

(5) 对截取加窗后的一帧语音信号AMP进行CEP和LPC谱分析,观察波形图,估计基音周期。如图2,图3所示。

图2 LPC谱

图3 CEP谱

4 LPC谱(左)和CEP谱(右)的讨论

对一帧语音信号做CEP谱和LPC谱都能准确地分析出语音信号的基音周期。LPC谱图波峰位置恰好对应CEP谱图中的波谷位置;波形基本上关于横轴对称;LPC谱估计基音周期,可以采用离开原点的第一个波谷出现的样值点除以采样频率;而用CEP谱图估计基音周期,可以采用离开原点的第一个波峰出现的样点值除以采样频率[7]。

但是,在语音信号分析过程中窗长的选择对于语音特征参数的选择是非常重要的,如果窗长很大,当语音信号通过时,反映波纹细节的高频部分被阻碍,短时能量随时间变化很小,不能真实地反映语音信号的幅度变化;反之,窗长太小,短时能量随时间有急剧的变化,不能得到平滑的能量函数,因此应该根据不同的需要选择合适的窗长,否则提取特征参数会产生很大的误差[8]。

此外,采用LPC谱估计基音周期的方法,其算法的运算量较大,而CEP 谱算法简单,概念更直观,且在少部分情况下基音峰会变得更突出,基音周期的估计值更加准确;在实际的基音周期检测算法中,CEP谱的应用更为广泛,因此基于CEP谱的改进算法是进一步需要研究的理论。

参考文献

[1]陈洪立.一种基音周期估计方法[J].江西通信科技,2004(2):8-10.

[2]王文延,曾庆宁.一种噪声环境下的语音端点检测方法[J].声学技术,2007,26(3):435-441.

[3][美]夸特尔瑞.离散时间语音信号处理(原理与应用)[M].赵胜辉,译.北京:电子工业出版社,2000.

[4]王洪海,刘刚,郭建军.基于滑动倒谱的自动语言识别[J].智能系统学报,2008(4):336-341.

[5]李跃强,孙星明,周天亮.基于复倒谱变换的数字音频水印研究[J].计算机工程,2006,32(23):145-148.[6]丛玉良.数字信号处理及其Matlab实现[M].北京:电子工业出版社,2004.

[7]拉宾纳,谢弗.语音信号数字处理[M].朱雪龙,译.北京:科学出版社,1993.

[8]刘建,郑方,吴文虎.基于混合幅度差函数的基音提取算法[J].电子学报,2006,34(10):1 925-1 928.

[9]周文,侯阿临.基于自适应滤波和小波变换的基音检测[J].电声技术,2006,30(10):41-43.

[10]欧贵文,程新荣,杜剑峰.一种基于时域的基音周期提取方法[A].第五届全国人机语音通讯学术会议论文集[C].1998.

推荐访问:基音 提取 周期 语音 信号