摘 要:为改进汽车的NVH性能,提高产品竞争力,如何通过声品质研究改善汽车的声学特性成为当前汽车技术研发的重点。对汽车声品质研究的国内外现状进行综述,详细介绍了主观评价方法的优缺点,并列举了在客观评价中应用广泛的心理声学参数的含义及数学模型。同时,对建立声品质客观量化模型的方法进行对比,并指出汽车声品质研究未来的发展方向。
关键词:声品质;主观评价;客观分析;心理声学参数
中图分类号:U467.1文献标文献标识码:A文献标DOI:10.3969/j.issn.2095-1469.2014.06.01
对于汽车这种不可或缺的交通工具,人们要求具有良好的声学特性,不仅声压级能满足噪声法规的要求,而且要有较好的听觉愉悦性。由于传统的A计权声压级不能充分反映人们对噪声的主观感觉,于是开展了对噪声的主观评价研究,声品质的概念应运而生[1-2]。声品质是指在特定的技术目标或任务内涵中研究声音的适宜性,声品质中的“声”是人耳的听觉感知,“品质”则是指人耳对声音事件的听觉感知过程,并最终做出的主观判断[3]。人是声品质最终的接受者和最直接的评价者,声品质受到声音固有特性、评价者的生理、心理等各方面的综合影响,因此声品质的研究是一个综合多领域的多学科研究。
目前,国内外汽车声品质评价的主要流程为:首先建立声品质评价组,对多个汽车噪声的采样样本进行主观评价;然后对噪声样本客观评价完以后,以统计学方法进行多重回归分析,确定主观评价结果与客观物理参数之间的相关性;最终建立用心理声学参量表达的声品质函数公式客观量化模型,并以此作为汽车产品设计及制造的声学参考和评价指标[4-6]。本文对国内外常用的汽车声品质研究方法进行了综述,并提出了今后的发展方向。
1 汽车声品质研究现状
1.1 国外汽车声品质研究现状
知名的汽车制造公司、相关研究机构、著名大学等都大力开展对汽车声品质的研究,在声品质评价的原理、流程、主观评价方法、心理声学参数及客观量化模型等方面取得了十分丰硕的理论和应用成果。
奥地利AVL公司的Schiff Banker等人通过测量60种有代表性的发动机噪声,按声学特征归纳为8类评价指标,提炼出48个物理特征量,建立了完整的噪声族谱测试方法和以数理统计为基础的主观评价技术[7];此后,日本学者在此研究的基础上,又将这 8 种声品质评价指标扩展成 12 种,并进一步完善了声品质的评价[8];日本本田公司提出了如响亮、轰鸣、强劲、尖锐、平稳等10余种主观感觉作为声质量评价的属性,并归纳为运动感和豪华感两类基本声学评价属性,并针对不同国家建立了客观量化的数学表达式[9]。
1997 年,R. Bisping提出在车内声品质的特征参数中愉悦度和劲度是最为重要的两个[10-11]。而R. Guski对车内声品质的特征参数进行深入的研究之后,则提出了3个心理声学参数:愉悦度、劲度和激励响应[12]。同年,福特公司对主观评审试验进行了系统的总结,对比了成对比较法、语义细分法、等级评分法和简单排序法等方法,得出成对比较法和语义细分法更加有效的结论[13]。1999 年,
R. Hoeldrich等人仔细研究了粗糙度的计算方法,针对其缺点提出了改进意见,使其适用于特定车内噪声声品质的研究[14-15]。同年,奥地利AVL公司针对欧洲乘客,研发了一款车内声品质评价的软件系统,可直接绘制声品质的评价曲线[16-17]。
2007 年,韩国仁荷大学的Sang-Kwon Lee等人对小型乘用车进行了声品质研究,指出了影响车内隆隆声的主要影响因素是响度和粗糙度,并建立了基于神经网络的声品质客观量化模型,分析了响度、尖锐度和粗糙度对轰鸣声和隆隆声的影响[18-19]。2010 年, Vanni Falasca 等人,经过大量的试验,建立了针对重型商用车的完整的声品质客观量化模型,模型输入的主观评价指标为低频结构噪声、高频空气传播噪声和风噪声[20]。
目前国际上对于汽车声品质的研究仍处于不断发展完善的阶段。由于受到地域、文化差异和民族习惯等的影响,各国学者对声品质的理解不同,难以形成统一的汽车声品质评价标准,导致研究方法的多样性,研究结果的差异性。
1.2 国内汽车声品质研究现状
国内在汽车声品质方面的研究起步相对较晚。近几年,以同济大学、吉林大学、重庆大学等高校为首的研究团队在国外的声品质研究成果的基础上,对汽车声品质评价有了深入的研究,并取得了丰硕的成果。
同济大学的声学研究所对汽车声品质的研究较早,为国内声品质研究奠定了坚实的基础。2003年,毛东兴以匀速行驶条件下车内噪声为研究对象,系统完整地对声品质主观评价与分析方法进行研究,建立了汉语环境下声品质研究的基础[3]。2005年,该团队对声品质主观评价的成对比较法有了深入的研究,针对成对比较法在主观评价试验中的缺点,提出了分组成对比较法,并给出了评价试验的三角循环误判的方法,不仅缩短了评价时间,而且提高了评价结果的可靠性[21-22]。2006年,其又建立了以 1/3 倍频程声压级、锐度和粗糙度为变量的车内声品质低沉度参量的数学模型,并通过主观评价试验的方法验证了模型的准确性和有效性[23]。2009年,申秀敏等人建立了基于神经网络的车内声品质预测模型,结果表明与多元线性回归方法相比,神经网络方法具有更高的预测精度[24]。
吉林大学对汽车声品质的研究取得了较大的进展。2006年,刘宗巍等人介绍了声品质客观量化的研究概况,并阐述了噪声主动控制方法在改善汽车声品质方面的作用和潜力[25]。2007年,梁杰以多工况下的车内声品质为研究对象,通过分析心理声学参量,构建了车内声品质的量化模型,并以此模型指导汽车的降噪措施[26]。2009 年,谢军建立了以心理声学客观参量描述车内声品质的数学模型,开发了基于双耳听觉模型的车内声品质分析与评价方法的分析系统,并进行了验证[27]。2010年,孙强针对车内声品质,进行了主观评价试验和客观量化描述,并采用人工神经网络技术建立了声品质偏好性和烦躁度的BP神经网络预测模型,与多元线性回归方法对比分析,验证了神经网络模型的准确性和优越性[28]。
2008年,重庆大学VDL团队的赵勤采用多元线性回归方法对摩托车声品质进行研究,建立了以心理声学客观参数量化描述主观评价结果的声品质数学模型,并用主观试验验证了模型具有良好的预测性[29]。2010年,张亮采集了摩托车有效噪声样本,预处理后进行了主观试验,提出了声样本心理声学参数的特征因子,将神经网络应用于声品质评价中,建立起能反映声品质参数与人的主观感受偏好性之间关系的评价模型[30]。2012年,张芳对13辆不同类型乘用车的喇叭进行声学测试,计算各样本的主要心理声学客观参量,通过相关和回归分析建立了描述主观评价与客观参量之间相关性的偏好性评价模型[31]。该团队在弹性板/矩形腔耦合系统声品质、汽车雨刮器声品质及发动机启动时车内声品质等都有较深入的研究,并取得了一定的成果,可以作为进一步研究的借鉴[32-34]。
国内对汽车声品质的研究虽已取得了一定的成果,但与国外相比还存在较大的差距,例如对声品质的客观参量缺乏深入的分析,缺乏专业的声品质评价人员,客观量化模型的建模方法单一且效果不佳,不能很好地与实际车内声学设计相结合,因此需要相关的研究机构、学者、汽车公司继续努力。
2 声品质主观评价研究
目前,对声品质的评价可分为主观评价和客观评价两种。声品质的主观评价方法是一种以人为主体的,主要是通过问卷调查或评审团主观评价试验的形式,运用心理学等多种学科对声品质进行评价的方式[35]。其本质上就是运用试验心理学的方法来研究噪声问题,其涉及的因素很多,包括测试对象的选择、噪声的准备、听测环境和评价方法的选择等。目前,国际上主观评价中常采用的方法有成对比较法、语义细分法、等级评分法、排序法、多维尺度分析法等。主观评价方法在不断发展,不同方法都有其优缺点以及所适用的环境,因此经济、有效评价方法的研究也是声品质研究中的一个重要方面。
2.1 成对比较法
成对比较法(Pair Comparison)是一种广泛使用的评价方法,按照事先设计好的声音样本矩阵,将声音样本成对播放,评价者根据评价任务做出比较评价。该方法的试验设计和分析相对简单,国内外很多学者在研究声品质中应用了这种方法,并得到了满意的结果。
成对比较法是一种相对的评价方法,因而人耳能够分辨出两个声音样本的微小差异,没有经验的评价者也容易掌握,将样本进行组合的方式也提高了评价的准确性。而且,成对比较法有多种方法来进行数据检验,从而保证评价结果的合理性。成对比较法也存在缺点,随着声音样本的增加,比较对会按照样本数量的平方迅速增加,导致评价工作耗时耗力,使评价者产生疲劳。同济大学声学研究所毛东兴等人针对该缺点,提出了分组成对比较法。其基本原理是:将总体样本分成多个样本组,各样本组之间预设关联样本,对各样本组独立进行成对比较试验,最后重建整体样本的评价结果。该方法是成对比较法的一种改进,取得了较好的结果。
2.2 语义细分法
语义细分法(Semantic Differential)是评价者依照一系列意义相反的形容词对,对声音样本进行评价,即等级描述。事先设置好的形容词对要易于理解,并符合研究目的,比如安静的/喧闹的。将意义相反的形容词安置在等级的两端,中间使用一些量度的副词,评价者根据对声音的主观感受做出相应的评价,最后经过数值化分析转化为相应的分数。评价等级一般可以划分为5级、7级、9级等。
研究表明,在对样本依次进行评价的过程中,由于受到各种因素的影响,评价者的主观衡量标尺也在不断地调整中。从而造成评价结果的离散性大,重复性差,尤其是在样本数量较大时该问题更加明显。针对该缺点,毛东兴等人在此方法的基础上,提出了参考语义细分法,其基本原理是:选择一个参考样本,评价过程中参考样本与其余的声样本依次进行比较,评价者根据评价指标,对评价样本相对于参考样本做出区域的判断。该方法提高了评价结果的准确性,取得了良好的效果。
2.3 等级评分法
等级评分法(Rating scales)是根据声音的某个属性,在设定的评分范围内进行评分。评价试验过程中,声音样本需要按顺序播放,且不能重播,评价者要在预先设定的评分范围内对听到的声音进行评分。该方法要对全部的评价结果进行数据检验,在剔除不合格的评价结果后,评价分值的算术平均值就是该样本的声品质分值。由于该方法得到的结果为分值形式,因此简便快捷,便于后续分析处理,是一种比较常用的方法。对于未经训练的评价者,很难给出准确数字来代表主观感受,这会降低评价的准确性,因此采用等级评分法时要选择适当的等级范围,并对评价者进行一定训练。
对于等级评分法的评价结果,通过计算各评价者之间相关系数的方式进行数据检验。通常选用统计学中的Spearman相关系数作为该方法的数据检验。
2.4 排序法
排序法(Rank Order)是主观评价中最简单的一种方法。评价者根据声音的某个属性,在所有样本连续播放完后进行好坏的排序。评价过程中,声音样本可以进行多次重复播放。但是,采用该方法时只能对少量的样本进行评价,通常样本数量不能超过6个。
排序法与等级评分法类似,以数值估计的形式对声音样本进行评分,但是无法给出具体的比例尺度,只能简单判断声音样本的优劣,适用于快速得到声音样本的简单比较结果。
3 声品质客观评价研究
声品质客观评价是以声音的物理参数及心理学客观参数为基础,通过测试分析这些客观参数来评价声音的优劣,并根据对声音的频率、包络、调制及调幅等仿真修改来确定令人烦恼的原因所在。
声品质客观评价研究的目的是建立声品质主观感知属性与物理声学、心理声学之间的联系,即从物理声学、心理声学的角度,对噪声声品质的主观属性进行理解。为了客观量化对声音的主观评价,国际上许多专家学者经过长期的理论和试验研究提出一些心理声学的基本参数。声品质客观评价方法的基础是心理声学参数的合理应用,即提取声音的客观参数及建立数学模型来表征声音特性,如响度、尖锐度、粗糙度、波动度等。
3.1 响度
响度(Loudness)是备受关注的心理声学参数,它反映人耳对声音响亮程度的主观感受,考虑了人耳的掩蔽特性,也是声品质研究中最早被运用的参数。响度的单位为宋(sone),定义1 kHz、40 dB的纯音具有的响度为1 sone。一般来说,声音的响度值越大,对人造成的烦恼程度也越严重,声品质也越差[36-37]。
响度计算模型最早是1933年Fletcher和Munson提出的,但是该模型使用起来非常麻烦。目前应用广泛的响度计算模型标准有3种,它们都考虑了人耳的掩蔽效应、双耳效应等因素的影响,分别为Stevens模型、Zwicker模型和Moore模型。
3.1.1 Stevens响度模型
1956年,Stevens提出了新的响度计算模型。该方法是基于一组等响(Loudness Index)指数曲线,经过不断改善具有多个版本的曲线图表,其中 Mark VI成为1975年的国际标准ISO 532A并一直沿用至今。模型可以根据以下几个步骤完成:
(1)将输入信号按其频带宽划分成多个窄带信号,测量或计算每个窄带信号的频带声压级。
(2)根据频带的中心频率和频带声压级,在等响指数曲线中找出每个频带对应的响度指数S。
(3)总响度St及响度级的求解。
,
。
式中,St为总响度;Sm为最大的响度指数。整个计算过程中,响度指数的获取是最重要的一步。
3.1.2 Zwicker响度模型
1958年,Zwicker提出了一种基于激励模型的响度计算法,该模型是建立在对人耳听觉机制深入理解的基础上,反映了人耳耳蜗的工作机制。从ISO 532B的利用图表进行计算,到修订后的德国标准DIN 45631的计算机程序算法,Zwicker模型有了成熟的发展,该计算模型也成为了国际标准并得到广泛应用。模型在计算流程上体现了人耳的听觉感知过程,其计算流程如图1所示。
3.1.3 Moore响度模型
1996年,Moore 在Zwicker计算模型的基础上进行了改进,最突出的是实现了外耳和中耳传递函数的确定及激励模型的具体转化方法。相对于Zwicker模型中的图表方式,改进后的Moore激励模型的计算是基于解析式的,实现了响度值随频率、强度改变的连续计算。与其它计算模型对比,使用Moore模型所得计算结果最准确,Moore模型成为2005、2007年版的美国国家标准。Moore的计算流程如图2所示。
3.2 尖锐度
尖锐度(Sharpness)描述了声音品质评价中的音色特征,是衡量一个声音尖锐或沉闷程度的心理声学参量。通常来说,声音越刺耳,则尖锐度越高,声品质也越差。尖锐度的单位为“acum”,规定中心频率为1 kHz,带宽为160 Hz的60 dB窄带噪声的尖锐度为1 acum。声音信号中的高频成分对尖锐度的贡献量大,而低频成分的较小[38-39]。
目前,尖锐度的计算并没用统一的国际标准,其数学模型都是基于响度模型中的特征响度进行计算,常用的有Zwicker模型和Aures模型。两种模型都能够对尖锐度进行较准确的计算,但Aures尖锐度模型比Zwicker尖锐度模型更依赖于响度,因此,在已包含响度的心理声学参数模型的情况下,常用Zwicker尖锐度模型。常用的尖锐度计算模型如下:
Zwicker尖锐度模型
。
式中,S为尖锐度;N表示总响度;k=0.11为加权
系数;z为心理声学的特征频带率,Bark;N"表示特征响度,sone/Bark;g(z)是响度加权函数。Zwicker根据不同的临界频带设置如下:
。
Aures尖锐度模型
。
由以上公式可知,Aures尖锐度并不是特征响度的加权矩,而仅仅是特征响度的加权和。
3.3 粗糙度和波动度
粗糙度和波动度都是描述声信号的瞬时变化给人听觉上的不同感受。Zwicker在研究调幅纯音时指出,随调制频率从低频到高频的变化,人耳可获得3种不同的感受:当调制频率在15 Hz以下时,人们能感受到声音的高低起伏,这时的感受称为波动度(Fluctuation);调制频率超过15 Hz以后,人们的感受逐渐变为粗糙度(Roughness),并在70 Hz左右,感受到粗糙度最大;当调制频率大于150 Hz以后,可以清晰地分辨出3种(原频带、和频、差频)声音[40-41]。
粗糙度是人体听觉器官对噪声信号在时域上幅值(即包络)快速变化的一种感觉,反映了声音信号的调制程度、调制幅度大小和调制频率分布。粗糙度具有许多计算模型,各模型的主要差别在于将信号包络转换为粗糙度的方式。遗憾的是几乎所有模型都无法完全同主观试验数据吻合,至今尚未形成计算标准。粗糙度的单位为asper,以60 dB、1 kHz纯音经100%幅值调制,70 Hz调频调制时的粗糙度为1 asper。应用较为广泛的Zwicker&Fastl模型为
。
式中,R代表粗糙度;fmod为调制频率;ΔLE为声信号激励级的变化量。
抖动度用于描述人耳对缓慢移动调制声音的感受程度,它反映了人耳主观感受到的声音响亮起伏程度,尤其适用于描述20 Hz以下低频调制的声音信号。抖动度的单位为vacil,规定声压级为60 dB的1 kHz纯音经100%调幅调制、4 Hz调频调制时的抖动度为1 vacil。抖动度的计算与粗糙度类似,其数学模型为
。
式中,F代表抖动度;f0为调制基频,取值为4 Hz。
3.4 语音清晰度
语音清晰度也叫AI指数(Articulation Index),描述了由于噪声原因导致人与人交流时语音清晰度发生变化的物理量,其大小与背景噪声的高低及其频率特性相关。对于车内噪声环境而言,人耳能够听到的语音范围为200~6 300 Hz[42],如图3所示。
由图3可知,在噪声声压级小于可听语音范围时,AI指数很高,几乎达到100%,人与人之间的交流受到轻微的影响;而在噪声声压级的幅值大于可听语音范围时,AI指数很低,降为0%,人与人之间的交流会受到很大的影响。在该频率范围内(200~6 300 Hz),每个频带语音清晰度百分比的平均值即为总的语音清晰度。
4 声品质客观量化模型
声品质研究最终的评判标准是人的听觉感受,虽然可以用某些客观参量来进行描述,提高评价效率,但人是声音的最终接受者和评判者,声品质的研究不能脱离人。然而主观评价试验的一致性和重复性较差,需要大量的人力、物力和时间。声品质的客观评价和主观评价各有其应用特点,如果主观与客观结果具有很好的一致性,就能结合主观评价和客观评价的优点,这就是研究主客观统一模型的出发点。近年来,研究人员一直在研究如何用定量的方法来描述声品质的主观评价,即将客观评价与主观评价相结合,以心理声学评价参数为基础,建立能够客观衡量的声品质评价模型。
建立主观与客观评价结果的映射关系,最常见的方法是采用数理统计的方法,先进行主成分分析或显著度分析,再构造形成多元线性或非线性回归模型。Norman C. Otto 等人对汽车启动声品质进行研究分析,采用成对比较法主观评价,并进行主成分分析,得到准确可靠的声品质评价结果[43]。合肥工业大学的陈剑等人采用分组成对比较法评价车内噪声声品质偏好性,并对评价结果进行相关分析和多元回归分析,得到回归方程[44]。吉林大学的王登峰等人以4种类型轿车在不同挡位和车速下匀速行驶时副驾驶员耳旁噪声为评价对象,分析计算了各噪声样本的主要心理声学客观参数,并通过相关分析和多元回归分析,建立了以客观参数描述主观评价结果的数学模型[25-28,45]。韩国汉阳大学的Jae-Eun Jeong 等人运用多元统计分析方法,结合心理声学参数,提出了车内声品质的马氏距离算法,大幅度提高了声品质客观量化模型的预测结果精度[46-47]。
数理统计的方法在声品质主客观统一模型的建立中得到了成熟的应用,但是人耳对听觉事件的感知过程是一个非线性的映射过程,该方法难以达到理想要求。
神经网络方法则因为其非线性和自主学习特征,在建立声品质主客观统一模型中也得到了大量应用。韩国仁荷大学的Sang-Kwon Lee 在深入学习神经网络知识的基础上,将神经网络算法应用到声品质客观量化模型中,并分析了心理声学参数中的响度、尖锐度和粗糙度与主观感受的轰鸣声和隆隆声之间的关系[18-19,48-49]。上海工程技术大学的王岩松等人鉴于模型的非线性特性及主观与客观评价各自的优缺点,采用BP神经网络建立声品质评价模型,并对模型的准确度进行了验证分析,结果表明该模型的评价结果相比普通的噪声评价指标更能体现人体的主观感觉[50-52]。吉林大学的孙强等人应用BP神经网络知识,建立了车内声品质BP评价模型,并对模型训练及结果进行对比,证明采用该模型,可以节省主观评价所需的大量人力物力资源,降低研发成本,为汽车声品质的评价预测提供了一种可靠的方法[25-28,53]。神经网络方法具有其非线性的优点,但却都受制于一个难题,即要求有较多的训练样本,而许多实际应用中能够获得的样本数量却往往不够充分。对于小样本集,训练结果最好的模型不一定是预报能力最好的模型,即所谓“小样本难题”。
支持向量机(Support Vector Machine,SVM)方法具有非线性、小样本及泛化能力强等特点,在语音识别、文字识别等领域得到成功应用[54-55],已取得令人鼓舞的研究成果,但国内外车辆工程领域内支持向量机的应用还少有报道。比利时鲁汶大学的Coen等人采用最小二乘SVM方法对发动机声舒适性进行了分类和建模[55]。而天津大学的刘海等人应用遗传算法优化支持向量机建立起车用柴油机声品质预测模型,并与BP神经网络预测模型进行对比,结果表明基于GA-SVM的辐射声品质预测模型能够准确地反映客观评价参量与主观满意度之间的非线性映射关系[56]。申秀敏等人对多元线性回归、神经网络和支持向量机的三类预测模型进行比较,并以车内噪声数据样本为对象,对支持向量机算法的车内噪声声品质预测问题进行了尝试,可以作为进一步应用的借鉴[57]。
虽然以心理声学指标、数理统计参数估计方法及电声试验方法为基础的模型与方法在车辆的噪声品质评价与应用等方面已取得了相当进展,但由于人主观因素的复杂性,对车辆噪声的主观与客观的评价指标参数选择、主客观统一描述方法、人群偏好性特征等问题却并没有好的解决办法,有待进一步完善。
5 讨论与结论
本文详细介绍了汽车声品质研究的主观评价方法和客观评价方法,并对建立声品质客观量化模型方法的优缺点进行了对比。从以下几个方面进行讨论,并指出了未来汽车声品质研究的重点。
(1)虽然稳态工况下汽车声品质的研究已渐趋成熟,然而对于非稳态下的汽车声品质仍处于起步阶段。汽车非稳态下声品质的好坏与汽车的设计、制造工艺密不可分,在一定程度上反映了整车加工制作的质量,也是衡量一个国家汽车工业发达与否的标准。汽车非稳态声品质的研究对汽车制造具有重要意义和应用价值。
(2)声品质客观评价方法的基础是心理声学参数的合理应用,虽然国内外对心理声学参数及建立数学模型的研究已经发展了较长时间,也取得了丰硕的成果,但是很多心理声学参数仅适用于稳态声学信号,而且没有统一的国际标准,这需要进一步研究完善。
(3)建立主观与客观评价结果的映射关系,传统的方法难以达到理想效果,支持向量机方法具有非线性、小样本及泛化能力强等特点,在汽车声品质预测模型方面的应用具有广阔的前景,但是国内外在该方面还鲜有报道,还需要深入分析声品质客观量化模型建立的原理和步骤,进行仿真实例验证。