嗓音声学检测影响因素分析

/ 5

嗓音声学检测影响因素分析

1李艳:2王红星:3刘新舟:

中南大学湘雅公共卫生学院,

中南大学湘雅医院康复医学科,

中南大学湘雅医院康复医学科,

通讯作者:李哲,中南大学湘雅医院康复医学科

嗓音是语言的基础,在沟通、个性表达以及社交中具有重要意义。大脑语言中枢发出指令控制呼吸肌收缩产生气流上行至声门形成声门波,产生基音[1],基音向上传导经过共鸣腔体和构音器官时某些声音被放大,形成不同的嗓音[2]。在嗓音形成通路上神经支配、解剖结构或功能损害会导致呼吸、发声、共鸣或构音等功能异常,进而出现嗓音障碍。嗓音障碍是临床中常见的主诉,也是一些隐匿性疾病如帕金森、肌萎缩侧索硬化以及喉癌等的早期表现。因此,嗓音障碍的精准识别对于疾病的早期诊断与治疗具有重要意义。

目前,嗓音的评估主要包括患者主观评分、感知嗓音评估、动态喉镜检查、空气动力学和声学评估五个方面。其中嗓音声学检测由于无创、易获取、可重复并能提供喉功能相关的定量数据,是嗓音客观评估的首选方法之一。通过测量基频、共振峰、基频微扰(Jitter)、振幅微扰(Shimmer)以及噪协比(NHR)等多个指标反映发声过程声带振动的稳定性和规律性[3]、共鸣以及噪声能量等。因此声学检测在早期识别异常嗓音、疾病诊断、评估嗓音功能、动态观察病情以及评价治疗方案中均有优越表现。但由于嗓音是一个复杂多维的过程,会受到声门下气流、声带振动以及共鸣等因素的影响,目前尚未出现统一的嗓音声学检测方法也缺乏鉴别嗓音障碍的声学区间值。本文将对影响嗓音声学的因素进行梳理,分析可能影响声学检测结果的因素,为提高声学检测的准确性及后续临床中嗓音的精准评估提供参考。目前国内外开展的嗓音声学影响因素分析主要归纳为个体差异和检测方式两个部分。

1.个体差异

1.1人种、语言

嗓音因人种、语言、文化的不同而有一定区别[4]。嗓音声学研究选择的元音在阿拉伯语中[5]是/i:/、/e:/、/a:/、/o:/和/u:/,在瑞典[6]语中则是/e:/、/u:/、/i:/和/ɔ/,而汉语主要集中在/a/、/i/和/u/,在汉语不同方言与民族语言中相同元音也表现出显著差异[7]。声带振动产生基音,在高位言语中枢及相应神经的控制下经过胸腔、咽腔、口腔以及鼻腔音进行共鸣,某些谐音被选择性的放大,形成共振峰。发声过程中,随着软腭、舌、唇、齿的活动,声道的形状与长度也发生改变,共鸣特性也产生相应改变。发音时由于不同元音舌位前后与高低位置的不同,导致第一共振峰与第二共振峰产生相应变化[8]。此外由于人种生理特性和发声习惯的差别,对声带振动、共鸣和构音都产生不同程度的影响,因此在声学检测研究中应将人种和语言因素纳入考量。

1.2年龄

嗓音随着年龄增长产生显著变化,婴幼儿、青春期(变声期),成年人以及老年人各阶段嗓音参数存在差异显著都有其各自的特点。新生儿声带短,发育不完全,随着年龄增长相关肌肉、声韧带和膜部逐步发育,幼儿段声音高亢,进入青春期后激素水平及喉结构变化,嗓音也经历了明显的变声过程开始变低沉并开始表现性别差异[9]。青年至中年嗓音较趋于稳定,是嗓音研究的较好时期。而进入老年后喉结构、激素水平都开始衰退,声带振动稳定性也开始受影响[10]。当前有关研究主要集中在对比不同年龄阶段嗓音声学值的变化,缺乏特定阶段的深入研究。在嗓音声学检测中应充分考虑不同年龄段界定所处发育或衰退阶段对嗓音的影响。

1.3体型

声带振动过程中物体的基本频率与其质量成反比,振动时肌纤维不同程度与方式的收缩会引起声带长度与厚度的变化,从而使振动组织的质量发声改变,进而影响基频。对三维CT成像[11]和尸体解剖[12]结果表明,声带伴随着喉软骨的生长延长体积增加,更大的颈围和喉凸起意味着更长的声带,因而我们推测基频或与颈围、体型有关,目前,国内目前尚未见体型与嗓音声学关联的相关研究。国外有部分研究表明体型与声学有关,但相关性很微弱[13],而Collins等[14]发现身体特征与声音特质没有关系。这可能与反映体型变量的选择与混杂因素的控制有关,如何选取恰当的体型变量参数尤为重要。

1.4空气动力学

目前与发声有关的空气动力学指标主要有声门下压、发声阈压、平均气流率、声门阻力以及最长声时等[15]。无创、简单易获取的空气动力学指标最长声时被认为与肺活量和声门闭合度有关,进而能间接反映喉功能[16],是目前临床嗓音工作中最常用的指标之一。曹媛等[17]在比较声带息肉、声带白斑与喉癌等占位病变时发现,最长声时则依次降低,而Jitter、Shimmer和NHR依次增加。同时,在有关阻塞性睡眠呼吸暂停低通气综合征(OSAHS)的研究中发现OSAHS组在声门下压、平均气流率明显高于正常组,声门阻力及发声效率低于正常组,而与之相应的嗓音声学检测结果显示Jitter、Shimmer和NHR等相关指标明显高于正常组[18]

。这可能是因为OSAHS患者因上气道结构异常或病变导致呼吸阻力增加经口呼吸增加,但由于没有鼻腔湿润作用导致声带表面干燥,摩擦力增加。为维持声带振动需要更高的声门下压[19],同时振动过程中产生的噪声能量也更高。Tao等[20]也发现声带表面水分减少会引起发声阈值升高,而当压力增加到一定程度时会导致声带损伤,而声带振动受损与嗓音声学多个指标直接相关。空气动力学为发声动提高原动力,也从多个方面影响嗓音,因此在声学研究的过程应考虑空气动力学对声带振动的影响。

1.5患病

声带或喉的病理改变,如声带小结、息肉、赘生物或其他占位病变影响声带本身的质量与弹性,同时对其振动的规律性与闭合产生不同程度影响,进而出现病态嗓音[21]。当前大部分研究聚焦于某些病种的病理性质与侵犯部位给嗓音声学带来不同程度的影响。近期,唐静等[22]发现帕金森患者共振峰显著低与对照组,且随疾病严重程度增加而降低。这可能和声带僵硬[23]或口腔关节活动有关[24]。此外,在对声带小结、白斑、喉癌、唇腭裂以及功能性构音障碍等患者的研究中也都发现其嗓音声学与正常人存在显著差异[25]。因此,进行嗓音研究时应充分考虑嗓音病理改变对声学的影响。

1.6其他

日常抽烟、大量饮酒以及专业训练等都会对声音产生一定影响。申金霞等[26]研究发现吸烟者的jitter、shimmer和NHR都显著高于对照组,且随着烟龄的增加影响更大。吸烟带来的影响主要是声带水肿和粘膜干燥[27]。而在饮酒研究中酒龄较短者与正常组无显著差异而较长者(>15年)则噪声能量较对照组显著升高。临床中饮酒会导致咽喉反流,胃酸、胃蛋白酶等可能对声带粘膜造成刺激,导致粘膜上皮角化或不典型增生进而影响嗓音[28]。王建群等[29]在对比不同歌唱专业人员与对照组嗓音声学时发现,专业歌唱人员与对照组在振幅微扰和谐噪比有显著差异。

2.检测语料

检测语料是指声学检测过程中仪器录入并分析的声音样本,是嗓音声学分析的主要载体。声学检测对于嗓音质量评价、诊断嗓音疾病、评估疗效具有重要参考价值,其中检测中语料的选择是首要问题,恰当的语料能更准确反映受试者嗓音情况和发声系统状态。声学分析可采集频率、幅度、时间等方面信息,包括元音或连续语音(即音节/单词/句子),二者之间发声行为存在很大差异[30]。其中连续语音更接近日常用语的真实情况,但由于计算机嗓音声学检测是基于稳定语音的检测。录入声音样本后字段语音在提取基频和稳定字段困难程度大大增加,而基频的提取直接影响各声学参数的具体数值,导致其准确性欠佳。声学检查需要选择截取数据进行分析,对辅音以及连续语音的分析的可靠性较元音差,与主观听感知评估的相关性也欠佳,因此目前国内外研究更多的依然是稳定元音,以稳定元音为基础的研究主要集中在各语种的元音以及不同声强。而使用元音作为检测语料有包含具体元音的选择和发声强度的选择。

2.1元音类别

以往认为胸声区稳定元音的声带振动不受元音类型影响,但此观点逐渐不被多数学者认可。后续研究表明元音差异会影响声带振动,进而对声学结果产生影响[31]。发/a/时声带呈自然状态,声道形状较开阔,对声音影响较小[32];元音/i/使声门暴露充分,声带被拉紧变薄易,受病理变化影响但代偿能力强会导致嗓音声学检测出现“漏诊”。同时/a/、/æ/有效频段较/i/、/u/宽,且有效频段集中在频域高段,更易受相关疾病声学信号的噪声影响,因而有利于更早检出病态嗓音[33,34]。近年来国内外相关研究多采用各地区语种相应元音进行声学分析,但具体采用哪一个元音作为检查的声样尚未达成共识[34]

2.2声强

声强是指单位时间里流经单位面积的能量包括最低音、舒适音、真声最高音和假声最高音。最低音、舒适音和真声最高音由声带整体振动属于胸音区,假声最高音由声带边缘或部分振动为头音区。杨式麟等[36]发现胸声区发声的频率与声强的升降是并行的,但由真声最高音转向假声最高音的频率虽然频率升高并与其真声最高音有显著差异,但声强下降并与真声最高的声强有显著性差异。这说明假声最高音的频率增加并非靠气流强度冲击,而是靠声带拉紧变化的边缘振动。既往大部分研究选择的是日常生活中使用比较多的舒适音,但病变往往对整体振动影响较轻,边缘振动影响较重或先影响边缘振动,故检查是不能忽视假声最高音的检测,有利于疾病的早发现和早诊断。进行全音域的发声样进行研究有利于对不同发声强度声学特点的研究,同时能减少声强控制不同对声学结果的影响。

嗓音是一种不稳定的复合信号,能从多个维度反映发声生理和病理情况,而如何早期准确、高效识别病理嗓音是目前研究研究关注的重点[36]。但由于嗓音受到发声过程中诸多因素影响目前尚未有统一公认的指标或方法能全面评价嗓音问题,因此明确嗓音的影响因素对提高声学检测准确性、声学区间值的划分以及异常嗓音治疗方案的个体化制定具有重要意义。此外,加强声学检测与其他评估的结合,探索多参数的综合化分析以及声学机器学习系统的研发是未来的研究方向,也将为嗓音障碍的识别、评估、诊断和治疗方面提供重要参考。

参考文献:

[1]Lu D, Chen F, Yang H, Yu Ret al. Changes After Voice Therapy in Acoustic Voice Analysis of Chinese Patients With Voice Disorders. J Voice. 2018 May;32(3):386.e1-386.e9

[2]刘雄光杨强. 嗓音声学检测中的常用指标及意义 [J] 中国中西医结合耳鼻咽喉科杂志. 2004, 06. 345-347.

[3] Manfredi C, D'Aniello M, Bruscaglioni P,et al, A comparative analysis of fundamental frequency estimation methods with application to pathological voices. [J] Medical engineering & physics. 2000, 222. 135-147.

[4] 王臻旎,陈旸,吴民华等.成人普通话元音的声学分析(英文)[J].康复学报,2020,30(03):183-191

[5] Natour YS, Marie BS, Saleem MA,et al. Formant frequency characteristics in normal Arabic-speaking Jordanians[J]. J Voice. 2011 Mar;25(2):e75-84.

[6] White P . Formant frequency analysis of children's spoken and sung vowels using sweeping fundamental frequency production[J]. Journal of Voice, 1999, 13(4):570-582.

[7]孔江平. 论语言发声[M]. 中央民族大学出版社, 2002.

[8]万萍, 黄昭鸣,郑钦. 中国人嗓音共鸣功能的声学基础研究 [J] 临床耳鼻咽喉头颈外科杂志[J]. 2010, 2406. 250-252.

[9]路绩云, 刘莎, 徐文,. 正常青少年嗓音的元音发音特性 [J] 听力学及言语疾病杂志. 2007, 153. 195-197,201.

[10]侯丽珍, 韩德民, 徐文, .国人正常嗓音特点的相关研究 [J] 临床耳鼻咽喉科杂志. 2002, 1612. 667-669.

[11] Inamoto Y , Saitoh E , Okada S , et al. Anatomy of the larynx and pharynx: effects of age, gender and height revealed by multidetector computed tomography[J]. Journal of Oral Rehabilitation, 2015, 42(9):670-677.

[12] N. Enver, C. Doruk, E. Kara, et al. Does Size Matter in Laryngology? Relation Between Body Height and Laryngeal Morphometry[J]. Journal of Voice. 2019, 35prepublish.

[13] K. Pisanski. Voice parameters predict sex-specific body morphology in men and women [J] Animal behaviour. 2016, 112. 13-22.

[14] Collins S A . Men's voices and women's choices[J]. Animal Behaviour, 2000.

[15] S. Larissa,Thaís Donalonso. Influence of vocal and aerodynamics aspects on the voice-related quality of life of older adults. [J] Journal of applied oral science : revista FOB. 2020, 28. e20200052.

[16] Dejonckere P H , Bradley P , Clemente P , et al. A basic protocol for functional assessment of voice pathology, especially for investigating the efficacy of (phonosurgical) treatments and evaluating new assessment techniques. Guideline elaborated by the Committee on Phoniatrics of the European Lary[J]. European archives of oto-rhino-laryngology: Official journal of the European Federation of Oto-Rhino-Laryngological Societies (EUFOS), 2001(2):258.

[17]曹媛,张奇雪,阮宏莹,.声带占位病变患者多维嗓音声学分析及发声空气动力学检测比较[J].听力学及言语疾病杂志, 2019, 27(3):5.DOI:10.3969/j.issn.1006-7299.2019.03.011.

[18]魏梅,杜建群,王晓雨,.阻塞性睡眠呼吸暂停低通气综合征患者多维嗓音及发声空气动力学分析[J].听力学及言语疾病杂志, 2019, 27(6):6.DOI:10.3969/j.issn.1006-7299.2019.06.007.

[19] Titze I R , Fitch W T , Hunter E J ,et al.Vocal power and pressure-flow relationships in excised tiger larynges.[J].Journal of Experimental Biology, 2010, 213(22).DOI:10.1242/jeb.044982.

[20] Tao C , Jiang J J , Zhang Y .A fluid-saturated poroelastic model of the vocal folds with hydrated tissue[J].Journal of Biomechanics, 2009, 42(6):774-780.DOI:10.1016/j.jbiomech.2008.12.006.

[21]周林灿.病理嗓音的声学分析和合成[D].华东师范大学,2011.DOI:10.7666/d.y1903630.

[22]唐静,陈林丽,杨荆生,.元音发音障碍作为帕金森病早期标志的评估[J].中国神经免疫学和神经病学杂志, 2023, 30(2):110-114.

[23]Tseng WenHsuanChang ChiChinYang TsungLinHsiao TzuYu.Estimating vocal fold stiffness: Using the relationship between subglottic pressure and fundamental frequency of phonation as an analog[J].Clinical otolaryngology: official journal of ENT-UK ; official journal of Netherlands Society for Oto-Rhino-Laryngology & Cervico-Facial Surgery, 2020, 45(1).

[24] B F M A , C D M S A , B S R B A ,et al.Sensorimotor control of vocal pitch and formant frequencies in Parkinson's disease[J].Brain Research, 2016, 1646:269-277.DOI:10.1016/j.brainres.2016.06.013.

[25]陈爽,吕士良.嗓音声学分析在临床医学领域的应用研究[J].西北民族大学学报:自然科学版, 2022, 43(3):6.

[26]申金霞,余力生.吸烟,饮酒对嗓音及喉部的不同影响[J].中国现代医学杂志, 2015, 025(007):79-82.

[27]冯彦,王斌全,夏立军.吸烟饮酒对嗓音影响的客观定量研究[J].中国药物与临床, 2007, 7(10):2.DOI:10.3969/j.issn.1671-2560.2007.10.006.

[28]罗晖晖.不同嗓音疾病的相关发病因素和声学的分析[D].福建医科大学,2014.

[29]王建群, 高下, 俞晨杰,. 歌唱艺术嗓音声学参数分析 [J] 听力学及言语疾病杂志[J]. 2005, 136. 395-396.

[30] Maryn Y, Roy N. Sustained vowels and continuous speech in the auditory-perceptual evaluation of dysphonia severity. J Soc Bras Fonoaudiol. 2012;24(2):107-12.

[31] 魏春生, 陈锋. 国际音标和a:的选择对声学测试参数的影响[J]. 临床耳鼻咽喉科杂志, 1999, 13(3):102-103.

[32] 侯丽珍, 韩德民, 徐文,. 嗓音检测中元音声样的选择[J]. 听力学及言语疾病杂志, 2002, 10(1):3.

[33] 雷科, 杨旭, 沈建中,. 成人嗓音声学参数正常参考值的研究[J]. 临床耳鼻咽喉头颈外科杂志

, 2000, 014(006):255-257.

[34] 王修信, 姚铁钧. 嗓音频谱分析中/a,i/音采样的比较[J]. 听力学及言语疾病杂志, 1998, 6(3):3.

[35]杨式.嗓音的声学检测(3)[J].听力学及言语疾病杂志, 2002.DOI:CNKI:SUN:TLXJ.0.2002-02-031.

[36] Sellam V , Jagadeesan J .Classification of Normal and Pathological Voice Using SVM and RBFNN[J].Journal of Signal & Information Processing, 2014, 5(1):1-7.DOI:10.4236/jsip.2014.51001.