郑秋豫(中央研究院语言学研究所语音实验室)
提 要:近年来台湾的语音学及相关研究,大致可分为1.语音学基础研究、2.音系学导向语音学研究、3.语音感知研究、4.数据库语音学研究、及5.语音科技开发研究。传统语音学基础研究课题,包括从产制和感知看语意焦点、界限(含词、词组、音节、变调)对音段、声调、和超音段的影响;从产制看塞音、鼻元音元音鼻化的跨语言现象、研究汉语声调及变调的处理;韵律与语音讯号处理;塞音听辨感知、声调的范畴感知、构音与听觉感知等。音系学导向的研究则以连读变调、幼儿母语习得过程中的声调习得的语音参数为主。数据库语音学研究,则有朗读、自发性二种语料的数据库设计、语料收集、标注系统、语料释出的数据库建置的前置研究,以及以语料的量化研究。研究课题包括语流韵律、自然口语的词语更正等。比较完整并具开创性的研究,当属口语语流韵律的研究。特点是在课题上不再只局限于声调、句调,直接走向大单位口语篇章的韵律研究;在方法上不再是语料观察描述,而采用建置语音数据库及量化语料的研究;在研究角度上由上而下,进而厘清宏观与由下而上微观语音单位间的关系。并以统计方法提取大批语料的声学参数,如:基频轨迹、音节长度在时程上的相对分布,响度分布的单位、语流中停顿的边界效应与停延长段,具体证明上层单位「多短语韵律语段」与下层单位短句、韵律词、音节间的分层韵律关连性以及对整体韵律输出的贡献度。此外并提出包裹式的多短语基型,解释口语篇章的整体韵律输出的规范,有系统的找到并解释了声调、句调和多短语语段间层层关系的具体证据。除提取语流韵律的阶层式特征外,并提出「阶层式多短语语段的韵律组织结构」一说;更进一步提出对应数学模型,以为语音科技开发的应用。总的来说,口语韵律研究的课题、方法、规模、及说法皆具有开创性,并将学说直接应用于语音科技开发。与语音学相关的应用研究,则以语音科技开发为主轴,包括语音合成与语音识别,研究课题包括韵律、声调的TTS开发、语音识别的强健性相关课题、新一代口语系统与多媒体接口等研究等。
关键词:产制、感知、焦点、界限、音段、声调、变调、超音段、口语语流韵律、词语更正,数据库语音学、量化、韵律组织、语音科技开发
近年来台湾的语音学及相关研究,大致可分为1.语音学基础研究、2.音系学导向语音学研究、3.语音感知研究、4.数据库语音学研究及5.语音科技开发研究。其中音系学导向、语音学研究和语音感知研究,其实也在基础研究之列;数据库语音学研究则为跨学科研究;语音科技开发研究以工科研究人员为主,是跨学科研究里的应用研究。
1 台湾地区语音学研究简介─基础研究综观台湾近年的语音学门的研究方向,还是不脱传统语音学之研究课题,包括:
1.1.从产制和感知看语意焦点、界限(含词、词组、音节、变调)对音段、声调、和超音段的影响,研究者是交通大学外文系副教授潘荷仙。
1.1.1观察台闽语鼻音尾及鼻化现象如何受语调词、音节影响而产生变化,结果发现:(1)台闽语鼻音尾及有声塞音首之鼻化作用主要表现于时长上,界线强度越强,鼻气流长度越长。(2)鼻气流整体形状亦受界限强度影响,如跨语调界限常有二呼出鼻气流峰及鼻气流谷。而跨词界限常出现平坦无起伏之鼻气流。(3)各界限有其独特标记,如语调界限易造成二呼出鼻气流峰及气流谷,词界限后元音最长,跨音节界限之鼻气流最短。(Pan,2002)
1.1.2.台闽语高降调、低降调、入声高降调、入声低降调在语调、变调、词、音节界限前后之基频及长度变化。结果发现界限强度越强界限后音节之降调基频范围越大。(Pan,inpressa)
1.2.从产制观点看塞音、鼻元音与元音鼻化的跨语言现象,探讨英语、法语、国语、闽南语塞音的声学特征,研究者是清华大学语言学研究所教授张月琴。研究结果发现:英语的无声送气和不送气塞音的VOT长度和国语、闽南语的相似,但和法语的无声不送气塞音不同。(张,2000)
1.3.汉语声调及变调的处理;研究主题包括声调产制与感知,研究者是台湾大学语言学研究所助理教授冯怡蓁。研究重点是兩种汉语官话方言之異同比较,即台湾地区的国语与中国大陸的普通话。结果显示,与普通话相较,国语调阈较窄,调值也多集中于中低音阈,且国语二声之调型并非一纯扬调,而是一近似抑扬调之调型。此一调型于单字、单词及承载句中,皆相当稳定。感知相关研究亦发现,抑扬调型与扬调型,皆可诱发国语使用者二声之判定。而三声之判定只能由纯抑调型诱发。(Fon,2006)
1.4.自发性语料中韵律与语音讯号的处理;针对言谈段落、韵律段落、音阈及音长之间的对应关系,进行跨语言之比较,研究者是台湾大学语言学研究所助理教授冯怡蓁。结果显示,韵律段落、音阈与音长皆为国语、普通话、英语与日语之共通的言谈段落讯号成分。不同的是,各个语言使用成分的比例与程度皆不甚相同。有趣的是,感知实验亦发现,对以国语为母语者而言,要判定言谈段落,听辨语音讯号组合较强健之语言(如英日语),较语音讯组合号较弱之语言(如汉语官话)來得容易。
2 音系学导向的研究
2.1.由Autosegmental-Metric(AM)角度出发,设计一连串实验,探讨音节凸显性与词组界限(Phrase Boundary)如何影响音段(Segment)及超音段(Supra-Segment)之变化,研究者是交通大学外文系副教授潘荷仙。主要是研究台闽语入声音节在窄、宽焦点、不具焦点情况下的声学差异,结果发现具窄焦点音节其基频范围虽扩大,但长度之增长才是台闽语焦点语气之最稳定表征(Pan,inpressb)。此外,研究结果亦发现台闽语入声音节具creaky音质,但焦点能使入声音节之音质产生breathy现象,而较不具creaky特质,主因为基频与音质均受声带振动控制,焦点使入声音节之基频上升,因此音质从creaky变为breathy。
2.2.以连读变调、幼儿母语习得过程中的声调习得的语音参数为主,为音韵规律寻求声学证据,使形式音韵学的论述更为有力,研究者是中正大学语言学研究所教授蔡素娟。研究结果包括:(1.)台湾话入声在边界位置的完全中化(completeneutralization,Tsay,1996);(2.)台湾话声调(包括入声)在语境位置的中化(Tsay,Charles-LuceandGuo,1999;TsayandMyers,2001);(3.)台湾话变调的结构保存(structure preserving,Tsay,Charles-Luce&Guo,1999)等,都是证明台湾话变调的词汇性声学证据。此外她的研究还包括(4.)国语三声的变调(MyersandTsay,2003)及(5.)得到数据证明音节时长在声调习得中所扮演的角色(TsayandHuang,1998;Tsay,2001)。
3 语音感知研究
3.1.塞音听辨感知研究,研究者是清华大学语言学研究所教授张月琴。结果发现英语、法语和国语语者在感知闽南语的塞音时,均受母语的语音─构音的影响,均认为闽南语送气/不送气、不送气/浊声、送气/浊声三种对立中,不送气/浊声较难区辨,且英语语者的听辨结果比法语、国语语者还差。研究结果亦指出,母语音韵系统的区辨特征为送气/不送气(国语)时,语者区听辨闽南语塞音对立,比母语区辨特征为不送气/浊声(应与)的语者还容易。(Chang,2004)
3.2.声调的范畴感知,研究课题有:(1)探讨不同類型非声调语言语者其声调范畴感知特性是否相同。(2)探讨声调语言语者听辨非母语的声调范畴感知特性。(3)厘清amplitude(振幅)在声调范畴感知中的角色。研究者是清华大学语言学研究所教授张月琴。针对课题(1.)与(2.),以日语和香港粤语的语者进行国语声调(一声─二声、二声─四声、三声─四声)的听辨实验。结果发现:粤语语者听辨率较日语语者佳,但较国语语者差,支持声调感知是范畴性的,会受到母语影响。针对课题(3.),则是国语语者听辨由不同音高曲线,配上固定的振幅曲线所制成的声调刺激项。结果发现,振幅会影响声调范畴的界线点。(Chang,2006)3.3.构音与听觉感知,研究课题包括:(1.)台湾语者英语辅音串构音的构音与听觉感知(张,2004)(2.)苏州话的舌尖元音是否有标的?(张,2005)为清华大学语言学研究所教授张月琴之研究。第二项研究拟使用美国Haskins Laboratories的the PerkellEMMA system、HOCUS以及palatograph、linguagraph等设备,从构音、语音知觉、声学等角度來分析苏州话的舌尖元音构音特性:其元音特性的厘清有助于对汉语方言之舌尖元音(卷舌、非卷舌、圆唇)音韵角色的了解。
4 数据库语音学研究——跨学科研究数据库语音学研究,以中央研究院语言学研究所首开先河,并已有相当成果。研究课题包括:
(1.)口语语料库方法论研究,研究者是研究员郑秋豫和助研究员曾淑娟;(2.)口语语流韵律研究,研究者是研究员郑秋豫;(3.)现代汉语自然口语的词语更正及语音研究,研究者是助研究员曾淑娟。
4.1.口语语料库方法论研究,为数据库语言学之基础。先有研究员郑秋豫自1994年起,开始建构以朗读语料为主的国语语音数据库;2006年,又有助研究员曾淑娟开始搜集自发性语音数据库,近五年来有重要的研究成果,所建置的语音数据库也陆续完成授权程序后释出。郑秋豫于2006年1月授权民间公司释出收集十余年的多种语料及所发展的工作平台,正式对外发行《中央研究院口语韵律语料库暨工具平台》(Sinica Continuous Speech Prosody Corpora & Toolkit,简称COSPRO&Toolkit,网址:http://www.myet.com/COSPRO)。COSPRO包含九个子语料库(共10.5GB),短至孤立词组(1-4字词),长至段落语篇(85-996音节)。语料大部分是朗读语音(COSPRO编号01-08),小部分为自发性语音(COSPRO09,76MB)。111位发音人(61女,50男),因不同阶段的口语语流韵律研究课题,在录音室透过麦克风录制。释出的语料大部分(7.7GB)含音段及各级韵律停顿标注。平台则结合了Adobe®Audition®与Praat©等常用语音分析标注软件之特点,并整合语音分析、语音再合成的功能,使用者亦可自行定义标注文件名称,与原有的各类标注音檔一并使用。COSPRO可供进行语音教学、基础研究、语音科技开发(语音合成、识别与语者辨识)等多方面应用。曾淑娟于2005年11月授权中华民国计算语言学学会发行《现代汉语口语语音对话语料库》(http://www.aclclp.org.tw/use_mat.php#mcdc),释出的语料包括文字转写,可为语言学与语音科学研究提供高价值的研究素材。另外,数字典藏计划下建立的<<多媒体语料库>>也将为言谈分析创造更佳的研究工具。综合而言,以上二种语料的数据库设计、语料收集、标注系统、语料释出的数据库建置的前置研究,以及以语料的量化研究,除将传统的语音学研究的研究方法推向新的面向,在口语语流韵律研究方面,也透过量化分析,提出新的说法。
4.2.口语语流韵律研究,透过语料库语音学的研究,提出一系列证据与说法。整体而言,与一般语音学研究相异之处主要如下:
(1.)厘清连续口语语流韵律现象的规范制约来源。语流韵律的规范制约来自语段或语篇,最大的韵律特征则是韵律短语间的相对关连性(relativeassociation)。口语沟通时,凡涉及叙述、讨论、或表达较复杂的概念时,单一孤立短语无法完整表达语意,而须以连续短语组成语意相关、口气相连的语段。
(2.)提出口语韵律语流即语篇韵律(Discourse Prosody)的说法,及「阶层式多短语韵律句群(Prosodic Phrase Grouping PG)」及架构(图1)。研究结果发现,通过大批语料的量化分析,证明语流韵律实际来自语篇语意的关连性所造成的各级韵律单位的制约与互动,而非仅是字调与句调的互动;强调语篇范围大于句调的韵律单位,与边界效应均具系统性;语流中的停顿是边界效应停延后的必须成分,在语流中也承载韵律讯息。传统语音分析一向采「由下到上」的研究观点,研究韵律的重点多偏重字调和短语句调。其实,字调的规范制约单位只包括单字,字调之间关连性单位多半只达词(如连读变调);句法结构只规范孤立句的句型,句调单位仅达简单句(intonation unit简称IU)。赵元任先生(1968)曾以「大波浪小波浪」比喻,厘清了字调与语调之间的互动关系。然而,复杂句的调型或短语群的调型则付之阙如,语篇中句调间如何的互动也一向未受重视,实为传统语音研究之局限。事实上,语篇中的多短语语段也是韵律单位;口语语流韵律,其实就是语篇韵律。语篇韵律的来源是篇章语意的连贯性,其规范制约范围与单位远大于句法,强调语段中各短语间的韵律相关性,表现在听感上最显著的特征是:(1.)多短语语段如何起首、延续直到终了;(2.)各短语句调如何受制于上层韵律讯息而调整。通过大量语料的量化分析结果,郑秋豫证明多短语韵律语段PG是韵律短语的上层单位,找到PG的管辖制约证据。亦即在小波浪、大波浪之上,找到范围更大的浪潮,与其所管辖的各级下属单位层层相扣,「自涟由波、推波助澜、逐浪到潮」,各个层次分层贡献不同范围及比例的韵律成分,迭加后构成对整体韵律输出。语流中各短语句调多变的调型,其实是由于上层韵律单位系统性的规范制约而致。
(3.)提出语音学研究韵律,必须在语音单位、研究角度和研究重点上更新的看法。韵律语音单位方面,不能只局限于字调、词而止于句型,必须有大于简单句的语流韵律单位。研究角度方面,不能只采「由下而上」着重小单位的微观研究角度;必须兼容「由上而下」进行较大单位的宏观研究。研究重点不能只采取孤立语音或韵律单位的研究,必须放大语音讯号中的语境,检视语音单位间的关连性,在复杂的表面变异中,找出大单位的基型。语流韵律的研究,说明句调单位(Intonation Unit即IU)是韵律语流的次级韵律单位,各短语是姊妹关系,对即使同为叙述短句,成为PG的次级单位后,就必须依照PG指派的位置修正调整,以产生大语段的韵律语流。这也是语流中短语句调变化多端的原因。在这个跨短语的基型(图2)之上,可以在附加焦点,强调、语气等其它语音现象。
(4.)提出对应PG的跨短语调型、节拍、响度和停顿停延的模版,并提出数学模型作为语音科技开发应用。简单的说,PG将短语句调、词组韵律、字调视为规范不同层级的下级韵律单位,只需在韵律短语加上一层PG和三个韵律句群单位PG-I,PG-M,PG-F,亦即「PG起首、中段与结束」,便可系统性的解释并预估多短语语段中短语句调、节奏、响度的调整,并同时规范语流中的停顿与停延段,也就是语流中的停顿边界效应。整体来说,口语语流韵律研究通过语音数据库的建置,弥补了语料量不足的问题;透过处理大批语料的量化程序,提取特征与模版,解决了处理语音现象量稍大则无法概括出操作基型的问题。口语韵律的研究,从此也可以由上而下、从宏观的角度整合微观的观察,强调了各个语音单位在口语中的关连性,使语音学的研究不再是原子或分子式见树不见林的研究。
4.3.汉语自然口语词语更正研究,曾淑娟以语法与声韵特征分析探讨现代汉语口语层次里词语更正的使用是否具语言学上的规律性。从语法角度进行汉语词语更正类型分析、词类分布以及回溯距离分析。声韵分析则主要是基频、强度与音长三项声学特征在词语更正序列中所有的字的测量,特别是语误与更正中个别字的比较。分析结果显示现代汉语口语词语更正具有特定形式,而非任意随机现象。并不直接与语法或词类相关,而与词组的音节数较为相关。(Tseng,2006)
4.4.自然口语语音量化研究,曾淑娟检视与分析自然语音中的缩读现象,发现:自然语流包含不同程度的语音缩读。而量化分析与声学测量的结果,更进一步证实:语音缩读原应是一个连续过程,并且所指引到的最终缩读形式是可预期的。除了汉语音韵学里提到的规律,可以在语料研究里观察到之外;语料分析更显示出词汇意义与词频对缩读时音韵改变的影响。在所有缩读音节组合中,连并的双字词与三字词则多半为高频词。高频词出现音节缩读的比例比高频词在整个语料库出现的比例还来的高。这说明了语音的弱化与常用语是虚词,其携带的语意讯息通常不是新的讯息有直接的关系。由此一研究结果证明,语料库语言学并不仅是一个空洞的方法而已,而是一项科学工具,对语言学理论与现象能够能够提出有力的量化分析与证明。(Tseng,2005a,2005b,2005c)
5 语音科技开发研究——语音学相关研究
语音科学整合研究,语音科学与科技将是未来信息科学与数字内容无线时代技术之重要关键之一。同时,中文会是未来网络世界中仅次于英文的第二重要语言,其本质的特殊性,在语音处理上需要专门的知识。因此,绩优团队国际合作计划「New Generation Speech Science and Technologies—from Fundamentals to Applications」(NGSST),主要针对中文语音諸多相关領域,拓展新一代的理论及技术。集合台湾各大学与中研院众多顶尖的研究学者,带领年轻世代的学者形成一整合性研究团队,有着清楚明确的研究方向与任务:将成立一核心实验室(CoreLaboratory),整合各单位在语音相关领域现有的语料、工具及模型等资源,提供台湾学术界与研究机构使用,让更多学者及研究单位参与语音辨识与合成的研究,以提升台湾的语音相关研究水平及在国际学术界的影响力。
整个计划有兩大主轴,一是台湾各研究机构的语音相关学者之间的学术交术,包括中央研究院与七所大学,以期加强合作、整合研究成果;另一主轴则是推动与日本之语音相关領域的研究机构的交流互访,其中以日本的ATR(Advanced Telecommunication Research Institute)为交流的最主要窗口,另外也包含了五个重点大学。除了短期的互邀參访之外,更具体的交流方式为台湾方面的学者赴日进行较长时间的访问,以达到更深入交流的目的。关于本计划之更详尽之介绍,可參考下列网址:http://sovideo.iis.sinica.edu.tw/NeGSST/Index.htm
6 结语
本文以研究课题为出发点,简要地介绍近五年来,台湾的语音学与相关的研究的近况及研究成果,并提供相关的参考资料。
参考文献
限于篇幅,参考文献详见:http://www.ling.sinica.edu.tw/eip/FILES/publish/2007.4.12.16465395.5243567.pdf
注
郑秋豫. 台湾语音学及相关研究近况[C]// 第七届中国语音学学术会议暨语音学前沿问题国际论坛. 2006.