■赵 瑾 翟红华/山东农业大学外国语学院
山东方言属于官话方言区的中原官话、冀鲁官话和胶辽官话的交界区,方言现象非常复杂,有官话方言的特征,也有自己的特点。山东运河区域是指明清时期京杭大运河在山东境内流经的州县及辐射州县,大体包括今枣庄、济宁、聊城三市及德州市的德城、陵县、武城、夏津、平原,菏泽东部的单县、巨野、郓城,泰安市的东平,济南的平阴等近40 个县市。随着时代的变迁,运河区域各方言呈现出老派与新派的差异。老派主要指中老年人使用的方言,新派主要指年轻人使用的方言。老派方言比较稳定,能较全面地反映临某一方言的历史特点;新派方言主要是受普通话影响而形成的,其在语音系统、声调系统等方面均与普通话趋同。
一、山东运河区域方言语音研究现状
为了了解目前学界对山东运河区域老派及新派方言的研究现状,笔者以万方数据库、中国知网、中国期刊全文数据库及中国优秀硕博士论文全文数据库等为检索范围,以“山东运河区域方言语音研究”为主题词对1979-2020年的文献进行了检索,发现相关文献非常之少。再逐一以“某地(山东运河区域的40 个县市区)的方言语音研究”为关键词进行梳理,并重点关注所采集语音数据老派与新派之分。发现目前对山东运河区域方言的语音研究呈现以下几个特点:其一,针对老派方言的研究已较深入,相比之下,关注新派方言发展状况及进行新老派方言对比研究的文献较为不足;其二,多数论文着重研究某一地区主要方言点的整体发展状况及影响;其三,部分论文集中分析某一个方言点的语音数据;其四,少数论文对多个方言点的语音数据进行了对比研究;此外,极少数论文尝试运用先进的音系学理论深入分析语音现象。然而,随着社会的变迁,山东运河区域各方言老派人数呈下降趋势,且各老派方言均不同程度上受到相邻地区的影响。如今,在普通话这一强势语言的影响下,这些地区的新派方言又产生了社会变异,其语音系统、声调系统都在一定程度上产生了变化,关注新派方言的发展、展开新派方言调查和研究势在必行。二、山东运河区域新派方言语音库建设
语料库(corpora)是应用计算机技术对海量自然语言材料进行处理、存 储 以 供 检 索(retrieval)、索 引(concordance)以及统计分析的大型资料库。基于语料库的研究方法已经成为当代语言学和应用语言学的一种主流方法。建立山东运河区域新派方言语音库的目的就是要建立起一个面向山东运河区域所有方言区的新派方言大规模语音库,并在语音库的基础上,基于语音学的标注,对不同方言区新派方言的音段和语调特征进行研究。(一)语音语料库的建设方法
1、确定发音素材在建立新派方言语音库之前,首要的工作是完成发音文本的制作,并检验该文本的可用性。在文本设计时,需要最大限度地考察方言区新派方言的发音特征,使任务类型多样化,尽可能全面、客观地对发音人的语音特点进行概括。语料库中包含大量的朗读语料,可供专家学者针对新派方言特征开展基础研究。
2、确定发音人
山东运河区域大体包括今枣庄、济宁、聊城三市及德州市的德城、陵县、武城、夏津、平原,菏泽东部的单县、巨野、郓城,泰安市的东平,济南的平阴等近40 个县市。每个县市选取两男两女,个别县市内部方言差别较大的,则增加受试人。由于语音库中方言类型为新派方言,因此发音人年龄控制在17 至22岁,必须来自山东运河沿线地区,从小未曾离开家乡到外地生活或求学,且从小以方言为主要交流语言。对其父母也有要求,也是未曾离开本地,平时用方言交流等。
3、控制实地录音
录音过程在专业的录音室完成,在条件不允许的情况下,使用高性能定向话筒、高性能声卡、专门配置的电脑等设备在安静的环境下录制,以尽可能地保证录音质量,确保信噪比在合理的范围内。录音软件委托计算机领域的专家依本次录音实验目的进行开发研制。在该录音软件中,录音界面里可以显示句子、篇章等信息,采样频率为16000 赫兹,存储精度:16 位,单声道。一个单词或一个句子保存为一个独立的“wav”文件,以便于后期进行语音处理和分析。在录音时,发音人配戴耳麦,并坐在电脑屏幕前,录音由操作员来完成。
4、进行语音标注
语音库标注分为基础标注和扩展标注。基础标注就是对正则发音的标注。扩展标注包括语音实际发音的标注和韵律标注。语音库的标注非常费时费力。标注系统是多层次的,采用Praat 标注软件。方言的切分主要依靠手工,符号集用SAMAP-C。
5、实施数据库管理
录音开始前,建立录音人档案,以说明所有实际录音的重要信息,如:日期、说话人的ID 码及个人特性、录音场所及环境、背景噪音源、录音采样率等。
需要指出的是,该新派方言语音库提供给用户的是语音的物理性质和基本文本描述,这些参数在语言学上的意义仍需用户去做进一步的研究和评价,因此语音库是一个描述性的但非评价性的数据库。同时,语音库是一个开放而非封闭性的数据库,可进行后续的补充和修正。