于 乐
基于语料库的肯定与否定公理验证
于 乐
肯定结构与否定结构是一种普遍存在的语言现象。在汉语中,语义程度较高的词语主要使用于肯定结构,反之,语义程度较低的词语主要使用于否定结构之中。本文以石毓智的肯定与否定公理为基础,基于语料库对该公理进行验证,试图从一个新的角度论证该公理的合理性与适用性。
肯定与否定公理 语料库 验证
一、引言
在汉语中,我们都经常碰到以下这类句子:(1)王十二听了没吭声。
(2)他有一口雪白的牙齿。
“吭声”在汉语表达中常常与“不”、“没”等带有否定意义的词语搭配,但“雪白”却无“不/非雪白”等表达,为何会出现这种现象?
二、肯定与否定公理
石毓智在《肯定和否定的对称与不对称》一书提出“肯定与否定公理”:语义程度极小的词语,只能用于否定结构;语义程度极大的词语,只能用于肯定结构;语义程度居中的词语,可以自由地用于肯定和否定结构之中。如果将一组概念意义相同的词,将词语的语义程度按递增的方式从左到右进行排列,位于最左端的词只能用于或者多用于否定结构,位于中间的词可以自由地用于两种结构,位于最右端的词多用于或者只用于肯定结构。
如“叙说、提起、挂齿、说起、倾诉、诉说、谈论”将它们的语义程度由低到高的顺序排列起来:
挂齿 提起 说起 谈论 叙说 诉说 倾诉
挂齿的语义程度最低,只适用于否定结构,前面要加否定词“不”或“没”等否定词,而倾诉语义程度最高,则只能用于肯定结构,不能加否定词。
三、前人验证存在的问题
石毓智依据《动词逆序词典》中对否定词进行归纳统计,但是该词典数据相对较少,证明力度有限。“当然,只根据4个用例归纳出的结论在一定程度上还是一种假设,要得到确证还需要更多用例的支持(石毓智,1989)。”语料库为我们提供了一种新的视角,“语料库有例句多,材料广等特点,它已经成为语言研究的一种视角和方法,能够弥补传统研究方法的不足,也是传统研究方法的补充和验证(邹申 杨任明,2008)。”本文旨在通过统计语料库的数据,验证石毓智提出的肯定和否定公理。
四、研究方案
(一)研究目的借助CCL语料库,对石毓智提出的具有同一概念的否定性词语进行分析和统计,考察这一组同一概念的句子是否存在否定式与肯定式之比的量级序列。
(二)研究方法
本文主要对CCL网络语料库的数据进行统计和分析,数据庞大,资料具有参考价值。
货位分配优化前后,各算法求得的目标函数值对比如表4所示,其中“优化前”指本次测试中各算法的初代种群信息。
(三)研究判断标准
在实际统计操作中,我们将根据陶镜玉在《英汉否定表达比较及在对外汉语教学中的应用》提到的汉语否定标记与手段对语料库的语料进行分析和判断。
但在实际操作中,本文采用了粗略统计法,将词语和常用否定词搭配作为筛查对象,例如“介意”一般与“不”进行搭配,计算方法虽然粗略,也出现句子重复和错误的现象,但这些差错几率相对于整个数据而言非常小,不会影响到最后结果。
(四)研究客体
本文主要研究的客体均来自石毓智在《肯定和否定的对称与不对称》和《现代汉语的否定性成分中》提出的相同概念、存在量级序列的几组汉语词语,将从几组词语中随机挑出。
汉语:
介意 记得 牢记 铭记
打岔 妨碍 阻碍 阻挠
好气儿 和气 和蔼 和悦
抵事 顶事 顶用
勉强 强制 勒令
(五)研究问题
本文拟定主要解决的问题是:石毓智所提出的具有相同概念的词语是否真的存在量级序列?这样的量级序列是否能在语料库的统计数据中体现出来?
五、统计分析结果
(一)根据CCL语料库(网络版)所统计出,文章频率根据否定/肯定所得:___________________________
_介意_ ___________不/未_否定/肯定___打__岔_ __不/别/___没_否定/肯定_1367 ___11___ ___37____________ _____0.83_____________225_ ____________ ______79_________________________0.31 _记得_不/哪/没__________ __ 妨__碍_不/别/没/未___________ 16395 ___17___ __23____________ ___0.105___________4500_ _____________ ___1559________________________0.34 _牢记_ __不/___没_ _________ _阻碍_不/别/没/未___________ _2687_ _________ ___12_____________ ____0.004___________5990_ ____________ ____414_________________________0.07 _铭记_ __不/___无_ __________ __阻__挠_不/别/没/未___________ _1112 ________ ____________________ _0_0____________2407_ ____________ ____139_______________________0.058 _抵事_ ________ __________不_好气儿 ___没________ ___________好气儿__1__9_ _________ ____13_____________ _______0.68__________ _____________ _____12______________________________12_1 _有效_不/没/哪__________ __ 和__气_ __不/没______ ___________/别64584 ___19___ ___60____________ ____0.03_________3406_ ____________ ______76_______________________0.023 _灵验_不/哪/没__________ __ 和__蔼_ ______________ ____________不和蔼_391_ _________ ___62_____________ ____0.159___________1698_ _____________ _______2_________________________0.001 _万能_不/没/非_________ _ _________________________和悦_ _____________ ____________不和悦_1205_ ___2____ ___76_____________ ______0.23_____________134_ _____________ _______2_________________________0.015 _抵事_ _________ __________ ____不___________________________________勉强_不/没/未/别___________ __1__9_ _______ ___13_____________ _____0.68_________5605_ 324 ___0.0_____57 _顶事 __不/? __________ __强制 ______________ ___________不/非/没/无/未_148_ _______ ___60_____________ _______0.4____________7592_ ____________ ____609________________________0.08 _顶用_ __不/___没_ __________ __勒__令_ ______________ ________________不_209_ ________ _____89_____________ ______0.42_____________741_ _____________ _______4_________________________0.005
根据以上表格可以得出:
“介意”这一组的频率数据为0.83> 0.105>0.004>0,频率越大语义程度越小,因此这组的语义大小排序为:介意<记得 < 牢记< 铭记
“打岔”这一组的频率数据为0.34>0.31>0.07>0.058,频率越大语义程度越小,因此这组的语义大小排序为:妨碍<打岔 <阻碍 <阻挠
“抵事”这一组的频率数据为0.68>0.23>0.159>0.03,频率越大语义程度越小,因此这组的语义大小排序为:抵事<灵验<万能<有效
“好气儿”这一组的频率数据为1>0.023>0.015>0.001,频率越大语义程度越小,因此这组的语义大小排序为:好气儿<和气<和悦<和蔼
“勉强”这一组的频率数据为0.08>0.057>0.005,频率越大语义程度越小因此这组的语义大小排序为:强制<勉强<勒令
六、结语
从数据可以看出,在本文选出着六组同一概念的词语中确实有语义程度的差别,词语之间的否定与肯定之比差异非常明显,语义程度低与语义程度高的词语在频率上计算所得的数据差距十分大。虽然词语的语义排序与石毓智提出的序列有出入,但是大致是符合的,因此可以证明词语存在量级序列,并且能在语料库的统计数据中体现出来,石毓智提出的否定与肯定公理是适用的。但是本研究方法依旧存在漏洞。首先,数据中有出现重复与语法错误的语句,本研究是基于该错误数据数量可以忽略不计的基础上进行的,但是实际应该会有一定偏差,这是不可避免的。再次,该研究方法选取了一小部分的词语进行论证,是否能在更大的范围里应用,还是有待进一步验证。
[1]沈家煊.不对称和标记论[M].南昌:江西教育出版社,1999.
[2]石毓智.肯定和否定的对称与不对称(增订本)[M].北京:北京语言文化大学出版社,2001.
[3]石毓智.现代汉语的否定性成分[J].北京:语言研究,1989(13).
[4]陶镜玉.英汉否定表达比较及在对外汉语教学中的应用[D].南昌:南昌大学,2010:4~19.
[5]王力.中国现代语法[M].北京:商务印书馆,2011.
[6]邹申,杨任明.语料库在试题设计和验证中的应用研究[J].外语电化教学,2008(10).
(作者单位:华南理工大学外国语学院)