欢迎来到专业的新思文库网平台! 工作计划 工作总结 心得体会 事迹材料 述职报告 疫情防控 思想汇报 党课下载
当前位置:首页 > 范文大全 > 公文范文 > 正文

汉英词典中“研究”的词类标注问题与对策

时间:2022-11-12 08:00:15 来源:网友投稿


打开文本图片集

摘 要:近年来,词类标注问题成为汉语词典和汉外词典编纂的热点,更是一个难点。“研究”一词在几部认可度较高的漢语、汉英词典中的词类表征问题上存在很大分歧。根据双层词类范畴化理论,基于语料库对“研究”进行使用模式的调查结果表明,“研究”表指称的用法也具有很高的个体频率和类型频率,概括词“研究”在现代汉语社群语言层面词库中兼属动、名词,因而汉语和汉英词典应将其处理为动名兼类词。通过对“研究”一词的词类归属探讨,以期对汉语词典和汉英词典的编纂有所启发。

关键词:词类标注;兼类词;双层词类范畴化理论;使用频率;规约化

中图分类号:H06  文献标识码:A  文章编号:1673-2596(2019)07-0107-04

讲语法,先要讲词类,因为词类是讲语句结构必不可少的“道具”(或叫“理论构件”),有了这个道具才方便我们讲语法[1]。概括词的兼类问题一直被视为一个老大难问题,尤其兼类与词频是否相关是一个涉及语言本质观差异的大问题。兼类指的是一个多义的概括词或词项在社群语言系统层面词库中兼属两个或两个以上的词类范畴,在词典当中具体表现为兼类词[2],如在《汉英翻译大词典》(2015)中“哀怜”一词兼属形容词和名词。在汉语词类研究中,“研究”等涉及自指用法的词是否应该处理为兼类是学界一直存在争论而没有妥善解决的问题[3]。

一、研究问题

笔者查阅了国内认可度较高的几部汉语、汉英词典,发现“研究”一词的词类标注存在着诸多问题。经调查,《现代汉语词典》(2016)、《当代汉语词典》(2009)、《现代汉语规范用法词典》(2000)3部汉语词典,以及《汉英词典》(2010)、《简明汉英词典》(2002)、《新汉英词典》(2007)、《新世纪汉英大词典》(2016)、《汉英翻译大词典》(2015)等5部汉英词典对“研究”一词的义项设置及释义基本一致,但对其配例用法与词类标注上却大相径庭,具体如下:

第一,词类标注不一致。如图表1所示,5部词典将“研究”一词仅标注为动词,《新汉英》和《汉英翻译》同时标注了动词和名词,而《简明汉英词典》仅仅将其标为名词,这差别不可谓不大。其中3部汉语词典都没有为“研究”标注名词,为其标注为名词的只有3部汉英词典,这说明汉语词典和汉英词典对于“研究”词类标注存在很大分歧。

第二,词类标注与配例不一致。比如《现规用法》中的配例“数论的研究上了一个新台阶”,这里的“研究”应为名词;“研究的课题将陆续确定”这里作定语的“研究”应该是名词的标记用法。

同样我们对在国家语委现代汉语语料库中“研究”的词类标注进行了对比分析,也发现其存在诸多问题:

第一,“研究”与句中有相同用法的词所标注的词性不同。比如,在例①中,同是作宾语的“计划”标注为名词,而“研究”却标注为动词:

①它/r 又/d 说/v ,/w "/w 苏联/ns 所/u 需要/v 的/u ,/w 是/vl 一个/mq 全国性/n 的/u 科学/n 研究/v 和/c 发展/v 计划/n ……。

第二,同样做主宾语用法的“研究”,有的标注为名词,如在例②中,指称“研究”这件事情;有的标注为动词,如在例③中:

②谈到/v 考古学/n 新石器时代/nt 的/u 研究/n ,/w 我们/r 知道/v 在/p 那时/r 的/u 中国/ns 这/r 还是/d 一/m 门/q 新兴/a 的/u 学问/n ,/w 还/d 没有/v 受到/v 中国/ns 学者/n 的/u 注意/v。

③对于/p 藩镇/n 的/u 兴起/v ,/w 前人/n 的/u 研究/v 往往/d 拘泥/v 于/p 节度使/n 名号/n 的/u 出现/v。

第三,“研究”同样作为语素,有的标记为动词,如例④中,有的没有标记词性,如例⑤中:

④作为/v 研究生/n ,/w 或者/c 做/v 助教/n,/w 有的/r 也/d 可以/vu 到/v 科学院/n 去/v 研究/v。

⑤烟草/n 老板/n 供给/v 的/u 实验室/n 经费/n 下/v 增拨/v 给/v 了/u 他/r 几百/m 磅/q 的/u 研究/v 费/n 而已/u。

针对以上分析,笔者提出以下疑问:

其一,造成“研究”一词词类标注分歧的成因是什么?

其二,“研究”是否只存在动名兼类分歧,其是否还可能兼形容词,尤其是其动词名物化后的自指义项是否已经达到规约化,从而收录进词典?

二、研究设计

基于复杂适应系统的语言观和语料库的研究方法,王仁强提出了“双层词类范畴化理论”[4],该理论指出,词类范畴化发生在个体词的词类范畴化和概括词的词类范畴化两个层面;前者指说话者命题言语行为的表达过程,后者指一个言语社群集体无意识的自组织过程,其核心是规约化。王仁强、陈和敏指出个体词用法模式的规约化程度取决于个例频率、类型频率等[5]。要判断个体词项的某个词类是否达到规约化而以兼类收录进词典,我们应当调查其使用模式。尽管学界对“研究”的名词用法存在争议,但并未具体调查其规约程度。

因此本文基于近年来涌现并活跃在国际学术舞台的双层词类范畴化理论,基于国家语委现代汉语语料库(简称“语委语料库”)对其使用模式进行调查,同时辅之以CCL现代汉语语料库和Sketch Engine汉语语料库以得到更多汇合证据,首先统计“研究”的命题言语行为功能分布情况,并分析其具体用法,其余则标为构词或无效。然后针对语料库中“研究”的句法特征,统计其搭配的类型频率,以便判断其各用法尤其是指称用法是否达到规约化,从而决定其是否应收录进词典。

三、调查结果

(一)个体频率

经过检索,“研究”在语委语料库中共有8657条索引,由于其总数过多,我们不进行全样本分析,随机抽取1000条进行分析,其在CCL现代汉语语料库和Sketch Engine汉语语料库的索引也非常多(10000以上),因其索引本身属于随机分布,故各抽取前500条进行统计其个体频率。

经过考察,以上抽取的所有索引词条除去重复索引而无效的语料外,其他都是有效索引。在以上语料库中索引包含“研究生”“研究院”“研究所”等中的“研究”是构词用法,频繁出现,已独立成词,无须谈论其词类,其他的皆主要根据其命题言语功能判断其词类属性。如“还有人才学的研究也表明家庭的影响”在这条索引中,“研究”在句子中充当主语,表指称,语义为“钻研;探索”。依据此方法,如表2可见,“研究”在三大语料库中都出现了陈述、指称、修饰3种命题言语行为模式,且3个语料库中“研究”的用法个体频率从高到低排列依次是指称、陈述、修饰,特别是在CCL现代汉语语料库中,500条语料除去构词用法语料和12条重复索引而无效的语料,有244条语料显示“研究”一词具有指称用法,已占总数的48.8%。

(二)类型频率

“研究”的命题言语行为功能表达中,有主宾语的指称用法,但更多的是作宾语,构成动宾结构,其搭配词汇多样。如表3所示:“研究”的指称用法不仅出现在“动词短语+研究”的结构中,还出现在“形容词短语+研究”“名词短语+(的)+研究”等结构中。其中表指称作宾语的居首,其结构主要是VP+研究;作主语的主要结构为Adj+研究。总而言之,“研究”的指称用法所表现出的句法结构多样,其搭配的具体词汇也比较多样,而修饰用法所搭配的词汇比较而言就显得单一。

四、讨论

(一)概括词“研究”的词类归属问题

根据三大语料库的调查发现,表达指称命题言语行为功能的“研究”处于主宾语位置时拥有很高的个体频率和类型频率,其名词用法个体频率已经超过了动词用法,并且语义都为“考虑或商讨(意见、问题)、探索”,在报告中普遍使用。根据双层词类范畴化理论,“研究”表达指称的名词用法已经具有很高的规约化程度,根据现代汉语兼类与词频呈正相关[6],因此“研究”一詞,在语言层面应该将它处理为动词和名词的兼类词。

另外其修饰用法在3个语料库中分别占比10.2%,14%,16.8%,和表陈述和指称功能相比较,其个例频率相对较低。那么“研究”的形容词性用法是否达到规约化,或者仅是动词、名词临时的标记用法呢?根据学界普遍认可的判断形容词常规标准“很[不]~~”,标准中的“很”代表程度副词,还包括“挺、满、怪、非常、十分、极其”等[7]。经调查,笔者发现“研究”不能被“很”等程度副词修饰。“研究”处于定语位置如“……研究的课题……”,“……研究的材料……”等索引中的“研究”是名词的临时标记用法;“……出于研究的需要……”等中的“研究”虽然起修饰作用,但却是动词的临时有标记用法,而且其用法频率较低,并未达到社群语言层面,因此词典中不能为其标注形容词,只能处理为动、名兼类词。

(二)词典标记处理

根据国家语委2008年发布的《现代汉语常用词表(草案)》,“研究”作为1000以内的超高频词(频序号201)在语言演变过程中因去范畴化及再范畴化而衍生功能多义性的现象不足为怪。部分词典注意到了这一现象,即“研究”等自指词有做主宾语的名词用法,并在字典中有标注和配例,但大多数汉语、汉英词典因“简约原则”的束缚,没有单独标注其名词用法。针对双层词类范畴化理论开展的多项实证研究表明:兼类是现代汉语和现代英语等分析语中概括词在社群语言层面词库中的共性特征,但是现代汉语词典所展现的汉语兼类词比例大约只有现代英语的一半,现代汉语词典明显遵循“简约原则”,存在人为减少兼类的现象。

由此,《新时代汉英大词典》《汉英翻译词典》这2部词典将其标为动名兼类词是符合语言事实的,其余7部词典均存在漏设“研究”名词义项的现象,而《简明》只设计名词义项就更不合理了。因此,笔者根据现代汉语自指词义项的释义模式,采用名性释义与转换释义②相结合,对“研究”的词类归属问题及释义做以下修改建议:

【研究】①动探求事物的真相、性质、规律等。

②动考虑或商讨(意见、问题)。

③名钻研或探索的行为或过程。

本文调查结果表明,“研究”表指称功能的名词用法的个体频率和类型频率都已达到规约化,说明其在现代汉语社群语言层面词库中兼属动词和名词。笔者再次证明,词类标注必须遵循语言使用事实,不可一味坚持“简约原则”。双层词类范畴化理论兼顾经典逻辑和模糊逻辑,可增强词典编撰的准确性和科学性,为有效解决现代汉语词类研究提供理据。

注 释:

①表1中词典均是上述词典的简称。

②《现代汉语词典》(简称《现汉》)(第5版)少数自指义项的两类释义模式:转换释义是直接将原来对动词的释义转换为一个名词短语,如【预告】①事先通告,②事先的通告;名性释义是用已经解释的动词来解释名词,即“V的行为(或其它名词)”,如【恋爱】①男女互相爱慕,②男女互相爱慕的行动表现。具体和深入的关于自指词义项的释义模式可参见:杨旭,牛瑶,王仁强..“怀疑/信任”的词类标注研究—兼论兼类词自指义项的释义模式[J].广东外语外贸大学学报,2017,28(02):5-11;杨同用,何彦杰.动名兼类的词义引申类型、功能与释义[J].辞书研究,2010,(02):14-20.

参考文献:

〔1〕沈家煊.我看汉语的词类[J].语言科学,2009,(01):1-12.

〔2〕王仁强.现代英语兼类现状研究—以《牛津高阶英语词典》(第7版)为例[J].外国语:上海外国语大学学报,2014,(04):49-59.

〔3〕陸俭明.现代汉语语法研究教程(第四版)[M].北京:北京大学出版社,2013.

〔4〕RENQIANG,W.2014.Two-Level Word Class Categorization in Analytic Languages [C] // Proceedings of the 36th Annual Conference of the German Linguistic Society. University of Marburg, Germany: 345-347.

〔5〕王仁强,陈和敏.基于语料库的动词与构式关系研究—以sneeze及物动词用法的规约化为例[J].外语教学与研究,2014,(01):19-31.

〔6〕王仁强,周瑜.现代汉语兼类与词频的相关性研究——兼评“简略原则”的效度[J].外国语文,2015,31(02):61-69.

〔7〕郭锐.现代汉语词类研究[M].北京:商务印书馆,2002.

(责任编辑 赛汉其其格)

Abstract: The word class labeling,especially for multi-category lexeme in Chinese or Chinese-English dictionaries,has always been a hot and hard problem. The word class membership of"YANJIU" in most dictionaries is divergent. From the perspective of Two-level Word Class Categorization Theory,the present study conducts usage pattern surveys of YANJIU on the basis of the Chinese National Corpus. Since YANJIU has high token and type frequency in its reference usage,the lexemes of YANJIU belong to verbs- nouns heterosemous at langue,and should be labeled as such in large and medium-sized Chinese and Chinese-Foreign language dictionaries. It"s hoped to offer some suggestions on Chinese- English dictionaries and Chinese Lexicography.

Keywords: Word Class labeling; Heterosemy; Two-level Word Class Categorization Theory; Frequency of Use; Conventionalization

推荐访问:词类 汉英 标注 对策 词典