面向中文信息处理的“N+V”结构的句法语义研究-《现代语文(语言研究)》(2015年1期).docx

  • 1
  • 0
  • 约2.39千字
  • 约 23页
  • 2023-06-12 发布于北京
  • 正版发售

面向中文信息处理的“N+V”结构的句法语义研究-《现代语文(语言研究)》(2015年1期).docx

  1. 1、本文档共23页,仅提供部分内容试读,阅读完整内容需要下载文档。
  2. 2、本内容来自版权合作机构,仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
  3. 3、因数字商品的特殊性,一经售出,不提供退换货服务、不进行额外附加服务。
龙源版权所有 面向中文信息处理的“N+V”结构的句法语义研究 作者:刘安然 来源:《现代语文(语言研究)》2015年第01期 摘 要:立足于面向计算机的语言本体研究,从切分语料中选择数条N+V结构,从句法、语义和语用特征的角度探索该结构形成歧义的原因,找寻搭配两个成分的搭配规则,并将之形式化,进而制定相应的机用识别策略,从而提升计算机对该结构进行分析的能力。 关键词:中文信息处理 “N+V”结构 自动消歧 “N+V”格式是一种比较常见的同形异构结构,虽然表层形式简洁,从层次划分上不存在困难,但是内部可能存在不同的语法关系、语义关系。 一、“N+V”结构本体分析 (一)“N+V”结构的语法关系 本文所指“N+V”结构是指可以自足的、无其他成分或标记的合法语言单位,不包括“把N+V了”“N的V”等结构形式。根据冯志伟先生的潜在歧义理论,我们将这种结构底层存在的语法关系区分如下: 主谓关系,其中“N”作主语,“V”作谓语,二者之间是陈述与被陈述的关系,如:粮食丰收、妈妈做饭、小二黑结婚; 偏正关系,其中“N”为修饰语,“V”是中心语,如:口头创作、直线上升、文艺演出、汽车制造、语言研究、核试验; 既可以分析成主谓关系也可以分析成偏正关系,这种结构在没有给定语境时会产生理解上的歧义,如:机器生产、专业人员培训。 其中,前两种属于“格式真歧义短语”,它们具有相同的表层类型形式,但是对应着两种句法功能结构,计算机在处理时不能判断采取哪种句法结构,就会产生两种结果,而这种歧义对人来说是不存在的;最后一种属于“实例真歧义短语”,即实例化后产生的短语对应至少两种句法结构,这种歧义对人和计算机都是存在的。 除此之外,由于已经给定短语格式,其中成分的词类已经确定,不会作为结构歧义的产生原因;另一方面,只涉及两个成分的“N+V”结构,词与词搭配时不会产生不同的结构层次,也就不会成为结构歧义的产生原因。 (二)“N+V”结构的语义、语用关系 “N”和“V”之间的语义关系不止一种,“N”既可以作为施事支配“V”,又可以作为“V”的受事受到“V”的支配,还可以作为状语修饰“V”,当同一个结构能够分析出不同关系时就会产生歧义。如“机器”既可以作为“生产”动作的对象,又可以作为“生产”动作的施行者,就会产生歧义。因此,我们可以认为,不及物动词只能构成主谓结构和部分状中结构,而不会产生歧义,只有“V”可以带宾语并且能带体词性宾语时,才会反过来支配前面的“N”,才会产生理解上的区别。如“专业人员培训”中的“培训”是及物动词,“专业人员”既可以作为状语,表示“培训”动作的执行者,又可以作为宾语,表示“培训”动作的对象。 当进入结构的“N”和“V”之间构成动作与受事、对象关系时,有可能构成定中结构。当进入结构的“N”和“V”之间构成施事主体与动作关系时可能构成主谓结构。当这两种关系同时存在时,就会构成歧义结构,这也是歧义格式中最常见的双重歧义关系,还有一些歧义结构的语义关系比较特殊,如:西部开发(“N”既是客体又是地点)、每个人都给一本书(“N”既是主体又是与事)。而当这两种关系都不存在时,“N”通常表示“V”的某种方式、手段,或是动作的时间、原因、范围等,此时构成偏正结构中的另一种——状中结构。 名词性的“N+V”结构还具有一种特殊的语篇特征,即“N”失去话题性,不能被回指,而“V”失去谓词性,得到指称意义,有时可以被数量词修饰,如:一项季度考核、一份会议记录。据此,整个结构就产生指称的语义效果,具有类别义和概念性的倾向,伴随着“N”的改变,类别也会发生变化。 根据现有“N+V”结构的研究成果来看,学者们对定中式的研究比较多,其讨论主要集中在此结构的性质、产生机制和限制条件方面。 对于进入定中结构的“N”的限制条件,李晋霞提出高生命度、高個体度的名词不易进入;缺省宾语不能进入;区别性的下位名词更易进入;概念信息非常具体的“N”不易进入。耿国锋则提出语义抽象、泛化,分布上失去名词形态特征的名词比较容易进入,还有抽象名词、集合名词较容易进入。对于“V”的限制条件,马真、陆俭明《“名词+动词”词语串浅析》中提出四类排斥进入主谓结构的动词:企图类、成为类、“使”类和“着想”类;并提出进入偏正结构的动词必须是名动词。李晋霞则提出:强动作动词、特征动词、口语动词、黏着动词、不及物动词不易进入,但可以举出很多反例。耿国锋提出,动作具有无界性的动词、非完成性和非瞬时性的动词、及物性降低的动词比较容易进入,且进入后失去动词的典型句法功能。但是,名词性“N+V”结构处在不稳定的发展变化中,许多曾经排斥的情况已经有为数不少的用例,需要重新考虑相应的规则。 这些限制条件具有启发价值,但其中某些概念比较模糊,有些对音节的限制几乎只是现象描写,还有一些从词类

文档评论(0)

龙源期刊 + 关注
官方认证
服务提供商

龙源期刊网创建于1998年,是中国领先的人文大众期刊数字发行平台。全文在线的综合性人文大众类期刊品种达到4200多种,优质版权文章数量超过2500万篇,内容涵盖时政、管理、财经、文学、艺术、哲学、历史、社会、科普、军事、教育、家庭、体育、休闲、健康、时尚、职场等全领域。

认证主体北京龙源网通电子商务有限公司
IP属地北京
统一社会信用代码/组织机构代码
91110113721412769J

1亿VIP精品文档

相关文档

相关课程推荐