浅议统计语言学在作家语言风格研究中的实际应用-《现代语文》(2018年2期).docx

  • 0
  • 0
  • 约2.35千字
  • 约 19页
  • 2023-06-12 发布于四川
  • 正版发售

浅议统计语言学在作家语言风格研究中的实际应用-《现代语文》(2018年2期).docx

  1. 1、本文档共19页,仅提供部分内容试读,阅读完整内容需要下载文档。
  2. 2、本内容来自版权合作机构,仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
  3. 3、因数字商品的特殊性,一经售出,不提供退换货服务、不进行额外附加服务。
龙源版权所有 浅议统计语言学在作家语言风格研究中的实际应用 作者:万晓雯 来源:《现代语文》2018年第02期 摘要:统计语言学是应用统计数学的方法来研究语言现象的语言学科,研究领域广泛,学界常常运用统计语言学,通过分析语言单位的出现频率及作家的用词频率、词长分布和句长分布,确定作家的写作风格。通过“判定《静静的顿河》作者”“证明《红楼梦》是否出自一人之手”两个案例可以看出,统计语言学的研究方法在进入文学研究领域后,取得了非常好的实用效果。但是,在实际应用中,除了各类词汇等可控变量,还有其他潜在因素导致统计语言学的结论有时并非绝对精准。通过进行多方面、深层次地原因分析和推断,我们发现,要得到准确的研究结果,必须做好研究的前期准备,要选择具有相似语言环境的语料,要注意避开文学语言的形象思维影响,不能滥用统计语言学研究方法,并在操作过程中严格控制各种变量,以科学的思想指导研究。 关键词:统计语言学 语言风格研究 实际应用 作为大数据时代语言学研究的一个热点领域,统计语言学(statistical linguistics)属于数理语言学的一个分支,涉及语言学、计算机科学和数学等多个学科门类,是应用数理统计、概率論和信息论等统计数学的方法来研究语言现象的语言学科。 一、统计语言学的研究领域 相较于自然科学,人文科学的研究多涉及人(包括研究者本人)的大脑,因此很容易导致“自我中心性错误”和“内省性错误”。无论是过多地依赖本人的经验,还是过多地依赖自己的内省来做出判断,都会导致研究缺乏客观性与科学性,其价值是有限的。统计语言学则是倡导用科学的方法进行实验,进而得出结论,“特别注重语言本身的系统性和动态性特点,强调语言描写的真实性和精确性”。 从其研究内容看,统计语言学大致可分为语音统计学、词汇统计学、语法统计学和语义统计学,分别研究语言的语音、词汇、语法和语义的统计特征。从其功能看,统计语言学可分为描述统计与推断统计:描述统计的作用是对数据进行整理、归纳和总结,压缩数据,把握其一般性的特征和全貌;推断统计则是根据描述统计提供的结果,进一步对有关联系加以推断。 “统计语言学可用来发现语言学内在规律(词频与词排序之间的关系)、常用词和非常用词、词语搭配、短语获取、语言习得、语域变异以及作品风格分析等领域。”可以看到,统计语言学的研究领域广泛,但其中最主要、最熟稔的实际应用,当属通过语言单位的出现频率及作家的用词频率、词长分布和句长分布,确定作家的写作风格。统计语言学进入文学研究领域后,还催生出了另一个学科,即文艺风格学,一种应用现代语言学成果和技术来分析研究文学作品的边缘学科。如苏联学者用该方法研究赫尔岑、屠格涅夫的语言风格,国内也有人用这种方法研究巴金、曹禺、老舍等人的语言风格。 二、统计语言学与语言风格研究 黎运汉在《汉语风格学》中指出:“语言表现风格是综合运用风格手段的结果,从调音、遣词、择句到设格、谋篇等的风格手段,综合地反映在一篇文章、一部作品,或一种语体,或一个作家的作品,或一个时代的作家的作品,或一个民族的作家的作品里,这就从成了他们各自的表现风格。”换言之,语言风格的差异,正是由于作者使用特定语言单位的频率不同而造成的。于是,通过对语言结构特征的分析,我们可以比较直观地感受到不同文体与不同作者的风格,得出不同作者语言风格的同一性或区别性特征,而不仅仅是通过一系列描述型的论述,阐述文体或者语言风格问的差异。统计语言学的诞生,使语言单位的出现频率和分布数据变得重要,成为一种彰显作家语言风格的数学特征。 运用统计语言学判定作家风格的数学特征,其具体过程是:选取两位作家的公认代表作品作为语料样本,首先对样本进行分词处理,以文本为基本单位计算各类语言要素在文本中所占的频率和百分比,根据两个样本的平均值,比较语言要素分布是否具有差异。一般而言,为了测试数学统计特征是否能够有效辨别不同作家语言风格,还可以选用一个作家的其他作品为语料样本,计算该样本与统计所用语料样本的相关性。 鉴于其在判定作家风格方面的显著功效,统计语言学也被成功地运用到“作者考证”这个充满争议的研究领域中。在通过分析匿名文章的写作风格进而判定其真正作者方面,统计语言学也展现出了非常好的应用效果。以往,当某本名著的作者产生争议时,我们只能够凭借经验、历史文献和作家生平记录来进行考证。如今有了统计语言学,我们可以通过严谨的数据分析,提出更有说服力的证据。 三、实际应用案例 (一)《静静的顿河》的作者纠纷案 统计语言学最著名的实际应用,就是成功破解了文学史上关于《静静的顿河》的作者纠纷案。 《静静的顿河》在苏联文学史上占有较高的地位。此书全景式地描写了俄国内战时期顿河流域的社会景观,甚至有人将其与《战争与和平》等名著相提并论。然而自从《静静的顿河》

文档评论(0)

龙源期刊 + 关注
官方认证
服务提供商

龙源期刊网创建于1998年,是中国领先的人文大众期刊数字发行平台。全文在线的综合性人文大众类期刊品种达到4200多种,优质版权文章数量超过2500万篇,内容涵盖时政、管理、财经、文学、艺术、哲学、历史、社会、科普、军事、教育、家庭、体育、休闲、健康、时尚、职场等全领域。

认证主体北京龙源网通电子商务有限公司
IP属地四川
统一社会信用代码/组织机构代码
91110113721412769J

1亿VIP精品文档

相关文档

相关课程推荐